Encerrado

Criação de um algoritmo para a extração automática de informações de textos

Construção de um algoritmo que realize a seguinte tarefa: a partir da inserção de uma determinada palavra-chave, ele deve realizar uma busca automática em arquivos de texto (em um pdf, por exemplo) e retornar informações para um banco de dados. <br /><br />Sendo mais específico, tenho um número bastante extenso de arquivos pdf (contendo inúmeras páginas), cada um correspondendo a um processo judicial. Quero saber (entre inúmeras outras coisas) a sentença de cada processo, sem precisar ler todos, o que levaria muito tempo. Lendo alguns, consigo determinar um padrão que as sentenças seguem. Gostaria de usar esse padrão para determinar uma regra para a localização da informação de interesse (a sentença, no caso). Uma vez localizada, queria poder estabelecer outra regra de como armazenar a informação numa base de dados. Por exemplo, uma marcação de "sim" caso a sentença tenha sido em favor do solicitante.<br /><br />Gostaria de alguma flexibilidade para alterar essas regras de busca.

Habilidades: Cartografia & Mapas, Arquitetura de software, Desenvolvimento de Software, Design UML, Interface do usuário / AI

Ver mais:

ID do Projeto: #12484664