Automatização da escrita de códigos de extração
Orçamento $1500-3000 USD
Estamos buscando um profissional experiente para nos auxiliar com a padronização da extração de dados advindos de laudos laboratoriais, que atualmente se apresentam de diversas formas, e frequentemente são alvo de alguma mudança de formatação por parte dos laboratórios que os emitem.
Atualmente, temos catalogados por volta de 40 formatos diferentes. E conhecimento da existência de muitos mais.
Segue abaixo um pequeno descritivo da problemática em questão:
Inputs:
Formato PDF ou Excel.
Laudos Analíticos Laboratoriais, contendo informações comuns sobre amostras ambientais (data de coleta, nome do composto, resultado, unidade, dentre algumas outras dezenas de informações).
Desafios dos Inputs:
Formatos diversos, dificultando uma padronização via soluções prontas ou semi-automáticas (ex.: Report Miner ou códigos individuais).
Embora as informações sejam sempre as mesmas, há duas particularidades:
• Nem sempre todas as informações vão estar presentes em cada laudo;
• Os formatos de tabela e a forma de apresentação dos resultados varia significativamente dentre diferentes laboratórios.
Breve descritivo do ferramental atual: Biblioteca de códigos individuais capazes de lidar com os casos mais comuns.
Problema: Pequenas mudanças no formato do input requerem intervenção para adaptação dos códigos ou para a geração de novos códigos.
Objetivo: Extrair dados de qualquer tipo de input sem a necessidade de promover ajustes no código a ser utilizado.
Solução Buscada: Um código integrado capaz de extrair informações dos mais diversos formatos de inputs, novos ou futuros. Para tal, a solução deve empregar algum tipo de aprendizado de máquina para, a partir dos casos existentes, aprender a se adaptar a novos formatos de input e não requerer mais a intervenção humana a cada novo formato.
OBS.: NDA será obrigatório
6 freelancers estão ofertando em média $2114 nesse trabalho
Hi, I am Ibrahim, and I am a data scientist, I can help you create a system that could standardize the documents. Thanks for the invite. Regards, Ibrahim Anjum
Hi.Dear... Nice to meet you. I saw your project details carefully. Thanks for your posting. I am expert in Python and Matlab programming. I am working in this this field for 5 years. I have many experiences and I think Mais
OLÁ, LI A DESCRIÇÃO POSSO AJUDÁ-LO A EXTRAÇÃO DE DADOS DE DIFERENTES FORMATOS DE RELATÓRIOS COM O CÓDIGO DE APRENDIZAGEM DA SMART MACHINE PARA QUE NÃO NECESSITA CODIFICAR PARA O NOVO FORMATO
Hi I'm a Data Scientist and I've worked on many projects and I'm also familiar with both python and R for achieving these tasks, I'm confident I will get the work done and achieve great results Best Regards