Encerrado

Automatização da escrita de códigos de extração

Estamos buscando um profissional experiente para nos auxiliar com a padronização da extração de dados advindos de laudos laboratoriais, que atualmente se apresentam de diversas formas, e frequentemente são alvo de alguma mudança de formatação por parte dos laboratórios que os emitem.

Atualmente, temos catalogados por volta de 40 formatos diferentes. E conhecimento da existência de muitos mais.

Segue abaixo um pequeno descritivo da problemática em questão:

Inputs:

Formato PDF ou Excel.

Laudos Analíticos Laboratoriais, contendo informações comuns sobre amostras ambientais (data de coleta, nome do composto, resultado, unidade, dentre algumas outras dezenas de informações).

Desafios dos Inputs:

Formatos diversos, dificultando uma padronização via soluções prontas ou semi-automáticas (ex.: Report Miner ou códigos individuais).

Embora as informações sejam sempre as mesmas, há duas particularidades:

• Nem sempre todas as informações vão estar presentes em cada laudo;

• Os formatos de tabela e a forma de apresentação dos resultados varia significativamente dentre diferentes laboratórios.

Breve descritivo do ferramental atual: Biblioteca de códigos individuais capazes de lidar com os casos mais comuns.

Problema: Pequenas mudanças no formato do input requerem intervenção para adaptação dos códigos ou para a geração de novos códigos.

Objetivo: Extrair dados de qualquer tipo de input sem a necessidade de promover ajustes no código a ser utilizado.

Solução Buscada: Um código integrado capaz de extrair informações dos mais diversos formatos de inputs, novos ou futuros. Para tal, a solução deve empregar algum tipo de aprendizado de máquina para, a partir dos casos existentes, aprender a se adaptar a novos formatos de input e não requerer mais a intervenção humana a cada novo formato.

OBS.: NDA será obrigatório

Habilidades: Linguagem de Programação R, Processamento de dados, Machine Learning (ML), Data Extraction

Sobre o Cliente:
( 0 comentários ) Rio de Janeiro, Brazil

ID do Projeto: #33266834

6 freelancers estão ofertando em média $2114 nesse trabalho

ibrahimanjum330

Hi, I am Ibrahim, and I am a data scientist, I can help you create a system that could standardize the documents. Thanks for the invite. Regards, Ibrahim Anjum

$3333 USD in 45 dias
(110 Comentários)
6.4
SlavaMaltsev1

Hi.Dear... Nice to meet you. I saw your project details carefully. Thanks for your posting. I am expert in Python and Matlab programming. I am working in this this field for 5 years. I have many experiences and I think Mais

$1500 USD in 7 dias
(2 Comentários)
3.5
vinzin

OLÁ, LI A DESCRIÇÃO POSSO AJUDÁ-LO A EXTRAÇÃO DE DADOS DE DIFERENTES FORMATOS DE RELATÓRIOS COM O CÓDIGO DE APRENDIZAGEM DA SMART MACHINE PARA QUE NÃO NECESSITA CODIFICAR PARA O NOVO FORMATO

$1500 USD in 15 dias
(1 Comentário)
1.6
aymanlafaz0

Hi I'm a Data Scientist and I've worked on many projects and I'm also familiar with both python and R for achieving these tasks, I'm confident I will get the work done and achieve great results Best Regards

$1500 USD in 30 dias
(3 Comentários)
1.8
(0 Comentários)
0.0
sundevmar

Olá, Obrigado por compartilhar o requisito do seu projeto. Lemos sua exigência e entendemos. Para entender mais e esclarecer nossas dúvidas, queremos conversar com você. Portanto, envie-nos uma mensagem para que pos Mais

$1850 USD in 12 dias
(0 Comentários)
0.0