IA ajuda cientistas com pesquisas para combater o covid-19

Enquanto o mundo se une na luta contra o COVID-19, cientistas e pesquisadores de todo o mundo estudam o novo coronavírus e publicam suas descobertas em revistas especializadas e servidores de pré-impressão.

Espalhados por esses documentos de pesquisa, podem estar as peças do quebra-cabeça que desbloquearão a cura ou a vacina para o COVID-19 ou novas maneiras de tratar pacientes e impedir a propagação do vírus. Infelizmente, nenhuma pessoa pode passar por dezenas de milhares de documentos, e os milhares que são adicionados a cada semana.

É aqui que a comunidade de inteligência artificial entra em cena. Entre outros esforços para ajudar a combater a pandemia de coronavírus , os pesquisadores da IA ​​estão rapidamente ocupados desenvolvendo ferramentas que ajudarão os cientistas médicos a navegar no corpus de literatura em rápido crescimento em torno do coronavírus.

O esforço conjunto para processar os documentos COVID-19, que reuniu agências governamentais, gigantes da tecnologia, universidades e laboratórios de pesquisa, será uma medida de quão úteis foram os nossos algoritmos de IA de última geração.

covid19

O conjunto de dados CORD-19

Em março, o governo dos EUA se uniu às gigantes da tecnologia Microsoft e Google para reunir trabalhos de pesquisa sobre o COVID-19. O corpus foi compilado em um conjunto de dados chamado COVID-19 Open Research Dataset (CORD-19) pelo Allen Institute for AI (AI2) em parceria com a Chan Zuckerberg Initiative, Centro de Segurança e Tecnologia Emergente da Universidade de Georgetown, Microsoft Research e o Biblioteca Nacional de Medicina dos Institutos Nacionais de Saúde, em coordenação com o Escritório de Políticas de Ciência e Tecnologia da Casa Branca.

O CORD-19 foi lançado em meados de março e disponibilizado aos pesquisadores de IA para usá-lo para criar modelos de aprendizado de máquina que podem ajudar os cientistas a encontrar as informações de que precisam.

O conjunto de dados inicial incluiu mais de 24.000 trabalhos de pesquisa de publicações revisadas por pares, bem como servidores de pré-impressão, como o bioRxiv e o medRxiv. Desde então, aumentou para mais de 47.000 documentos.

O CORD-19 está disponível no site Semantic Scholar da AI2 , um mecanismo de pesquisa para pesquisas revisadas por pares. Pesquisadores de aprendizado de máquina podem baixar o banco de dados do Semantic Scholar. O corpus também foi integrado ao mecanismo de pesquisa e pode ser consultado através do Semantic Scholar.

A AI2 também lançou o CORD-19 Explorer , um mecanismo de busca em texto completo especializado para o corpus de pesquisa COVID-19. O Explorer também possui links para outras ferramentas relevantes. Alguns deles foram criados no CORD-19, como esse mecanismo de pesquisa que usa a Pesquisa Cognitiva do Microsoft Azure. Outras ferramentas são baseadas em outras fontes de dados, como o Elsevier Coronavirus Research Repository . Você também encontrará um link para a COVID-19 Cognitive City , uma rede social focada em impedir a propagação do coronavírus.

O desafio Kaggle

O Semantic Scholar e o Google Scholar, que também consolida trabalhos de pesquisa relevantes, já são ferramentas poderosas para pesquisar o corpus de conhecimento gerado no COVID-19. O Semantic Scholar utiliza transformadores, o estado da arte no processamento de linguagem natural (PNL) . O Google também adicionou o BERT, uma implementação de transformadores, em uma atualização recente ao seu mecanismo de pesquisa .

A comunidade, no entanto, está interessada em saber se eles podem forçar os limites dos algoritmos atuais de IA e explorá-los para ajudar ainda mais os cientistas em sua luta contra o COVID-19.

Após o lançamento do CORD-19, a Kaggle, o hub de propriedade do Google para competições de ciência de dados e aprendizado de máquina, lançou o Desafio de conjunto de dados de pesquisa aberta COVID-19 . “Estamos emitindo um apelo à ação dos especialistas em inteligência artificial do mundo para desenvolver ferramentas de mineração de texto e dados que possam ajudar a comunidade médica a desenvolver respostas para perguntas científicas de alta prioridade”, diz a descrição do desafio.

Para poder medir o progresso e o sucesso, o desafio foi dividido em uma lista de 10 tarefas que podem ajudar a entender melhor as novas informações sobre COVID-19, atendimento ao paciente e cura do desenvolvimento.

Por exemplo, uma tarefa envolve intervenções não farmacêuticas . A IA que executa essa tarefa deve ser capaz de examinar o conjunto de dados e encontrar documentos que discutam os NPIs e sua eficácia, como a proibição de viagens e o fechamento de escolas estão ajudando a achatar a curva COVID-19. Outra tarefa envolve reunir as últimas descobertas sobre os fatores de risco COVID-19.

Os resultados devem incluir informações complementares, como a força das evidências encontradas nos estudos, o que pode ajudar no processo de tomada de decisão.

“As descobertas devem ser focadas, concisas, extrair cotações e números dos papéis e também fornecer um link para a fonte subjacente”, escreveu Anthony Goldbloom, CEO da Kaggle, em um comunicado sobre o desafio do CORD-19.

Até o momento em que este artigo foi escrito, houve mais de 730 colaboradores no Desafio CORD-19.

Onde está a tecnologia da IA ​​hoje

As tarefas incluídas no Desafio CORD-19 são tarefas muito práticas e os resultados afetarão diretamente nossa resposta à pandemia de coronavírus. Mas uma coisa a notar é que não podemos esperar milagres das tecnologias contemporâneas de inteligência artificial.

O processamento da linguagem é talvez o subcampo mais desafiador da IA e as funções mais complexas do cérebro humano, a única coisa que nos diferencia de outros seres vivos. Segundo muitos especialistas, o problema do processamento da linguagem permanecerá sem solução até criarmos uma inteligência geral artificial , o tipo de IA que possui recursos de abstração, raciocínio e solução de problemas no nível humano. E, segundo muitos relatos, estamos a pelo menos décadas da IA ​​em geral.

No momento, nossos modelos mais avançados de PNL contam com aprendizado profundo e redes neurais artificiais . As redes neurais são modelos estatísticos muito eficientes que podem encontrar padrões recorrentes em grandes seqüências de dados. Modelos de aprendizado profundo como transformadores, agora usados ​​nos modelos de linguagem mais avançados, podem operar em corpora muito grandes de texto e responder a consultas de maneiras que estavam além das capacidades dos algoritmos de inteligência artificial anteriores.

No entanto, quando se trata de extrair os significados implícitos que geralmente são omitidos na linguagem escrita e falada, até os algoritmos de IA mais sofisticados enfrentam dificuldades . Ainda não temos IA capaz de entender e processar a linguagem humana com a mesma eficiência que uma criança de sete anos.

Mas o lado positivo é que esse desafio em particular envolve um campo muito restrito de pesquisa. Ao contrário do entendimento geral da linguagem natural, o Desafio CORD-19 tem um requisito muito específico: procurar informações sobre um vírus e uma doença.

Embora os sistemas atuais de IA não tenham uma solução geral para os problemas, eles são muito bons em lidar com domínios estreitos, geralmente com desempenho ainda melhor que os humanos. De fato, de acordo com a Goldbloom, “Alguns dos trabalhos mais impactantes até agora envolveram métodos simples, como correspondência de seqüências de caracteres e expressões regulares “. Correspondência de seqüência de caracteres e expressões regulares nem sequer são consideradas AI hoje.

Outro fator que fornece esperança é a qualidade da informação. Um dos desafios do aprendizado de máquina é reunir e limpar os dados usados ​​no treinamento dos modelos. Nesse caso, há um esforço conjunto de toda a comunidade e muito esforço manual e automatizado está sendo feito para garantir que tenhamos um corpo consolidado de documentos confiáveis ​​para pesquisa.

Portanto, provavelmente não podemos esperar o surgimento de um sistema de IA que possa ler e entender todos os documentos como um cientista humano faria. Os esforços anteriores para criar esses sistemas de IA falharam e não houve nenhum avanço fundamental para mostrar esperança de mudança nesse sentido.

Mas o que podemos esperar é o desenvolvimento de ferramentas de pesquisa baseadas em IA muito especializadas que ajudarão nossos cientistas a encontrar bits relevantes no crescente mar de informações publicadas no COVID-19. Contanto que você saiba quais perguntas fazer – e as pessoas que usam esses sistemas certamente o farão -, você poderá obter informações de qualidade.

Como escreveu o CEO da A12 , Oren Etzioni, na Wired na semana passada : “Enquanto o júri ainda não divulgou as contribuições da AI nas próximas semanas, é claro que a comunidade da AI se alistou para combater o Covid-19. É irônico que a IA que causou tanta consternação com reconhecimento facial, falhas profundas e agora esteja na linha de frente de ajudar os cientistas a enfrentar o Covid-19 e futuras pandemias … Nosso uso da IA ​​para combater o Covid-19 nos lembra que a IA é uma ferramenta, não um ser, e cabe a nós empregar essa ferramenta para o bem comum. ”

Fonte: thenextweb.com

LEIA TAMBÉM: Coronavírus, governo chinês lança app detector de contato próximo

DEIXE UMA RESPOSTA

Please enter your comment!
Please enter your name here