Saúde

Estudo: Google revela novos recursos dos LLMs da Med-Gemini

Um estudo executado por Google Pesquisa em colaboração com Google DeepMind revela que a gigante da tecnologia expandiu as capacidades de seus modelos de IA para Med-Gemini-2D, Med-Gemini-3D e Med-Gemini Polygenic.

O Google disse que aprimorou os recursos do Med-Gemini usando dados de histopatologia, dermatologia, radiologia 2D e 3D, dados genômicos e oftalmológicos.

O Med-Gemini-2 da empresa foi treinado em imagens médicas convencionais codificadas em 2D, como cortes de tomografia computadorizada, patches patológicos e radiografias de tórax.

Med-Gemini-3D analisa dados médicos 3D, e o Google treinou Med-Gemini-Polygenic em recursos que não são de imagem, como genômica.

O estudo revelou que o modelo refinado do Med-Gemini-2D excedeu os resultados anteriores de geração de relatórios habilitados para IA para radiografias de tórax em 1% a 12%, com os relatórios sendo “equivalentes ou melhores” do que os relatórios originais dos radiologistas.

O modelo também superou seu desempenho anterior em termos de resposta visual a perguntas de radiografias de tórax, graças a melhorias no codificador visual e no componente de linguagem do Gemini.

Ele também teve um bom desempenho na classificação de radiografias de tórax e na resposta a perguntas visuais de radiologia, excedendo as linhas de base anteriores em 17 das 20 tarefas; entretanto, em oftalmologia, histopatologia e dermatologia, o Med-Gemini-2D ultrapassou os valores iniciais em 18 das 20 tarefas.

Med-Gemini-3D poderia ler varreduras 3D, como tomografias computadorizadas, e responder perguntas sobre as imagens.

O modelo provou ser o primeiro LLM capaz de gerar laudos para tomografias computadorizadas 3D; no entanto, apenas 53% dos relatórios foram clinicamente aceitáveis. A empresa reconheceu que pesquisas adicionais são necessárias para que a tecnologia alcance a qualidade dos relatórios de radiologistas especializados.

Med-Gemini-Polygenic é o primeiro modelo da empresa que utiliza dados genômicos para prever resultados de saúde.

Os autores escreveram que o modelo superou “a abordagem padrão linear baseada em pontuação de risco poligênico para previsão de risco de doenças e generaliza para doenças geneticamente correlacionadas para as quais nunca foi treinado”.

A MAIOR TENDÊNCIA

Os pesquisadores relataram limitações do estudo, afirmando que é necessário otimizar os modelos multimodais para diversas aplicações clínicas relevantes, avaliá-los extensivamente nos conjuntos de dados clínicos apropriados e testá-los fora dos padrões acadêmicos tradicionais para garantir segurança e confiabilidade em situações do mundo real.

Os autores do estudo também observaram que “uma gama cada vez mais diversificada de profissionais de saúde precisa estar profundamente envolvida em futuras iterações desta tecnologia, ajudando a orientar os modelos para capacidades que tenham utilidade valiosa no mundo real”.

Foram mencionadas diversas áreas nas quais as avaliações futuras deveriam se concentrar, incluindo a redução da lacuna entre o benchmark e a beira do leito, a minimização da contaminação de dados em grandes modelos e a identificação e mitigação de riscos de segurança e distorções de dados.

“Embora as capacidades avançadas em tarefas médicas individuais sejam úteis por si só, vislumbramos um futuro em que todas estas capacidades sejam integradas em sistemas abrangentes para executar uma série de tarefas clínicas multidisciplinares complexas, trabalhando em conjunto com seres humanos para maximizar a eficácia clínica e melhorar resultados dos pacientes Os resultados apresentados neste estudo representam um passo para concretizar esta visão”, escreveram os pesquisadores.

Source

Related Articles

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button