Principais conclusões
- A inovação de IA do Google agora auxilia em diagnósticos clínicos, graças ao treinamento em variações sonoras.
- O modelo HeAR do Google é treinado para detectar sinais de tuberculose e outras doenças pulmonares analisando sons de tosse do paciente.
- Uma empresa parceira está usando o HeAR do Google para melhorar as avaliações pulmonares e o diagnóstico de TB, mostrando 94% de precisão.
A inovação de IA do Google se expandiu dramaticamente nos últimos dois anos, desde que os aplicativos de IA voltados para o consumidor ganharam popularidade. Hoje, o Gemini do Google é mais do que um chatbot na web — ele está firmemente integrado a vários recursos e aplicativos na nova série Google Pixel 9, mas a empresa ainda depende muito da inovação. Um relatório recente revela que o Google agora está trabalhando com vários parceiros internacionais para auxiliar diagnósticos clínicos com IA treinada para reconhecer doenças por variações no mero som de sintomas como tosse e espirro.
Além da maravilha da IA em si, o Google atingiu um marco importante com o Gemini, e mais especificamente, o Gemini Nano. É um modelo menor e em escala reduzida da IA generativa, que pode ser executado no dispositivo na maioria dos telefones Android modernos. Isso o torna independente da instabilidade da rede celular e de outras variáveis associadas ao processamento em nuvem de consultas para modelos de IA. A Bloomberg relata que o titã da tecnologia se uniu a uma start-up indiana, a Salcit Technologies, especializada em aprimorar a saúde respiratória usando IA, para criar uma solução semelhante que esperamos que seja executada no dispositivo eventualmente.
É fácil ver onde isso vai dar — os modelos de IA no dispositivo do Google podem ajudar a acelerar o diagnóstico de doenças respiratórias em áreas remotas onde a assistência médica primária e o acesso a equipamentos médicos caros continuam sendo uma preocupação. Essa parceria já rendeu um resultado, que o Google está chamando de modelo HeAR, abreviação de Health Acoustic Representations.
IA generativa para o resgate
O HeAR é essencialmente um modelo de IA de base do Google que é treinado em 300 milhões de clipes de áudio de tosses, fungadas, espirros e respiração de todo o mundo disponíveis em conteúdo publicamente visível. Embora imperceptíveis para o ouvido destreinado, esses clipes soam diferentes da respiração de uma pessoa saudável. Os dados de treinamento do Google para o HeAR também incluíram 100 milhões de sons de tosse para ajudar a rastrear rapidamente as pessoas para doenças como tuberculose. A Salcit Technologies está usando o HeAR do Google para melhorar as avaliações pulmonares e o diagnóstico de TB entregues por sua IA interna chamada Swaasa.
Embora o diagnóstico assistido por IA não substitua a avaliação clínica e o tratamento adequados, o Swaasa foi aprovado para uso pelo regulador de dispositivos médicos indiano. Executando como um aplicativo em um dispositivo móvel, o Swaasa precisa de um clipe de áudio de 10 segundos do paciente tossindo para diagnosticar doenças com 94% (alegada) de precisão. Embora o método não garanta confiabilidade infalível e tenha seus próprios problemas, como gravações claras, ele já é mais barato do que o teste de espirometria típico usado para diagnosticar TB e outras doenças.
Mais importante, o Swaasa ainda depende do processamento em nuvem e tem amplo espaço para melhorias antes que o HeAR possa ser implementado no dispositivo. Enquanto isso, o Google está apostando em tecnologia de IA semelhante para treinar modelos de base para detectar autismo com base em sons que uma criança faz. Tempos emocionantes.