Pular para o conteúdo principal

Sonar cria avatar em tempo real com seu olhar e expressão facial

 

Sonar em óculos inteligentes rastreia olhares e expressões faciais
Protótipo de laboratório dos óculos que monitoram olhos e rosto usando uma espécie de sonar.
[Imagem: Jason Koski/Cornell University]


Sonar facial

Pesquisadores incorporaram em óculos duas tecnologias de detecção semelhantes a um sonar, que permitem rastrear o olhar e as expressões faciais da pessoa.

Embora ainda precise de um banho de design, a tecnologia é pequena o suficiente para caber em aparelhos disponíveis no mercado, como óculos inteligentes, óculos de realidade virtual ou fones de realidade aumentada, e com a grande vantagem de que ela consome significativamente menos energia do que aparelhos semelhantes que usam câmeras.

Os dois sistemas usam alto-falantes e microfones miniaturizados para dirigir para o rosto ondas sonoras inaudíveis ao ser humano, e então captar os sinais refletidos causados pelos movimentos do rosto e dos olhos. O primeiro dispositivo, que a equipe batizou de GazeTrak, é o primeiro sistema de rastreamento ocular baseado em sinais acústicos. O segundo, EyeEcho, é o primeiro sistema baseado em óculos que detecta expressões faciais de forma contínua e precisa e as recria através de um avatar em tempo real.

"[O sistema] é pequeno, barato, e de baixo consumo de energia, então você pode usá-lo em óculos inteligentes todos os dias - não vai acabar com a bateria," disse o professor Cheng Zhang, da Universidade Cornell, nos EUA, acrescentando que o protótipo funciona no laboratório "por várias horas" na bateria de óculos inteligentes e mais de um dia em um óculos de realidade virtual.

Sonar em óculos inteligentes rastreia olhares e expressões faciais
Além do ineditismo do sistema acústico, o equipamento consome pouquíssima energia das baterias.
[Imagem: Jason Koski/Cornell University]

Sonar com inteligência artificial

Para o GazeTrak, os pesquisadores posicionaram um alto-falante e quatro microfones ao redor da parte interna de cada armação ocular, para disparar e captar ondas sonoras do globo ocular e da área ao redor dos olhos. Os sinais sonoros resultantes entram em um sistema de aprendizado profundo personalizado que usa inteligência artificial para inferir continuamente a direção do olhar da pessoa.

Para o EyeEcho, bastam um alto-falante e um microfone, localizados próximos às dobradiças dos óculos, apontando para baixo para captar o movimento da pele conforme as expressões faciais mudam. Os sinais refletidos também são interpretados usando IA.

As leituras dos olhos e das feições são então usadas para atualizar em tempo real as feições de um avatar digital. Assim, os usuários podem fazer videochamadas em viva-voz por meio desse avatar, mesmo em um café barulhento ou na rua.

Embora alguns óculos inteligentes tenham a capacidade de reconhecer rostos ou distinguir entre algumas expressões específicas, atualmente nenhum rastreia expressões continuamente, garante a equipe.

Sonar em óculos inteligentes rastreia olhares e expressões faciais
Detalhes do equipamento e seu uso para recriar expressões de um avatar.
[Imagem: Jason Koski/Cornell University]

Aplicações recreativas e médicas

As duas tecnologias têm aplicações que vão além do aprimoramento da experiência de realidade virtual. O GazeTrak, por exemplo, pode ser usado com leitores de tela, para ler trechos de texto para pessoas com baixa visão conforme navegam em um site.

Combinados, os dois também poderiam ajudar a diagnosticar ou monitorar doenças neurodegenerativas, como Alzheimer e Parkinson. Com essas condições médicas, os pacientes muitas vezes apresentam movimentos oculares anormais e rostos menos expressivos, e este tipo de tecnologia poderia acompanhar a progressão da doença no conforto da casa do paciente, sugere a equipe.

Bibliografia:

Artigo: EyeEcho: Continuous and Low-power Facial Expression Tracking on Glasses
Autores: Ke Li, Ruidong Zhang, Siyuan Chen, Boao Chen, Mose Sakashita, François Guimbretière, Cheng Zhang
Revista: CHI conference on Human Factors in Computing Systems (CHI’24)
DOI: 10.1145/3613904.3642613
Fonte: https://www.inovacaotecnologica.com.br/

Comentários

Postagens mais visitadas deste blog

LG lança no Brasil monitor ultrawide curvo WQHD de 34 polegadas com taxa de atualização de 100 Hz

A LG lançou no no Brasil um novo monitor UltraWide curvo com painel VA de 34 polegadas com resolução WQHD. Batizado de 34WR50QC-B, esse modelo tem suporte a tecnologia AMD FreeSync , e a taxa de atualização é de 100 Hz. Dentre outros recursos suportados, a LG destaca a função Picture By Picture (PBP), que permite a visualização de múltiplos conteúdos a partir de dois computadores diferentes simultaneamente, recurso ideal para espaços de coworking onde duas pessoas podem compartilhar o mesmo monitor. O monitor também promete 99% de cobertura do espaço de cor sRGB e suporte ao HDR10. “O novo monitor contempla características para o conforto visual durante a utilização, a partir das funções Reader Mode, onde os consumidores podem ajustar a temperatura de cor e a luminância para contribuir com a redução dos níveis de fadiga ocular e Flicker Safe, que controla a intensidade de brilho (cintilância) do monitor praticamente imperceptível ao olho humano, ajudando assim a re

Reator de fusão nuclear supera dois obstáculos operacionais importantes

  Um trabalhador dentro da câmara de vácuo do tokamak DIII-D durante uma parada para manutenção. [Imagem: Rswilcox] Plasma estável por mais tempo Uma reação de  fusão nuclear  superou duas barreiras cruciais para operar em um "ponto ideal" necessário para a produção de energia: Aumentar a densidade do plasma e manter esse plasma contido mais denso. O feito foi alcançado em um pequeno reator experimental do tipo  tokamak , chamado DIII-D, pertencente ao Departamento de Energia dos EUA, mas operado pela empresa General Atomics. Existem várias abordagens na tentativa de chegar à fusão nuclear sustentada, como a mais famosa  fusão inercial a laser , que vem batendo todos os recordes até agora, a  fusão magneto-inercial , o  reator SPARC do MIT  e o  reator de fusão privado Trenta . Mas os tokamaks representam de longe a versão mais utilizada em todo o mundo, consistindo em uma uma câmara em formato de pneu onde um plasma mais quente do que a superfície do Sol precisa ser contido

Gemini: IA do Google chega ao Android no Brasil; veja como usar

O Google disponibilizou o Google Gemini para download em celulares Android, via Google Play. Além de funcionar como um chatbot baseado em inteligência artificial , como o ChatGPT , o app pode substituir o assistente digital padrão do Google, ativado pelo comando de voz “ok Google”. Ao ser instalado, o app pergunta ao usuário se quer substituir o tradicional assistente pelo Gemini, mostrando algumas das diferenças entre os sistemas. Dentre as habilidades do Gemini estão “criar imagens personalizadas, escrever e-mails e postagens, aprender de forma prática, definir alarmes, timers e lembretes e muito mais”, de acordo com o app. Recursos oferecidos pelo assistente antigo, como “usar as rotinas do Assistente” e “traduza conversas em tempo real” não aparecem na lista de recurso do Gemini, na tela inicial do app. Em testes da reportagem, o Gemini não atendeu ao pedido “toque uma música no Spotify”, respondendo “ainda não posso te ajudar com este provedor, mas estou aprendendo”. O