Autores
Anatoli Evdokimov, Alina Enikeeva, Paean Luby e Arryn Robbins

Jovens revisores

Harkirat e Hrdaya

Resumo

O rastreamento ocular é uma tecnologia que pode registrar os movimentos dos olhos e revelar aos cientistas para o que as pessoas olham em uma tela ou no mundo. Cientistas usam o rastreamento ocular para entender o que os indivíduos notam ou do que se lembram; pesquisadores de marketing que criam anúncios o utilizam para descobrir quais comerciais ou produtos captam a atenção dos consumidores; e designers de videogames usam a tecnologia para avaliar quais partes de um game são confusas para os jogadores, assim podem consertá-las. O equipamento utilizado para o rastreamento ocular pode ser caro e gerar um processo muito demorado para pesquisadores, então será que há outra forma de registrar os movimentos dos olhos sem precisar comprar um rastreador visual? Há sim! Cientistas da computação podem usar um método baseado em computadores chamado aprendizado de máquina para fazer com que uma webcam do dia a dia se torne um rastreador ocular — eles conseguem fazer isso até com telefones celulares. Neste artigo, você aprenderá sobre como o rastreador ocular funciona e quais as vantagens e desvantagens de utilizar webcams para rastrear olhos.

Os olhos são janelas para a mente

Você já conversou com um amigo e percebeu que os olhos dele não estavam mais olhando para você, e sim para algo atrás de você? O que fez? Você provavelmente se virou para ver o que seu amigo estava olhando. Isso mostra que os movimentos dos olhos nos dizem ao que as pessoas estão prestando atenção. Os cientistas registram os movimentos dos olhos para entender do que os indivíduos se recordam e o que capta sua atenção, como leem e até mesmo para detectar certos distúrbios. Um rastreador ocular* é uma câmera que tira fotos dos olhos de alguém [1]. Esse equipamento estuda as informações dessas imagens (como o formato das pupilas) para identificar para onde a pessoa está olhando e é capaz de tirar centenas ou até milhares de fotos por segundo! O grande número de imagens permite que os rastreadores oculares sejam muito precisos ao identificar quando uma pessoa olha para algo e onde está o que chamou a atenção dela.

Se um rastreador ocular registrar os movimentos dos seus olhos enquanto você assiste a um vídeo, um cientista poderá usar esses dados para entender ao que você prestava atenção ao olhar para a tela e por quanto tempo. Por exemplo, um rastreador ocular pode detectar suas fixações*: quando seus olhos parecem ter parado de se mover para olhar algo. Fixações mais longas (como quando você olha fixamente para algo) podem significar que está realmente focado em um personagem do vídeo; já fixações mais curtas e frequentes podem revelar que você está distraído por outros personagens ou objetos, ou tendo dificuldade para entender o que está acontecendo na tela. O rastreador também consegue detectar se os seus olhos acompanham o deslocamento dos personagens sem você nem perceber (Figura 1). Os movimentos amplos e abrangentes que seus olhos fazem entre as fixações são chamados de sacadas* (para obter mais informações sobre os movimentos dos olhos, consulte este artigo: Frontiers for Young Minds article).

.

Figura 1 – Um tablet mostra um vídeo com caminhos de varredura ocular. Um caminho de varredura se refere à trajetória que os olhos percorrem quando uma pessoa está olhando para algo. Os círculos grandes representam fixações, em que os olhos do indivíduo parecem parar, e as linhas mostram as sacadas que os olhos fazem entre as fixações. Para quais trechos deste vídeo a pessoa mais olhou?

Ensinando computadores a prever a localização do olhar

No laboratório os cientistas usam um equipamento especial de rastreamento ocular que é muito bom para identificar para onde uma pessoa está olhando na tela, o que é chamado de localização do olhar (Figura 2). Embora os rastreadores oculares sejam ferramentas excelentes, eles apresentam alguns problemas. Em primeiro lugar, o equipamento pode ser muito caro, por isso nem todo cientista que deseja pesquisar os movimentos oculares pode adquiri-lo. Em segundo, os rastreadores só podem medir os movimentos oculares presencialmente e com uma pessoa por vez — isso significa que pesquisas que exigem muitos indivíduos podem levar muito tempo para ser realizadas. Além disso, pode ser mais complicado encontrar pessoas dispostas a participar se elas tiverem de ir a um laboratório.

Figura 2 – (A) Uma participante trabalha em um computador com sistema de rastreamento ocular, que utiliza muitos equipamentos técnicos e exige que a pessoa mantenha a cabeça imóvel apoiada no queixo. Todos esses aparelhos tornam o sistema muito preciso para identificar para onde a participante está olhando na tela do computador. (B) Um indivíduo trabalha em um computador com webcam integrada. A câmera não requer tantos equipamentos e os participantes podem se sentar confortavelmente e mover a cabeça livremente.

Esses desafios no uso de aparelhos de rastreamento ocular podem ser superados com webcams para rastrear os olhos. Essas câmeras podem ser encontradas nos dispositivos pessoais mais comuns, como telefones ou computadores, tornando mais fácil para os cientistas alcançar um grupo diversificado de participantes, uma vez que estes não precisam ir a um laboratório. As webcams também são muito mais baratas do que os equipamentos de rastreamento ocular, e os cientistas poderiam usá-las para coletar dados de movimentos oculares remotamente, o que economizaria tempo e dinheiro [2]. Essas câmeras não foram projetadas para rastrear os olhos, então como os cientistas obtêm dados do movimento ocular ao utilizá-las? Existem várias maneiras de usar webcams como rastreadores oculares, mas um modo popular é com o aprendizado de máquina.* [3]

O aprendizado de máquina é uma forma de os computadores utilizarem dados (como imagens ou números) e um conjunto de cálculos matemáticos para se instruir com a experiência e encontrar padrões no mundo. Usando o aprendizado de máquina, os computadores podem aprender com muitas fotos de rostos de pessoas. Quando estava brincando com seus amigos, você já percebeu para onde eles estavam olhando, como um brinquedo legal ou um lanche gostoso? Você usa pistas para descobrir isso, como: movimentos dos olhos, para onde a cabeça deles está virada ou o quão perto eles estão de algo. Os computadores podem fazer algo semelhante. Eles olham milhares de fotos de rostos de pessoas e tentam encontrar padrões nessas imagens, assim como seu cérebro encontra padrões nas ações de seus amigos. Os computadores utilizam esses padrões para adivinhar para onde alguém pode estar olhando quando olha para um rosto, por exemplo. Os cientistas melhoraram o aprendizado de máquina para fazer previsões mais precisas do local para onde uma pessoa está olhando usando outras informações úteis, como pontos de referência dos olhos e da face que apontam bordas em um rosto (Figura 3); informações detalhadas, como a distância que alguém está da webcam; e até informações da cena na tela [4].

Figura 3 – Imagens de webcam com pontos de referência faciais.

Os pontos de referência no rosto desta mulher estão localizados em bordas e áreas importantes do rosto, como a mandíbula, a boca, as sobrancelhas e o mais importante, os olhos. O aprendizado de máquina pode usar pontos de referência para fazer previsões mais apuradas da localização do olhar a partir de imagens de câmeras como esta.

Os desafios do rastreamento ocular por webcam

Embora o rastreamento ocular por webcam possa ajudar os cientistas a tirar conclusões sobre a localização do olhar das pessoas por um custo baixo, ele está longe de ser perfeito. O rastreamento ocular da webcam não é muito esclarecedor ao definir para onde os olhos realmente estão olhando. Comparado a um equipamento de rastreamento ocular de laboratório, a webcam não é muito boa em separar as variações de movimentos oculares. Isso ocorre porque as fotos tiradas com uma câmera são de qualidade inferior às de um rastreador de laboratório. Além disso, a quantidade de frames por segundo (que define a rapidez com que as câmeras podem tirar fotos) é muito diferente. Uma webcam pode tirar cerca de 30 fotos por segundo. Embora possa parecer muito, os rastreadores oculares de laboratório podem capturar centenas ou até milhares de imagens no mesmo período! Tirar menos fotos por segundo significa que a webcam não consegue capturar determinados movimentos oculares que acontecem muito rapidamente.

Os cientistas podem usar webcams para rastrear o padrão geral dos movimentos oculares, mas as medições não são exatas para movimentos oculares mais discretos. Quando alguém deseja rastrear movimentos oculares de personagens e cenas amplas em um vídeo ou anúncio, a baixa precisão pode não ser um grande problema. No entanto, quando os cientistas realizam experiências, necessitam de mais precisão para rastrear movimentos oculares lentos ou rápidos, como os que ocorrem durante a leitura ou a procura de pequenos objetos em uma cena. Por exemplo, digamos que você está focado em uma pessoa falando em um vídeo, então move seu olhar para ver um animal se mexendo ao fundo logo atrás dela e, em seguida, volta os olhos para quem está falando. Essas rápidas mudanças no olhar podem não ser detectadas no rastreamento ocular da webcam. Além disso, pense sobre onde e como você normalmente assiste a vídeos, navega na internet ou usa uma câmera. É possível que, às vezes, você esteja no escuro e se movimentando. Como as webcams têm qualidade de imagem inferior em comparação com os rastreadores oculares de laboratório, elas são ideais quando as pessoas estão em salas com boa iluminação e permanecem quietas durante o processo. Já quando os pesquisadores coletam imagens de webcam remotamente, nem sempre é possível ter certeza de que os indivíduos estão nessas condições. 

Olhando além: o futuro do rastreamento ocular

O rastreamento ocular por webcam pode ser uma abordagem mais barata e que economiza tempo para pesquisadores que desejam estudar os movimentos oculares. No entanto, existem limitações em seu uso para esse fim, pois elas não são tão precisas quanto os rastreadores oculares de laboratório em prever para onde alguém está olhando. Os cientistas estão trabalhando para melhorar os métodos de rastreamento ocular via webcams, como o uso de aprendizado de máquina, para que elas possam prever os movimentos oculares mais corretamente. Esse trabalho é importante porque ajuda a tornar a tecnologia de rastreamento ocular fácil de usar para todos, permitindo que os cientistas aprendam mais sobre como vemos e interagimos com o mundo que nos rodeia, mesmo no conforto da nossa casa.

Glossário

Rastreador ocular:   Equipamento de tecnologia que pode registrar os movimentos oculares das pessoas e dizer aos cientistas o que os participantes estão olhando e por quanto tempo.

Fixações:    O tempo entre amplos movimentos oculares quando os olhos parecem ter parado para olhar algo.

Sacadas:   Um movimento grande e abrangente que seus olhos fazem entre as fixações.

Aprendizado de máquina:   Forma de analisar dados que permite aos computadores aprender com a experiência.

Pontos de referência:    Áreas que ajudam um computador a entender onde estão as bordas de partes importantes de um rosto em uma imagem, como os cantos dos olhos ou o queixo.

Precisão:    O nível de correção que o sistema de rastreamento determina para onde alguém está olhando. 

Agradecimentos

O consentimento informado por escrito foi obtido do(s) indivíduo(s) para a publicação de quaisquer imagens ou dados identificáveis incluídos neste artigo.

Conflito de interesses

Os autores declaram que a pesquisa foi realizada na ausência de quaisquer relações comerciais ou financeiras que pudessem ser interpretadas como potencial conflito de interesses.

Referências

[1]  Robbins, A., e Hout, M. C. 2015. Look into my eyes. Sci. Am. Mind 26:54-61. doi: 10.1038/scientificamericanmind0115-54

[2]  Papoutsaki, A., Laskey, J., e Huang, J. 2017. “Searchgazer: Webcam eye tracking for remote studies of web search”, em Proceedings of the 2017 Conference on Conference Human Information Interaction and Retrieval (Nova York, NY: ACM), 17-26.

[3]  Valliappan, N., Dai, N., Steinberg, E., He, J., Rogers, K., Ramachandran, V., et al. 2020. Accelerating eye movement research via accurate and affordable smartphone eye tracking. Nat. Commun. 11:4553. doi: 10.1038/s41467-020-18360-5

[4]  Park, S., Aksan, E., Zhang, X., e Hilliges, O. 2020. “Towards end-to-end video-based eye-tracking”, em Computer Vision–ECCV 2020: 16th European Conference, Glasgow, UK, August 23-28, 2020, Proceedings, Part XII 16 (Berlin: Springer International Publishing), 747-63.


Citação

Evdokimov A, Enikeeva A, Luby P e Robbins A (2024) How Scientists Use Webcams to Track Human Gaze.Front. Young Minds. 12:1259404. doi: 10.3389/frym.2024.1259404

Editora

Kristina Shea

Mentores de ciência

Srinivasa Ramanujam Kannan e doutora Jasleen Kaur

Datas de publicação

Enviado: 15 de julho de 2023; aceito: 22 de março de 2024; publicado on-line: 9 de abril de 2024.

Copyright © 2024 Evdokimov, Enikeeva, Luby e Robbins

Autores

Anatoli Evdokimov

Tolya está na faculdade cursando uma especialização dupla, em ciência da computação e ciências cognitivas. Ele trabalha em projetos de aprendizado com máquinas e cognição visual no Robbins Lab, da Universidade de Richmond. Ele adora construir modelos computacionais éticos e imparciais que irão aprimorar nossa compreensão da cognição humana. No tempo livre, Tolya gosta de coletar conjuntos de dados on-line e aprender a criar visualizações interessantes. Ele também adora patinação no gelo, gatos e café.

Alina Enikeeva

Alina está fazendo uma dupla especialização, em ciência da computação e psicologia, na Universidade de Richmond. Ela gosta de trabalhar em áreas em que esses dois campos se encontram e descobrir maneiras de integrar tecnologia e pesquisas de psicologia. Além disso, Alina aprecia explorar o autoconhecimento praticando meditação e ajudando outras pessoas como voluntária em Organizações Não Governamentais (ONGs).  

Paean Luby

Paean está estudando na Universidade de Richmond. Ela é uma aspirante a engenheira de software de realidade virtual que deseja se tornar professora de ciência da computação. Após a morte dos avós, por demência e acidente vascular cerebral, ela vem dedicados seus estudos a retardar doenças neurodegenerativas utilizando ambientes enriquecidos por simulação digital. Atualmente, Paean está realizando pesquisas pré-clínicas de neurociência comportamental no Lambert Lab, além de liderar um projeto de pesquisa visual baseado em aprendizado de máquina no Robbins Visual Cognition Lab. Na pós-graduação, ela pretende expandir o potencial da realidade virtual como tratamento para doenças neurodegenerativas.

Arryn Robbins

A doutora Robbins é professora assistente no departamento de psicologia da Universidade de Richmond. Como cientista cognitiva, vem realizando sua pesquisa em cognição visual (incluindo movimentos oculares e busca visual), particularmente sobre como as pessoas encontram coisas categorizadas ou que nunca viram antes. Ela também investiga o comportamento de segurança, especialmente ao dirigir. Nas horas vagas, a doutora Robbins gosta de estar ao ar livre com a família e os cachorros.

*Arobbins@richmond.edu

Jovens revisores

Harkirat – 9 anos

Oi, estou no 4o ano e adoro sonhar, rabiscar e solucionar quebra-cabeças! Eu gosto muito de unicórnios, sou superboa em amarelinha e consigo resolver o cubo mágico super-rápido! Um dia, eu quero provar todos os cookies e encontrar o mais gostoso. Quando não estou na escola, ou eu estou lendo livros legais, ou construindo coisas incríveis com o meu Lego, ou me desafiando com quebra-cabeças difíceis.  

Hrdaya- 10 anos 

Hrdaya ama ler livros e gosta de achar erros de ortografia ou gramática em revistas desde os 4 anos. Inglês é sua matéria favorita. Seus hobbies incluem ler livros, praticar xadrez, jogar cartas e dançar. Ela tem curiosidade para entender mais sobre as coisas ao redor, ama cachorrinhos e pássaros.  

Este é um artigo de acesso aberto distribuído sob os termos da Creative Commons Attribution License (CC BY). O uso, distribuição ou reprodução em outros fóruns é permitido, desde que o(s) autor(es) original(ais) e o(s) proprietário(s) dos direitos autorais sejam creditados e a publicação original nesta revista seja citada, de acordo com a prática acadêmica aceita. Não é permitido o uso, distribuição ou reprodução que não esteja em conformidade com estes termos.

Texto traduzido do site https://kids.frontiersin.org/articles/10.3389/frym.2024.1259404

Ixi! Você bateu no paywall!

Ainda não é assinante? Assine agora e tenha acesso ilimitado ao conteúdo do Joca.

Assinante? Faça Login

Voltar para a home

Ou faça sua assinatura e tenha acesso a todo o conteúdo do Joca

Assine

Comentários (0)

Compartilhar por email

error: Contéudo Protegido