Dois novos artigos de pesquisa examinam o que acontece quando comportamentos humanos são vinculados às capacidades de modelos de IA. Os primeiros resultados mostram que ao espelhar o comportamento humano as inteligências artificiais podem gerar melhores designs tanto para teclados como para gráficos. Os modelos Chartist e Typoist interagem, respectivamente, com visualizações de dados e teclados touchscreen, da mesma forma que um usuário humano faria, proporcionando uma visão mais clara de como e por que esses modelos operam da maneira que operam.
O modelo Chartist consegue ler e compreender gráficos como um humano, o que pode fornecer feedback instantâneo para a criação de designs mais compreensíveis. Os erros de digitação semelhantes aos humanos cometidos pelo Typoist, criado em conjunto com a equipe do Google Gboard, podem ajudar a tornar a entrada de texto em dispositivos móveis mais precisa. Ambos os modelos serão apresentados na CHI, a principal conferência de pesquisa em interação humano-computador.
Se você pedir para as pessoas olharem para o mesmo gráfico estatístico e responderem a perguntas com base nos dados, seus movimentos oculares irão variar bastante, como mostrado na imagem de exemplo. “Como as pessoas movem os olhos em um gráfico e como elas usam isso para compreender do que se trata o gráfico, essas duas coisas estão inter-relacionadas”, diz o professor Antti Oulasvirta, do Centro Finlandês de Inteligência Artificial (FCAI) e da Universidade Aalto. O Chartist pode replicar a diversidade dos movimentos oculares humanos ao ler gráficos. Combinado com a capacidade de um modelo de linguagem grande, o Chartist pode então integrar o que foi visualizado em cada ponto de um gráfico. “Essa conexão nunca foi feita antes”, continua Oulasvirta. “Podemos pedir ao modelo para coletar informações de um gráfico para responder a uma pergunta específica, e ele pode dar sentido ao gráfico como um todo, de maneiras que realmente simulam o comportamento humano.”
O raciocínio passo a passo de como o modelo Chartist chega às suas conclusões também é transparente, explica o pesquisador de pós-doutorado Danqing Shi , que é o primeiro autor dos artigos Chartist e Typoist. Essa abordagem de “caixa de vidro” é importante para tornar os modelos de IA explicáveis, em oposição às caixas-pretas onde o processo de tomada de decisão fica oculto. Concretamente, modelos como o Chartist podem ajudar as pessoas a fazer melhores visualizações de dados, simulando a facilidade de leitura e compreensão de diferentes designs de gráficos. “O Chartist também pode potencialmente pegar qualquer imagem de gráfico e permitir que uma pessoa ‘converse’ com ela e obtenha informações da imagem, mesmo que não consiga vê-la ou lê-la”, diz Oulasvirta.
Typoist é o modelo mais recente e moderno de comportamento de digitação no qual Oulasvirta e seus colegas vêm trabalhando há vários anos. “Quase todo mundo tem um dispositivo móvel, mas sabemos que para alguns, como idosos, digitar pode ser muito difícil”, diz Oulasvirta. “Se queremos uma sociedade onde todos possam participar, precisamos saber por que as pessoas cometem erros ao digitar.” Os erros podem surgir desde a pressa ao digitar até o esquecimento, e os pesquisadores os classificam de três maneiras: deslizes dos dedos; lapsos ou esquecimento de dar um comando aos dedos; e erros, quando o que é visto na tela está errado e um erro de digitação em andamento é ignorado.
Mas como ter um modelo computacional que comete esses mesmos erros ajuda a facilitar a digitação para as pessoas? Simular a digitação pode levar ao design de teclados melhores, sem a necessidade de testá-los com muitos usuários. Quando um aplicativo de teclado como o Gboard tem um bilhão de usuários, mesmo uma pequena alteração pode ter um enorme impacto social, ressalta Shi, por isso é crucial garantir que ele funcione da melhor forma para os usuários. “Um digitador simulado, como o Typoist, que se comporta como um humano, pode produzir muitos dados para orientar o desenvolvimento de sistemas de entrada de texto melhores para usuários humanos reais”, afirma Shi.
Tanto o Chartist quanto o Typoist, modelos que simulam com precisão como as pessoas leem gráficos ou digitam em teclados touchscreen, oferecem caminhos para pesquisas com usuários mais rápidas e baratas por meio de dados sintéticos, a produção de grandes volumes de medições semelhantes às humanas. Além disso, a nova maneira de criar modelos usando simulações e aprendizado de máquina oferece um caminho para maior transparência e explicabilidade em sistemas de IA para interação humano-computador. O artigo do Typoist foi reconhecido com uma menção honrosa, concedida aos 5% melhores artigos da conferência CHI.