Investigadores de la Universidad Pompeu Fabra han hecho un análisis automático de 10 millones de mensajes de Twitter publicados por usuarios estadounidenses y han desarrollado un método para caracterizar de manera automática el significado de los populares emoji.
Los emoji o ideogramas de origen japonés se han popularizado enormemente. Incluyen todo un universo de significados que va más allá de las tradicionales emoticonos o símbolos gráficos utilizados para transmitir estados de ánimo formados habitualmente a partir de caracteres ASCII. Los emoji permiten describir objetos, situaciones y sentimientos incluso con pequeñas imágenes, proporcionando una forma visual y rápida de comunicarse.
Francesco Barbieri, Francesco Ronzano y Horacio Saggion, del Grupo de Investigación en Tratamiento Automático del Lenguaje Natural del Departamento de Tecnologías de la Información y las Comunicaciones de la UPF, presentarán su trabajo en la Language Resource and Evaluation Conference 2016, que se celebrará del 23 al 28 de mayo en Portoroz (Eslovenia).
Con el análisis automático de 10 millones de mensajes de Twitter y el método ideado por ellos, informa la UPF en una nota, se puede caracterizar de manera automática el significado de los emoji, con lo cual ahora se pueden comparar los ideogramas «semánticamente», es decir según su significado.
Por ejemplo, el método es capaz de discernir la proximidad semántica que puede haber entre los emoji y , o entre los emojis y . Además, el modelo permite entender el significado de los emoji y propone las palabras que se encuentran más cerca de un ideograma concreto. Por ejemplo, el emoji apunta hacia «soccer», «fútbol» «regionales», y así sucesivamente. Y al revés, el método desarrollado por estos investigadores, a partir de un determinado texto permite sugerir los ideogramas asociados más apropiados para complementar y enriquecer de manera gráfica su significado.
Los nuevos modelos desarrollados se han contrastado con experimentos de similitud semántica, «comparando los resultados de nuestros modelos con la evaluación humana, así como también llevando a cabo una evaluación cualitativa exhaustiva», manifiestan los autores.
En definitiva, los emoticonos e ideogramas no son sólo un asunto de adolescentes en sus mensajes de texto, sino que se han convertido en un tipo de expresión matizada que tiene la capacidad de traspasar las barreras idiomáticas.