Un buscador semántico de Inteligencia Artificial localiza información tanto en texto como en audios y vídeos
Investigadores de la Escuela de Telecomunicación de la UPCT han participado en la creación de la herramienta de gestión documental multimedia SigmaOnTopic
Localizar agujas en un pajar. La búsqueda de información en bases de datos no estructurados y formatos multimedia, como vídeos o audios, puede dejar de ser una labor tortuosa gracias a la Inteligencia Artificial. Así lo demuestra la herramienta de gestión documental con soporte multimedia SigmaOnTopic, desarrollada por la consultora especializada en IA Sigma Cognition y por investigadores del grupo de investigación GIRTEL de la UPCT.
Este buscador semántico con capacidades avanzadas permite recuperar información precisa y relevante de entidades, corporaciones u organismos públicos y resulta especialmente útil en industrias con un bajo nivel de desarrollo informático, ya que permite a las empresas localizar facturas, números de serie, manuales de uso y todo tipo de documentos de manera rápida e intuitiva.
“El sistema permite realizar búsquedas mucho más precisas que un buscador tradicional basado en palabras clave. El buscador realmente entiende lo que busca el usuario y es capaz de ofrecer unidades formativas que incluyen contenido relacionado, así como responder a preguntas sobre dichos contenidos, usando un modelo similar al que se usa en el popular ChatGPT”, explica José Santa Lozano, investigador del grupo GIRTEL.
SigmaOnTopic se distingue de los gestores documentales tradicionales y los buscadores de información basados en índices por su capacidad para indexar y recuperar datos no estructurados en múltiples idiomas y formatos, incluyendo texto presente en imágenes o el contenido de vídeos o audios. El sistema ofrece respuestas directas a consultas de los usuarios formuladas en lenguaje natural y, por tanto, permite una búsqueda semántica, en la que no sólo estén presentes los términos exactos de la consulta sino también otras expresiones similares. Además, elabora un resumen automático del contenido.
La herramienta es el resultado de un proyecto de investigación industrial iniciado a mediados de 2022, financiado por las Ayudas 2021 destinadas a la investigación y desarrollo en inteligencia artificial y otras tecnologías digitales y su integración en las cadenas de valor, de Red.es, en el marco del Plan de Recuperación, Transformación y Resiliencia de la economía española. El profesor Pablo Pavón lidera la participación de la UPCT en este proyecto a través de un contrato de I+D con Sigma Condition.
Actualmente, la herramienta SigmaOnTopic se encuentra en su fase de implementación y evaluación dentro de la plataforma de contenido digital educativo INDIE de la Universidad Politécnica de Cartagena (UPCT), que utilizan numerosas universidades españolas. Para ello, se indexó toda la información disponible en abierto para convertirla a material procesable, incluyendo los datos audiovisuales.
Este lunes 15 de julio, a las 12 horas, José Santa y Carlos Crespo, jefe de Proyecto de Sigma Cognition, expondrán los resultados del proyecto en un seminario online para cuyo acceso hay que registrarse a través de este enlace.