Los portales de noticias y las redes sociales son ricas fuentes de información, por ejemplo para predecir las tendencias del mercado de valores. Muchos proveedores de servicios permiten rastrear grandes colecciones de textos introduciendo en sus motores de búsqueda palabras clave descriptivas, que tienden a ser muy ambiguas, sin embargo, y muestran rápidamente los límites de las tecnologías de búsqueda actuales.
Científicos de la computación de la Universidad del Sarre (Alemania) han desarrollado una nueva tecnología de análisis de textos que mejora considerablemente la búsqueda en colecciones de texto muy grandes por medio de la inteligencia artificial. Más allá de las búsquedas, esta tecnología también ayuda a investigar e incluso en la escritura de textos, proporcionando automáticamente información de contexto y sugiriendo enlaces a sitios web de interés.
Ambiverse, una empresa
spin-off del Instituto Max Planck de Informática de Saarbrücken, presentará esta nueva tecnología durante la feria de tecnología CeBIT 2016, que se celebrará en Hannover del 14 al 18 de marzo.
En la era de los teléfonos inteligentes y las salas de chat, la información en las empresas no se distribuye a través de palabras habladas, sino más bien a través de correos electrónicos, bases de datos y portales de noticias internas.
"De acuerdo con una encuesta realizada por la empresa de análisis de mercado Gartner, apenas un cuarto de todas las empresas están utilizando métodos automáticos para analizar su información textual. Para 2021, Gartner predice que lo hará el 65 por ciento. Esto se debe a que la cantidad de datos dentro de las empresas está en continuo crecimiento y, por tanto, se hace más y más costoso tenerlos estructurados y rastrearlos con éxito", dice Johannes Hoffart, investigador del Instituto Max Planck de Informática y fundador de Ambiverse.
Su equipo ha desarrollado una nueva tecnología para el análisis de grandes cantidades de texto, en la que la inteligencia artificial está continuamente "pensando en voz alta" al fondo.
"Para el análisis de los textos, nos basamos en conjuntos extremadamente grandes de conocimiento construidos a partir de fuentes de libre acceso como Wikipedia o grandes portales multimedia de la web. Estos conjuntos pueden crecer con conocimiento específico de la empresa o del ámbito de actuación, tales como catálogos de productos o correspondencia de los clientes", dice Hoffart en la
nota de prensa de la universidd, recogida por AlphaGalileo.
Mediante la aplicación de algoritmos complejos, estos textos son examinados y analizados con herramientas lingüísticas. "Nuestro software asigna entonces las empresas y áreas de negocio a las categorías correspondientes, lo cual nos permite reunir información valiosa sobre cómo de bien posicionados en el mercado están sus productos en comparación con los de los competidores", explica. Un reto especialmente difícil es el hecho de que los nombres de productos y empresas son de todo menos únicos y tienden a tener significados completamente diferentes en diferentes contextos, lo que los hace muy ambiguos.
Comentario: Recomendamos leer también: