Publicación semántica en Unidad Editorial: caso de estudio de un cliente en el sector de los medios de comunicación
El pasado año, el grupo de medios español Unidad Editorial desarrolló y desplegó una nueva plataforma de gestión de contenidos para su redacción integrada. Unidad Editorial es una compañía del grupo italiano RCS MediaGroup y publica algunos de los periódicos y revistas con mayor circulación de España, además de contar con una cadena de emisoras de radio y una licencia de televisión digital terrestre con cuatro canales.
Cuando un periodista escribe una pieza (noticia, columna, reseña) y la incorpora al gestor de contenidos, hay que etiquetarla semánticamente como uno de los primeros pasos dentro de un flujo de trabajo que terminará con su despliegue en diferentes formatos, a través de diversos canales (papel, web, tabletas y aplicaciones móviles) y en diferentes cabeceras. Tras un proceso de evaluación de proveedores en los meses anteriores, la compañía seleccionó la tecnología de analítica de texto de Daedalus para el procesamiento semántico de las noticias. La publicación semántica incluía, en este caso, la identificación (con desambiguación) de entidades nombradas en la noticia (personalidades, lugares, organizaciones, etc.), expresiones temporales y monetarias, conceptos y palabras o expresiones clave, clasificación del texto conforme al esquema IPTC (estándar internacional para la clasificación de noticias en más de 1400 clases organizadas en tres niveles), análisis de sentimiento, etc.
Los metadatos resultado del etiquetado se usan para múltiples fines: indexación, archivo y búsqueda, personalización, localización de contenido relacionado, publicidad contextual, SEO, etc.
La integración se hizo en dos etapas. Primero, durante el desarrollo, integración y prueba del nuevo CMS, el etiquetado semántico se hacía invocando servicios de las APIs de nuestra plataforma en la nube MeaningCloud. Cuando se hizo el paso a producción, instalamos nuestras APIs en un servidor del cliente, por motivos de independencia, siguiendo un modelo tradicional de licencia de software en propiedad. El único cambio necesario para la migración en el software del cliente fue una constante con la dirección de internet del servicio.
Las compañías de medios representan un mercado natural para Daedalus. Entregamos nuestra primera solución para un periódico en el año 2001. En esa época, comenzamos conversaciones con el diario El País para integrar nuestra solución de corrección ortográfica, gramatical y de estilo para castellano en su sistema de gestión de contenidos de prensa (Hermes, entonces de Unisys, ahora de Atex). A pesar de las dificultades técnicas (la solución debía funcionar con o sin conexión a internet, y debía distribuirse e instalarse completamente integrada con los mecanismos de actualización de Hermes) y del trabajo lingüístico para automatizar los criterios del Libro de Estilo de El País, el trabajo se completó en pocos meses. Algún tiempo después, nuestra solución de revisión lingüística se incorporó a una plataforma distinta (basada en Linux en lugar de Windows, con un gestor de contenidos propio) para la edición digital del diario El Mundo.
La Publicación Semántica es el objetivo de la última API publicada en MeaningCloud. Esta Interfaz de Programación de Aplicaciones está dirigida al mercado de la industria editorial y de los contenidos. Sus resultados incluyen:
- Identificación de entidades (personas, empresas, organizaciones, marcas, productos…) desambiguadas.
- Identificación de palabras clave y conceptos relevantes.
- Clasificación temática basada en taxonomías estándar (IPTC).
- Identificación de otras informaciones relevantes (direcciones físicas y virtuales, cantidades monetarias, etc.
- Contenido enriquecido con información relacionada.
- Posibilidad de incorporar diccionarios especializados y otro recursos lingüísticos.
- Revisión ortográfica, gramatical y de estilo previa a la publicación.
¿Te gustaría hacer una prueba? Puedes hacerlo gratis. Regístrate y enriquece tu publicación, hasta un volumen de procesamiento de medio millón de palabras al mes.
Y, en caso de que tengas planes para asistir al Sentiment Analysis Symposium 2014, que tendrá lugar del 5 al 6 de marzo en Nueva York, no olvides visitarnos. ¡Buena suerte!
José Carlos González (@jgonzalez_es)