Extrae la información más relevante
La extracción de entidades permite etiquetar nombres de personas, lugares u organizaciones de cualquier tipo de contenido, de forma que este se pueda encontrar y relacionar con otro contenido de forma efectiva. El etiquetado de esta información facilita estructurar cualquier tipo de información no estructurada (texto, audio o video) y obtener su huella semántica.
La API de Extracción de Topics de MeaningCloud
Esta API extrae la información más relevante de un texto como las personas, lugares, organizaciones o productos que se mencionan, conocidas como entidades con nombre propio. Además también identifica los principales conceptos y muchos otros datos relevantes como fechas, teléfonos, cantidades monetarias o direcciones electrónicas (URLS, emails, hashtags). Estas entidades, conceptos y valores proporcionan una representación semántica del documento que permite desarrollar aplicaciones inteligentes que procesan contenido en múltiples idiomas. Sin embargo, el análisis no se limita a identificar cuando se menciona una entidad, sino que se realiza un análisis de correferencia y se enlaza con recursos externos como Wikipedia o Linked Data que representan a la entidad.
MeaningCloud identifica esta información en cualquier tipo de texto, ya sean páginas web, noticias, contenido de redes sociales o transcripciones de audio y video. Además es capaz de realizar este análisis en diferentes idiomas (multi-idioma), sino que usa una conjunto de tipos común (multilingüe). Este jerarquía de tipos de entidad, que se conoce como ontología contiene más de 200 clases que por ejemplo permiten decir que Google no solo es una organización sino una compañía que fabrica software.
Además, puedes añadir tus propios diccionarios para extender las capacidades de etiquetado de entidades y conceptos de MeaningCloud y adaptarlas a un nuevo dominio o a las necesidades de tu aplicación. ¿Necesitas analizar documentos sobre biomedicina? Puedes incorporar los nombres de medicamentos, principios activos o enfermedades para analizar semánticamente la literatura científica.
Ventajas de automatizar la extracción de información. Aplicaciones
La anotación de entidades, asi como su clasificación y desambiguación, mejora la búsqueda de información, el posicionamiento en buscadores o la recomendación de contenido relacionado. Además, es una tarea básica para un procesamiento semántico de la información que permita extraer relaciones o etiquetar el sentimiento asociado a una entidad.
Inteligencia competitiva
Extrae las entidades y conceptos más relevantes de cualquier noticia o contenido web para monitorizar tendencias y crear aplicaciones de inteligencia de negocio.
Análisis de medios sociales
Descubre los temas e intereses de tu público objetivo en redes sociales. Identifica tendencias asociados a los temas de la conversación.
Búsqueda y recomendación de contenido
Etiqueta tu contenido o tus productos usando las categorías como ayuda a la navegación o para identifcar contenido relacionado en tu sitio web.
Diferenciadores de nuestra API de Extracción de Topics
Tipos de entidades
No solo personas, lugares y organizaciones. Usa una amplia jearquía con más de 200 tipos y subtipos de entidades.
Extracción de conceptos
Anota y agrupa los principales conceptos, incluyendo conceptos multipalabra (prima de riesgo) y calcula su relevancia.
Citas y otros datos relevantes
Anota las citas o habla indirecta e identifica en el texto a quien se atribuye. Ideal para el análisis de noticias y redes sociales. Extrae también otros datos relevantes como fechas, dinero o teléfonos.
Desambiguación de entidades y correferencia
Usa pistas contextuales para identificar de qué entidad se habla y su tipo si varias se llaman igual. No confundas la ciudad de Barcelona con el equipo.
Multiples idiomas
Extrae entidades con una taxonomía común para Español, Inglés, Francés, Italiano y Catalán.
Wikipedia y Linked Data
Asocia las entidades anotadas a páginas de Wikipedia o recursos de la nube Linked Data como Freebase o Dbpedia.