Archivo de categorías: Tecnologías del Lenguaje

Entradas sobre tecnologías del lenguaje.

Los hechos asombrosos de los superhéroes de la analítica de texto

En los últimos años, la gran explosión de contenido generado por los usuarios en los medios sociales (redes, foros, comunidades) ha aumentado significativamente la necesidad de extraer información de esos textos no estructurados. Por extraño que parezca, los extraordinarios logros de los superhéroes de la analítica de texto en realidad son fruto de lo que una tecnología adecuada (en manos de personas corrientes) puede llegar a ofrecer.

Superhéroes de la analítica de texto

Continuar leyendo


¿Qué es la voz del empleado (VoE)?

Voz del Empleado. Siluetas con burbujas que representan el diálogo

Conseguir empleados comprometidos se ha convertido en una prioridad  para muchas organizaciones en los sectores público y privado. Los programas de la Voz del Empleado (VoE) desempeñan un papel clave en esos esfuerzos, al permitir recolectar, administrar y actuar de manera sistemática sobre el feedback y las aportaciones de los empleados sobre una variedad de temas relevantes para la empresa.

La relación entre Engagement y Voz del Empleado es muy parecida  a la que existe entre la Voz del Cliente (VoC) y la Experiencia del Cliente. VoC proporciona las ideas que mejoran la experiencia del cliente. La Voz del Empleado tiene la misma función para el compromiso de los empleados. Ver: Voz del Empleado, Voz del Cliente y NPS

La Voz del Empleado recoge las necesidades, deseos, esperanzas y preferencias de todos los empleados dentro de una organización. La VoE toma en cuenta tanto las necesidades explícitas, tales como salarios, carrera profesional,  salud y jubilación, así como las necesidades tácitas que pueden incluir la satisfacción en el trabajo y el respeto de los compañeros de trabajo y de los supervisores.
Continuar leyendo


Voz del Cliente en Seguros

Para las compañías de seguros resulta vital entender el feedback que sus clientes -actuales y potenciales- expresan a través de todo tipo de canales y puntos de contacto. A toda esta valiosa información le llamamos la Voz del Cliente. Por cierto, no hace mucho, le dedicamos un post al papel de la Minería de texto en el sector de seguros.

(Este post es un desarrollo de la presentación de meaningcloud.com en el I Congreso de Big Data en el sector asegurador español organizado por ICEA. Más abajo tenemos la presentación que hicimos desde Meaning Cloud).

Cada vez hay más empresas que entienden que para crecer de forma rentable en entornos de mucha competencia, necesitan clientes satisfechos. Conseguir diferenciación entre los productos de las aseguradoras no resulta fácil.  La experiencia del cliente (Customer Experience) es un elemento fundamental en el éxito comercial del sector.

Escuchar, entender y actuar sobre lo que los clientes nos están diciendo sobre su experiencia con nuestras compañías está directamente relacionado con la mejora de la Experiencia de Usuario y con la rentabilidad. En el post sobre Voz del Cliente y NPS vimos con más detalle esta correlación entre experiencia de cliente y beneficios.

 

Continuar leyendo


Voz del Empleado, Voz del Cliente y NPS

Cada vez hay más empresas que entienden que para crecer de forma rentable en entornos de mucha competencia, necesitan conseguir clientes satisfechos. Y saben que las personas de su organización, los empleados, tienen un papel fundamental en conseguir mejorar la experiencia del cliente.

En esta pelea competitiva por mejorar la fidelidad de los clientes, las empresas tienen que ser capaces de escuchar y entender lo que los clientes están diciendo. Es lo que llamamos la Voz del Cliente (VoC).

Una misión, como la de conseguir clientes satisfechos, que no vaya unida a una medida precisa del éxito (o del fracaso), es sólo un brindis al sol. Ya lo decía Lord Kevin: si no se puede medir, no se puede mejorar.

El Net Promoter Score (NPS) se ha convertido, para muchísimas empresas en la métrica fundamental para medir la satisfacción del cliente.

En la misma línea, la misión de conseguir personas motivadas y felices en nuestra organización también tiene su métrica: el eNPS (el NPS del empleado). Por tanto, hay que escuchar y entender igualmente la Voz del Empleado.

Tanto el NPS como el eNPS, como veremos más abajo, necesitan encontrar el porqué que se esconde detrás de la valoración numérica. Ambos recogen las respuestas de miles de clientes y empleados a la pregunta abierta ¿Cuál es principal razón que te lleva a dar esta valoración? Es aquí donde la tecnología lingüística de Meaning Cloud interviene.
Continuar leyendo


Introducción al análisis de sentimientos (minería de opiniones)

En la última década, el análisis de sentimientos (SA, sentiment analysis), también conocido como minería de opiniones (opinion mining), ha despertado un creciente interés. Resulta un gran reto para las tecnologías del lenguaje, ya que obtener buenos resultados es mucho más difícil de lo que muchos creen. La tarea de clasificar automáticamente un texto escrito en un lenguaje natural en un sentimiento positivo o negativo, opinión o subjetividad (Pang and Lee, 2008), es a veces tan complicada que incluso es difícil poner de acuerdo a diferentes anotadores humanos sobre la clasificación a asignar a un texto dado. La interpretación personal de un individuo es diferente de la de los demás, y además se ve afectada por factores culturales y experiencias propias de cada persona. Y la tarea es aún más difícil cuanto más corto sea el texto, y peor escrito esté, como es el caso de los mensajes en redes sociales como Twitter o Facebook.

Continuar leyendo


Descubre insights inesperados con la nueva release de MeaningCloud

Acabamos de publicar una nueva release de MeaningCloud con algunas novedades que van a cambiar tu manera de hacer analítica de texto. Como complemento a las técnicas analíticas más habituales -que extraen información o clasifican un texto en función de diccionarios y categorías predefinidos- incorporamos técnicas de aprendizaje no supervisado que permiten explorar una serie de documentos para descubrir y extraer de ellos insights (temas, relaciones) no previstos.

En esta nueva release de MeaningCloud publicamos una API de Clustering de Texto que  permite descubrir la estructura implícita y los temas significativos que emergen de los contenidos de tus documentos, conversaciones sociales, etc. Esta API toma un conjunto de textos y los distribuye en grupos (clusters) en función de la similitud entre los contenidos de cada documento. El objetivo es que los documentos de un cluster sean muy parecidos entre sí y muy diferentes a los otros clusters.

El clustering es una tecnología utilizada tradicionalmente en el análisis de datos estructurados. Lo que tiene de particular nuestra API es que sus pipelines están optimizados para analizar texto no estructurado.

Text Clustering API

Continuar leyendo


¿Pueden los antidepresivos causar malformaciones en el feto?

Puede que no sea lo más común que en el blog de una empresa de tecnología de la información se hable de antidepresivos y embarazos, lo entendemos perfectamente. Pero en MeaningCloud hemos comprobado que los temas de salud tienen una fuerte repercusión en medios sociales y las empresas del sector, incluyendo las farmacéuticas, harían bien en tratar de entender la conversación que se genera alrededor. ¿Cómo? Mediante la tecnología de análisis de texto, como veremos a continuación.

Mirando los datos recogidos por nuestro prototipo para la monitorización de temas de salud en medios sociales nos sorprendimos del repentino incremento de menciones del término ‘embarazo’ el día 10 de julio. Para saber el porqué de este dato, acudimos a los tuits que hablaban sobre ese estado de buena esperanza. Resulta que ese mismo día se había publicado una noticia sobre un estudio aparecido en el British Medical Journal sobre los efectos nocivos que los antidepresivos pueden causar en el feto durante el embarazo.
Continuar leyendo


Analizando datos sobre salud en medios sociales

El análisis de medios sociales puede ser una buena inversión en el área de salud. A la gente le encanta compartir información en los medios sociales, incluso datos sobre salud. ¡Sí, es verdad! Y constituye el punto de partida del trabajo de investigación titulado ‘Exploring Spanish health social media for detecting drug effects’, cuyo objetivo es monitorizar las conversaciones en medios sociales para averiguar cómo hablan los usuarios sobre su relación con el consumo de fármacos. Esto permite identificar posibles efectos adversos hasta ahora desconocidos relacionados con dichos fármacos. Aunque existe un protocolo oficial para informar a las autoridades competentes de la existencia de algún efecto adverso no documentado, se llegan a comunicar solamente un 5 – 20 % de ellos. Además, se pueden analizar las conversaciones sobre fármacos, síntomas, condiciones y enfermedades para obtener más información. Por ejemplo, es posible descubrir cómo los usuarios buscan medicamentos específicos a través de los medios sociales o cómo algunos se dedican a venderlos, a menudo de forma ilegal; muchos otros hablan de la mezcla de alcohol con drogas u otras sustancias ilegales. Por supuesto, no todo lo que aparece en internet es fiable—este es otro tema—, pero puede estimular el planteamiento de nuevas hipótesis.

drugs

El equipo de investigación Grupo de Bases de Datos Avanzadas de la Universidad Carlos III de Madrid ha llevado a cabo la investigación mencionada y ha desarrollado modelos híbridos para obtener el conocimiento necesario para identificar efectos adversos. La plataforma de procesamiento del lenguaje natural que ha permitido el análisis basado en esos modelos es MeaningCloud. Las capacidades de personalización que ofrece esta plataforma han sido decisivas, puesto que han facilitado la integración de vocabulario específico y otros conocimientos del dominio de la medicina. Como sabemos, los nombres de los medicamentos y de los síntomas pueden ser muy complicados y a menudo no es fácil escribirlos adecuadamente. Los resultados del algoritmo son prometedores, ya que su recall es un 10 % mayor que el de otros algoritmos conocidos. Puedes encontrar más detalles en el artículo científico publicado por la revista BMC Medical Informatics and Decision Making Journal. Estos desarrollos forman parte del proyecto TrendMiner y están disponibles en la página web: TrendMiner Health Analytics Dashboard, que recopila los comentarios de los usuarios de medios sociales sobre fármacos antidepresivos. La consola muestra los antidepresivos mencionados junto con los síntomas relacionados; haciendo clic en cada uno de ellos se puede consultar su evolución a lo largo del tiempo. Además, en la parte inferior de la página se muestran los textos originales que se han analizado para extraer dichas menciones, los nombres de medicamentos, síntomas, enfermedades y cualquier relación haya sido identificada entre ellos. Esas relaciones pueden revelar si un fármaco es adecuado para un determinado síntoma o si una enfermedad es, en realidad, un efecto adverso provocado por el medicamento mencionado. El prototipo permite también hacer búsquedas utilizando el código ATC (Anatomical Therapeutic Chemical Classification System) y el nivel correspondiente según este sistema de clasificación. Si se activa la opción ‘By Active Substance’ [‘por principio activo’], se buscará cualquier fármaco contenga el principio activo del producto buscado. Por otro lado, la funcionalidad de búsqueda predictiva permitirá encontrar más fácilmente la expresión correcta para referirse a un fármaco o a una enfermedad.

Las empresas del dominio de salud y las farmacéuticas ya pueden explotar su información no estructurada


En la industria farmacéutica y de salud
, tenemos a nuestra disposición nuevas herramientas de ciencia de datos capaces de extraer información valiosa sobre documentos de redacción libre como las historias clínicas electrónicas. Es posible explotar la información asociada a datos como el coste de tratamientos médicos, su eficiencia (precio, ventajas y riesgos), referencias a fármacos, efectos secundarios o resultados a largo plazo.

[/raw]