En la última década, el análisis de sentimientos (SA, sentiment analysis), también conocido como minería de opiniones (opinion mining), ha despertado un creciente interés. Resulta un gran reto para las tecnologías del lenguaje, ya que obtener buenos resultados es mucho más difícil de lo que muchos creen. La tarea de clasificar automáticamente un texto escrito en un lenguaje natural en un sentimiento positivo o negativo, opinión o subjetividad (Pang and Lee, 2008), es a veces tan complicada que incluso es difícil poner de acuerdo a diferentes anotadores humanos sobre la clasificación a asignar a un texto dado. La interpretación personal de un individuo es diferente de la de los demás, y además se ve afectada por factores culturales y experiencias propias de cada persona. Y la tarea es aún más difícil cuanto más corto sea el texto, y peor escrito esté, como es el caso de los mensajes en redes sociales como Twitter o Facebook.
Por qué apostamos por la Voz del Cliente
¿Qué es la Voz del Cliente?
¿Te has preguntado alguna vez por qué ciertos productos o servicios sufren cambios radicales o incluso desaparecen del mercado (y a veces vuelven a aparecer con otro nombre comercial)? ¿Depende solo de los volúmenes de venta o entran en juego otros factores? Para contestar a estas preguntas hay que introducir el concepto de «Voz del Cliente» (Voice of the Customer en inglés) y saber qué designa. Con este término se hace referencia a todas aquellas prácticas que permiten entender qué opina un cliente (real o potencial) sobre un producto o servicio. Pero eso no se limita a una simple lectura de comentarios o juicios escritos a petición —pensemos en una encuesta en línea—, el asunto es mucho más complejo.
En los últimos años, los canales por los que clientes y usuarios expresan sus opiniones, quejas, sugerencias o felicitaciones (sí, estas también son importantes, luego veremos por qué) se han multiplicado de forma exponencial. Hace solo una década, los canales que nos permitían interactuar con el mundo empresarial eran muy reducidos, como el teléfono o las encuestas precompiladas (muchas veces enviadas por correo tradicional). Además, la mayoría de las interacciones entre cliente y empresa respondían a una necesidad específica de la segunda, es decir, eran solicitadas.
¿Cómo ha cambiado?
Hoy en día, el panorama ha cambiado radicalmente. Los canales de comunicación son numerosos y además permiten interactuar de distintas maneras a través de distintos soportes (imágenes, audio, vídeo, etc.). Y lo que más nos importa es que esta interacción
- es constante: 24 horas al día, 365 días al año;
- en la mayoría de los casos es multiidioma;
- no siempre responde a patrones predefinidos (ni siquiera se ajusta, muchas veces, a las normas ortográficas);
- no es estructurada: no está almacenada en una base de datos tradicional ni organizada según criterios preestablecidos.
No cabe duda de que, desde una perspectiva corporativa, a esta enorme cantidad de información ¡se le puede sacar mucho partido!
Continuar leyendo
Descubre insights inesperados con la nueva release de MeaningCloud
Acabamos de publicar una nueva release de MeaningCloud con algunas novedades que van a cambiar tu manera de hacer analítica de texto. Como complemento a las técnicas analíticas más habituales -que extraen información o clasifican un texto en función de diccionarios y categorías predefinidos- incorporamos técnicas de aprendizaje no supervisado que permiten explorar una serie de documentos para descubrir y extraer de ellos insights (temas, relaciones) no previstos.
En esta nueva release de MeaningCloud publicamos una API de Clustering de Texto que permite descubrir la estructura implícita y los temas significativos que emergen de los contenidos de tus documentos, conversaciones sociales, etc. Esta API toma un conjunto de textos y los distribuye en grupos (clusters) en función de la similitud entre los contenidos de cada documento. El objetivo es que los documentos de un cluster sean muy parecidos entre sí y muy diferentes a los otros clusters.
El clustering es una tecnología utilizada tradicionalmente en el análisis de datos estructurados. Lo que tiene de particular nuestra API es que sus pipelines están optimizados para analizar texto no estructurado.
¿Pueden los antidepresivos causar malformaciones en el feto?
Puede que no sea lo más común que en el blog de una empresa de tecnología de la información se hable de antidepresivos y embarazos, lo entendemos perfectamente. Pero en MeaningCloud hemos comprobado que los temas de salud tienen una fuerte repercusión en medios sociales y las empresas del sector, incluyendo las farmacéuticas, harían bien en tratar de entender la conversación que se genera alrededor. ¿Cómo? Mediante la tecnología de análisis de texto, como veremos a continuación.
Mirando los datos recogidos por nuestro prototipo para la monitorización de temas de salud en medios sociales nos sorprendimos del repentino incremento de menciones del término ‘embarazo’ el día 10 de julio. Para saber el porqué de este dato, acudimos a los tuits que hablaban sobre ese estado de buena esperanza. Resulta que ese mismo día se había publicado una noticia sobre un estudio aparecido en el British Medical Journal sobre los efectos nocivos que los antidepresivos pueden causar en el feto durante el embarazo.
Continuar leyendo
Analizando datos sobre salud en medios sociales
El análisis de medios sociales puede ser una buena inversión en el área de salud. A la gente le encanta compartir información en los medios sociales, incluso datos sobre salud. ¡Sí, es verdad! Y constituye el punto de partida del trabajo de investigación titulado ‘Exploring Spanish health social media for detecting drug effects’, cuyo objetivo es monitorizar las conversaciones en medios sociales para averiguar cómo hablan los usuarios sobre su relación con el consumo de fármacos. Esto permite identificar posibles efectos adversos hasta ahora desconocidos relacionados con dichos fármacos. Aunque existe un protocolo oficial para informar a las autoridades competentes de la existencia de algún efecto adverso no documentado, se llegan a comunicar solamente un 5 – 20 % de ellos. Además, se pueden analizar las conversaciones sobre fármacos, síntomas, condiciones y enfermedades para obtener más información. Por ejemplo, es posible descubrir cómo los usuarios buscan medicamentos específicos a través de los medios sociales o cómo algunos se dedican a venderlos, a menudo de forma ilegal; muchos otros hablan de la mezcla de alcohol con drogas u otras sustancias ilegales. Por supuesto, no todo lo que aparece en internet es fiable—este es otro tema—, pero puede estimular el planteamiento de nuevas hipótesis.
El equipo de investigación Grupo de Bases de Datos Avanzadas de la Universidad Carlos III de Madrid ha llevado a cabo la investigación mencionada y ha desarrollado modelos híbridos para obtener el conocimiento necesario para identificar efectos adversos. La plataforma de procesamiento del lenguaje natural que ha permitido el análisis basado en esos modelos es MeaningCloud. Las capacidades de personalización que ofrece esta plataforma han sido decisivas, puesto que han facilitado la integración de vocabulario específico y otros conocimientos del dominio de la medicina. Como sabemos, los nombres de los medicamentos y de los síntomas pueden ser muy complicados y a menudo no es fácil escribirlos adecuadamente. Los resultados del algoritmo son prometedores, ya que su recall es un 10 % mayor que el de otros algoritmos conocidos. Puedes encontrar más detalles en el artículo científico publicado por la revista BMC Medical Informatics and Decision Making Journal. Estos desarrollos forman parte del proyecto TrendMiner y están disponibles en la página web: TrendMiner Health Analytics Dashboard, que recopila los comentarios de los usuarios de medios sociales sobre fármacos antidepresivos. La consola muestra los antidepresivos mencionados junto con los síntomas relacionados; haciendo clic en cada uno de ellos se puede consultar su evolución a lo largo del tiempo. Además, en la parte inferior de la página se muestran los textos originales que se han analizado para extraer dichas menciones, los nombres de medicamentos, síntomas, enfermedades y cualquier relación haya sido identificada entre ellos. Esas relaciones pueden revelar si un fármaco es adecuado para un determinado síntoma o si una enfermedad es, en realidad, un efecto adverso provocado por el medicamento mencionado. El prototipo permite también hacer búsquedas utilizando el código ATC (Anatomical Therapeutic Chemical Classification System) y el nivel correspondiente según este sistema de clasificación. Si se activa la opción ‘By Active Substance’ [‘por principio activo’], se buscará cualquier fármaco contenga el principio activo del producto buscado. Por otro lado, la funcionalidad de búsqueda predictiva permitirá encontrar más fácilmente la expresión correcta para referirse a un fármaco o a una enfermedad.
Las empresas del dominio de salud y las farmacéuticas ya pueden explotar su información no estructurada
En la industria farmacéutica y de salud, tenemos a nuestra disposición nuevas herramientas de ciencia de datos capaces de extraer información valiosa sobre documentos de redacción libre como las historias clínicas electrónicas. Es posible explotar la información asociada a datos como el coste de tratamientos médicos, su eficiencia (precio, ventajas y riesgos), referencias a fármacos, efectos secundarios o resultados a largo plazo.
[/raw]
Nos vemos en el Sentiment Analysis Symposium 2015 en Nueva York
Los próximos 15-16 de julio, Nueva York acogerá una nueva edición del Sentiment Analysis Symposium. Este evento es una gran oportunidad para mantenerte al día en aquellas tecnologías y soluciones que te ayudan a descubrir el valor para el negocio que poseen las opiniones, emociones y actitudes expresadas en medios sociales, noticias y feedback corporativo, para conseguir tus objetivos de negocio.
Este año el programa tiene dos recorridos: uno de Presentaciones, que incluye una mezcla de ponencias y paneles de negocio y técnicos y otro en formato Taller con contenidos más largos. Consulta la agenda aquí.
Durante el último año en MeaningCloud hemos apreciado una explosión de interés en el análisis de sentimiento desde muy diferentes sectores, y el Sentiment Analysis Symposium es el principal evento para descubrir los últimos desarrollos en ésta y otras áreas relacionadas, tales como la monitorización social y el análisis de la voz del cliente. Por esto motivo vamos a patrocinar el Symposium nuevamente en 2015.
Estamos entusiasmados por poder presentar y colaborar junto a otros líderes del sector en el evento de este año en Nueva York. Nuestra presentación principal lleva por título: “From Strangers to Acquaintances: Multidimensional Customer Profiling” (“De extraños a conocidos: perfilado multidimensional de clientes”) y describe como las empresas tratan de integrar las interacciones multicanal (conversaciones sociales, comportamiento web, actividad en el contact center) y otros datos para perfilar y segmentar a sus usuarios en tiempo real. En este contexto, un enfoque ganador consiste en en combinar dimensiones como la demografía, el estilo de vida, la afinidad de marca o la intención para entender mejor a su audiencia y generar oportunidades de negocio.
Para más información y registro, por favor visita el sitio web del Symposium. Y si quieres ahorrarte el 20% en tu inscripción, contáctanos en news@meaningcloud.com.
Nos vemos en el Sentiment Analysis Symposium de Nueva York, y no dejes de seguir @SentimentSymp.
Descubre el PORQUÉ que hay detrás de las valoraciones de tus clientes – Un webinar con Seth Grimes
El miércoles 10 de junio en MeaningCloud daremos la bienvenida al experto en analítica de texto Seth Grimes, para un webinar de una hora dedicado a cómo obtener el máximo partido del feedback de los clientes.
Seth explicará la importancia de la analítica de texto en los nuevos escenarios de Experiencia del Cliente / Voz del Cliente, al permitirnos entender cantidades masivas de feedback no solicitado y no estructurado proveniente de encuestas, interacciones en el contact center y medios ociales… en tiempo real.
Y el equipo de MeaningCloud mostrará cómo esas ideas se pueden llevar eficientemente a la práctica usando nuestras herramientas de “Meaning-as-a-Service” fáciles de usar, personalizables y asequibles .
Tanto si estás en el sector de análisis de mercados o gestión de la experiencia del cliente como si eres un cliente final que intenta llevar sus customer insights al siguiente nivel, este webinar es para ti.
Esperamos contar con tu asistencia en este evento tan especial.
(Este webinar se desarrollará en inglés.)
Improve Customer Experience Management with Text Analytics
Discover the WHY behind your Customer Scores – A webinar with Seth Grimes
Wednesday, June 10th, 2015; 8am PST/11am EST
ACTUALIZACIÓN: este webinar ya ha tenido lugar. Accede a la documentación y a la grabación aquí.
#TuitometroMadrid: un demostrador de la potencia de MeaningCloud
Utilizando las APIs de MeaningCloud y en unos pocos días hemos desarrollado una herramienta de monitorización social acerca de un tema de gran actualidad: las próximas elecciones locales y autonómicas en España.
Con la gran expectación despertada por las próximas elecciones del 24 de mayo, han aparecido varias las iniciativas que tratan de analizar la conversación en medios sociales sobre las diversas opciones políticas.
Queremos hablaros de una que, si bien no va a ganar la medalla a la primera en llegar, sin duda va a ganarla a la más rápida (luego os explicamos esta aparente contradicción).
En MeaningCloud hemos desarrollado #TuitometroMadrid, una aplicación que permite analizar en tiempo real y de manera completa la conversación en Twitter alrededor de partidos y candidatos en la Comunidad y Ayuntamiento de Madrid.
#TuitometroMadrid permite monitorizar el buzz, la opinión y los términos y hashtags más relevantes alrededor de cada opción política y compararlas agregadamente.
¿Por qué decimos que es la más rápida? Porque además de ofrecer la información casi en tiempo real (y no como informes a posteriori) ha sido la de desarrollo más veloz: usando las API de MeaningCloud un ingeniero implementó todo el análisis semántico de los contenidos sociales en menos de un día.
Aparte de su utilidad como herramienta informativa, #TuitometroMadrid es una demostración de que las tecnologías de análisis semántico sirven para resolver problemas reales de manera sencilla y asequible.
¿Quieres incorporar el análisis semántico a tus aplicaciones de la manera más sencilla, personalizable y asequible? Usa gratuitamente MeaningCloud.
Personaliza tus herramientas de analítica de texto (grabación de webinar)
El pasado día 12 presentamos nuestro webinar “Multiplica la exactitud de tu analítica de texto”.
Hablamos de la necesidad de personalizar los procesos de analítica de texto -incorporando información del dominio- para mejorar la exactitud (precisión, cobertura) de estas herramientas. E hicimos un recorrido por las capacidades de MeaningCloud para personalizar las funciones de
- Clasificación de texto
- Extracción de información
- Análisis de sentimiento.
Estas herramientas de personalización poseen interfaces gráficas de usuario y son muy sencillas de utilizar, empoderando a los usuarios para adaptar el sistema a su aplicación y poniendo al alcance de todo el mundo una analítica de texto de alta calidad. Creemos que en conjunto estas capacidades son únicas en el sector y ponen a MeaningCloud por delante de otras ofertas competitivas.
Para los que no pudisteis asistir al webinar, a continuación tenéis la presentación y la grabación.
(This webinar was also delivered in English. Please find the recording here.)
MeaningCloud Webinar – Multiplica la precisión de tu analítica de texto from MeaningCloud on Vimeo.
Multiplica la exactitud de tu analítica de texto con nuestras herramientas de personalización (webinar)
Las herramientas de analítica de texto son extraordinariamente valiosas para extraer el significado del contenido no estructurado, pero su exactitud está limitada por el uso de recursos lingüísticos genéricos. Por ejemplo, un sistema automático nunca va a identificar los productos de una empresa si estos no se han incorporado a los diccionarios de la herramienta.
La incorporación de recursos lingüísticos personales (modelos, diccionarios) permite a estas herramientas alcanzar altos niveles de precisión y cobertura, pero en general es un proceso caro, que exige un conocimiento profundo de estas tecnologías.
En MeaningCloud abogamos por democratizar el análisis semántico, poniéndolo al alcance de todos los usuarios y desarrolladores. Por eso MeaningCloud incorpora Customizer, un motor de personalización dotado de herramientas gráficas que permite a los usuarios crear sus propios modelos de clasificación y diccionarios de una manera interactiva y sencilla. Para que alguien que necesita analizar comentarios sobre hoteles en Londres pueda incorporar los establecimientos, atributos y vocabulario usados en este contexto.
Acompáñanos en este webinar de MeaningCloud y descubre de manera práctica cómo su herramienta Customizer te empodera para realizar una analítica de texto orientada a tu dominio con total autonomía y flexibilidad y la máxima precisión.
ACTUALIZACIÓN: este webinar ya ha tenido lugar. Accede a la documentación y a la grabación aquí:
- En español: 12 de mayo de 2015,16:00 hora CET. Accede a la grabación.
- En inglés: 14 de mayo de 2015, 17:00 hora CET. Accede a la grabación.