Infografía: la voz del cliente como en los cuentos

Si alguna vez has tenido que echarte al camino con la misión de encontrar qué necesitan tus clientes, qué quieren o qué aborrecen, sabrás que hay muchos peligros acechando, tareas arriesgadas y aliados inesperados.

Infografia. La voz del cliente como en los cuentos

Comparte esta imagen en tu sitio web

Los clientes están hablando. Están participando en charlas apasionadas y sinceras en foros, redes sociales y chats … Escucharlos, entender lo que quieren decir y actuar sobre ese conocimiento está directamente relacionado con mejorar la experiencia del usuario y, como resultado, mejorar la rentabilidad de la organización .

En los últimos años, el escenario ha cambiado radicalmente. Para empezar, las fuentes se han multiplicado. La conversación, por otro lado, funciona las 24 horas del día, los 365 días del año. A menudo es multilingüe y muchas veces ni siquiera cumple con las reglas ortográficas más básicas. Es lenguaje natural, no-estructurado.

Si tienes que analizar la voz del cliente, es probable que carezcas de los recursos humanos necesarios para alcanzar, leer, clasificar, interpretar o extraer valor de tales volúmenes de datos. Y menos aún hacerlo en tiempo real.

Resultado: gran parte de este tesoro valioso sigue sin explotarse.
Sólo un procesamiento automático o semiautomático de las fuentes masivas de datos no-estructurados nos permite realizar este análisis con la calidad, volumen y coherencia necesarios.

¿Por qué necesitas tus propias arañas?

Una serie de herramientas comerciales como Radian 6 o BrandWatch ofrecen acceso a una variedad de fuentes de texto para analizar la voz del cliente. Algunos dicen que llegan hasta 80 millones de sitios.

3 problemas con estas soluciones de uso general para el crawling

1. Radian 6 y los otros llegan a muchas partes, pero son superficiales. Sus rastreadores entran a muchas webs, pero, normalmente son solo capaces de “arañar” la superficie de estos sitios. No sueñes con que te traigan el sitio completo.
2. Apenas entienden las necesidades de tu negocio. Son de uso general. ¿Qué ocurre si estás interesado en escuchar y analizar la voz de los jugadores de videojuegos: la solución empaquetada va a llegar sólo a una pequeña porción de esos sitios que te interesa analizar.
3. Muchas veces, la fuente más valiosa de la voz del cliente se esconde en los foros. Y los foros basados en web son difíciles de rastrear con crawlers. El crawling empaquetado no funciona en este territorio.
En nuestra experiencia, cuando quieres analizar en serio la Voz del Cliente, es muy probable que necesites arañas con una programación ad-hoc para llegar a lo que realmente necesita analizar.

Las cadenas de texto son claramente insuficientes. Utiliza una plataforma semántica.

Tienes los textos. Es hora de analizarlos. Las búsquedas basadas en cadenas de texto no van a funcionar. El lenguaje natural es simplemente demasiado complicado. La ambigüedad, la ironía, los errores ortográficos y otros problemas lo hacen realmente difícil de procesar. Ya escribimos sobre esto en: Recognizing entities in a text: not as easy as you might think!

Sólo 3 ejemplos que ilustran la necesidad de herramientas más sofisticadas para analizar el lenguaje natural:

1. ¿De qué hablamos cuando decimos “Washington”?. Puede referirse a personas más o menos conocidas (empezando por George Washington), el estado en la costa del Pacífico de los EE.UU., la capital de los EE.UU. (Washington, DC) y un buen número de otras ciudades, instituciones e instalaciones en EEUU y en otros países. Puede incluso ser un metonimia para referirse al gobierno federal de los Estados Unidos.

Se necesitan recursos semánticos y contextuales para realizar una correcta desambiguación. ¿Hay otras referencias al mismo nombre (tal vez en una forma más completa) a lo largo del texto? El análisis semántico puede decirnos si tratamos con una persona (que produce acciones humanas) o un lugar (donde suceden las cosas).

2. Cuando escribimos intentamos evitar las repeticiones. Dentro de un texto, solemos referirnos a las mismas entidades con nombres diferentes.

Recordemos a Nelson Mandela, el Dr. Mandela (dependiendo del contexto) y Madiba son reconocidos por los angloparlantes como la misma entidad.

3. Las faltas de ortografía abundan. Los errores de tecleado son frecuentes. Las abreviaturas creativas también. ¿Si en un texto en inglés encontramos la palabra “Genva“, deberíamos pensar en Geneva, Genève (en francés Ginebra) o Genoa (en Génova italiana)?

Una plataforma semántica tratará todas esas dificultades. La estrategia para interpretar correctamente una palabra desconocida, implica usar métricas para la distancia entre la palabra desconocida y otras palabras que podemos reconocer como correctas.

En nuestro ejemplo, si el texto ha sido tecleado con un teclado qwerty, parece que la distancia entre Genva y Geneve implica una sola operación de borrado, mientras que la distancia entre Genva y Genoa implica una sustitución usando una letra bastante separada en el teclado. Por lo tanto, con métricas de distancia, Geneve debe ser preferido. Pero la información contextual es igualmente importante para la desambiguación. Si nuestro texto incluye menciones a lugares en Suiza, o se puede establecer como el contexto geográfico correcto, entonces Ginebra gana oportunidades. De lo contrario, si el texto es sobre los cruceros por el Mediterráneo, Génova parece ser la elección natural.

Finalmente, dentro de una plataforma semántica, el análisis de sentimiento consiste en la aplicación del procesamiento de lenguaje natural, análisis de texto y lingüística computacional para identificar y extraer información subjetiva de varios tipos de contenido.

Cocinando valor desde datos estructurados

Una vez domesticado (estructurado) el lenguaje natural, es tiempo de extraer valor de los datos. Los paneles de control, las alertas o la posibilidad de realizar consultas adicionales sobre los datos nos acercan al final feliz, es decir, a sugerir acciones que mejorarán la experiencia de sus clientes.

 


Leave a Reply

Your email address will not be published. Required fields are marked *

*
*