¿Como interpretar los sentimientos en Internet?
Las redes sociales están permitiendo que cientos de millones de usuarios puedan opinar sobre todo tipo de cosas: películas, hoteles, líneas aéreas, restaurantes, etc. Este hecho permite que la web se pueda rastrear para conocer de primera mano las opiniones de los usuarios sobre un determinado servicio o producto. Pero el problema radica en, dada la inmensidad de la red y los cientos de millones de usuarios, como hacerlo de manera automática, al igual que se hace con los hechos cuantificables. El New York Times pública hoy un artículo, Mining the Web For Feelings, Not Facts, sobre este tema. Cuenta como compañías como Jodange están intentando realizar esta función. En el propio texto ya se comenta la dificultad de la tarea, dada la naturaleza ambigüa de lenguaje humano. Aún así un tema muy interesante. Otras webs que realizan algo parecido, con los contenidos de Twitter, son Twetterfeel, Twendz o Twitrrat.
Muy interesante para ver en tiempo real si algo es valorado como positivo o negativo. Por ejemplo, una marca.



















El éxito en estos procesos (Sentiment Analysis) es proporcional a los conjuntos de entrenamiento.
Es decir, un artículo, comentario o post, es contrastado con conjuntos masivos de texto pre-etiquetado bajo las categorías de positivo, negativo o neutro, y si el texto en cuestión guarda más similitud (gramática, semántica y probabilísitca) con un grupo de entrenamiento, éste es etiquetado de tal forma.
Los conjuntos de entrenamiento representan un momento en el tiempo o incluso un dominio o dominios específicos, por lo tanto son perennes y dependientes de los temas tratados, cada proyecto de análisis de sentimiento debe de ser cualificado por separado y sobre todo, preguntarnos esas cosas tan básicas como para qué y por qué. Quizás no se trate de agrupar opiniones sino de responderlas.
Todo negocio que se nutre de los "sentimientos" debe de ser tomado con la máxima frialdad.
Y ahora decidme: ¿Es este comentario positivo, negativo o neutro?
No sabría decirte. Pero sí que tienes razón sobre lo que comentas, pero creo que las herramientas que describe el artículo son más básicas. No están entrenadas, simplemente miran en tiempo real patrones básicos. No quieren ser sofisticadas, simplemente ofrecer tendencias. Veremos a ver su eficacia.