Métodos de análisis de sentimientos de texto (1) - Métodos de análisis de sentimientos basados en léxico
Introduction to text sentiment analysis
Introducir un texto, y luego el sistema electrónico le alimenta automáticamente qué tipo de orientación de sentimiento tiene el texto, ya sea positivo o negativo, este es un análisis de sentimientos de texto, también conocido como minería de opinión.Se refiere al proceso de recopilación, procesamiento, análisis, resumen y razonamiento sobre el texto subjetivo con emoción, que implica varios campos de investigación como inteligencia artificial, aprendizaje automático, minería de datos y procesamiento del lenguaje natural.
El análisis de sentimientos de texto es una rama importante en el campo del procesamiento del lenguaje natural, que se usa ampliamente en el análisis de opinión pública y la recomendación de contenido, etc. Es un tema de investigación en los últimos años.De acuerdo con los diferentes métodos utilizados, se clasifican en métodos de análisis de sentimientos basados en léxicos de sentimiento, métodos de análisis de sentimientos basados en el aprendizaje automático tradicional y los métodos de análisis de sentimientos basados en el aprendizaje profundo.
Introducción de métodos de análisis de sentimientos basados en léxico
El método basado en los léxicos del sentimiento se refiere a la división de la polaridad del sentimiento bajo una granularidad diferente basada en la polaridad del sentimiento de las palabras del sentimiento proporcionadas por diferentes léxicos de sentimiento.
En primer lugar, el texto se ingresa y se procesa previamente a través de los datos (incluida la renovación, la eliminación de caracteres no válidos, etc.), seguido de una operación de separación de palabras, luego las palabras de diferentes tipos y grados del sentimiento léxicos se colocan en el modelo para capacitar, y finalmente los tipos de sentimientos se emiten de acuerdo con las reglas de juicio del sentimiento.
La mayoría de los léxicos de sentimiento existentes se construyen manualmente, y de acuerdo con la diferente granularidad de la división, las tareas de análisis de sentimientos existentes se pueden clasificar en palabras, frase, atributo, oración, capítulo y otros niveles.
La construcción manual de los léxicos de sentimiento es costosa y requiere leer una gran cantidad de materiales relevantes y léxicos existentes, resumiendo palabras que contienen tendencias de sentimiento al resumirlos y etiquetarlos con diferentes niveles de polaridad e intensidad del sentimiento.
Ventajas y desventajas:
El enfoque basado en el léxico del sentimiento puede reflejar con precisión las características no estructuradas del texto y es fácil de analizar y comprender.En este método, el efecto de clasificación de sentimientos es más preciso cuando la cobertura y la precisión de las palabras de sentimiento son altas.
Sin embargo, este método todavía tiene algunos defectos.
El método de clasificación de sentimientos basado en los léxicos de sentimiento depende principalmente de la construcción de léxicos de sentimiento, pero debido al rápido desarrollo de la red en esta etapa y la velocidad de la actualización de la información, hay muchas palabras nuevas en la red y el reconocimiento de estosLas nuevas palabras no funcionan bien, y los léxicos de sentimiento existentes deben ampliarse continuamente para satisfacer las necesidades.
La misma palabra de sentimiento en los léxicos de sentimiento puede expresar diferentes significados en diferentes momentos, en diferentes idiomas o en diferentes dominios, por lo que el método basado en los léxicos del sentimiento no es muy efectivo en dominio cruzado y en el lenguaje cruzado.
Al usar léxicos de sentimiento para la clasificación de sentimientos, las relaciones semánticas entre contextos a menudo no se consideran.
Por lo tanto, se necesitan más académicos para realizar una investigación suficiente sobre los métodos basados en el léxico de los sentimientos.