Méthodes d'analyse du sentiment de texte (1) - Méthodes d'analyse des sentiments basés sur le lexique
Introduction to text sentiment analysis
Entrer un texte, puis le système électronique vous nourrit automatiquement quel type d'orientation du sentiment du texte, qu'il soit positif ou négatif, il s'agit d'une analyse du sentiment de texte, également connu sous le nom d'extraction d'opinion.Il fait référence au processus de collecte, de traitement, d'analyse, de résumé et de raisonnement sur le texte subjectif avec émotion, qui implique divers domaines de recherche tels que l'intelligence artificielle, l'apprentissage automatique, l'exploration de données et le traitement du langage naturel.
L'analyse du sentiment de texte est une branche importante dans le domaine du traitement du langage naturel, qui est largement utilisée dans l'analyse d'opinion publique et la recommandation de contenu, etc. Il s'agit d'un sujet de recherche brûlant ces dernières années.Selon les différentes méthodes utilisées, elles sont classées en méthodes d'analyse des sentiments basées sur les lexiques de sentiment, les méthodes d'analyse des sentiments basées sur l'apprentissage automatique traditionnel et les méthodes d'analyse des sentiments basées sur l'apprentissage en profondeur.
Introduction des méthodes d'analyse des sentiments basés sur le lexique
La méthode basée sur les lexiques de sentiment fait référence à la division de la polarité des sentiments sous différentes granularité en fonction de la polarité du sentiment des mots de sentiment fournis par différents lexiques de sentiment.
Premièrement, le texte est entré et prétraité via les données (y compris le débroussage, la suppression des caractères non valides, etc.), suivi d'une opération de séparation de mots, puis les mots et les diplômes différents des lexiques de sentiment sont placés dans le modèle de formation, et enfin les types de sentiment sont sortis en fonction des règles de jugement du sentiment.
La plupart des lexiques de sentiment existants sont construits manuellement, et selon la granularité différente de la division, les tâches d'analyse des sentiments existantes peuvent être classées en mots, phrase, attribut, phrase, chapitre et autres niveaux.
La construction manuelle des lexiques de sentiment est coûteuse et nécessite la lecture d'une grande quantité de matériaux pertinents et de lexiques existants, résumant les mots contenant des tendances de sentiment en les résumant et en les étiquetant avec différents niveaux de polarité et d'intensité du sentiment.
Avantages et inconvénients:
L'approche basée sur le lexique du sentiment peut refléter avec précision les caractéristiques non structurées du texte et est facile à analyser et à comprendre.Dans cette méthode, l'effet de classification des sentiments est plus précis lorsque la couverture et la précision des mots de sentiment sont élevées.
Cependant, cette méthode présente encore quelques défauts.
La méthode de classification des sentiments basée sur les lexiques de sentiment dépend principalement de la construction des lexiques de sentiment, mais en raison du développement rapide du réseau à ce stade et de la vitesse de mise à jour de l'information, il y a de nombreux nouveaux mots sur le réseau, et la reconnaissance de celles-ciLes nouveaux mots ne fonctionnent pas bien et les lexiques de sentiment existants doivent être étendus en continu pour répondre aux besoins.
Le même mot de sentiment dans les lexiques de sentiment peut exprimer différentes significations à différents moments, dans différentes langues ou dans différents domaines, de sorte que la méthode basée sur les lexiques de sentiment n'est pas très efficace dans le domaine transversal et la langue transversale.
Lorsque vous utilisez des lexiques de sentiment pour la classification des sentiments, les relations sémantiques entre les contextes ne sont souvent pas prises en compte.
Par conséquent, davantage de chercheurs sont nécessaires pour mener des recherches suffisantes sur les méthodes basées sur le lexique des sentiments.