Méthodes d'analyse du sentiment de texte (2) - méthodes traditionnelles d'analyse des sentiments basés sur l'apprentissage automatique
Introduction des méthodes traditionnelles d'analyse des sentiments basées sur l'apprentissage automatique
L'apprentissage automatique est une méthode d'apprentissage qui forme un modèle à partir de données données et prédit les résultats du modèle.Cette méthode a été étudiée jusqu'à présent et a obtenu de nombreux résultats efficaces.
La méthode d'analyse des sentiments basée sur l'apprentissage automatique fait référence à l'extraction des fonctionnalités à travers une grande quantité de corpus étiqueté ou non étiqueté, à l'aide d'algorithmes d'apprentissage automatique statistiques, et enfin de la sortie des résultats dans l'analyse des sentiments.
Les méthodes de classification des sentiments basées sur l'apprentissage automatique sont divisées en trois catégories principales:méthodes supervisées, semi-supervisées et non supervisées.
Dans les méthodes supervisées, différentes catégories de sentiment peuvent être classées en donnant un ensemble d'échantillons avec polarité émotionnelle.Les méthodes supervisées dépendent davantage des échantillons de données et passent plus de temps sur l'étiquetage manuel et le traitement des échantillons de données.Les méthodes supervisées communes sont KNN, Naive Bayes et SVM.
Dans les méthodes semi-supervisées, les résultats de la classification du sentiment de texte peuvent être efficacement améliorés par l'extraction des fonctionnalités à partir de texte non étiqueté, et cette méthode peut résoudre efficacement le problème des ensembles de données clairsemés avec l'étiquetage.
Dans les méthodes non supervisées, le texte non marqué est classé en fonction de la similitude entre les textes, et cette méthode est moins utilisée dans l'analyse des sentiments.
Avantages et inconvénients:
Les méthodes traditionnelles de classification des sentiments basées sur l'apprentissage automatique se concentrent principalement sur l'extraction des caractéristiques du sentiment et la combinaison de classificateurs, et la combinaison de différents classificateurs a un certain impact sur les résultats de l'analyse des sentiments.Ces méthodes ne peuvent souvent pas utiliser pleinement les informations contextuelles du texte et ont le problème d'ignorer la sémantique contextuelle lors de l'analyse du contenu texte, de sorte que leur précision de classification est affectée.