Je travaille sur un projet où je mets en œuvre l'analyse de sentiments en utilisant la bibliothèque Stanza pour le traitement du langage naturel en français. Cependant, je fais face à des difficultés pour obtenir les résultats souhaités. J'ai essayé d'appliquer le pipeline Stanza sur une colonne de texte dans un DataFrame, mais les résultats ne correspondent pas à ce que j'attends.
Voici un extrait de mon code :
pythonCopy codeimport stanzaimport pandas as pd
Télécharger les modèles nécessaires pour le français
stanza.download("fr")
Charger le pipeline CoreNLP sans spécifier de modèle de sentiment
nlp_corenlp = stanza.Pipeline(lang='fr', processors='tokenize')
Charger les données depuis le fichier Excel
chemin_fichier_excel = '/content/drive/MyDrive/ColabNotebooks/exportReponses-20240130.xlsx'df = pd.read_excel(chemin_fichier_excel)
Ajouter le traitement du texte avec Stanza
df['verbatim_processed'] = df['verbatim'].apply(lambda text: nlp_corenlp(text).to_dict())Cependant, j'obtiens une erreur du type "AssertionError: input should be either str, list, or Document", et les résultats ne correspondent pas à mes attentes.
Comment puis-je résoudre cette erreur et m'assurer que le traitement du texte avec Stanza fonctionne correctement?De plus, je suis ouvert à d'autres bibliothèques ou approches pour l'analyse de sentiments en français. Des recommandations pour combiner la classification de classes ou d'autres solutions seraient également appréciées.Merci pour votre aide!
Problèmes avec l'analyse de sentiments en utilisant Stanza et classification de classes - Résultats inattendus