Pour trouver à qui attribuer un document, un texte ou toute autre forme d'expression
écrite, l'apport de l'analyse des données peut se révéler fructueux.
Si pour un ensemble d'auteurs supposés, l'on dispose de documents leur étant attribués,
une analyse sémantique peut être lancée.
Remarque préliminaire
Si l'on remarque dans le document un mot ou une expresssion dont on sait que son
utilisation est fréquente chez telle personne, cela ne suffit pas à attribuer à
celle-ci la paternité du document.
En effet, pour que l'analyse sémantique soit probante, il est nécessaire que
l'on puisse effectuer une vraie comparaison en se servant de plusieurs mots
ou expressions et en y intégrant plus d'une personne.
Déroulement de l'étude
Pour chaque auteur supposé, il faut se munir de un ou plusieurs textes, ceux-ci
ne traitant pas obligatoirement du même sujet que le document à analyser.
L'analyse peut porter sur quelques personnes ou dizaines de personnes.
Donc, à ce moment nous disposons de:
XXX - document à analyser
Martin - texte
Marcel - document
Maurice - texte, texte
...
Différents mots ou expressions apparaissant dans l'ensemble des textes et documents
doivent être sélectionnés.
Un tableau personnes X mots doit ensuite être rempli, chaque case contenant le
nombre de fois ou le mot ou expression a été utilisé par la personne.
Méthode utilisée
Pour analyser ce tableau, l'analyse des correspondances s'impose.
Elle positionne en deux dimensions les personnes et XXX. Les personnes
les plus proches de XXX sont celles qui susceptibles d'avoir fourni le
document initial.
Exécuter une analyse des correspondances
Un exemple d'analyse sémantique
Cet exemple est basé sur l'analyse sémantique des professions de foi des
principaux candidats au premier tour des élections présidentielles 2017.
Voir l'exemple
|