[YUE Yimei] Phase 2 : Utilisation de iTrameur

Afin d’analyser notre corpus concernant le terme « masculinité » en français, en coréen et en chinois, nous avons un outil développé par notre enseignant : iTrameur.

Le lien de iTrameur :

http://www.tal.univ-paris3.fr/trameur/iTrameur/

Cet outil peut nous aider à analyser les corpus en ligne.

Dans cet article, je vais vous montrer comment j’utilise iTrameur pour analyser le corpus en chinois.

1- Tout d’abord, nous devons faire un gros corpus en mettant tous les textes segmentés ensemble, et ajouter les balises « <dump> » et « </dump> » au début et à la fin de chaque texte. 

Comme j’ai mis les textes segmentés de chaque URL dans le répertoire DUMP-TEXTE et nommé ces fichiers sous le nom de « $numerotableau-$compteur », mais dans ce répertoire, il y a encore d’autres genres de fichiers  : index et bigramme. Ce sont des fichiers dont je n’ai pas envie d’ajouter les contenus dans le gros fichier. Donc, j’ai décidé de mettre les fichier de textes segmentés dans un nouveau répertoire, et puis je mets leur contenu dans le gros fichier.

Voici les commandes que j’ai utilisé dans le Bash :  

2- Après avoir obtenu le gros fichier avec des balises, on peut commencer à importer ce fichier dans l’iTrameur pour analyser.

Si l’on importe directement le fichier, le résultat est comme ça. 

Donc, il faut vider « Délimiteur de contexte » et ajouter les délimiteurs qu’on a besoin d’utiliser. Ici, puisque j’ai utilisé l’espace pour segmenter les mots chinois, je dois ajouter l’espace et les ponctuations chinoises dans les délimiteurs. 

Et il y a quelques résultats de donnés et schémas qui peuvent être très utiles pour nous aider à analyser le corpus.

Cadre – TGF+BT+VN

Cela nous donne un tableau avec la fréquence de mot  

Trame – Dictionnaire

Ici, on peut choisir le mot que on s’intéresse, et puis on peut voir le schéma de co-occurence générale dans Coocs – Cooccurrents.

3- Commencement d’analyse avec les donnés que l’iTrameur nous offre. C’est très pratique avec l’iTrameur.

Et parmi les résultats que l’iTrameur nous donne, il y a quelques points intéressants que nous pouvons exploiter.

Premièrement : quand on parle de la masculinité, le sujet concerne aussi la femme. Dans le résultat, le mot « femme » (42) en français, et le mot « sexe féminin » (187) en chinois sont assez fréquents.

homme (187) ; sexe féminin (187) ; masculinité (186)

Mais ce qui est intéressant, c’est que dans le corpus français, il y a le pronom « il » et « elle » (même « il » peut être utilisé pour d’autre sens, ici je pense que la plupart d’occurences de « il » est plutôt pour exprimer le sens de sexe masculin) pour exprimer deux sexes différents. Par contre, en chinois, dans ce tableau, il y a seulement le pronom qui exprime le sexe masculin, le pronom « elle » en chinois n’est pas tellement fréquent dans mon corpus. Ce point reste à exploiter avec plus d’information sur l’iTrameur, et tant mieux sur plus de donnés.

il (255)

Deuxièmement, le mot masculinité est souvent lié avec l’enfant et l’éducation dans ces deux langues. Il me semble que c’est un consensus la masculinité est liée avec l’éducation.

garçon enfant (134) ; éducation (129) ; santé (129)

Troisièmement, dans ces deux corpus, le « pays » se montre assez fréquent.

Dans le corpus en français, la France a apparu pour 95 fois (presque deux fois plus que le mot motif « masculinité » 54 fois). Et dans le corpus chinois, la fréquence du mot « Chine » est de 324 fois (à peu près 1.75 fois plus que le mot « masculinité » 186 fois).

La masculinité est probablement très souvent liée au pays selon notre corpus.

Sexe masculin (395) ; Chine (324)

Quatrièmement, il semble que la masculinité est en crise en Chine à la fois en France.

Les mots co-existent avec la « masculinité » en chinois sont « empoisonner », « crise », « définition », « avoir », « à la mode », « sauver », « élever », « menacer le futur du pays », « homme de beauté », « comme fleur », « toxic » …

Et en français, ce sont « crise », « définition », « dominante » qui apparaissent plus fréquents autour de mot « masculinité ».

Je me pose la question, pourquoi la masculinité est supposée en crise, je crois que j’ai trouvé une réponse semblable dans le corpus chinois. Le mot « maquillage » a apparu assez souvent en chinois, ce qui est anormal. Pourtant, ce point reste à développer et vérifier avec plus de données.

mode (64)
maquillage (62)

Laisser un commentaire

Concevoir un site comme celui-ci avec WordPress.com
Commencer