juin 29, 2021

La linguistique informatique pour découvrir les prête-plume et la tricherie contractuelle déloyale – Et ses limites

Nous avons mené une expérience avec un corpus d’écrits d’étudiants collecté auprès d’un groupe d’étudiants hors des États-Unis et du Royaume-Uni, appartenant tous à la même classe. Les travaux sélectionnés constituaient tous une réponse au même sujet. Dans cet ensemble de documents, nous avons ensuite introduit un document écrit par un prête-plume professionnel, composé par le prête-plume R, répondant au même sujet que les étudiants. R a également reçu les mêmes articles universitaires à lire avant de rédiger sa réponse au sujet et les mêmes spécifications de rédaction que les autres étudiants. Nous avons ensuite téléchargé les travaux des étudiants et le document écrit par R sur Ouriginal pour les analyser avec la fonction Metrics. 

Recognizing a ghostwriter through computational linguistics

Selon les discussions théoriques précédentes et les résultats expérimentaux en stylométrie, l’interférence entre les genres et les sujets peut rendre la différenciation entre les auteurs plus difficile. En effet, l’utilisation commune de mots et de phrases qui accompagne les travaux d’écriture sur un même sujet, ainsi que les conventions d’écriture propres à certains genres, rendent difficile l’identification d’une signature d’auteur forte qui puisse être utilisée vérifier l’auteur. Dans notre expérience, nous avons pu observer que R était une valeur aberrante élevée pour pratiquement toutes les mesures examinées par Ouriginal Metrics.

Étant donné que nous avons contrôlé le sujet et le genre, nous avons noté que ce qui variait dans cette expérience était l’éducation et le contexte de socialisation du rédacteur fantôme professionnel. Lorsque le devoir de R a été retiré de l’ensemble des documents des étudiants et que Ouriginal Metrics a été relancé, aucun texte soumis par les étudiants n’a été marqué en rouge. 

Lexical Originality as one of the measures supporting the Peer Group Similarity Hypothesis

Pour illustrer le système, nous allons examiner une mesure dans Ouriginal Metrics : L’authenticité lexicale compare le nombre de mots uniques dans un document à d’autres documents téléchargés sur Ouriginal et sélectionnés pour être comparés. En prenant en compte « l’hypothèse de la similarité des groupes de pairs » évoquée dans la première partie de cette série de blogs sur la tricherie contractuelle et la détection des prête-plume, nous nous attendions à ce qu’un groupe  d’étudiants dans la même classe, disposant du même matériel pédagogique et écrivant sur le même sujet, présente une faible variance en matière d’authenticité lexicale.

Sans document écrit par un prête-plume introduit dans l’ensemble, c’est effectivement ce que nous avons observé. Avec le document écrit par un rédacteur fantôme inclus dans l’expérience, nous avons remarqué que R utilisait un langage très différent pour exprimer ses pensées. Même si R a reçu les mêmes ressources, la diction est un indice qui montre que R est soit un génie, soit qu’il n’est pas un pair universitaire des autres étudiants. Bien sûr, cette seule mesure n’est pas suffisante, c’est pourquoi Ouriginal Metrics jette un regard d’ensemble. Ce faisant, nous avons remarqué que l’écriture de R était complètement différente de celle des autres élèves sur le plan quantitatif, ce qui a déclenché un signal d’alarme dans Ouriginal Metrics et a nécessité une inspection plus approfondie. 

Les limites de l’hypothèse : Bilinguisme, facteurs socio-économiques et classes moins homogènes

Nous avons réalisé des expériences similaires qui ont donné des résultats comparables et cette recherche à Ouriginal soutient l’hypothèse de similitude des groupes de pairs. Cependant, nous sommes pleinement conscients que d’autres expériences tenant compte de l’éducation linguistiquement diversifiée (classes multiculturelles) peuvent affiner ou réfuter notre hypothèse. Par exemple, il peut y avoir des différences culturelles ou socio-économiques au sein de la classe qui influencent les performances des élèves sur différents critères. Si l’on fait abstraction des résultats obtenus dans les mesures linguistiques, ces différences sociales dans la classe incitent à adopter de nouvelles approches pédagogiques qui tiennent compte du fait que les classes sont de moins en moins homogènes. 

Déjà, les classes multiculturelles remettent en question les pédagogies sur la manière d’éduquer efficacement les étudiants sur les effets négatifs du plagiat. Ces changements exigent notamment que les enseignants soient conscients des différents milieux en jeu dans la classe et qu’ils les intègrent à l’expérience d’apprentissage. Il ne fait aucun doute que la perspective multiculturelle est l’avenir de l’éducation et qu’Ourigial la soutient en tant que garant de l’intégrité universitaire et leader d’opinion en matière de technologie éducative.

Nous aimerions connaître votre opinion sur l’identification des prête-plume par la linguistique informatique et notre logiciel ! Discutez de ces sujets avec nous sur Twitter.

Au cas où vous auriez manqué la première partie, retrouvez-la ici : Détection de l’écriture fantôme et analyse du style d’écriture : Les basiques – Ouriginal

Lire plus de blogs :

This website uses cookies to improve the site’s overall user experience and performance. Read more here.