Nicolas Garneau (Université Laval). Photo: Oriane Morriet

Nicolas Garneau décrit comment la génération automatique de texte peut conduire à la désinformation

9 décembre 2019, 10h00

| Article rédigé par Oriane Morriet

Le phénomène de la désinformation ne se limiterait pas à la modification d’images ou deepfake, il concernerait également la génération automatique de texte. C’est du moins l’avis de Nicolas Garneau, étudiant au doctorat à l’Université Laval, dont l’intervention intitulée « Vers la génération de fausses nouvelles », qu’il a prononcée à l’occasion de la Journée Techno du CRIM sur la Désinformation à l’ère de l’intelligence artificielle, portait sur les dernières inventions en matière de contenus textuels générés grâce à l’intelligence artificielle. Retour sur la présentation de Nicolas Garneau pour tenter de comprendre comment la génération automatique de texte peut conduire à la désinformation.

En 2017, Google enregistre un boom considérable de recherches autour des fausses nouvelles : c’est le début de l’ère des fake news. D’un côté, le président américain Donald Trump accuse constamment les médias de rapporter des fausses nouvelles, tandis que d’un autre côté, des sites se spécialisent dans la création de fausses nouvelles humoristiques. Nicolas Garneau cite Le Revoir, qui parodie le Devoir. « Les fake news ne datent cependant pas d’hier, mais jusqu’à présent il y avait toujours un humain derrière », prévient Nicolas Garneau. Le développement de l’intelligence artificielle change la donne : il est désormais possible de générer des fausses nouvelles par l’intermédiaire d’un programme informatique.

Pour permettre de bien comprendre son propos, Nicolas Garneau revient sur la définition de l’apprentissage automatique. « Grâce à l’apprentissage automatique, il est possible de faire de la génération de texte. Cela prend des données et un algorithme d’apprentissage. Celui-ci va alors nous donner un modèle pour poser des actions », décrit l’étudiant au doctorat. En matière de génération textuelle, il faut un gros corpus de textes pour entraîner un algorithme. L’idée est de lui permettre de comprendre comment construire un groupe de mots, une phrase, un paragraphe, etc. « Les modèles de langue comprennent comment écrire du texte. Ensuite, on utilise le modèle pour générer de nouveaux contenus », résume Nicolas Garneau.

À titre d’exemple de modèle de langue, Nicolas Garneau cite OpenAI, une organisation à but non-lucratif présidée par Elon Musk et Sam Altman. Spécialisée dans la recherche en intelligence artificielle de haut niveau, OpenAI possède une division spécifique pour le traitement de la langue naturelle. « Ils ont inventé un modèle de langue qu’ils ont finalement décidé de ne pas rendre public car ils le jugeaient trop dangereux », commente l’étudiant au doctorat. Le Generative Pre-Trained Model 2 (GPT) était en effet si performant qu’il bernait l’être humain en écrivant des textes particulièrement vraisemblables.

« Ils ont entraîné leur modèle avec 8 millions de pages Web, avec des données relativement propres. Cela représentait 40GB de données textuelles. GPT est un réseau de neurones de deep learning avec 1,5 millier de paramètres. C’est un modèle hyper gros. Un seul entraînement de ce modèle coûte 43 millions $ US », détaille Nicolas Garneau. Grâce à ces caractéristiques, GPT est capable de prédire avec exactitude le prochain mot d’une phrase et d’évaluer avec précision la probabilité de cette phrase. « Dans les textes générés par GPT, il n’y a pas beaucoup d’erreurs sémantiques ni syntaxiques », poursuit-il.

Afin de s’essayer lui-même à la génération automatique de texte, Nicolas Garneau a décidé d’entraîner un modèle de langue en se servant des articles écrits dans Le Journal de Montréal. « J’avais 250 000 phrases de 30 auteurs différents, avec 10 lignes de code », résume-t-il. Pour entraîner le modèle, l’étudiant au doctorat s’est servi d’Amazon Open Source, ce qui lui a coûté 1 dollar et 1 heure de temps. Reste à savoir si les phrases générées à l’aide de ces ressources sont convaincantes : « Les médias se voient comme les consommateurs d’esprit » ou encore « La loi est soumise à l’embauche du gouvernement précédent et blablabla ».

Quand le modèle de langue est bien entraîné, Nicolas Garneau reconnaît qu’il est difficile de reconnaître le faux du vrai. « Il est même possible de conditionner un modèle de langue pour générer du contenu par rapport à un certain thème ou à un certain style », commente-t-il. C’est ainsi que l’intelligence artificielle peut générer de fausses nouvelles et conduire à la désinformation. En reproduisant le style d’une personne, l’algorithme peut se faire passer pour quelqu’un d’autre. De là à l’escroquerie ou à la manipulation, il n’y a qu’un pas.

Pour se défendre contre ces fausses nouvelles automatiquement générées par l’intelligence artificielle, le remède est justement l’intelligence artificielle. Dans l’article scientifique « Defending Against Neural Fake News », certains chercheurs de l’Université Cornell ont ainsi analysé que le développement de programmes informatiques capables de détecter les fausses nouvelles générées automatiquement permettaient leur éradication à 92%. « C’est bien, mais il reste donc encore 8% de fake news sur le Web », relève Nicolas Garneau. Pour conclure sa présentation, l’étudiant au doctorat appelle donc à la prudence. « Il est important de vérifier nos sources », achève-t-il.

Cet article sera intégré au Guide de l’industrie: : INTELLIGENCE ARTIFICIELLE, un ouvrage de référence unique pour comprendre les rouages de l’industrie québécoise de l’intelligence artificielle : ses entreprises, ses personnalités, les grands centres de recherche, les processus, les marchés, les considérations économiques, éthiques, ses forces et les défis qui l’animent.

Il est possible de commander, de contribuer ou de soutenir cette publication en > cliquant ici <.

https://bit.ly/2OOhYbn - info@lienmultimedia.com

Intéressé.e à reproduire un article, une photo ou une vidéo ?

En bénéficiant de notre licence de reproduction, vous pourrez :

publier un article dans vos sites Web, dans vos infolettres, dans vos réseaux sociaux, etc.
en modifier la longueur
recevoir les photos (et vidéos, si applicable) en haute résolution
publier les photos (et vidéos, si applicable) dans vos sites Web, dans vos infolettres, dans vos réseaux sociaux, etc.
le contenu devient public sur notre plateforme, ce qui vous octroie encore plus de visibilité

Sous réserve que les droits sur les contenus que vous souhaitez reproduire (textes, photos ou vidéos) nous appartiennent.

Je veux en bénéficier maintenant Donnez-moi plus d'informations

DERNIERS ARTICLES

Cher abonné, le saviez-vous…

CONNEXION

SUIVEZ-NOUS

RECEVEZ GRATUITEMENT
LE BULLETIN QUOTIDIEN [voir un exemple]

Nicolas Garneau décrit comment la génération automatique de texte peut conduire à la désinformation

Sur le même sujet

Intéressé.e à reproduire un article, une photo ou une vidéo ?

DERNIERS ARTICLES

Danny Perreault encadre à sa façon les finissants en création de médias interactifs de l’UQAM

Les finissants de l’UQAM se démarquent aux PRIX NUMIX

Laurence Thérien a beaucoup appris lors du programme Jeunes pousses de l’ONF

Les diffuseurs toujours à la recherche de contenus engageants

Ania Jamila relate la production de la saison deux d’« Ainsi va Manu »

Téléfilm Canada annonce un financement de 21,6 M $ pour la production de 22 longs métrages - marché francophone

La Guilde canadienne des réalisateurs soutient la WGC dans son vote pour un mandat de grève

Le Partenariat du Quartier des spectacles forme un nouveau conseil d’administration

Amalga et Les Films du Lac annoncent la production du film « Menteuse » d’Émile Gaudreault

François Legault annonce la création du Musée national de l’histoire du Québec

La CMPA commente le vote d’autorisation de grève du WGC

Le Groupe de travail mondial pour les médias publics condamne la destruction de la tour de télévision de Kharkiv

« Má Sài Gòn » (« Mère Saigon) » de Khoa Lê est maintenant disponible en VSD

Prime Video devient le diffuseur officiel des soirées de hockey du lundi soir de la LNH au Canada

« De Pierre en fille » : Julianne Côté et Patrice Robitaille sont en tournage pour la 2e saison

Télé-Québec annonce la production de deux séries de fiction jeunesses originales

Baromètre des affaires : chute de l’indice de confiance des PME en avril

Les internautes possèdent environ 170 mots de passe en moyenne, selon une étude

OASIS immersion prolonge « Rêver l’Asie » et « Nature vive » jusqu’à la Fête du travail

TOPO met en vitrine l’expo « Écosystème Alpha » d’Aude Guivarc’h

Bell Média lance un nouveau portfolio de chaînes FAST

L’UQAM honore sept personnes diplômées d’exception, dont Melissa Mongiat et Kim O’Bomsawin

Qohash clôture un financement de série B de 17,4 M$ mené par le Fonds de solidarité FTQ

Studio Parachute met simplicité et éthique au cœur de l’innovation

Cher abonné, le saviez-vous…

CONNEXION

SUIVEZ-NOUS

RECEVEZ GRATUITEMENT LE BULLETIN QUOTIDIEN [voir un exemple]

Nicolas Garneau décrit comment la génération automatique de texte peut conduire à la désinformation

Sur le même sujet

Intéressé.e à reproduire un article, une photo ou une vidéo ?

DERNIERS ARTICLES

RECEVEZ GRATUITEMENT
LE BULLETIN QUOTIDIEN [voir un exemple]