CONNEXION

  • Abonnement
  • Publicité
  • Contact
  • Guide industrie
  • Vidéos
  • Podcasts
  • magazine CONVERGENCE
  • Boutique
  • Numérique
  • Jeux Vidéo
  • Mobile
  • Animation
  • Informatique
  • Arts Médiatiques
  • Marketing
  • Musique
  • Industrie
  • Réalité virtuelle
  • Intelligence artificielle
  • Startups
  • Artisans du numérique
  • Conseils d’experts
  • Exclusifs
  • SUIVEZ-NOUS

    RSS

    RECEVEZ GRATUITEMENT
    LE BULLETIN QUOTIDIEN [voir un exemple]

    DeepMedia, l’intelligence artificielle au service de la traduction Rijul Gupta et Emma Brown. Photo: Courtoisie

    DeepMedia, l’intelligence artificielle au service de la traduction

    30 septembre 2022, 07h30
         |      Article rédigé par Sophie Bernard     

    Après des études en informatique, Rijul Gupta étudie en génie à l’Université de Yale. C’est là qu’il rencontre Emma Brown, qui faisait son baccalauréat en études russes et est-européennes ainsi qu’en sciences politiques. Cinq ans après avoir obtenu son diplôme, Rijul Gupta travaillait comme ingénieur dans une entreprise de construction lorsqu’il a vu, comme des millions de personnes, une fausse vidéo du réalisateur et acteur Jordan Peele incarnant Barack Obama. Il a été frappé par le visage de Jordan Peele et par la façon dont il entrait dans la peau de l’ancien président américain. Il s’est demandé comment utiliser cette nouvelle technologie pour le bien et non pour le mal.

    En 2017, il lance DeepMedia, d’abord une start-up dans laquelle il investit ses économies pour acheter du matériel, et commence à jouer avec l’apprentissage machine. Après une levée de fonds en 2020, il fait appel à son ancienne collègue de Yale, qui se joint à lui à titre de directrice de l’exploitation de la start-up. « Au départ, nous avons développé une application assez simple qui permettait de générer des vidéos en balayant les visages, explique-t-il. Puis, Emma et moi avons beaucoup discuté. Je suis fan de Star Trek et, dans l’émission, il y a un traducteur universel. Cela nous a donné, en 2021, l’envie de pivoter pour nous intéresser à la traduction universelle. »

    Aujourd’hui, la solution développée par DeepMedia permet de traduire en 10 langues. D’ici la fin de l’année, elle devrait pouvoir en offrir 20 ou 30. « Un des éléments importants pour nous était de créer un outil éthique qui utiliserait le deep fake, qui pourrait prendre du contenu et le rendre disponible à l’échelle de la planète avec une technologie qui ferait le bien, alors que, pour le moment, elle fait peur à bien des gens », enchaîne Emma Brown. L’équipe de DeepMedia développe son produit avec l’apprentissage profond en toile de fond pour comprendre ce qu’une personne dit dans une vidéo, en prenant en compte le mouvement de ses lèvres, ses expressions et le contexte dans lequel elle parle pour le traduire le plus fidèlement possible dans une ou plusieurs autres langues. L’intelligence artificielle permet de comprendre puis de traduire en générant du média synthétique.

    « Par exemple, si une personne parle en anglais, nous pouvons générer de la traduction en français en adaptant le mouvement des lèvres et les expressions grâce à notre produit Web, poussé par l’intelligence artificielle. » Avant de proposer la solution au grand public, la start-up veut d’abord s’assurer qu’elle ne pourra jamais être utilisée pour des raisons malveillantes. Pour le moment, elle est offerte en mode SaaS à des entreprises médiatiques, à l’ONU et gratuitement à des influenceurs sur TikTok, YouTube ou d’autres plateformes qui peuvent ainsi faire grandir mondialement leur base d’adeptes (fans). Avant de la lancer officiellement, Rijul Gupta, Emma Brown et leur équipe veulent qu’elle soit hyper précise.

    « Deux éléments se trouvent au coeur de notre travail afin de nous assurer de la précision de la traduction, souligne la directrice de l’exploitation. D’abord, nous utilisons l’intelligence artificielle pour que la traduction soit exacte, puis nous ajoutons des humains dans la boucle pour valider le travail de la machine. L’apport des humains est ce qui nous différencie des autres produits. » Son collègue donne en exemple une traduction de l’anglais à l’espagnol. En anglais, on peut dire « Hi, how are you ? You look great today ! ». Or, la traduction en espagnol ne peut être faite mot à mot puisque la langue comprend le masculin et le féminin, contrairement à l’anglais. D’après le contexte, la solution de DeepMedia peut détecter si on parle à un homme ou à une femme, ou encore à une personne plus âgée, avec qui l’on parle de façon plus formelle.

    La solution de DeepMedia devrait être fin prête au milieu de l’année 2023 sous forme de produit. « Avant, nous devons nous assurer que la traduction est vraie et honnête, et nous assurer que notre solution ne peut pas être manipulée, souligne le directeur général. Alors qu’il était de 1 pour 100 quand nous avons commencé, le niveau d’automation devrait atteindre un pour 10 000. » Parmi les langues que la solution peut traduire, on compte l’espagnol, le français, le mandarin, le russe et l’ukrainien.

    Les deux collègues ont très hâte de venir partager leur vision et leur mission à MTL connecte. Déjà, ils ont donné à traduire des informations sur les autres conférenciers à leur produit afin de mieux comprendre de quoi sera composée la conférence. « Notre but est que rien ne puisse plus arrêter les gens de communiquer entre eux », lance Rijul Gupta.

    Sur le même sujet

    Intéressé.e à reproduire un article, une photo ou une vidéo ?

    En bénéficiant de notre licence de reproduction, vous pourrez :

    • publier un article dans vos sites Web, dans vos infolettres, dans vos réseaux sociaux, etc.
    • en modifier la longueur
    • recevoir les photos (et vidéos, si applicable) en haute résolution
    • publier les photos (et vidéos, si applicable) dans vos sites Web, dans vos infolettres, dans vos réseaux sociaux, etc.
    • le contenu devient public sur notre plateforme, ce qui vous octroie encore plus de visibilité

    Sous réserve que les droits sur les contenus que vous souhaitez reproduire (textes, photos ou vidéos) nous appartiennent.

    DERNIERS ARTICLES

    Rau_Ze sort son premier album « Virer nos vies ».

    Rau_Ze sort son premier album « Virer nos vies ».

    Suite
    29 mars 2024, 09h10
    MUTEK et la SAT annoncent une alliance stratégique

    MUTEK et la SAT annoncent une alliance stratégique

    Suite
    28 mars 2024, 03h00
    « Dans les médias » décerne ses prix

    « Dans les médias » décerne ses prix

    Suite
    28 mars 2024, 01h00