Le IA de Google apprend à reproduire le discours humain

0
101

Nous savons tous très bien que le géant de la technologie Google travaille dur pour synthétiser des voix qui sonnent de plus en plus comme des humains. L’idée est de rendre les interactions naturelles avec l’assistant personnel, avec les intervenants Google Home et même avec l’interprète.

Le IA de Google apprend à reproduire le discours humain

Le géant de la technologie Google travaille dur pour synthétiser des voix qui sonnent de plus en plus comme des humains. L’idée est de rendre les interactions naturelles avec l’assistant personnel, avec les intervenants Google Home et même avec l’interprète.

Cette fois, la société, bien sûr, le géant de la technologie Google a publié une nouvelle percée dans cette direction en utilisant des réseaux de neurones. Pouvez-vous reconnaître la différence entre la voix humaine et la voix synthétisée?

Le géant de la technologie Google a créé un système appelé Tacotron 2, pour la synthèse de la parole directement à partir du texte.

Il a plusieurs fonctionnalités intéressantes comme la correction de votre écriture: vous pouvez taper “this isrealy awhsome” et ensuite vous pouvez simplement entendre la phrase correcte “c’est vraiment génial”.

De plus, le système prononce les mots selon leur signification. Par exemple, “désert” peut être “désert” ou “désert” – le réseau de neurones détecte ceci et donne l’accent correct.

Il marque également une pause lorsqu’il détecte des virgules, change d’intonation en posant une question; prononce correctement des termes plus complexes comme «Otolaryngology» ou «Talib Kweli»; et est bon aussi pour les twisters.

Le plus crucial, cependant, est que le Tacotron 2 se rapproche de la voix humaine. Dans ce lien, vous pouvez trouver les exemples de voix, et je parie que vous ne pouvez pas identifier quelle phrase a été prononcée par un humain, et laquelle a été produite par le géant de la technologie IA de Google, IA (Artificial Intelligence).

Laire aussi  jolie plate-forme Fe est maintenant sur l'origine

Le IA de Google

Le IA de Google apprend à reproduire le discours humain
Le IA de Google apprend à reproduire le discours humain

Le retour est à la fin de la publication. J’étais capable d’identifier correctement les voix générées par ordinateur; certaines différences de rythme de parole permettent de le détecter – elles sont perceptibles mais très subtiles.

Cette nouvelle technique du géant technologique Google réunit deux projets de génération de discours précédents: WaveNet et le Tacotron original.

Le WaveNet est un réseau de neurones qui apprend à simuler notre voix.

Il commence par les audios enregistrés par les humains, essaye de les répliquer et s’améliore à chaque itération, jusqu’à créer une voix synthétique proche de la vraie. Il effectue une simulation en utilisant 16 000 échantillons pour chaque seconde.

le Tacotron original a servi à émuler des fonctionnalités de haut niveau, telles que l’intonation et la prosodies.

ces deux systèmes produisent un discours qui sonne naturel et se rapproche de la fidélité audio du vrai discours humain, écrivent les chercheurs. L’étude est disponible ici.

Alors, qu’est-ce que tu en penses? Merci de partager vos opinions et vos réflexions dans la section commentaire ci-dessous


LAISSER UN COMMENTAIRE

Please enter your comment!
Please enter your name here