Google a publié les premiers éléments de son projet, qui dérivent de la recherche effectuée pour la construction d'une Intelligence Artificielle. Cette technologie serait capable de traduire les services de ce dernier dans 1000 langues. L’Intelligence Artificielle sert bien ce projet qui a été dévoilé pour la première fois en novembre dernier, sous le nom de "modèle universel de la parole" (pour universal speech model, en anglais), avec une particularité qui consiste dans le fait qu’il est entraîné à la fois sur l'oral et l'écrit dans toute sa démarche.
Polyglotte plus que jamais :
Ainsi, les services seront désormais proposés dans 1000 langues. A ce qu’il parait, Google avance bien dans la mission qu'il s'est donné de construire un modèle d'IA dédié à la communication orale et capable de traduire et transcrire dans toute une panoplie de langues les plus parlées dans le monde.
Google a détaillé, dans un point d'étape partagé sur son blog dédié à ses projets de recherche, que ce nouveau modèle a été conçu sur "12 millions d'heures de parole et 28 milliards de phrases écrites, qui couvrent plus de 300 langues".
Cette intelligence artificielle est d’ailleurs exploitée dans la création de maintes légendes sur YouTube, qui est la plateforme vidéo du groupe.
Il a été précisé dans ce sens que le modèle peut réaliser une reconnaissance automatique de la parole dans une centaine de langues, parmi elles, celles plus ou moins répandues à l’international, comme l'anglais ou le mandarin, ou encore les quelques dialectes sous-utilisés tels que le cebuano ou l’azerbaïdjanais.
Le principal défi du projet se situe dans ce point même : dans un modèle classique d’apprentissage, le manque de données vocales et textuelles disponibles rend difficile la formation de l’IA.
Dans le même sillage, Google précise que pour certaines langues qui sont parlées par moins de vingt millions de personnes, la recherche des données nécessaires à l'entraînement de l'intelligence artificielle est "très difficile".
Toutefois, la grande entreprise américaine fait preuve d’un optimisme à toute épreuve en soulignant : "Notre processus d'apprentissage du modèle est efficace pour s'adapter à de nouvelles langues et à de nouvelles données".
Pour rappel, Google avait fait savoir en novembre dernier que le projet prendrait plusieurs années avant son lancement officiel, et qu’il sera progressivement déployé dans les différents services du géant de la tech, comme par exemple ses claviers numériques, Google Traduction et YouTube.
Polyglotte plus que jamais :
Ainsi, les services seront désormais proposés dans 1000 langues. A ce qu’il parait, Google avance bien dans la mission qu'il s'est donné de construire un modèle d'IA dédié à la communication orale et capable de traduire et transcrire dans toute une panoplie de langues les plus parlées dans le monde.
Google a détaillé, dans un point d'étape partagé sur son blog dédié à ses projets de recherche, que ce nouveau modèle a été conçu sur "12 millions d'heures de parole et 28 milliards de phrases écrites, qui couvrent plus de 300 langues".
Cette intelligence artificielle est d’ailleurs exploitée dans la création de maintes légendes sur YouTube, qui est la plateforme vidéo du groupe.
Il a été précisé dans ce sens que le modèle peut réaliser une reconnaissance automatique de la parole dans une centaine de langues, parmi elles, celles plus ou moins répandues à l’international, comme l'anglais ou le mandarin, ou encore les quelques dialectes sous-utilisés tels que le cebuano ou l’azerbaïdjanais.
Le principal défi du projet se situe dans ce point même : dans un modèle classique d’apprentissage, le manque de données vocales et textuelles disponibles rend difficile la formation de l’IA.
Dans le même sillage, Google précise que pour certaines langues qui sont parlées par moins de vingt millions de personnes, la recherche des données nécessaires à l'entraînement de l'intelligence artificielle est "très difficile".
Toutefois, la grande entreprise américaine fait preuve d’un optimisme à toute épreuve en soulignant : "Notre processus d'apprentissage du modèle est efficace pour s'adapter à de nouvelles langues et à de nouvelles données".
Pour rappel, Google avait fait savoir en novembre dernier que le projet prendrait plusieurs années avant son lancement officiel, et qu’il sera progressivement déployé dans les différents services du géant de la tech, comme par exemple ses claviers numériques, Google Traduction et YouTube.