Dans le cours : L'essentiel d'OpenAI et des modèles de langage GPT pour Node.js

Accédez au cours complet aujourd’hui

Inscrivez-vous aujourd’hui pour accéder à plus de 24 900 cours dispensés par des experts.

Passer de la parole au texte avec l'API Whisper

Passer de la parole au texte avec l'API Whisper

Dans cette section, on découvre Whisper. C'est un modèle de langage qui permet de transformer l'audio en format texte. Pour les développeurs, on aura accès à deux points de terminaison. On va se placer au niveau de la plateforme de OpenAI pour découvrir l'API pour les développeurs, et on trouvera la section qui correspond à Speech to text. Grâce à cette API, on pourra transformer l'audio en format texte. On aura accès à ces deux points de terminaison que sont transcription et translation, grâce au modèle Whisper. Le premier projet que nous allons découvrir sera ici pour transcrire les fichiers audio en n'importe quelle langue. Ce sera la première démonstration, et c'est ce à quoi ressemble l'output. On aura cet objet, et ce sera la valeur de cette clé " text " qui correspondra à la transcription du fichier audio. Ensuite, vous aurez également le point de terminaison qui permet à la fois de traduire et de transcrire, et l'output se fera en anglais. Plusieurs formats de fichiers seront…

Table des matières