OpenAI présente de nouvelles fonctionnalités d'IA vocale pour l'API OpenAI

OpenAI a lancé de nouvelles fonctionnalités d'IA vocale pour sa plateforme API, aidant les développeurs à créer des applications qui interagissent avec les utilisateurs, transcrivent la parole et traduisent les langues. Le nouveau modèle GPT-Realtime-2 offre une simulation vocale réaliste, permettant des conversations naturelles avec les utilisateurs. Contrairement à la version précédente, ce modèle possède des capacités de raisonnement de niveau GPT-5 et est conçu pour traiter des requêtes plus complexes. C'est ce que rapporte Techcrunch.com rapporte .
De plus, l'entreprise a introduit la fonction GPT-Realtime-Translate. Elle fournit des services de traduction en temps réel pendant la conversation et prend en charge plus de 70 langues d'entrée et 13 langues de sortie. Par ailleurs, l'outil GPT-Realtime-Whisper offre une transcription en direct de la parole en texte, enregistrant les interactions instantanément.
Les représentants d'OpenAI affirment que ces nouveaux modèles transforment les interfaces vocales, passant de simples systèmes de questions-réponses à des outils capables d'effectuer des tâches complexes : écouter, analyser et agir. Ces technologies devraient transformer des secteurs tels que le service client, l'éducation, les médias et la création de contenu.
En ce qui concerne la sécurité, l'entreprise a mis en place des systèmes de protection spéciaux pour prévenir les abus, la fraude et le spam. Si les règles concernant les contenus nuisibles sont enfreintes pendant une conversation, le système interrompt automatiquement l'interaction. Les nouveaux modèles vocaux sont inclus dans l'API OpenAI Realtime, avec une tarification basée sur le temps d'utilisation ou la consommation de jetons.
Lisez “Zamin” sur Telegram !