OpenAI представила новые функции голосового интеллекта для API

Компания OpenAI запустила новые функции голосового интеллекта для своей платформы API, помогающие разработчикам создавать приложения для общения с пользователями, преобразования речи в текст и перевода. Новая модель GPT-Realtime-2 обеспечивает реалистичную симуляцию голоса, позволяя вести естественные диалоги. В отличие от предыдущей версии, эта модель обладает логическим мышлением уровня GPT-5 и предназначена для обработки более сложных запросов. Об этом сообщает Techcrunch.com сообщает .
Также компания представила функцию GPT-Realtime-Translate. Она предоставляет услуги перевода в режиме реального времени во время разговора и поддерживает более 70 входных и 13 выходных языков. Кроме того, инструмент GPT-Realtime-Whisper позволяет преобразовывать речь в текст в прямом эфире, мгновенно записывая ход общения.
Представители OpenAI отмечают, что эти новые модели превращают голосовые интерфейсы из простых систем «вопрос-ответ» в инструменты, способные выполнять сложные задачи: слушать, анализировать и действовать. Ожидается, что эти технологии произведут значительные изменения в таких сферах, как обслуживание клиентов, образование, медиа и создание контента.
Что касается безопасности, компания внедрила специальные системы защиты для предотвращения злоупотреблений, мошенничества и спама. Если в ходе беседы нарушаются правила использования вредоносного контента, система автоматически прекращает диалог. Новые голосовые модели включены в состав OpenAI Realtime API, а их стоимость определяется в зависимости от времени использования или расхода токенов.
Читайте «Zamin» в Telegram!