GPT Audio от OpenAI - мультимодальная модель для работы с текстом и аудио¶
Первая общедоступная аудиомодель OpenAI для генерации и обработки звука с расширенным контекстом.
Что это¶
GPT Audio - это мультимодальная модель от OpenAI, которая работает как с текстом, так и с аудио. Она представляет собой первую общедоступную аудиомодель компании с улучшенным декодером для более естественного звучания голосов. Модель способна обрабатывать аудиовход и генерировать текстовый или аудиовыход.
Что умеет¶
Модель выделяется способностью работать с аудиофайлами наравне с текстом, что открывает возможности для создания голосовых ассистентов, аудиотранскрипции и синтеза речи. Улучшенный декодер обеспечивает более натуральное звучание голосов и лучшую консистентность. Поддержка инструментов позволяет интегрировать модель в сложные рабочие процессы.
Кому подходит¶
Подходит разработчикам голосовых интерфейсов, создателям контента для синтеза речи, а также для задач транскрибирования аудио и создания аудиоассистентов.
Характеристики¶
| Параметр | Значение |
|---|---|
| Провайдер | OpenAI |
| Контекст | 128 000 токенов |
| Вход | текст, аудио |
| Выход | текст, аудио |
| Цена входа | $2.50 / 1М токенов |
| Цена выхода | $10.00 / 1М токенов |
| Макс. вывод | 16 384 токенов |
| Вызов инструментов (tools) | да |
| Режим рассуждения | нет |
| Появилась | Январь 2026 |
| Обновлено | 11 июн 2026 |
Где запустить: провайдеры¶
Модель раздаётся через 1 провайдер. Контекст, цены за 1М токенов по провайдерам:
| Провайдер | Контекст | Макс. вывод | Вход $/1М | Выход $/1М |
|---|---|---|---|---|
| OpenAI | 128K | 16K | $2.50 | $10.00 |
Доступ из России¶
Для использования из России доступна через агрегаторы моделей, такие как OpenRouter (ID: openai/gpt-audio), где можно оплатить криптовалютой или международными картами. Прямой доступ к API OpenAI из РФ ограничен, поэтому OpenRouter является основным обходным путем.
Похожие модели¶
Whisper · ElevenLabs · Play.ht · Murf AI
Нейросеть на ваших встречах, документах и переписке: отвечает со ссылкой на источник. Это ваша вторая память на базе ИИ. Данные хранятся в России, старт бесплатный.
Зарегистрироваться бесплатноENGRAM запоминает ваши встречи, документы и переписку и мгновенно находит ответ со ссылкой на источник. Ваша вторая память на базе ИИ. Данные в России, старт бесплатный.
Зарегистрироваться бесплатно