Перейти к содержанию

← OpenAI

LLM-модели / OpenAI

GPT Audio от OpenAI - мультимодальная модель для работы с текстом и аудио

Первая общедоступная аудиомодель OpenAI для генерации и обработки звука с расширенным контекстом.

OpenAI Контекст 128K Вход: текст, аудио $2.50 / 1М вход

Что это

GPT Audio - это мультимодальная модель от OpenAI, которая работает как с текстом, так и с аудио. Она представляет собой первую общедоступную аудиомодель компании с улучшенным декодером для более естественного звучания голосов. Модель способна обрабатывать аудиовход и генерировать текстовый или аудиовыход.

Что умеет

Модель выделяется способностью работать с аудиофайлами наравне с текстом, что открывает возможности для создания голосовых ассистентов, аудиотранскрипции и синтеза речи. Улучшенный декодер обеспечивает более натуральное звучание голосов и лучшую консистентность. Поддержка инструментов позволяет интегрировать модель в сложные рабочие процессы.

Кому подходит

Подходит разработчикам голосовых интерфейсов, создателям контента для синтеза речи, а также для задач транскрибирования аудио и создания аудиоассистентов.

Характеристики

Параметр Значение
Провайдер OpenAI
Контекст 128 000 токенов
Вход текст, аудио
Выход текст, аудио
Цена входа $2.50 / 1М токенов
Цена выхода $10.00 / 1М токенов
Макс. вывод 16 384 токенов
Вызов инструментов (tools) да
Режим рассуждения нет
Появилась Январь 2026
Обновлено 11 июн 2026

Где запустить: провайдеры

Модель раздаётся через 1 провайдер. Контекст, цены за 1М токенов по провайдерам:

Провайдер Контекст Макс. вывод Вход $/1М Выход $/1М
OpenAI 128K 16K $2.50 $10.00

Доступ из России

Для использования из России доступна через агрегаторы моделей, такие как OpenRouter (ID: openai/gpt-audio), где можно оплатить криптовалютой или международными картами. Прямой доступ к API OpenAI из РФ ограничен, поэтому OpenRouter является основным обходным путем.

Похожие модели

Whisper · ElevenLabs · Play.ht · Murf AI

Открыть на OpenRouter

Попробуйте ENGRAM на своих данных

Нейросеть на ваших встречах, документах и переписке: отвечает со ссылкой на источник. Это ваша вторая память на базе ИИ. Данные хранятся в России, старт бесплатный.

Зарегистрироваться бесплатно
Обучаем команды работе с нейросетями под ваши процессы. Узнать о корпоративном обучении