Перейти к содержанию

← Google

LLM-модели / Google

Gemini 3.1 Flash TTS Preview от Google - синтез речи, контекст, цена и аналоги

Новая модель синтеза речи от Google, преобразующая текст в реалистичную озвучку.

Google Контекст 8K Вход: текст $1.00 / 1М вход

Что это

Gemini 3.1 Flash TTS Preview - это модель преобразования текста в речь от Google. Она представляет собой существенный шаг вперед по сравнению с предыдущим поколением, принимая текстовый ввод и генерируя высококачественный аудиовыход.

Что умеет

Модель специализируется на создании естественного и качественного звучания из текста. Она эффективно закрывает задачи озвучки контента, создания аудио из текстовых данных и интеграции голосовых функций в приложения.

Кому подходит

Подходит разработчикам для внедрения синтеза речи в сервисы, создателям контента для озвучки материалов и всем, кому нужен программный генератор голоса из текста.

Характеристики

Параметр Значение
Провайдер Google
Контекст 8 192 токенов
Вход текст
Выход speech
Цена входа $0.0000
Цена выхода $0.0000
Вызов инструментов (tools) нет
Режим рассуждения нет
Появилась Апрель 2026
Обновлено 11 июн 2026

Где запустить: провайдеры

Модель раздаётся через 1 провайдер. Контекст, цены за 1М токенов и аптайм по провайдерам:

Провайдер Контекст Макс. вывод Вход $/1М Выход $/1М Аптайм
Google 8K - $0.0000 $0.0000 100.0%

Доступ из России

Прямой доступ из РФ к API Google ограничен. Основной способ использования - через агрегаторы вроде OpenRouter, которые предоставляют API-доступ к модели. Оплата через них возможна международными картами.

Похожие модели

OpenAI TTS · ElevenLabs · Google Gemini 2.5 Flash TTS

Открыть на OpenRouter

Попробуйте ENGRAM на своих данных

Нейросеть на ваших встречах, документах и переписке: отвечает со ссылкой на источник. Это ваша вторая память на базе ИИ. Данные хранятся в России, старт бесплатный.

Зарегистрироваться бесплатно
Обучаем команды работе с нейросетями под ваши процессы. Узнать о корпоративном обучении