Перейти к содержанию

← Z.AI

LLM-модели / Z.AI

GLM 4.7 Flash от Z.AI - возможности, контекст, цена и аналоги

Мощная 30B-параметровая модель от Z.AI, оптимизированная для агентного программирования и выполнения длинных задач.

Z.AI Контекст 203K Вход: текст $0.060 / 1М вход Рассуждение

Что это

GLM 4.7 Flash - это современная языковая модель от китайской компании Z.AI, представляющая класс 30 миллиардов параметров. Она известна балансом производительности и эффективности, поддерживает работу с инструментами и цепочки рассуждений. Модель способна обрабатывать контекст до 202 тысяч токенов.

Что умеет

Модель особенно сильна в задачах программирования и долгосрочного планирования, будучи специально оптимизированной для агентных сценариев кодирования. Она выделяется среди аналогов расширенным контекстом и поддержкой инструментов, что позволяет эффективно решать сложные многоэтапные задачи.

Кому подходит

Подходит разработчикам, создающим AI-агентов, и инженерам, которым нужна модель для сложного программирования, автоматизации и планирования задач.

Характеристики

Параметр Значение
Провайдер Z.AI
Контекст 202 752 токенов
Вход текст
Выход текст
Цена входа $0.060 / 1М токенов
Цена выхода $0.400 / 1М токенов
Макс. вывод 16 384 токенов
Вызов инструментов (tools) да
Режим рассуждения да
Появилась Январь 2026
Обновлено 11 июн 2026

Где запустить: провайдеры

Модель раздаётся через 5 провайдеров. Контекст, цены за 1М токенов и аптайм по провайдерам:

Провайдер Контекст Макс. вывод Вход $/1М Выход $/1М Аптайм
DeepInfra 203K 16K $0.060 $0.400 92.5%
Cloudflare 131K 131K $0.061 $0.400 99.7%
Novita 200K 128K $0.070 $0.400 -
Phala 203K 203K $0.100 $0.430 99.3%
Venice 128K 16K $0.125 $0.500 -

Цена входа по провайдерам, $/1М токенов

Venice$0.125
Phala$0.100
Novita$0.070
Cloudflare$0.061
DeepInfra$0.060

Доступ из России

Из России модель доступна через агрегаторы API, такие как OpenRouter (ID: z-ai/glm-4.7-flash). Оплата возможна международными картами или криптовалютой. Прямой доступ к API от Z.AI для российских пользователей может быть ограничен, поэтому использование через посредников остается основным вариантом.

Похожие модели

Qwen2.5 32B · DeepSeek Coder 33B · CodeLlama 34B · WizardCoder 33B

Открыть на OpenRouter

Попробуйте ENGRAM на своих данных

Нейросеть на ваших встречах, документах и переписке: отвечает со ссылкой на источник. Это ваша вторая память на базе ИИ. Данные хранятся в России, старт бесплатный.

Зарегистрироваться бесплатно
Обучаем команды работе с нейросетями под ваши процессы. Узнать о корпоративном обучении