Перейти к содержанию

← NVIDIA

LLM-модели / NVIDIA

Nemotron 3 Ultra 550B - возможности, контекст 1M токенов, цена и доступ из РФ

Мощная MoE-модель от NVIDIA с поддержкой рассуждений и миллионным контекстом для сложных агентных задач.

NVIDIA Контекст 1M Вход: текст $0.500 / 1М вход Рассуждение

Что это

Nemotron 3 Ultra 550B от NVIDIA построена на гибридной архитектуре Transformer-Mamba с механизмом Mixture of Experts: из 550 миллиардов параметров активно задействуются 55 миллиардов. Модель поддерживает расширенное рассуждение (reasoning) и работу с инструментами (tools), что делает её пригодной для сложных многошаговых сценариев. Контекстное окно в 1 миллион токенов позволяет обрабатывать очень длинные документы и разговоры без потери информации.

Что умеет

Модель хорошо справляется с задачами, требующими глубокого анализа и цепочки рассуждений: юридические и технические документы, сложный код, исследовательские запросы. Архитектура MoE обеспечивает высокую эффективность: большой объём параметров при умеренных вычислительных затратах на каждый запрос. Поддержка инструментов открывает возможности для построения агентных пайплайнов и оркестрации задач.

Кому подходит

Подходит разработчикам и командам, которые строят агентные системы, автоматизируют аналитику больших текстов или нуждаются в модели с глубоким reasoning для корпоративных и исследовательских задач.

Характеристики

Параметр Значение
Провайдер NVIDIA
Контекст 1 000 000 токенов
Вход текст
Выход текст
Цена входа $0.500 / 1М токенов
Цена выхода $2.50 / 1М токенов
Макс. вывод 16 384 токенов
Вызов инструментов (tools) да
Режим рассуждения да
Появилась Июнь 2026
Обновлено 11 июн 2026

Где запустить: провайдеры

Модель раздаётся через 2 провайдера. Контекст, цены за 1М токенов и аптайм по провайдерам:

Провайдер Контекст Макс. вывод Вход $/1М Выход $/1М Аптайм
DeepInfra 262K 16K $0.500 $2.50 98.6%
Together 512K - $0.600 $3.60 100.0%

Цена входа по провайдерам, $/1М токенов

Together$0.600
DeepInfra$0.500

Доступ из России

Прямой доступ к сервисам NVIDIA из России ограничен. Рабочий вариант: подключиться через OpenRouter (openrouter.ai) по API с идентификатором nvidia/nemotron-3-ultra-550b-a55b. Оплата на OpenRouter принимается картами Visa и Mastercard, в том числе выпущенными за рубежом; российские карты МИР не поддерживаются. Альтернатива: пополнение через крипту или виртуальные карты иностранных банков.

Похожие модели

DeepSeek R1 · Qwen3 235B A22B · Mistral Large · Llama 3.3 70B Instruct

Открыть на OpenRouter

Попробуйте ENGRAM на своих данных

Нейросеть на ваших встречах, документах и переписке: отвечает со ссылкой на источник. Это ваша вторая память на базе ИИ. Данные хранятся в России, старт бесплатный.

Зарегистрироваться бесплатно
Обучаем команды работе с нейросетями под ваши процессы. Узнать о корпоративном обучении