Перейти к содержанию

← NVIDIA

LLM-модели / NVIDIA

Nemotron 3 Super от NVIDIA - что умеет, контекст 1 млн токенов, цена и аналоги

Гибридная модель NVIDIA с контекстом в миллион токенов для сложных многоагентных задач и рассуждений.

NVIDIA Контекст 1M Вход: текст $0.090 / 1М вход Рассуждение

Что это

Nemotron 3 Super - это крупная языковая модель на 120 миллиардов параметров от NVIDIA, использующая гибридную архитектуру Mamba-Transformer. Она активирует только 12 миллиардов параметров для каждой операции, что обеспечивает высокую вычислительную эффективность. Модель поддерживает инструменты и цепочечное рассуждение.

Что умеет

Главное преимущество - огромный контекст в 1 миллион токенов, что позволяет обрабатывать очень длинные документы или сложные многошаговые задачи. Модель оптимизирована для работы в составе многоагентных систем и приложений, требующих глубокого анализа и рассуждений. Эффективная архитектура MoE позволяет снизить стоимость вычислений при сохранении точности.

Кому подходит

Подходит разработчикам сложных агентских систем, аналитикам для работы с большими объемами текстов и исследователям, которым нужны модели с продвинутыми возможностями рассуждения.

Характеристики

Параметр Значение
Провайдер NVIDIA
Контекст 1 000 000 токенов
Вход текст
Выход текст
Цена входа $0.090 / 1М токенов
Цена выхода $0.450 / 1М токенов
Вызов инструментов (tools) да
Режим рассуждения да
Появилась Март 2026
Обновлено 11 июн 2026

Где запустить: провайдеры

Модель раздаётся через 4 провайдера. Контекст, цены за 1М токенов и аптайм по провайдерам:

Провайдер Контекст Макс. вывод Вход $/1М Выход $/1М Аптайм
DekaLLM 262K - $0.090 $0.450 99.0%
DeepInfra 262K 16K $0.100 $0.500 94.5%
DigitalOcean 1M - $0.300 $0.650 -
Nebius 262K - $0.300 $0.900 -

Цена входа по провайдерам, $/1М токенов

DigitalOcean$0.300
Nebius$0.300
DeepInfra$0.100
DekaLLM$0.090

Доступ из России

Прямой доступ к API NVIDIA из России может быть ограничен. Наиболее удобный способ использовать модель - через агрегаторы вроде OpenRouter, принимающие оплату с российских карт или через криптовалюту. Также можно использовать прокси или VPN для доступа к оригинальному API.

Похожие модели

Claude 3 Opus · GPT-4 Turbo · DeepSeek-V2 · Llama 3 70B

Открыть на OpenRouter

Попробуйте ENGRAM на своих данных

Нейросеть на ваших встречах, документах и переписке: отвечает со ссылкой на источник. Это ваша вторая память на базе ИИ. Данные хранятся в России, старт бесплатный.

Зарегистрироваться бесплатно
Обучаем команды работе с нейросетями под ваши процессы. Узнать о корпоративном обучении