Nemotron 3 Super от NVIDIA - что умеет, контекст 1 млн токенов, цена и аналоги¶
Гибридная модель NVIDIA с контекстом в миллион токенов для сложных многоагентных задач и рассуждений.
Что это¶
Nemotron 3 Super - это крупная языковая модель на 120 миллиардов параметров от NVIDIA, использующая гибридную архитектуру Mamba-Transformer. Она активирует только 12 миллиардов параметров для каждой операции, что обеспечивает высокую вычислительную эффективность. Модель поддерживает инструменты и цепочечное рассуждение.
Что умеет¶
Главное преимущество - огромный контекст в 1 миллион токенов, что позволяет обрабатывать очень длинные документы или сложные многошаговые задачи. Модель оптимизирована для работы в составе многоагентных систем и приложений, требующих глубокого анализа и рассуждений. Эффективная архитектура MoE позволяет снизить стоимость вычислений при сохранении точности.
Кому подходит¶
Подходит разработчикам сложных агентских систем, аналитикам для работы с большими объемами текстов и исследователям, которым нужны модели с продвинутыми возможностями рассуждения.
Характеристики¶
| Параметр | Значение |
|---|---|
| Провайдер | NVIDIA |
| Контекст | 1 000 000 токенов |
| Вход | текст |
| Выход | текст |
| Цена входа | $0.090 / 1М токенов |
| Цена выхода | $0.450 / 1М токенов |
| Вызов инструментов (tools) | да |
| Режим рассуждения | да |
| Появилась | Март 2026 |
| Обновлено | 11 июн 2026 |
Где запустить: провайдеры¶
Модель раздаётся через 4 провайдера. Контекст, цены за 1М токенов и аптайм по провайдерам:
| Провайдер | Контекст | Макс. вывод | Вход $/1М | Выход $/1М | Аптайм |
|---|---|---|---|---|---|
| DekaLLM | 262K | - | $0.090 | $0.450 | 99.0% |
| DeepInfra | 262K | 16K | $0.100 | $0.500 | 94.5% |
| DigitalOcean | 1M | - | $0.300 | $0.650 | - |
| Nebius | 262K | - | $0.300 | $0.900 | - |
Цена входа по провайдерам, $/1М токенов
Доступ из России¶
Прямой доступ к API NVIDIA из России может быть ограничен. Наиболее удобный способ использовать модель - через агрегаторы вроде OpenRouter, принимающие оплату с российских карт или через криптовалюту. Также можно использовать прокси или VPN для доступа к оригинальному API.
Похожие модели¶
Claude 3 Opus · GPT-4 Turbo · DeepSeek-V2 · Llama 3 70B
Нейросеть на ваших встречах, документах и переписке: отвечает со ссылкой на источник. Это ваша вторая память на базе ИИ. Данные хранятся в России, старт бесплатный.
Зарегистрироваться бесплатноENGRAM запоминает ваши встречи, документы и переписку и мгновенно находит ответ со ссылкой на источник. Ваша вторая память на базе ИИ. Данные в России, старт бесплатный.
Зарегистрироваться бесплатно