Перейти к содержанию

← ByteDance

LLM-модели / ByteDance

UI-TARS 7B: модель для работы с графическими интерфейсами от ByteDance

UI-TARS 7B это мультимодальная модель от ByteDance, оптимизированная для взаимодействия с графическими пользовательскими интерфейсами.

ByteDance Контекст 128K Вход: изображения, текст $0.100 / 1М вход

Что это

UI-TARS 7B представляет собой мультимодальную модель, разработанную компанией ByteDance. Она специализируется на понимании и взаимодействии с различными графическими интерфейсами, включая десктопные приложения, веб-браузеры, мобильные операционные системы и игры. Модель обрабатывает как текстовые, так и визуальные данные.

Что умеет

Модель UI-TARS 7B сильна в задачах, связанных с автоматизацией действий в пользовательских интерфейсах. Она способна интерпретировать визуальные элементы экрана и выполнять соответствующие действия, что делает ее полезной для создания автоматизированных агентов. Это позволяет эффективно взаимодействовать с различными программами и веб-сайтами.

Кому подходит

Модель подходит разработчикам, которым нужно создавать автоматизированных агентов для работы с графическими интерфейсами. Также она будет полезна для задач, связанных с тестированием ПО и автоматизацией рутинных действий в цифровой среде.

Характеристики

Параметр Значение
Провайдер ByteDance
Контекст 128 000 токенов
Вход изображения, текст
Выход текст
Цена входа $0.100 / 1М токенов
Цена выхода $0.200 / 1М токенов
Макс. вывод 2 048 токенов
Вызов инструментов (tools) нет
Режим рассуждения нет
Появилась Июль 2025
Обновлено 11 июн 2026

Где запустить: провайдеры

Модель раздаётся через 1 провайдер. Контекст, цены за 1М токенов и аптайм по провайдерам:

Провайдер Контекст Макс. вывод Вход $/1М Выход $/1М Аптайм
Parasail 128K 2K $0.100 $0.200 100.0%

Доступ из России

UI-TARS 7B доступна через агрегаторы API, такие как OpenRouter. Для использования из России необходимо зарегистрироваться на платформе агрегатора и получить API-ключ. Оплата услуг на таких платформах может осуществляться с помощью зарубежных банковских карт или криптовалюты.

Похожие модели

GPT-4o · Gemini 1.5 Pro · Llava

Открыть на OpenRouter

Попробуйте ENGRAM на своих данных

Нейросеть на ваших встречах, документах и переписке: отвечает со ссылкой на источник. Это ваша вторая память на базе ИИ. Данные хранятся в России, старт бесплатный.

Зарегистрироваться бесплатно
Обучаем команды работе с нейросетями под ваши процессы. Узнать о корпоративном обучении