Для работы AI-агентов используются языковые модели и база знаний. Ниже представлены доступные модели, типы тарификации и правила работы с токенами.
Доступные модели
В панели управления можно создать агентов на базе следующих больших языковых моделей:
|
Провайдер |
Модель |
Размышления |
|
OpenAI |
gpt-4.1 |
❌ |
|
OpenAI |
gpt-5.1 |
✅ |
|
OpenAI |
gpt-5.2 |
✅ |
|
OpenAI |
gpt-5.3 Codex |
✅ |
|
OpenAI |
gpt-5.4 |
✅ |
|
OpenAI |
gpt-5.4 Mini |
✅ |
|
OpenAI |
gpt-5.4 Nano |
✅ |
|
DeepSeek |
DeepSeek V3.2 |
❌ |
|
DeepSeek |
DeepSeek V3.2 reasoner |
✅ |
|
xAI |
grok-code-fast |
✅ |
|
xAI |
grok-3 |
✅ |
|
xAI |
grok-4 |
✅ |
|
xAI |
grok-4-fast |
❌ |
|
xAI |
grok-4-fast-reasoner |
✅ |
|
xAI |
grok-4.1-fast |
❌ |
|
xAI |
grok-4.1-fast-reasoner |
✅ |
|
Google AI |
Gemini 2.5 Flash-Lite |
❌ |
|
Google AI |
Gemini 2.5 Flash |
❌ |
|
Google AI |
Gemini 2.5 Pro |
✅ |
|
Google AI |
Gemini-3-flash-preview |
✅ |
|
Google AI |
Gemini-3-pro-preview |
✅ |
|
Google AI |
Gemini-3.1-pro-preview |
✅ |
|
Anthropic |
Claude Haiku 3.5 |
❌ |
|
Anthropic |
Claude Haiku 4.5 |
✅ |
|
Anthropic |
Claude Sonnet 4 |
✅ |
|
Anthropic |
Claude Sonnet 4.5 |
✅ |
|
Anthropic |
Claude Sonnet 4.6 |
✅ |
|
Anthropic |
Claude Opus 4.1 |
✅ |
|
Anthropic |
Claude Opus 4.5 |
✅ |
|
Anthropic |
Claude Opus 4.6 |
✅ |
|
Anthropic |
Claude Opus 4.7 |
✅ |
|
Qwen |
Qwen 3 Flash |
❌ |
|
Qwen |
Qwen 3 Max |
❌ |
|
Qwen |
Qwen 3 Plus |
❌ |
|
Qwen |
Qwen 3 Plus Reasoning |
✅ |
|
Qwen |
Qwen 3.5 Flash |
❌ |
|
Qwen |
Qwen 3.5 Flash Reasoning |
✅ |
|
Qwen |
Qwen 3.5 Plus |
❌ |
|
Qwen |
Qwen 3.5 Plus Reasoning |
✅ |
|
Qwen |
Qwen 3.6 Plus |
❌ |
|
Qwen |
Qwen 3.6 Plus Reasoning |
✅ |
|
Yandex |
Alice AI LLM |
✅ |
|
Yandex |
Yandex GPT 5.1 Lite |
❌ |
|
Yandex |
Yandex GPT 5.1 Pro |
✅ |
При работе через API список версий может быть шире. Все доступные варианты можно найти на сайте.
Модели с размышлениями
Если при выборе модели отображается пиктограмма мозга — значит, модель поддерживает режим размышлений (reasoning).
В этом режиме модель перед финальным ответом самостоятельно формулирует промежуточные рассуждения. Модель задает себе уточняющие вопросы и отвечает на них. Это позволяет добиться более точного, аргументированного ответа, особенно в сложных задачах.
Каждая итерация размышлений требует дополнительного ввода и вывода текста, а значит — увеличивает количество затраченных токенов.
Отключить размышления нельзя.
Как работают токены
Модели работают с текстом, разбивая его на фрагменты — токены. Один токен может быть:
- частью слова (например, «техно» + «логия»);
- целым коротким словом (например, «кот»);
- символом или знаком препинания.
В среднем 1 000 токенов ≈ 750 слов на русском или английском языке.
Приведенные значения приблизительны и предназначены для общего представления о расходах. Каждая модель использует собственный токенизатор с уникальной логикой разбиения текста
Токены тарифицируются как на входе, так и на выходе. Например, если ваш запрос содержит 20 токенов, а ответ от модели — 30 токенов, то всего будет списано 50 токенов из доступной квоты.
Типы тарификации агентов
Для агентов доступны два вида тарификации: пакетная и поресурсная. На аккаунте могут быть агенты либо только с пакетной, либо только с поресурсной тарификацией.
Пакетная тарификация доступна, если на аккаунте уже есть агенты с пакетной тарификацией.
Актуальные тарифы можно найти в панели управления или на сайте.
При создании агента вы выбираете подходящий пакет токенов, который действует один месяц. Списание за тариф выполняется единоразово в момент создания агента.
Через месяц сервис автоматически продлевается, и вам становится доступен такой же пакет токенов. Токены, не израсходованные в текущем месяце, сгорают.
Определить оптимальное количество токенов, необходимое для вашего агента, можно только в процессе работы, понаблюдав за динамикой потребления.
В начале работы мы рекомендуем выбирать минимальный подходящий тариф и в дальнейшем увеличивать его при необходимости. Уменьшить тариф невозможно.
Дополнительные пакеты токенов
Если токенов недостаточно, вы можете перейти на следующий тариф или докупить дополнительный пакет токенов, который будет действовать до конца текущего оплаченного периода.
Пакет позволит гибко настроить количество токенов с шагом в 250 тысяч и будет действовать только до конца текущего оплаченного месяца (можно определить по дате списания за тариф — в разделе «Баланс и платежи» → «История операций»).
Списание за пакет выполняется единоразово. Тариф при этом не изменится, и в следующем месяце будет списана стандартная стоимость тарифа.
Лимит потребления токенов
Опция доступна только для агентов с поресурсной тарификацией.
При создании агента и в дальнейшем в его настройках вы можете настроить лимит потребления токенов, чтобы контролировать их расход.
Для этого:
- Кликните на нужного агента в разделе «AI-агенты».
- Перейдите на вкладку «Управление» и кликните «Установить лимиты».
- Включите или отключите лимит и установите нужное значение.
База знаний
Расчет стоимости
Стоимость базы знаний складывается из двух составляющих:
- Абонентская плата за токены
При создании базы знаний сразу списывается 450 ₽ за 10 млн токенов. Токены расходуются на индексацию базы, а также на все запросы к ней. Этот платеж повторяется ежемесячно. - Почасовая оплата за базу данных OpenSearch
Для работы базы знаний используется облачная база данных. После создания базы начинает взиматься почасовая оплата. Размер платы зависит от выбранной конфигурации.
При создании базы данных выбирайте минимальный подходящий тариф — в дальнейшем его можно будет увеличить. Уменьшение тарифа недоступно.
Пример расчета
При создании базы знаний с минимальной конфигурацией:
- Сразу списывается 450 ₽ за 10 млн токенов (ежемесячный платеж).
- В течение всего месяца с аккаунта списывается 1,23 ₽ каждый час за работу базы данных.
Дополнительные токены
При необходимости вы можете добавлять токены по цене 60 ₽ за 1 000 000 токенов, нажав кнопку «Добавить токены» в панели управления базой знаний.

Дополнительные токены будут добавлены до конца оплаченного периода. То есть, если следующее списание за единый тариф произойдет через два дня, дополнительные токены пропадут через два дня.
Расход токенов при индексации
Для индексации используется модель встраивания text-embedding-3-large, которая преобразует тексты в векторный формат. Это необходимо для индексации данных и последующей работы с ними.
Расход токенов при индексации зависит от формата загружаемого файла. Ниже — пример приблизительного потребления токенов при загрузке документов разных объемов:
|
Формат |
1 МБ |
10 МБ |
100 МБ |
500 МБ |
|
|
240 000 |
2 400 000 |
24 000 000 |
120 000 000 |
|
|
450 000 |
4 500 000 |
45 000 000 |
225 000 000 |
|
|
62 000 |
620 000 |
6 200 000 |
31 000 000 |
|
|
39 000 |
390 000 |
3 900 000 |
19 500 000 |
|
|
221 000 |
2 210 000 |
22 100 000 |
110 500 000 |
Фактический расход может отличаться в зависимости от структуры и содержания файла.