Для работы AI-агентов используются языковые модели и база знаний. Ниже представлены доступные модели, тарифы на их использование и правила работы с токенами.
Доступные модели
Мы предоставляем доступ к следующим большим языковым моделям:
|
Провайдер |
Модель |
Окно контекста в токенах |
Максимум выходных токенов |
Размышления |
|
OpenAI |
gpt-5.1 |
400 000 |
128 000 |
✅ |
|
OpenAI |
gpt-5.2 |
400 000 |
128 000 |
✅ |
|
DeepSeek |
DeepSeek V3.2 |
128 000 |
64 000 |
❌ |
|
DeepSeek |
DeepSeek V3.2 reasoner |
128 000 |
65 536 |
✅ |
|
xAI |
grok-code-fast |
256 000 |
131 072 |
✅ |
|
xAI |
grok-3 |
131 072 |
131 072 |
✅ |
|
xAI |
grok-4 |
256 000 |
131 072 |
✅ |
|
xAI |
grok-4-fast |
2 000 000 |
131 072 |
✅ |
|
Google AI |
Gemini 2.5 Flash-Lite |
1 000 000 |
8 192 |
❌ |
|
Google AI |
Gemini 2.5 Flash |
1 000 000 |
8 192 |
❌ |
|
Google AI |
Gemini 2.5 Pro |
1 000 000 |
32 768 |
✅ |
|
Google AI |
Gemini-3-flash-preview |
1 000 000 |
65 536 |
✅ |
|
Google AI |
Gemini-3-pro-preview |
1 000 000 |
65 536 |
✅ |
|
Anthropic |
Claude Sonnet 4 |
200 000 |
200 000 |
✅ |
|
Anthropic |
Claude Opus 4.1 |
200 000 |
200 000 |
✅ |
|
Anthropic |
Claude Sonnet 4.5 |
200 000 |
64 000 |
✅ |
|
Anthropic |
Claude Haiku 4.5 |
200 000 |
64 000 |
✅ |
|
Anthropic |
Claude Opus 4.5 |
200 000 |
65 536 |
✅ |
|
Anthropic |
Claude Opus 4.6 |
200 000 |
128 000 |
✅ |
|
Anthropic |
Claude Sonnet 4.6 |
200 000 |
131 072 |
✅ |
|
Qwen |
Qwen 3 Flash |
1 000 000 |
32 768 |
❌ |
|
Qwen |
Qwen 3 Max |
262 144 |
65 536 |
❌ |
|
Qwen |
Qwen 3 Plus |
1 000 000 |
32 768 |
❌ |
|
Qwen |
Qwen 3 Plus Reasoning |
1 000 000 |
32 768 |
✅ |
|
Yandex |
Alice AI LLM |
32 000 |
128 000 |
✅ |
|
Yandex |
Yandex GPT 5.1 Lite |
32 000 |
128 000 |
❌ |
|
Yandex |
Yandex GPT 5.1 Pro |
32 000 |
128 000 |
✅ |
Как работают токены
Модели работают с текстом, разбивая его на фрагменты — токены. Один токен может быть:
- частью слова (например, «техно» + «логия»);
- целым коротким словом (например, «кот»);
- символом или знаком препинания.
В среднем 1 000 токенов ≈ 750 слов на русском или английском языке.
Приведенные значения приблизительны и предназначены для общего представления о расходах. Каждая модель использует собственный токенизатор с уникальной логикой разбиения текста
Токены тарифицируются как на входе, так и на выходе. Например, если ваш запрос содержит 20 токенов, а ответ от модели — 30 токенов, то всего будет списано 50 токенов из доступной квоты.
Модели с размышлениями
Если при выборе модели отображается пиктограмма мозга — значит, модель поддерживает режим размышлений (reasoning).
В этом режиме модель перед финальным ответом самостоятельно формулирует промежуточные рассуждения. Модель задает себе уточняющие вопросы и отвечает на них. Это позволяет добиться более точного, аргументированного ответа, особенно в сложных задачах.
Каждая итерация размышлений требует дополнительного ввода и вывода текста, а значит — увеличивает количество затраченных токенов.
Отключить размышления нельзя.
Тарифы агентов
Для AI-агентов доступны два типа тарифов:
- Основные тарифы — фиксированные пакеты токенов, которые автоматически продлеваются каждый месяц.
- Дополнительные пакеты — разовые покупки токенов, которые действуют только до конца оплаченного по основному тарифу месяца.
Основные тарифы
Списание за тариф выполняется единоразово в момент создания агента или смены его тарифа. В следующем месяце тариф будет продлен, также единоразовым списанием. Токены, не израсходованные в текущем месяце, сгорают.
|
Модель |
0,5 млн токенов |
1 млн токенов |
2,5 млн токенов |
5 млн токенов |
10 млн токенов |
25 млн токенов |
| gpt-5.1 | 660 ₽ | 1 100 ₽ | 2 613 ₽ | 5 060 ₽ | 9 680 ₽ | 23 375 ₽ |
| gpt-5.2 | 930 ₽ | 1 550 ₽ | 3 681 ₽ | 7 130 ₽ | 13 640 ₽ | 32 938 ₽ |
|
DeepSeek V3.2 |
36 ₽ |
60 ₽ |
143 ₽ |
276 ₽ |
528 ₽ |
1 275 ₽ |
|
DeepSeek V3.2 reasoner |
36 ₽ |
60 ₽ |
143 ₽ |
276 ₽ |
528 ₽ |
1 275 ₽ |
|
grok-code-fast |
100 ₽ |
200 ₽ |
450 ₽ |
850 ₽ |
1 500 ₽ |
3 500 ₽ |
|
grok-3 |
1 000 ₽ |
1 800 ₽ |
4 000 ₽ |
7 800 ₽ |
15 000 ₽ |
36 000 ₽ |
|
grok-4 |
1 000 ₽ |
1 800 ₽ |
4 000 ₽ |
7 800 ₽ |
15 000 ₽ |
36 000 ₽ |
|
grok-4-fast |
36 ₽ |
60 ₽ |
150 ₽ |
280 ₽ |
520 ₽ |
1 200 ₽ |
|
Gemini 2.5 Flash-Lite |
30 ₽ |
60 ₽ |
150 ₽ |
250 ₽ |
450 ₽ |
1 100 ₽ |
|
Gemini 2.5 Flash |
150 ₽ |
300 ₽ |
650 ₽ |
1 200 ₽ |
2 400 ₽ |
5 500 ₽ |
|
Gemini 2.5 Pro |
660 ₽ |
1 100 ₽ |
2 500 ₽ |
5 000 ₽ |
9 500 ₽ |
23 200 ₽ |
|
Gemini-3-flash-preview |
150 ₽ |
250 ₽ |
600 ₽ |
1 150 ₽ |
2 200 ₽ |
5 300 ₽ |
|
Gemini-3-pro-preview |
780 ₽ |
1 300 ₽ |
3 088 ₽ |
5 980 ₽ |
11 440 ₽ |
27 625 ₽ |
|
Claude Sonnet 4 |
1 000 ₽ |
1 800 ₽ |
4 000 ₽ |
7 800 ₽ |
15 000 ₽ |
36 000 ₽ |
|
Claude Opus 4.1 |
5 100 ₽ |
8 500 ₽ |
20 100 ₽ |
39 000 ₽ |
74 800 ₽ |
180 600 ₽ |
|
Claude Sonnet 4.5 |
1 000 ₽ |
1 800 ₽ |
4 000 ₽ |
7 800 ₽ |
15 000 ₽ |
36 000 ₽ |
|
Claude Haiku 4.5 |
535 ₽ |
891 ₽ |
2 116 ₽ |
4 099 ₽ |
7 841 ₽ |
18 934 ₽ |
|
Claude Opus 4.5 |
1 680 ₽ |
2 800 ₽ |
6 650 ₽ |
12 880 ₽ |
24 640 ₽ |
59 500 ₽ |
|
Claude Opus 4.6 |
1 680 ₽ |
2 800 ₽ |
6 650 ₽ |
12 880 ₽ |
24 640 ₽ |
59 500 ₽ |
|
Claude Sonnet 4.6 |
1 080 ₽ |
1 800 ₽ |
4 275 ₽ |
8 280 ₽ |
15 840 ₽ |
38 250 ₽ |
|
Qwen 3 Flash |
27 ₽ |
45 ₽ |
107 ₽ |
207 ₽ |
396 ₽ |
956 ₽ |
|
Qwen 3 Max |
396 ₽ |
660 ₽ |
1 568 ₽ |
3 036 ₽ |
5 808 ₽ |
14 025 ₽ |
|
Qwen 3 Plus |
84 ₽ |
140 ₽ |
333 ₽ |
644 ₽ |
1 232 ₽ |
2 975 ₽ |
|
Qwen 3 Plus Reasoning |
258 ₽ |
430 ₽ |
1 021 ₽ |
1 978 ₽ |
3 784 ₽ |
9 138 ₽ |
|
Alice AI LLM |
875 ₽ |
1 750 ₽ |
4 375 ₽ |
8 750 ₽ |
17 500 ₽ |
43 750 ₽ |
|
Yandex GPT 5.1 Lite |
105 ₽ |
210 ₽ |
525 ₽ |
1 050 ₽ |
2 100 ₽ |
5 250 ₽ |
|
Yandex GPT 5.1 Pro |
205 ₽ |
410 ₽ |
1 025 ₽ |
2 050 ₽ |
4 100 ₽ |
10 250 ₽ |
Определить оптимальное количество токенов, необходимое для вашего агента, можно только в процессе работы, понаблюдав за динамикой потребления.
В начале работы мы рекомендуем выбирать минимальный подходящий тариф и в дальнейшем увеличивать его при необходимости. Уменьшить тариф невозможно.
Дополнительные пакеты
Если вам нужно больше токенов, но следующий тарифный план избыточен или токены требуются только разово — вместо смены тарифа используйте дополнительные пакеты токенов, которые можно докупить в панели.
Пакет позволит гибко настроить количество токенов с шагом в 250 тысяч и будет действовать только до конца текущего оплаченного месяца (можно определить по дате списания за тариф — в разделе «Баланс и платежи» → «История операций»).
Списание за пакет выполняется единоразово. Тариф при этом не изменится, и в следующем месяце будет списана стандартная стоимость тарифа.
|
Модель |
250 000 токенов |
|
gpt-5.1 |
330 ₽ |
|
gpt-5.2 |
465 ₽ |
|
DeepSeek V3.2 |
18 ₽ |
|
DeepSeek V3.2 reasoner |
18 ₽ |
|
grok-code-fast |
50 ₽ |
|
grok-3 |
500 ₽ |
|
grok-4 |
500 ₽ |
|
grok-4-fast |
18 ₽ |
|
Gemini 2.5 Flash-Lite |
15 ₽ |
|
Gemini 2.5 Flash |
80 ₽ |
|
Gemini 2.5 Pro |
330 ₽ |
|
Gemini-3-flash-preview |
75 ₽ |
|
Gemini-3-pro-preview |
390 ₽ |
|
Claude Sonnet 4 |
500 ₽ |
|
Claude Opus 4.1 |
2 550 ₽ |
|
Claude Sonnet 4.5 |
500 ₽ |
|
Claude Haiku 4.5 |
267 ₽ |
|
Claude Opus 4.5 |
840 ₽ |
|
Claude Opus 4.6 |
840 ₽ |
|
Claude Sonnet 4.6 |
540 ₽ |
|
Qwen 3 Flash |
14 ₽ |
|
Qwen 3 Max |
198 ₽ |
|
Qwen 3 Plus |
42 ₽ |
|
Qwen 3 Plus Reasoning |
129 ₽ |
|
Alice AI LLM |
438 ₽ |
|
Yandex GPT 5.1 Lite |
53 ₽ |
|
Yandex GPT 5.1 Pro |
103 ₽ |
База знаний
Расчет стоимости
Стоимость базы знаний складывается из двух составляющих:
- Абонентская плата за токены
При создании базы знаний сразу списывается 450 ₽ за 10 млн токенов. Токены расходуются на индексацию базы, а также на все запросы к ней. Этот платеж повторяется ежемесячно. - Почасовая оплата за базу данных OpenSearch
Для работы базы знаний используется облачная база данных. После создания базы начинает взиматься почасовая оплата. Размер платы зависит от выбранной конфигурации.
При создании базы данных выбирайте минимальный подходящий тариф — в дальнейшем его можно будет увеличить. Уменьшение тарифа недоступно.
Пример расчета
При создании базы знаний с минимальной конфигурацией:
- Сразу списывается 450 ₽ за 10 млн токенов (ежемесячный платеж).
- В течение всего месяца с аккаунта списывается 1,23 ₽ каждый час за работу базы данных.
Дополнительные токены
При необходимости вы можете добавлять токены по цене 60 ₽ за 1 000 000 токенов, нажав кнопку «Добавить токены» в панели управления базой знаний.

Дополнительные токены будут добавлены до конца оплаченного периода. То есть, если следующее списание за единый тариф произойдет через два дня, дополнительные токены пропадут через два дня.
Расход токенов при индексации
Для индексации используется модель встраивания text-embedding-3-large, которая преобразует тексты в векторный формат. Это необходимо для индексации данных и последующей работы с ними.
Расход токенов при индексации зависит от формата загружаемого файла. Ниже — пример приблизительного потребления токенов при загрузке документов разных объемов:
|
Формат |
1 МБ |
10 МБ |
100 МБ |
500 МБ |
|
|
240 000 |
2 400 000 |
24 000 000 |
120 000 000 |
|
|
450 000 |
4 500 000 |
45 000 000 |
225 000 000 |
|
|
62 000 |
620 000 |
6 200 000 |
31 000 000 |
|
|
39 000 |
390 000 |
3 900 000 |
19 500 000 |
|
|
221 000 |
2 210 000 |
22 100 000 |
110 500 000 |
Фактический расход может отличаться в зависимости от структуры и содержания файла.