<div><img src="https://top-fwz1.mail.ru/counter?id=3548135;js=na" style="position:absolute;left:-9999px;" alt="Top.Mail.Ru" /></div>
Managed Kubernetes — разверните готовый кластер за 5 минут →
Вход / Регистрация
На главную
25eb9e0a-a5a8-472a-ace7-940b8bd2adf0
Облачные сервисы

Тарификация AI-агентов

Для работы AI-агентов используются языковые модели и база знаний. Ниже представлены доступные модели, тарифы на их использование и правила работы с токенами.

Доступные модели

Мы предоставляем доступ к следующим большим языковым моделям:

Провайдер

Модель

Окно контекста в токенах

Максимум выходных токенов

Размышления

OpenAI

GPT-4.1-nano

1 047 576

16 384

OpenAI

GPT-4.1-mini

1 047 576

16 384

OpenAI

GPT-4.1

1 047 576

128 000

OpenAI

GPT-4o-mini

128 000

16 384

OpenAI

GPT-4o

128 000

128 000

OpenAI

GPT-5-nano

400 000

128 000

OpenAI

GPT-5-mini

400 000

128 000

OpenAI

GPT-5

400 000

128 000

DeepSeek

DeepSeek-chat

128 000

8 192

DeepSeek

DeepSeek-reasoner

128 000

65 536

xAI

grok-3-mini

131 072

131 072

xAI

grok-code-fast-1

256 000

131 072

xAI

grok-3

131 072

131 072

xAI

grok-4

256 000

131 072

xAI

grok-4-fast

2 000 000

131 072

xAI

grok-4-fast

2 000 000

131 072

Google AI

Gemini 2.0 Flash-Lite

1 000 000

8 192

Google AI

Gemini 2.5 Flash-Lite

1 000 000

8 192

Google AI

Gemini 2.0 Flash

1 000 000

8 192

Google AI

Gemini 2.5 Flash

1 000 000

8 192

Google AI

Gemini 2.5 Pro

1 000 000

32 768

Anthropic

Claude Haiku 3.5

200 000

200 000

Anthropic

Claude Sonnet 3.7

200 000

200 000

Anthropic

Claude Sonnet 4

200 000

200 000

Anthropic

Claude Opus 3

200 000

200 000

Anthropic

Claude Opus 4.1

200 000

200 000

Anthropic

Claude Sonnet 4.5

200 000

64 000

Anthropic

Claude Haiku 4.5

200 000

64 000

Как работают токены

Модели работают с текстом, разбивая его на фрагменты — токены. Один токен может быть:

  • частью слова (например, «техно» + «логия»);
  • целым коротким словом (например, «кот»);
  • символом или знаком препинания.

В среднем 1 000 токенов ≈ 750 слов на русском или английском языке.

Приведенные значения приблизительны и предназначены для общего представления о расходах. Каждая модель использует собственный токенизатор с уникальной логикой разбиения текста

Токены тарифицируются как на входе, так и на выходе. Например, если ваш запрос содержит 20 токенов, а ответ от модели — 30 токенов, то всего будет списано 50 токенов из доступной квоты.

Модели с размышлениями

Если при выборе модели отображается пиктограмма мозга — значит, модель поддерживает режим размышлений (reasoning).

В этом режиме модель перед финальным ответом самостоятельно формулирует промежуточные рассуждения. Модель задает себе уточняющие вопросы и отвечает на них. Это позволяет добиться более точного, аргументированного ответа, особенно в сложных задачах.

Каждая итерация размышлений требует дополнительного ввода и вывода текста, а значит — увеличивает количество затраченных токенов.

Отключить размышления нельзя.

Тарифы агентов

Для AI-агентов доступны два типа тарифов:

  • Основные тарифы — фиксированные пакеты токенов, которые автоматически продлеваются каждый месяц.
  • Дополнительные пакеты — разовые покупки токенов, которые действуют только до конца оплаченного по основному тарифу месяца.

Основные тарифы

Списание за тариф выполняется единоразово в момент создания агента или смены его тарифа. В следующем месяце тариф будет продлен, также единоразовым списанием. Токены, не израсходованные в текущем месяце, сгорают.

Модель

500 000 токенов

1 000 000 токенов

2 500 000 токенов

5 000 000 токенов

10 000 000 токенов

25 000 000 токенов

GPT-4.1-nano

30 ₽

60 ₽

150 ₽

250 ₽

450 ₽

1 100 ₽

GPT-5-nano

30 ₽

60 ₽

150 ₽

250 ₽

450 ₽

1 100 ₽

GPT-4.1-mini

100 ₽

200 ₽

450 ₽

850 ₽

1 500 ₽

3 500 ₽

GPT-5-mini

120 ₽

250 ₽

500 ₽

1 000 ₽

1 800 ₽

4 000 ₽

GPT-4o-mini

150 ₽

300 ₽

650 ₽

1 200 ₽

2 400 ₽

5 500 ₽

GPT-4.1

500 ₽

1 000 ₽

2 100 ₽

4 000 ₽

8 000 ₽

19 100 ₽

GPT-5

660 ₽

1 100 ₽

2 500 ₽

5 000 ₽

9 500 ₽

23 200 ₽

GPT-4o

1 200 ₽

2 400 ₽

5 500 ₽

10 500 ₽

20 200 ₽

48 800 ₽

DeepSeek-chat

36 ₽

60 ₽

143 ₽

276 ₽

528 ₽

1 275 ₽

DeepSeek-reasoner

36 ₽

60 ₽

143 ₽

276 ₽

528 ₽

1 275 ₽

grok-3-mini

36 ₽

60 ₽

150 ₽

280 ₽

520 ₽

1 200 ₽

grok-code-fast-1

100 ₽

200 ₽

450 ₽

850 ₽

1 500 ₽

3 500 ₽

grok-3

1 000 ₽

1 800 ₽

4 000 ₽

7 800 ₽

15 000 ₽

36 000 ₽

grok-4

1 000 ₽

1 800 ₽

4 000 ₽

7 800 ₽

15 000 ₽

36 000 ₽

grok-4-fast

36 ₽

60 ₽

150 ₽

280 ₽

520 ₽

1 200 ₽

Gemini 2.0 Flash-Lite

20 ₽

35 ₽

80 ₽

160 ₽

300 ₽

750 ₽

Gemini 2.5 Flash-Lite

30 ₽

60 ₽

150 ₽

250 ₽

450 ₽

1 100 ₽

Gemini 2.0 Flash

30 ₽

60 ₽

150 ₽

250 ₽

450 ₽

1 100 ₽

Gemini 2.5 Flash

150 ₽

300 ₽

650 ₽

1 200 ₽

2 400 ₽

5 500 ₽

Gemini 2.5 Pro

660 ₽

1 100 ₽

2 500 ₽

5 000 ₽

9 500 ₽

23 200 ₽

Claude Haiku 3.5

270 ₽

450 ₽

1 000 ₽

2 000 ₽

3 900 ₽

9 500 ₽

Claude Sonnet 3.7

1 000 ₽

1 800 ₽

4 000 ₽

7 800 ₽

15 000 ₽

36 000 ₽

Claude Sonnet 4

1 000 ₽

1 800 ₽

4 000 ₽

7 800 ₽

15 000 ₽

36 000 ₽

Claude Opus 3

5 100 ₽

8 500 ₽

20 100 ₽

39 000 ₽

74 800 ₽

180 600 ₽

Claude Opus 4.1

5 100 ₽

8 500 ₽

20 100 ₽

39 000 ₽

74 800 ₽

180 600 ₽

Claude Sonnet 4.5

1 000 ₽

1 800 ₽

4 000 ₽

7 800 ₽

15 000 ₽

36 000 ₽

Claude Haiku 4.5

535 ₽

891 ₽

2 116 ₽

4 099 ₽

7 841 ₽

18 934 ₽

Определить оптимальное количество токенов, необходимое для вашего агента, можно только в процессе работы, понаблюдав за динамикой потребления.

В начале работы мы рекомендуем выбирать минимальный подходящий тариф и в дальнейшем увеличивать его при необходимости. Уменьшить тариф невозможно.

Дополнительные пакеты

Если вам нужно больше токенов, но следующий тарифный план избыточен или токены требуются только разово — вместо смены тарифа используйте дополнительные пакеты токенов, которые можно докупить в панели. 

Пакет позволит гибко настроить количество токенов с шагом в 250 тысяч и будет действовать только до конца текущего оплаченного месяца (можно определить по дате списания за тариф — в разделе «Баланс и платежи» → «История операций»).

Списание за пакет выполняется единоразово. Тариф при этом не изменится, и в следующем месяце будет списана стандартная стоимость тарифа.

Модель

250 000 токенов

GPT-4.1-nano

15 ₽

GPT-5-nano

15 ₽

GPT-4.1-mini

50 ₽

GPT-5-mini

60 ₽

GPT-4o-mini

80 ₽

GPT-4.1

250 ₽

GPT-5

330 ₽

GPT-4o

600 ₽

DeepSeek-chat

18 ₽

DeepSeek-reasoner

18 ₽

grok-3-mini

18 ₽

grok-code-fast-1

50 ₽

grok-3

500 ₽

grok-4

500 ₽

grok-4-fast

18 ₽

Gemini 2.0 Flash-Lite

10 ₽

Gemini 2.5 Flash-Lite

15 ₽

Gemini 2.0 Flash

15 ₽

Gemini 2.5 Flash

80 ₽

Gemini 2.5 Pro

330 ₽

Claude Haiku 3.5

135 ₽

Claude Sonnet 3.7

500 ₽

Claude Sonnet 4

500 ₽

Claude Opus 3

2 550 ₽

Claude Opus 4.1

2 550 ₽

Claude Sonnet 4.5

500 ₽

Claude Haiku 4.5

267 ₽

База знаний

При создании базы знаний используется модель text-embedding-3-large, которая преобразует тексты в векторный формат. Это необходимо для индексации данных и последующей работы с ними.

Доступен единый тариф — 450 рублей за 10 000 000 токенов.

Токены расходуются на индексацию базы, а также на все запросы к ней.

Списание за тариф выполняется единоразово, в момент создания базы. В следующем месяце тариф будет продлен, также единоразовым списанием.

При создании базы знаний создается облачная базы OpenSearch, которая необходима для хранения данных. Выбирайте минимальный подходящий тариф — в дальнейшем его можно будет увеличить. Уменьшение тарифа недоступно.

Списания за базу данных почасовые.

Расход токенов при индексации зависит от формата загружаемого файла. Ниже — пример приблизительного потребления токенов при загрузке документов разных объемов:

Формат

1 МБ

10 МБ

100 МБ

500 МБ

.txt

240 000

2 400 000

24 000 000

120 000 000

.csv

450 000

4 500 000

45 000 000

225 000 000

.xml

62 000

620 000

6 200 000

31 000 000

.htm, .html

39 000

390 000

3 900 000

19 500 000

.md

221 000

2 210 000

22 100 000

110 500 000

Фактический расход может отличаться в зависимости от структуры и содержания файла.

Была ли статья полезна?
Ваша оценка очень важна
Пока нет комментариев