<div><img src="https://top-fwz1.mail.ru/counter?id=3548135;js=na" style="position:absolute;left:-9999px;" alt="Top.Mail.Ru" /></div>
Managed Kubernetes — разверните готовый кластер за 5 минут →
Вход / Регистрация
На главную
25eb9e0a-a5a8-472a-ace7-940b8bd2adf0
Облачные сервисы

Тарификация AI-агентов

Для работы AI-агентов используются языковые модели и база знаний. Ниже представлены доступные модели, тарифы на их использование и правила работы с токенами.

Доступные модели

Мы предоставляем доступ к следующим большим языковым моделям:

Провайдер

Модель

Окно контекста в токенах

Максимум выходных токенов

Размышления

OpenAI

GPT-4.1-nano

1 047 576

16 384

OpenAI

GPT-4.1-mini

1 047 576

16 384

OpenAI

GPT-4.1

1 047 576

128 000

OpenAI

GPT-4o-mini

128 000

16 384

OpenAI

GPT-4o

128 000

128 000

OpenAI

GPT-5-nano

400 000

128 000

OpenAI

GPT-5-mini

400 000

128 000

OpenAI

GPT-5

400 000

128 000

DeepSeek

DeepSeek-chat

65 536

64 000

DeepSeek

DeepSeek-reasoner

65 536

32 000

xAI

grok-3-mini

131 072

131 072

xAI

grok-code-fast-1

256 000

131 072

xAI

grok-3

131 072

131 072

xAI

grok-4

256 000

131 072

Google AI

Gemini 2.0 Flash-Lite

1 000 000

8 192

Google AI

Gemini 2.5 Flash-Lite

1 000 000

8 192

Google AI

Gemini 2.0 Flash

1 000 000

8 192

Google AI

Gemini 2.5 Flash

1 000 000

8 192

Google AI

Gemini 2.5 Pro

1 000 000

32 768

Anthropic

Claude Haiku 3.5

200 000

200 000

Anthropic

Claude Sonnet 3.7

200 000

200 000

Anthropic

Claude Sonnet 4

200 000

200 000

Anthropic

Claude Opus 3

200 000

200 000

Anthropic

Claude Opus 4.1

200 000

200 000

Как работают токены

Модели работают с текстом, разбивая его на фрагменты — токены. Один токен может быть:

  • частью слова (например, «техно» + «логия»);
  • целым коротким словом (например, «кот»);
  • символом или знаком препинания.

В среднем 1 000 токенов ≈ 750 слов на русском или английском языке.

Приведенные значения приблизительны и предназначены для общего представления о расходах. Каждая модель использует собственный токенизатор с уникальной логикой разбиения текста

Токены тарифицируются как на входе, так и на выходе.
Например, если ваш запрос содержит 20 токенов, а ответ от модели — 30 токенов, то всего будет списано 50 токенов из доступной квоты.

Модели с размышлениями

Если при выборе модели отображается пиктограмма мозга — значит, модель поддерживает режим размышлений (reasoning).

В этом режиме модель перед финальным ответом самостоятельно формулирует промежуточные рассуждения. Модель задает себе уточняющие вопросы и отвечает на них. Это позволяет добиться более точного, аргументированного ответа, особенно в сложных задачах.

Каждая итерация размышлений требует дополнительного ввода и вывода текста, а значит — увеличивает количество затраченных токенов.

Отключить размышления нельзя.

Тарифы агентов

Для AI-агентов доступны два типа тарифов:

  • Основные тарифы — фиксированные пакеты токенов, которые автоматически продлеваются каждый месяц.
  • Дополнительные пакеты — разовые покупки токенов, которые действуют только до конца оплаченного по основному тарифу месяца.

Основные тарифы

Списание за тариф выполняется единоразово в момент создания агента или смены его тарифа. В следующем месяце тариф будет продлен, также единоразовым списанием. Токены, не израсходованные в текущем месяце, сгорают.

Модель

500 000 токенов

1 000 000 токенов

2 500 000 токенов

5 000 000 токенов

10 000 000 токенов

25 000 000 токенов

GPT-4.1-nano

30 ₽

60 ₽

150 ₽

250 ₽

450 ₽

1 100 ₽

GPT-5-nano

30 ₽

60 ₽

150 ₽

250 ₽

450 ₽

1 100 ₽

GPT-4.1-mini

100 ₽

200 ₽

450 ₽

850 ₽

1 500 ₽

3 500 ₽

GPT-5-mini

120 ₽

250 ₽

500 ₽

1 000 ₽

1 800 ₽

4 000 ₽

GPT-4o-mini

150 ₽

300 ₽

650 ₽

1 200 ₽

2 400 ₽

5 500 ₽

GPT-4.1

500 ₽

1 000 ₽

2 100 ₽

4 000 ₽

8 000 ₽

19 100 ₽

GPT-5

660 ₽

1 100 ₽

2 500 ₽

5 000 ₽

9 500 ₽

23 200 ₽

GPT-4o

1 200 ₽

2 400 ₽

5 500 ₽

10 500 ₽

20 200 ₽

48 800 ₽

DeepSeek-chat

80 ₽

150 ₽

300 ₽

600 ₽

1 200 ₽

2 800 ₽

DeepSeek-reasoner

160 ₽

300 ₽

600 ₽

1 200 ₽

2 200 ₽

5 200 ₽

grok-3-mini

36 ₽

60 ₽

150 ₽

280 ₽

520 ₽

1 200 ₽

grok-code-fast-1

100 ₽

200 ₽

450 ₽

850 ₽

1 500 ₽

3 500 ₽

grok-3

1 000 ₽

1 800 ₽

4 000 ₽

7 800 ₽

15 000 ₽

36 000 ₽

grok-4

1 000 ₽

1 800 ₽

4 000 ₽

7 800 ₽

15 000 ₽

36 000 ₽

Gemini 2.0 Flash-Lite

20 ₽

35 ₽

80 ₽

160 ₽

300 ₽

750 ₽

Gemini 2.5 Flash-Lite

30 ₽

60 ₽

150 ₽

250 ₽

450 ₽

1 100 ₽

Gemini 2.0 Flash

30 ₽

60 ₽

150 ₽

250 ₽

450 ₽

1 100 ₽

Gemini 2.5 Flash

150 ₽

300 ₽

650 ₽

1 200 ₽

2 400 ₽

5 500 ₽

Gemini 2.5 Pro

660 ₽

1 100 ₽

2 500 ₽

5 000 ₽

9 500 ₽

23 200 ₽

Claude Haiku 3.5

270 ₽

450 ₽

1 000 ₽

2 000 ₽

3 900 ₽

9 500 ₽

Claude Sonnet 3.7

1 000 ₽

1 800 ₽

4 000 ₽

7 800 ₽

15 000 ₽

36 000 ₽

Claude Sonnet 4

1 000 ₽

1 800 ₽

4 000 ₽

7 800 ₽

15 000 ₽

36 000 ₽

Claude Opus 3

5 100 ₽

8 500 ₽

20 100 ₽

39 000 ₽

74 800 ₽

180 600 ₽

Claude Opus 4.1

5 100 ₽

8 500 ₽

20 100 ₽

39 000 ₽

74 800 ₽

180 600 ₽

Определить оптимальное количество токенов, необходимое для вашего агента, можно только в процессе работы, понаблюдав за динамикой потребления.

В начале работы мы рекомендуем выбирать минимальный подходящий тариф и в дальнейшем увеличивать его при необходимости. Уменьшить тариф невозможно.

Дополнительные пакеты

Если вам нужно больше токенов, но следующий тарифный план избыточен или токены требуются только разово — вместо смены тарифа используйте дополнительные пакеты токенов, которые можно докупить в панели. 

Пакет позволит гибко настроить количество токенов с шагом в 250 тысяч и будет действовать только до конца текущего оплаченного месяца (можно определить по дате списания за тариф — в разделе «Баланс и платежи» → «История операций»).

Списание за пакет выполняется единоразово. Тариф при этом не изменится, и в следующем месяце будет списана стандартная стоимость тарифа.

Модель

250 000 токенов

GPT-4.1-nano

15 ₽

GPT-5-nano

15 ₽

GPT-4.1-mini

50 ₽

GPT-5-mini

60 ₽

GPT-4o-mini

80 ₽

GPT-4.1

250 ₽

GPT-5

330 ₽

GPT-4o

600 ₽

DeepSeek-chat

40 ₽

DeepSeek-reasoner

80 ₽

grok-3-mini

18 ₽

grok-code-fast-1

50 ₽

grok-3

500 ₽

grok-4

500 ₽

Gemini 2.0 Flash-Lite

10 ₽

Gemini 2.5 Flash-Lite

15 ₽

Gemini 2.0 Flash

15 ₽

Gemini 2.5 Flash

80 ₽

Gemini 2.5 Pro

330 ₽

Claude Haiku 3.5

135 ₽

Claude Sonnet 3.7

500 ₽

Claude Sonnet 4

500 ₽

Claude Opus 3

2 550 ₽

Claude Opus 4.1

2 550 ₽

База знаний

При создании базы знаний используется модель text-embedding-3-large, которая преобразует тексты в векторный формат. Это необходимо для индексации данных и последующей работы с ними.

Доступен единый тариф — 450 ₽ за 10 000 000 токенов.

Токены расходуются на индексацию при создании базы, а также на все запросы к ней.

Списание за тариф выполняется единоразово, в момент создания базы. В следующем месяце тариф будет продлен, также единоразовым списанием.

При создании базы знаний создается облачная базы OpenSearch, которая необходима для хранения данных. Выбирайте минимальный подходящий тариф — в дальнейшем его можно будет увеличить. Уменьшение тарифа недоступно.

Списания за базу данных почасовые.

Расход токенов при индексации зависит от формата загружаемого файла. Ниже — пример приблизительного потребления токенов при загрузке документов разных объемов:

Формат

1 МБ

10 МБ

100 МБ

500 МБ

.txt

240 000

2 400 000

24 000 000

120 000 000

.csv

450 000

4 500 000

45 000 000

225 000 000

.xml

62 000

620 000

6 200 000

31 000 000

.html

39 000

390 000

3 900 000

19 500 000

.md

221 000

2 210 000

22 100 000

110 500 000

Фактический расход может отличаться в зависимости от структуры и содержания файла.

Была ли статья полезна?
Ваша оценка очень важна
Пока нет комментариев