Создать базу знаний можно, если создан хотя бы один AI-агент. Для первого агента на аккаунте вы сможете создать базу после создания агента и подключить ее в настройках.
-
Перейдите в раздел «AI-агенты» → «Базы знаний».
-
Нажмите «Создать» или «Добавить».
-
Загрузите источник данных. Одновременно можно загрузить не более 100 файлов по 10 МБ каждый. Поддерживаемые форматы:
.csv
,.html
,.md
,.txt
,.xml
. Подробнее. -
Для хранения информации будет создана облачная база данных OpenSearch. Выберите подходящий тариф. Вы сможете увеличить его в дальнейшем, если потребуется.
-
Задайте имя базы знаний, чтобы было проще ориентироваться в них в панели управления. Дополнительно можно указать комментарий.
-
Нажмите «Заказать».
Начнется процесс создания облачной базы данных и индексации загруженных файлов.
Для индексации используется модель встраивания text-embedding-3-large. Скорость индексации зависит от размера файлов и занимает в среднем 2-3 минуты.
Стоимость тарифа базы знаний будет списана полностью при создании базы знаний. В следующем месяце тариф будет продлен по той же стоимости.
Списания за базу данных OpenSearch — почасовые.
Для человека, который не имеет опыта работы с LLM, было бы крайне полезно видеть пример(ы) того, как могут выглядеть базы знаний того или иного формата. может какие то разметки (не)нужны или может есть какие либо запреты. Можно ли использовать в базах знаний ссылки, медиа-контент? Что, если предоставить агенту изображения или анимации в SVG и многое другое. Наверняка все можно нагуглить и нарыть самостоятельно среди рекламных дебрей и кликбейтов...но это уже совсем другая история)
Добрый день! В качестве источников можно использовать текстовые данные. Ограничений по разметке/оформлению нет, кроме нюанса для таблиц: первая строка должна содержать имена колонок.
Источники данных могут содержать медиа, это не помешает индексации, но сами медиаданные распознаны не будут, агент будет работать только с текстом.
В источниках можно использовать ссылки, например, на вашу собственную документацию, чтобы агент мог прислать релевантные ссылки клиенту. Однако содержимое самой веб-страницы агент прочитать не сможет, если в источнике дать ему только URL.
Мы также добавили эти сведения в документацию.
У меня ошибка индексирования. Внутри файла нужно использовать какую-то особую разметку?
Добрый день! Насколько мы видим сейчас, данные успешно проиндексировались. Если проблема повторится, создайте, пожалуйста, тикет в поддержку — посмотрим, что могло пойти не так.
В каком формате должны быть файлы для базы знаний?
Поддерживаемые форматы: .csv, .html, .md, .txt, .xml.
В разделе AI-агенты нет раздела База знаний
Здравствуйте! Спасибо, мы уточнили формулировки в документации.
Первый агент на аккаунте создается без базы знаний. Как только он будет создан, в панели станет доступен раздел «Базы знаний», где вы сможете создать базу и подключить ее к агенту.
Для всех последующих агентов вы сможете создавать базы знаний заранее и подключать их на этапе создания агента.