Вы можете управлять источниками данных, которые используются в той или иной базе знаний: загружать новые файлы источников или удалять существующие.
Формат источников данных
Файлы источников данных могут быть в форматах: .csv, .htm, .html, .md, .txt, .xml, .pdf.
В качестве источников необходимо использовать текстовые данные. Ограничений по содержимому или оформлению нет, кроме нюанса для таблиц: первая строка должна содержать имена колонок.
Если источники данных содержат медиа (видео, изображения и др.), это не помешает индексации, но сами медиаданные распознаны не будут. Агент будет работать только с текстом.
В источниках можно использовать ссылки, например, на вашу собственную документацию или онлайн-каталоги, чтобы агент мог присылать клиентам релевантные ссылки. Однако ссылки тоже будут распознаны как текст — агент не сможет самостоятельно прочитать и проанализировать содержимое веб-страницы по приведенному URL.
Добавление источника данных
- Перейдите в раздел «AI-Агенты» → «Базы знаний»
- Выберите нужную базу и откройте вкладку «Источники данных».
- Нажмите кнопку «Добавить источник». Выберите способ добавления: загрузка файла или подключение по ссылке.
Поддерживаются форматы: .csv, .htm, .html, .md, .txt, .xml, .pdf . Максимальный размер каждого файла — 50 МБ.
Для всех форматов используются специализированные парсеры. Например, при обработке HTML-страниц не индексируются JS-скрипты, CSS, мета-теги и другие технические элементы — только содержимое страницы.
Загрузка файла
Выберите вкладку «Загрузить файл» и добавьте от 1 до 100 файлов.

Подключение по ссылке
Выберите вкладку «Подключить по ссылке» и вставьте ссылку в поле «Ссылка на источник». Нажмите «Добавить источник» — вы можете добавить сразу несколько.

При подключении по ссылке важно:
-
Страница должна быть доступна без авторизации;
-
Страница должна загружаться полностью при помощи
curl, без генерации на клиенте (не SPA).
Для источников, добавленных по ссылке, можно включить автоматическую переиндексацию. Для этого включите переключатель «Авто переиндексация по расписанию».
Переиндексация выполняется при изменении заголовка ETag. Если ETag не передается, индекс обновляется при каждом запуске по расписанию.
Управление источниками
Во вкладке «Источники данных» отображаются все добавленные источники:
-
Иконка файла — источник загружен вручную;
-
Иконка глобуса — источник подключен по ссылке.

При наведении курсора появляется кнопка переиндексации. Она повторно загрузит содержимое и обновит индекс:
-
Для файлов — проиндексирует текущую версию;
-
Для ссылок — загрузит актуальное содержимое по ссылке.
Кликнув по иконке с тремя точками напротив источника, вы можете:
-
Скачать файл (для источников, загруженных из файла);
-
Отредактировать ссылку или расписание (для источников, подключенных по ссылке);
-
Удалить источник — независимо от способа добавления.