Урок 4.4

Что такое RAG: когда AI опирается на документы и базы знаний клиента

Многие клиенты уже слышали про ChatGPT и большие языковые модели. Часть из них приходит с запросами:

«Хотим своего ChatGPT для компании»;
«Нужен ассистент, который отвечает по нашим регламентам»;
«Хотим умный поиск по внутренним документам».

Если упростить, им нужен AI, который:

отвечает не абстрактно «из головы»;
а опирается на документы, базы знаний и данные компании.

Такой подход называется RAG (Retrieval-Augmented Generation): модель сначала находит нужные фрагменты из документов, а потом генерирует ответ на их основе.

В этом уроке разберём, как объяснять RAG простым языком и в каких жалобах клиента он чаще всего встречается.

Что важно понять

1. Обычный LLM и RAG — в чём разница

Условно есть два режима работы:

Просто LLM (как публичный чат-бот) — модель отвечает на основе общих знаний и своего обучения; не знает специфики конкретной компании; не имеет доступа к закрытым документам клиента (если специально не настроить). Для клиента это выглядит как «умный собеседник», но он может не знать внутренних регламентов, не читает конкретные договоры, инструкции, НСИ и может отвечать «в общем», но не по правилам компании.
RAG (Retrieval-Augmented Generation) — перед ответом модель идёт в документы и базы клиента; находит релевантные фрагменты (регламенты, статьи базы знаний, договоры); строит ответ, опираясь на эти фрагменты, а не только на общие знания.

Простая формулировка для клиента:

«Обычный чат-бот отвечает „из головы", RAG-подход — это когда AI перед ответом смотрит в ваши документы и отвечает уже опираясь на них».

2. В каких жалобах клиента спрятан RAG-сценарий

Чаще всего RAG-подход нужен там, где:

много документов и инструкций;
сотрудники или клиенты не могут быстро в них разобраться;
важно отвечать по регламентам и актуальной информации, а не «как получится».

«Сотрудники постоянно спрашивают одно и то же, искать ответы в документах долго»

Сигналы: много внутренних регламентов, инструкций, методичек; база знаний есть, но ею мало пользуются; эксперты устали отвечать на одни и те же вопросы.

RAG-сценарий:

AI-ассистент, который читает внутренние документы и отвечает сотрудникам на вопросы «по базе»;
поиск ответов не по ключевым словам, а по смыслу;
ссылки на источники («ответ взят из такого-то регламента»).

«У нас хаос в базе знаний, нужную статью сложно найти»

Сигналы: много статей в Confluence, SharePoint, wiki-системах; поиск по ключевым словам даёт кучу нерелевантных результатов; сотрудники говорят: «проще спросить коллегу, чем искать».

RAG-сценарий:

умный поиск по базе знаний, который понимает вопрос по-человечески;
выдаёт краткий ответ + показывает, из каких документов он его собрал;
ускоряет адаптацию новичков и снижает нагрузку на экспертов.

«Нужно, чтобы AI отвечал по нашим договорам, регламентам и НСИ, а не фантазировал»

Сигналы: важна точность формулировок (юристы, комплаенс); есть риск, что «общий» чат-бот придумает лишнее; клиент хочет контролировать источники правды.

RAG-сценарий:

ассистент, который не придумывает условия договора, а ищет их в конкретных документах клиента;
ответы всегда опираются на реальный текст: договоры, регламенты, НСИ.

3. Как объяснить клиенту RAG на одном примере

Пример формулировки:

«Представьте, что у вас есть сотрудник, который:

1) сначала быстро пробегает глазами все ваши регламенты и документы,

2) находит нужные фрагменты,

3) и только потом формулирует ответ.

RAG-подход делает то же самое: AI сначала идёт в ваши документы, а уже потом отвечает».

Важно: речь не про «волшебную нейросеть», которая знает всё; речь про связку: ваши документы + модель, которая умеет читать и объяснять.

4. Как не перепутать RAG с «просто NLP/LLM» или «поиском»

Подход	Как ищет	Как отвечает
Обычный текстовый поиск	Совпадения по словам	Выдаёт список документов; человек сам читает и формулирует ответ
LLM без RAG	Не читает ваши документы	Отвечает по общим знаниям; может «фантазировать» и выдавать неточные для вашей компании формулировки
RAG	Понимает вопрос по-человечески; находит фрагменты в ваших документах	Формирует ответ, опираясь именно на найденные фрагменты; может показать источники

Хороший критерий: если клиент хочет, чтобы AI отвечал строго по его документам и базе знаний, а не просто «умно рассуждал» — это RAG-задача.

Пример из клиентской логики

Клиент говорит:

«У нас есть большая база знаний в Confluence и куча регламентов. Формально всё описано, но сотрудники всё равно бегают к экспертам за ответами. Говорят, что поиск в базе неудобный и быстрее спросить у живого человека».

Что должен услышать сотрудник:

у клиента уже есть база знаний и документы;
есть проблема доступа к знаниям, а не их отсутствия;
это типичный RAG-сценарий: нужен ассистент, который читает базу и отвечает по ней.

Как можно отреагировать:

«Это как раз типичная ситуация для RAG-подхода. Мы можем сделать ассистента, который понимает вопросы сотрудников по-человечески, подбирает нужные фрагменты из ваших статей и регламентов и формирует ответ, а при необходимости показывает, из какого документа он взял эту информацию».

Такая формулировка не пугает термином RAG и показывает конкретную пользу: быстрее доступ к знаниям, меньше нагрузка на экспертов, меньше хаоса.

✍️ Мини-практика

Определите, где явно просится RAG-подход — то есть задача, где AI должен опираться на документы и базы знаний клиента, а не только на общий опыт или числа. Варианты: A — «Да, нужен RAG, ответы по документам и базе знаний», B — «Нет, это другая AI-задача (числа, категории, сегменты или просто LLM)». Для каждой ситуации напишите букву и короткое обоснование.

«Хотим прогнозировать выручку по направлениям на следующий квартал».
«У нас есть большая база инструкций и регламентов, но сотрудники всё равно бегают к экспертам — говорят, что искать долго и неудобно».
«Нужно разделить клиентов на несколько сегментов по обороту и марже».
«Юристы устали отвечать на одни и те же вопросы по договорам, всё давно описано в шаблонах и регламентах».
«Хотим, чтобы AI объяснял сотрудникам наши внутренние процедуры, опираясь на актуальные документы, а не придумывал сам».

Напишите ответ и нажмите «Отправить». 0 предложений

На что обратить внимание

Правильные ответы: 1 — B (прогноз выручки — это «предсказать число»), 2 — A (база знаний есть, поиск неудобный — типичный RAG), 3 — B (сегментация по обороту/марже — числовые признаки), 4 — A (ответы юристам по договорам и шаблонам — RAG), 5 — A (ответы по актуальным внутренним документам — RAG).

Проверьте себя

Вопрос 1

Клиент говорит: «Мы хотим, чтобы у сотрудников был ассистент, который знает все наши регламенты и инструкции и отвечает на вопросы по ним, а не просто рассуждает в общем». Какой подход здесь уместнее всего?

A. Только прогнозирование показателей. B. Обычный LLM без доступа к документам. C. RAG.

Вопрос 2

Клиент говорит: «У нас уже есть поиск по базе знаний, но он работает по ключевым словам. Люди всё равно не находят нужное, потому что формулируют вопросы по-разному». Что здесь может дать RAG-подход?

A. Ничего, нужен только лучший полнотекстовый поиск. B. AI, который понимает вопрос по-человечески, ищет релевантные фрагменты и формирует ответ. C. Только прогнозирование активности пользователей.

Вопрос 3

Клиент говорит: «Мы боимся, что ChatGPT придумает условия договора, которых у нас нет. Нам важно, чтобы AI отвечал только на основе наших шаблонов и регламентов». Какая формулировка ответа от сотрудника будет наиболее корректной?

A. «Не переживайте, современные модели почти не фантазируют». B. «В вашем случае нужен подход, где модель перед ответом смотрит в ваши договора и регламенты — это называется RAG». C. «Давайте вообще не использовать AI в юридической части».

Итог урока

RAG-подход нужен там, где:

у клиента уже есть много документов, инструкций, регламентов и базы знаний;
важно, чтобы AI отвечал строго по этим документам, а не «в общем»;
сотрудники и клиенты страдают не от отсутствия информации, а от сложности её найти и использовать.

Ваша задача — научиться слышать фразы про «базу знаний, регламенты, инструкции, договоры» и переводить их в понятный посыл:

«Здесь нужен AI, который перед ответом читает ваши документы и отвечает по ним, а не просто рассуждает. Это и есть RAG-подход, на котором строятся умные ассистенты по базе знаний и внутренним документам».

В следующем уроке мы разберём ещё один важный блок — агентные AI-системы, которые не только читают и отвечают, но и сами выполняют многошаговые действия в бизнес-системах клиента.

Требуется авторизация

Что важно понять

1. Обычный LLM и RAG — в чём разница

2. В каких жалобах клиента спрятан RAG-сценарий

«Сотрудники постоянно спрашивают одно и то же, искать ответы в документах долго»

«У нас хаос в базе знаний, нужную статью сложно найти»

«Нужно, чтобы AI отвечал по нашим договорам, регламентам и НСИ, а не фантазировал»

3. Как объяснить клиенту RAG на одном примере

4. Как не перепутать RAG с «просто NLP/LLM» или «поиском»

Пример из клиентской логики

✍️ Мини-практика

Проверьте себя

Вопрос 1

Вопрос 2

Вопрос 3

Итог урока