Назад к курсу
Урок 4.4

Что такое RAG: когда AI опирается на документы и базы знаний клиента

Многие клиенты уже слышали про ChatGPT и большие языковые модели. Часть из них приходит с запросами:

Если упростить, им нужен AI, который:

Такой подход называется RAG (Retrieval-Augmented Generation): модель сначала находит нужные фрагменты из документов, а потом генерирует ответ на их основе.

В этом уроке разберём, как объяснять RAG простым языком и в каких жалобах клиента он чаще всего встречается.

Что важно понять

1. Обычный LLM и RAG — в чём разница

Условно есть два режима работы:

  1. Просто LLM (как публичный чат-бот) — модель отвечает на основе общих знаний и своего обучения; не знает специфики конкретной компании; не имеет доступа к закрытым документам клиента (если специально не настроить). Для клиента это выглядит как «умный собеседник», но он может не знать внутренних регламентов, не читает конкретные договоры, инструкции, НСИ и может отвечать «в общем», но не по правилам компании.
  2. RAG (Retrieval-Augmented Generation) — перед ответом модель идёт в документы и базы клиента; находит релевантные фрагменты (регламенты, статьи базы знаний, договоры); строит ответ, опираясь на эти фрагменты, а не только на общие знания.

Простая формулировка для клиента:

«Обычный чат-бот отвечает „из головы", RAG-подход — это когда AI перед ответом смотрит в ваши документы и отвечает уже опираясь на них».

2. В каких жалобах клиента спрятан RAG-сценарий

Чаще всего RAG-подход нужен там, где:

«Сотрудники постоянно спрашивают одно и то же, искать ответы в документах долго»

Сигналы: много внутренних регламентов, инструкций, методичек; база знаний есть, но ею мало пользуются; эксперты устали отвечать на одни и те же вопросы.

RAG-сценарий:

«У нас хаос в базе знаний, нужную статью сложно найти»

Сигналы: много статей в Confluence, SharePoint, wiki-системах; поиск по ключевым словам даёт кучу нерелевантных результатов; сотрудники говорят: «проще спросить коллегу, чем искать».

RAG-сценарий:

«Нужно, чтобы AI отвечал по нашим договорам, регламентам и НСИ, а не фантазировал»

Сигналы: важна точность формулировок (юристы, комплаенс); есть риск, что «общий» чат-бот придумает лишнее; клиент хочет контролировать источники правды.

RAG-сценарий:

3. Как объяснить клиенту RAG на одном примере

Пример формулировки:

«Представьте, что у вас есть сотрудник, который:

1) сначала быстро пробегает глазами все ваши регламенты и документы,

2) находит нужные фрагменты,

3) и только потом формулирует ответ.

RAG-подход делает то же самое: AI сначала идёт в ваши документы, а уже потом отвечает».

Важно: речь не про «волшебную нейросеть», которая знает всё; речь про связку: ваши документы + модель, которая умеет читать и объяснять.

4. Как не перепутать RAG с «просто NLP/LLM» или «поиском»

Подход Как ищет Как отвечает
Обычный текстовый поиск Совпадения по словам Выдаёт список документов; человек сам читает и формулирует ответ
LLM без RAG Не читает ваши документы Отвечает по общим знаниям; может «фантазировать» и выдавать неточные для вашей компании формулировки
RAG Понимает вопрос по-человечески; находит фрагменты в ваших документах Формирует ответ, опираясь именно на найденные фрагменты; может показать источники

Хороший критерий: если клиент хочет, чтобы AI отвечал строго по его документам и базе знаний, а не просто «умно рассуждал» — это RAG-задача.

Пример из клиентской логики

Клиент говорит:

«У нас есть большая база знаний в Confluence и куча регламентов. Формально всё описано, но сотрудники всё равно бегают к экспертам за ответами. Говорят, что поиск в базе неудобный и быстрее спросить у живого человека».

Что должен услышать сотрудник:

Как можно отреагировать:

«Это как раз типичная ситуация для RAG-подхода. Мы можем сделать ассистента, который понимает вопросы сотрудников по-человечески, подбирает нужные фрагменты из ваших статей и регламентов и формирует ответ, а при необходимости показывает, из какого документа он взял эту информацию».

Такая формулировка не пугает термином RAG и показывает конкретную пользу: быстрее доступ к знаниям, меньше нагрузка на экспертов, меньше хаоса.

✍️ Мини-практика

Определите, где явно просится RAG-подход — то есть задача, где AI должен опираться на документы и базы знаний клиента, а не только на общий опыт или числа. Варианты: A — «Да, нужен RAG, ответы по документам и базе знаний», B — «Нет, это другая AI-задача (числа, категории, сегменты или просто LLM)». Для каждой ситуации напишите букву и короткое обоснование.

  1. «Хотим прогнозировать выручку по направлениям на следующий квартал».
  2. «У нас есть большая база инструкций и регламентов, но сотрудники всё равно бегают к экспертам — говорят, что искать долго и неудобно».
  3. «Нужно разделить клиентов на несколько сегментов по обороту и марже».
  4. «Юристы устали отвечать на одни и те же вопросы по договорам, всё давно описано в шаблонах и регламентах».
  5. «Хотим, чтобы AI объяснял сотрудникам наши внутренние процедуры, опираясь на актуальные документы, а не придумывал сам».
Напишите ответ и нажмите «Отправить». 0 предложений
На что обратить внимание
Правильные ответы: 1 — B (прогноз выручки — это «предсказать число»), 2 — A (база знаний есть, поиск неудобный — типичный RAG), 3 — B (сегментация по обороту/марже — числовые признаки), 4 — A (ответы юристам по договорам и шаблонам — RAG), 5 — A (ответы по актуальным внутренним документам — RAG).

Проверьте себя

Вопрос 1

Клиент говорит: «Мы хотим, чтобы у сотрудников был ассистент, который знает все наши регламенты и инструкции и отвечает на вопросы по ним, а не просто рассуждает в общем». Какой подход здесь уместнее всего?

Вопрос 2

Клиент говорит: «У нас уже есть поиск по базе знаний, но он работает по ключевым словам. Люди всё равно не находят нужное, потому что формулируют вопросы по-разному». Что здесь может дать RAG-подход?

Вопрос 3

Клиент говорит: «Мы боимся, что ChatGPT придумает условия договора, которых у нас нет. Нам важно, чтобы AI отвечал только на основе наших шаблонов и регламентов». Какая формулировка ответа от сотрудника будет наиболее корректной?

Итог урока

RAG-подход нужен там, где:

  • у клиента уже есть много документов, инструкций, регламентов и базы знаний;
  • важно, чтобы AI отвечал строго по этим документам, а не «в общем»;
  • сотрудники и клиенты страдают не от отсутствия информации, а от сложности её найти и использовать.

Ваша задача — научиться слышать фразы про «базу знаний, регламенты, инструкции, договоры» и переводить их в понятный посыл:

«Здесь нужен AI, который перед ответом читает ваши документы и отвечает по ним, а не просто рассуждает. Это и есть RAG-подход, на котором строятся умные ассистенты по базе знаний и внутренним документам».

В следующем уроке мы разберём ещё один важный блок — агентные AI-системы, которые не только читают и отвечают, но и сами выполняют многошаговые действия в бизнес-системах клиента.