Что такое RAG: когда AI опирается на документы и базы знаний клиента
Многие клиенты уже слышали про ChatGPT и большие языковые модели. Часть из них приходит с запросами:
- «Хотим своего ChatGPT для компании»;
- «Нужен ассистент, который отвечает по нашим регламентам»;
- «Хотим умный поиск по внутренним документам».
Если упростить, им нужен AI, который:
- отвечает не абстрактно «из головы»;
- а опирается на документы, базы знаний и данные компании.
Такой подход называется RAG (Retrieval-Augmented Generation): модель сначала находит нужные фрагменты из документов, а потом генерирует ответ на их основе.
В этом уроке разберём, как объяснять RAG простым языком и в каких жалобах клиента он чаще всего встречается.
Что важно понять
1. Обычный LLM и RAG — в чём разница
Условно есть два режима работы:
- Просто LLM (как публичный чат-бот) — модель отвечает на основе общих знаний и своего обучения; не знает специфики конкретной компании; не имеет доступа к закрытым документам клиента (если специально не настроить). Для клиента это выглядит как «умный собеседник», но он может не знать внутренних регламентов, не читает конкретные договоры, инструкции, НСИ и может отвечать «в общем», но не по правилам компании.
- RAG (Retrieval-Augmented Generation) — перед ответом модель идёт в документы и базы клиента; находит релевантные фрагменты (регламенты, статьи базы знаний, договоры); строит ответ, опираясь на эти фрагменты, а не только на общие знания.
Простая формулировка для клиента:
«Обычный чат-бот отвечает „из головы", RAG-подход — это когда AI перед ответом смотрит в ваши документы и отвечает уже опираясь на них».
2. В каких жалобах клиента спрятан RAG-сценарий
Чаще всего RAG-подход нужен там, где:
- много документов и инструкций;
- сотрудники или клиенты не могут быстро в них разобраться;
- важно отвечать по регламентам и актуальной информации, а не «как получится».
«Сотрудники постоянно спрашивают одно и то же, искать ответы в документах долго»
Сигналы: много внутренних регламентов, инструкций, методичек; база знаний есть, но ею мало пользуются; эксперты устали отвечать на одни и те же вопросы.
RAG-сценарий:
- AI-ассистент, который читает внутренние документы и отвечает сотрудникам на вопросы «по базе»;
- поиск ответов не по ключевым словам, а по смыслу;
- ссылки на источники («ответ взят из такого-то регламента»).
«У нас хаос в базе знаний, нужную статью сложно найти»
Сигналы: много статей в Confluence, SharePoint, wiki-системах; поиск по ключевым словам даёт кучу нерелевантных результатов; сотрудники говорят: «проще спросить коллегу, чем искать».
RAG-сценарий:
- умный поиск по базе знаний, который понимает вопрос по-человечески;
- выдаёт краткий ответ + показывает, из каких документов он его собрал;
- ускоряет адаптацию новичков и снижает нагрузку на экспертов.
«Нужно, чтобы AI отвечал по нашим договорам, регламентам и НСИ, а не фантазировал»
Сигналы: важна точность формулировок (юристы, комплаенс); есть риск, что «общий» чат-бот придумает лишнее; клиент хочет контролировать источники правды.
RAG-сценарий:
- ассистент, который не придумывает условия договора, а ищет их в конкретных документах клиента;
- ответы всегда опираются на реальный текст: договоры, регламенты, НСИ.
3. Как объяснить клиенту RAG на одном примере
Пример формулировки:
«Представьте, что у вас есть сотрудник, который:
1) сначала быстро пробегает глазами все ваши регламенты и документы,
2) находит нужные фрагменты,
3) и только потом формулирует ответ.
RAG-подход делает то же самое: AI сначала идёт в ваши документы, а уже потом отвечает».
Важно: речь не про «волшебную нейросеть», которая знает всё; речь про связку: ваши документы + модель, которая умеет читать и объяснять.
4. Как не перепутать RAG с «просто NLP/LLM» или «поиском»
| Подход | Как ищет | Как отвечает |
|---|---|---|
| Обычный текстовый поиск | Совпадения по словам | Выдаёт список документов; человек сам читает и формулирует ответ |
| LLM без RAG | Не читает ваши документы | Отвечает по общим знаниям; может «фантазировать» и выдавать неточные для вашей компании формулировки |
| RAG | Понимает вопрос по-человечески; находит фрагменты в ваших документах | Формирует ответ, опираясь именно на найденные фрагменты; может показать источники |
Хороший критерий: если клиент хочет, чтобы AI отвечал строго по его документам и базе знаний, а не просто «умно рассуждал» — это RAG-задача.
Пример из клиентской логики
Клиент говорит:
«У нас есть большая база знаний в Confluence и куча регламентов. Формально всё описано, но сотрудники всё равно бегают к экспертам за ответами. Говорят, что поиск в базе неудобный и быстрее спросить у живого человека».
Что должен услышать сотрудник:
- у клиента уже есть база знаний и документы;
- есть проблема доступа к знаниям, а не их отсутствия;
- это типичный RAG-сценарий: нужен ассистент, который читает базу и отвечает по ней.
Как можно отреагировать:
«Это как раз типичная ситуация для RAG-подхода. Мы можем сделать ассистента, который понимает вопросы сотрудников по-человечески, подбирает нужные фрагменты из ваших статей и регламентов и формирует ответ, а при необходимости показывает, из какого документа он взял эту информацию».
Такая формулировка не пугает термином RAG и показывает конкретную пользу: быстрее доступ к знаниям, меньше нагрузка на экспертов, меньше хаоса.
✍️ Мини-практика
Определите, где явно просится RAG-подход — то есть задача, где AI должен опираться на документы и базы знаний клиента, а не только на общий опыт или числа. Варианты: A — «Да, нужен RAG, ответы по документам и базе знаний», B — «Нет, это другая AI-задача (числа, категории, сегменты или просто LLM)». Для каждой ситуации напишите букву и короткое обоснование.
- «Хотим прогнозировать выручку по направлениям на следующий квартал».
- «У нас есть большая база инструкций и регламентов, но сотрудники всё равно бегают к экспертам — говорят, что искать долго и неудобно».
- «Нужно разделить клиентов на несколько сегментов по обороту и марже».
- «Юристы устали отвечать на одни и те же вопросы по договорам, всё давно описано в шаблонах и регламентах».
- «Хотим, чтобы AI объяснял сотрудникам наши внутренние процедуры, опираясь на актуальные документы, а не придумывал сам».
На что обратить внимание
Проверьте себя
Вопрос 1
Клиент говорит: «Мы хотим, чтобы у сотрудников был ассистент, который знает все наши регламенты и инструкции и отвечает на вопросы по ним, а не просто рассуждает в общем». Какой подход здесь уместнее всего?
Вопрос 2
Клиент говорит: «У нас уже есть поиск по базе знаний, но он работает по ключевым словам. Люди всё равно не находят нужное, потому что формулируют вопросы по-разному». Что здесь может дать RAG-подход?
Вопрос 3
Клиент говорит: «Мы боимся, что ChatGPT придумает условия договора, которых у нас нет. Нам важно, чтобы AI отвечал только на основе наших шаблонов и регламентов». Какая формулировка ответа от сотрудника будет наиболее корректной?
Итог урока
RAG-подход нужен там, где:
- у клиента уже есть много документов, инструкций, регламентов и базы знаний;
- важно, чтобы AI отвечал строго по этим документам, а не «в общем»;
- сотрудники и клиенты страдают не от отсутствия информации, а от сложности её найти и использовать.
Ваша задача — научиться слышать фразы про «базу знаний, регламенты, инструкции, договоры» и переводить их в понятный посыл:
«Здесь нужен AI, который перед ответом читает ваши документы и отвечает по ним, а не просто рассуждает. Это и есть RAG-подход, на котором строятся умные ассистенты по базе знаний и внутренним документам».
В следующем уроке мы разберём ещё один важный блок — агентные AI-системы, которые не только читают и отвечают, но и сами выполняют многошаговые действия в бизнес-системах клиента.