Аналитика
Урок 4

Поиск закономерностей и аномалий

0 из 6
1
Фундамент
2
Погружение
3
Бизнес-кейс
4
Промпт
5
Инсайт
6
Практика
Фундамент

Что скрывают ваши данные

В предыдущих уроках вы научились очищать данные и превращать их в понятные отчёты. Но отчёт отвечает на вопрос «что произошло?» — это описательная аналитика. Сегодня вы перейдёте на следующий уровень — диагностическая аналитика, которая отвечает на вопрос «почему это произошло?»

Представьте: в отчёте вы видите, что продажи в марте упали на 20%. Описательная аналитика фиксирует факт. Диагностическая — находит причину: оказывается, 80% падения пришлось на один регион, где сменился менеджер. Без AI вы могли бы искать эту связь часами.

3 типа скрытых паттернов, которые находит AI:

1. Корреляции — когда два показателя движутся вместе. Растёт A → растёт B. Или наоборот: растёт A → падает B. Пример: чем больше времени клиент проводит на сайте, тем выше вероятность покупки. Или: чем длиннее письмо менеджера, тем ниже конверсия (неожиданно!).

2. Сезонность — повторяющиеся циклы. Еженедельные: продажи падают в понедельник и растут в пятницу. Ежемесячные: пик оплат в конце месяца. Годовые: спад летом, рост к Новому году. AI находит циклы даже в данных, где вы их не подозревали.

3. Аномалии (выбросы) — значения, которые резко выбиваются из общей картины. Один клиент купил на 500 000 ₽ при среднем чеке 3 000 ₽. Один день — нулевые продажи при обычных 50 в день. Это может быть ошибка, мошенничество или уникальная возможность.

Почему человек пропускает паттерны? В таблице из 1 000 строк и 10 колонок — 10 000 ячеек. Между ними — тысячи возможных связей. Человек способен удержать в голове 3-5 переменных одновременно. AI проверяет все комбинации за секунды.

Погружение

Метод «3 вопроса» и ловушка ложных корреляций

Чтобы AI нашёл паттерны, нужно задать правильные вопросы. Используйте метод «3 вопроса» — задавайте их последовательно к любому набору данных:

Вопрос 1: «Что коррелирует?»

Промпт: «Проанализируй эти данные и найди все пары показателей, которые изменяются вместе. Для каждой пары укажи: направление связи (прямая/обратная), силу связи (сильная/средняя/слабая), возможную причину.» AI найдёт связи, которые вы никогда бы не проверили вручную.

Вопрос 2: «Что повторяется?»

Промпт: «Найди в этих данных повторяющиеся паттерны: дневные, недельные, месячные, квартальные или годовые циклы. Покажи, в какие периоды показатели стабильно растут или падают. Есть ли предсказуемые пики и спады?» Это основа для прогнозирования, которое вы изучите в Уроке 5.

Вопрос 3: «Что выбивается?»

Промпт: «Найди аномалии — значения, которые резко отличаются от среднего. Для каждой аномалии покажи: дату/запись, насколько значение отклоняется от нормы, возможные причины.» Аномалии — это или проблемы (ошибки, мошенничество), или возможности (суперклиент, вирусный день).

⚠️ Ловушка: ложные корреляции.

AI отлично находит статистические связи. Но не все связи = причинно-следственные. Классический пример: продажи мороженого коррелируют с количеством утоплений. Значит ли это, что мороженое вызывает утопления? Нет — оба показателя растут летом из-за жары.

Правило проверки: для каждой корреляции спросите AI: «Может ли это быть ложной корреляцией? Есть ли третий фактор, который влияет на оба показателя?» AI честно укажет, когда связь может быть случайной.

Бизнес-кейс

Как сеть кофеен сократила списания на 30% благодаря неочевидной корреляции

Ситуация: Сеть из 12 кофеен в крупном городе. Каждый день пекут десерты: чизкейки, круассаны, тирамису. Проблема — 30% десертов списывается в конце дня, потому что не продались. Это 180 000 ₽ убытков в месяц.

Что пробовали: Уменьшили объёмы выпечки — начались дефициты: к 15:00 десерты заканчивались, клиенты уходили. Увеличили — снова списания. Классическая проблема: невозможно угадать спрос.

Решение с AI:

Управляющий загрузил в AI данные за 6 месяцев: продажи десертов по дням + день недели + погода + температура + события в городе. Попросил: «Найди все корреляции с продажами десертов.»

Что обнаружил AI:

1. Температура ниже +5°C → продажи горячих десертов (круассаны, штрудель) растут на 40%. Температура выше +20°C → растут холодные десерты (чизкейк, тирамису) на 35%.

2. Дождь → продажи всех десертов падают на 25%, но кофе растёт на 15% (люди берут кофе навынос, но не садятся есть десерт).

3. Пятница и суббота → пик десертов (+60% к среднему), понедельник — минимум (−30%). Это ожидаемо, но AI нашёл неожиданное: среда тоже показывала пик в трёх точках рядом с бизнес-центрами (корпоративные обеды).

Действия: Перестроили закупки: каждое утро менеджер смотрит прогноз погоды и день недели → AI рассчитывает план выпечки на день.

Результат за 2 месяца: списания сократились с 30% до 8%. Экономия: ~130 000 ₽ в месяц. При этом дефициты тоже уменьшились — десертов стало хватать до закрытия.

Готовый промпт

Промпт: Детектор паттернов и аномалий

Этот промпт запускает полный анализ данных по методу «3 вопроса»: корреляции, сезонность, выбросы. Плюс проверяет ложные корреляции и предлагает гипотезы причин. Замените параметры в квадратных скобках:

ChatGPT / Claude / DeepSeek
Ты — аналитик данных, специализирующийся на поиске скрытых закономерностей и аномалий. Твоя задача — найти в данных то, что не видно на первый взгляд.

Исходные данные:
[вставьте данные — таблицу, выгрузку, описание. Чем больше данных, тем точнее анализ]

Область: [что это за данные — продажи / маркетинг / HR / финансы / клиентская база / другое]

Проведи анализ по трём направлениям:

1. КОРРЕЛЯЦИИ
- Найди все пары показателей, которые изменяются вместе (прямая связь: A↑ → B↑) или в противофазе (обратная связь: A↑ → B↓)
- Для каждой корреляции укажи: какие показатели связаны, направление, сила связи (сильная/средняя/слабая)
- КРИТИЧЕСКИ ВАЖНО: для каждой корреляции оцени — может ли это быть ЛОЖНОЙ корреляцией? Есть ли третий фактор, влияющий на оба показателя?

2. СЕЗОННОСТЬ И ЦИКЛЫ
- Найди повторяющиеся паттерны: дневные, недельные, месячные, квартальные, годовые
- Укажи: какой показатель цикличен, период цикла, амплитуда (насколько меняется от пика до спада)
- Отметь, есть ли «нетипичные» пики или спады, которые не вписываются в цикл

3. АНОМАЛИИ (ВЫБРОСЫ)
- Найди значения, которые резко отклоняются от среднего (> 2 стандартных отклонения)
- Для каждой аномалии укажи: запись/дату, значение vs среднее, возможные причины
- Классифицируй: ошибка данных / разовое событие / потенциальная проблема / потенциальная возможность

В конце дай:
- ТОП-3 самых важных находки (что стоит изучить глубже)
- РЕКОМЕНДАЦИИ: какие решения можно принять на основе найденных паттернов
- ОГРАНИЧЕНИЯ: чего не хватает в данных для более точного анализа
📝 Как использовать:

Чем больше данных вы дадите AI, тем точнее будет анализ. Идеально — от 100 строк и за период минимум 3 месяца. Для маленьких наборов (20-50 строк) AI предупредит, что выводы предварительные. Обязательно проверяйте раздел «ложные корреляции» — это убережёт от неправильных решений. Если AI нашёл интересный паттерн — попросите углубить: «Расскажи подробнее о корреляции #2. Какие ещё данные нужны, чтобы подтвердить или опровергнуть эту связь?»

🤖 Открыть в AI-модели
Инсайт

Мысль дня

Данные не врут, но молчат. Они не придут к вам с готовым ответом — нужно задать правильный вопрос. AI — переводчик, который превращает молчание тысяч строк в понятные закономерности. Ваша задача — не просто спросить «что?», а спросить «почему?».
Практика

Задание: Найдите скрытые паттерны в данных

Сегодня вы побудете детективом данных — найдёте связи, циклы и аномалии, которые не видны невооружённым глазом. Три шага:

🔗 Шаг 1: Найдите 3 корреляции

Возьмите данные из практики Уроков 2-3 (или попросите AI сгенерировать: «Создай таблицу продаж магазина за 6 месяцев: дата, день недели, погода, температура, количество посетителей, количество покупок, средний чек, товарная категория. 200 строк.»). Используйте промпт «Детектор паттернов» и найдите минимум 3 корреляции.

🕵️ Шаг 2: Проверьте на ложные связи

Для каждой найденной корреляции спросите AI: «Эта корреляция — реальная причинно-следственная связь или ложная? Какой третий фактор мог бы объяснить обе переменные?» Отметьте, какие корреляции подтвердились, а какие оказались случайными.

🚨 Шаг 3: Найдите 2 аномалии и объясните их

Попросите AI найти выбросы в данных. Для каждой аномалии определите: это ошибка данных, разовое событие, проблема или возможность? Предложите, какое решение можно принять на основе каждой аномалии. Помните: аномалия — это не всегда плохо, иногда это лучший клиент или самый удачный день.

Блок изучен!