Корпоративный ИИ-ассистент: данные важнее модели

На пилоте ассистент отвечает блестяще. Двадцать вопросов от рабочей группы, двадцать точных ответов со ссылками на документы. Запускаем в прод - и на третий день он уверенно сообщает клиенту про скидку, которую отменили два года назад. Откуда взял? Из старого регламента, который так и лежит в общей папке рядом с новым.

Модель не сломалась. Сломался слой между ней и вашими документами. И провал корпоративного ИИ-ассистента почти всегда случается именно здесь. Не в нейросети.

Модель давно не узкое место

Сильная модель сегодня доступна каждому. GPT, Yandex, Qwen отвечают на общие вопросы лучше среднего сотрудника. Спорить о том, какая нейросеть умнее, почти бессмысленно - на ваших задачах разница будет в пределах погрешности.

Узкое место в другом. В доменных знаниях. Это регламенты, прайсы, инструкции, ТЗ, история переписки с клиентами - всё, что описывает, как именно работает ваша компания. Эти знания разбросаны по почте, чатам, тикетам и головам сотрудников. Без них модель либо молчит, либо берёт ответ из общего интернета и выдумывает применительно к вам.

И вот неприятная часть. Чем крупнее компания, тем хуже состояние этих знаний. Сорок отделов, десять лет истории, три версии одного регламента, и никто не помнит, какая действует.

Выбор между сценарным ботом и умным - вопрос более ранний, и его мы разобрали в статье про разработку чат-бота для бизнеса.

Демо обещает то, чего нет

Пилот почти всегда выглядит убедительно, и это ловушка. На демо берут пару десятков понятных вопросов, под которые заранее причёсаны документы. Реальный поток - это длинный хвост формулировок, опечатки, ссылки на устаревшие правила и вопросы на стыке трёх отделов.

У крупной компании разрыв между демо и продом шире, чем у малой. Документов тысячи, противоречий между ними десятки, и часть из них вы найдёте только тогда, когда ассистент выдаст клиенту неверный ответ. Поэтому честный пилот проверяют на реальных диалогах за прошлый месяц. Причёсанная выборка не доказывает ничего.

Откуда берётся правильный ответ

Чтобы ассистент отвечал по делу, знания нужно подготовить. Убрать дубли, пометить, какая версия действует, разнести по смыслу так, чтобы система находила нужный фрагмент и показывала источник. Это инженерная работа, и в ней основная сложность проекта.

Подключить модель к свалке документов - значит получить уверенную чушь вместо молчания. Ответ звучит гладко, ссылается на ваш файл и при этом неверен. Для клиента это хуже честного "не знаю". Как устроено извлечение ответа по документам и почему правильно собранная база не сочиняет, разбирали в материалах про RAG против ChatGPT и подготовку базы знаний.

Пример из практики интеграций. Прайс лежит в Excel, который раз в неделю правит менеджер вручную. Пока этот файл не станет управляемым источником, ассистент будет называть клиентам цены недельной давности. Сначала порядок в данных, потом ИИ поверх них.

Где будут наши данные

У среднего и крупного бизнеса есть вопрос, который убивает сделку быстрее цены. Где окажутся наши документы. Служба безопасности не пустит регламенты и базу клиентов в зарубежное облако, и правильно сделает.

Поэтому модель должна быть сменной. Наш LLM Агент работает на разных нейросетях - GPT, Yandex, Qwen. Данные можно держать на российских моделях ради 152-ФЗ или развернуть решение в вашем контуре, без выхода наружу. Для ИТ-директора это снимает главный стоп-фактор: вопрос "а где наши данные" перестаёт блокировать проект.

С другой стороны, локальное развёртывание дороже и требует ваших мощностей. Не каждой компании оно нужно. Но право выбрать должно остаться у вас, а не у поставщика одной зарубежной модели.

Деньги и риск спрятаны в интеграции

Ассистент, который только отвечает в чате, закрывает малую часть пользы. Основное начинается, когда он что-то делает в ваших системах. Заводит обращение в Битрикс24, поднимает статус заказа из 1С. Создаёт задачу менеджеру, квалифицирует входящий и направляет в нужный отдел.

Здесь же и основная стоимость, и основной риск. У крупной компании интеграционная поверхность широкая: десятки прав доступа, ограничения, регламенты согласований. Ассистент, который может что-то создать или изменить, должен делать это строго в рамках ролей. Иначе из помощника он превращается в источник ошибок. Это закладывают на старте, а не дорабатывают после инцидента.

Снижать риск важнее, чем обещать выгоду

Главный конкурент такого проекта - не другой подрядчик. Это решение ничего не менять и оставить как есть. На фоне неопределённости отложить ИИ кажется безопасным выбором. Хотя цена бездействия редко считается: менеджеры тратят часы на типовые вопросы, клиенты ждут ответ дольше, чем у конкурентов, а первая линия выгорает на повторах.

Риск внедрения ИИ-ассистента снижается понятным способом. Пилот на реальных данных с измеримым результатом. Поэтапный запуск: сначала один сценарий и один отдел, потом расширение. План отката без боли и внятный SLA. Вы видите цифры до того, как масштабируете, и в любой момент понимаете, за что платите.

Чем мерить, что ассистент работает

Запуск - ещё не результат. Ассистент, который отвечает, и ассистент, который снимает нагрузку, - разные вещи.

Главная цифра - доля обращений, закрытых без человека. Рядом стоит качество эскалаций: как часто ассистент вовремя позвал менеджера и передал ему контекст вместе с историей диалога. Дальше идут освобождённые часы первой линии и доля диалогов, доведённых до заявки или заказа. Эти числа показывают окупаемость. А счётчик отправленных сообщений не говорит почти ни о чём - можно обработать их тысячами и не закрыть ни одной задачи.

Скажем честно, без рейтинговой мишуры. Вебформат 25 лет занимается корпоративной интеграцией, за плечами больше 500 проектов, 6 место по тестированию и 9 по проектированию в Рейтинге Рунета. Главная наша работа - собрать доменные знания компании в управляемую базу и подключить к ней ИИ, который отвечает по вашим документам и регламентам, а не по общему интернету. Принцип один: сначала знания и данные, потом модель поверх них.

Коротко

Если свести в абзац: судьбу корпоративного ИИ-ассистента решает слой знаний и данных вокруг модели. Соберите и приведите в порядок базу - регламенты, прайсы, документы с пометкой действующих версий. Проверьте ассистента на реальных диалогах, а не на причёсанной выборке. Решите вопрос с местом хранения данных до старта, заложите интеграции и права доступа, запускайте поэтапно и смотрите на долю обращений, закрытых без человека. Тогда ассистент снимает нагрузку и окупается. Иначе вы получите гладкую программу, которая уверенно вводит клиентов в заблуждение. И худший вариант здесь - дорогой пилот, который так и не довели до прода.

Почему корпоративный ИИ-ассистент выдумывает по вашим регламентам

Модель давно не узкое место

Демо обещает то, чего нет

Откуда берётся правильный ответ

Где будут наши данные

Деньги и риск спрятаны в интеграции

Снижать риск важнее, чем обещать выгоду

Чем мерить, что ассистент работает

Коротко

Похожие статьи

Разработка чат-бота для бизнеса: от чего зависит, заработает он или нет

Почему RAG-агент не выдумывает, а корпоративный ChatGPT иногда да

Как подготовить базу знаний для LLM-агента: документы, FAQ, прайсы, каталог, права доступа

Думаете о корпоративном ИИ-ассистенте?