Продукт Проблема Исследование Решение Валидация Результат Работа над ошибками
Naumen Erudite • B2B / Enterprise

Переработка раздела управления ML-моделями

Роль
Продуктовый дизайнер
Команда
Продуктовый аналитик, UX-райтер, 1 backend, 1 frontend, QA

Саммари

Переработала раздел управления ML-моделями в платформе для создания голосовых роботов. Аналитики не понимали, что происходит с моделями и при любой ошибке шли в поддержку. Разобралась в технической логике системы, переработала архитектуру раздела. Обращений в поддержку стало меньше на 60%.

До
До редизайна
После
После редизайна

Продукт

Naumen Erudite — платформа для создания голосовых и чат-ботов. Роботов настраивают аналитики внедрения: прописывают логику диалогов, настраивают сценарии, обучают ML-модели.

Модели отвечают за то, как робот понимает клиента: распознают тему обращения, извлекают данные из реплик, выбирают следующий шаг в диалоге. Когда аналитик меняет логику, модели нужно переобучить. Для этого существует раздел «Обучение».

Проблема

Раздел существовал много лет и за это время оброс решениями, которые никто не мог объяснить. Часть логики не была описана нигде.

Главная боль была в статусах. На одном экране их было три: статус ML-компонента, статус модели в списке, и маленький крестик у даты активной модели. Крестик при этом означал самое важное — «модель не готова к работе», но выглядел как декоративная иконка. В итоге ни один статус не отвечал на вопрос прямо: робот сейчас работает?

Когда обучение падало с ошибкой, аналитик не понимал что произошло и шёл в поддержку. Каждое такое обращение — это время команды поддержки и простой робота на стороне клиента.

Раздел до переработки
До редизайна

Исследование

Я начала с погружения: читала документацию, обсуждала поведение системы с разработчиками и тестировала сценарии. В какой-то момент вызвала редкую ошибку, что чуть не уронила прод.

Параллельно провела интервью с восемью аналитиками. Разделила на опытных и новичков: опытные работают с разделом каждый день и знают обходные пути, но взгляд уже замылился и реальные проблемы не считываются. Новички показывают, что непонятно без документации и подсказок. Вместе они дали полную картину.

Главная проблема оказалась не в отдельных элементах, а в том что интерфейс не отражал как система работает. При ошибке обучения робот продолжает работать, но интерфейс никак этого не показывал.

Решение

Изначально прорабатывала варианты с похожей структурой, что сейчас в продукте: master-detail. Но они не решали главное — не открыв детали моделей, непонятно было что происходит с компонентом. И тестирование диалогов никуда логично не ложилось.

Тогда я пошла от вопроса: что аналитику нужно видеть сразу, а что можно убрать подальше. 90% времени в разделе это переобучение, поэтому разделила на два таба: «Управление обучением» и «Дополнительно». Тестирование и редкие настройки ушли на второй таб.

Карточку компонента переделала по той же логике. Она теперь сразу отвечает на вопрос: компонент работает или нет, и что с последней моделью. Раньше для этого нужно было открывать список моделей и разбираться самому.

Формулировки статусов переработали вместе с UX-райтером: убрали технические термины, заменили на язык, который отвечает на вопрос пользователя.

Таб «Управление обучением»
Управление обучением
Раскрыт аккордеон со списком моделей
Список моделей
Таб «Дополнительно»
Дополнительно

Валидация

Протестировала новый интерфейс на двух группах аналитиков — опытных и новичках, но уже с другими людьми. Просила пройти обычный путь: переобучить модели, разобраться с ошибкой, посмотреть статусы. Критических проблем не нашла, мелкие правки внесла до передачи в разработку.

Результат

–60%
обращений в поддержку по разделу «Обучение» за квартал

Работа над ошибками

В табе «Дополнительно» можно запустить автоматическое тестирование диалогов. После теста у аналитика два действия: посмотреть результаты или запустить заново. Я поставила «Посмотреть результаты» на первое место. Показалось, что это главное действие после завершения.

После релиза пользователи пришли с фидбеком: по привычке нажимали не туда и случайно запускали тестирование заново.

Исправила: вернула обе кнопки на привычные места, а кнопку запуска переименовала в «Запустить ещё раз» — чтобы аналитик понимал что это повторный запуск, а не первый. Я недооценила силу позиционной привычки.

До исправления
До
После исправления
После
Все кейсы