Подготовка данных для Агента

В этой статье описан процесс подготовки данных для обучения NLU-модели (функционал распознавания естественной речи) Агента.

Разработать дизайн диалога проще и быстрее, когда есть история диалогов компании с Собеседниками будущего Агента. Например, при создании Агента для техподдержки могут быть полезны записи телефонных разговоров с операторами техподдержки. Голосовые записи транскрибируются и кластеризуются с помощью инструмента майнинга интентов. В результате история диалогов будет разбита на тематики, и для каждой тематики будут примеры реплик Собеседников и готовые ответы на них Оператора. Примеры высказываний Собеседников в дальнейшем включаются в обучающую выборку фраз для интентов, а ответы Оператора используются при прописывании ответов Агента в Диалоговом Сценарии. Если вы заинтересованы в майнинге интентов, пожалуйста, напишите нам на info@chatme.ai. Подробнее смотрите в разделе Запрос на кластеризацию диалогов.

Когда подобных исторических данных нет, для наполнения Агента контентом можно:

  • Подробно описать бизнес-процесс и придумать данные самостоятельно;

  • Найти в открытом доступе чат-ботов для автоматизации схожих бизнес-процессов и адаптировать использованный в них сценарий диалога под себя;

  • Обратиться к экспертам chatme.ai для консультации по поводу вашего кейса. Простого тестового Агента мы можем подготовить сразу, если вы отправите немного данных – подробности в статье Запрос на тестового Агента.

О том, каким образом создать из подготовленных данных качественную выборку для обучения NLU-модели вашего Агента: Рекомендации по наполнению выборки Агента

Last updated