Интервью. Революция колл-центров: каких офисных сотрудников на самом деле вскоре заменят роботы

Недавно Amazon открыл полностью автоматизированный магазин, где нет продавцов, кассиров. Это событие спровоцировало новый виток обсуждений тренда на замещение роботами людей во многих областях бизнеса (например, вот статья по теме в The Guardian). Мне удалось поговорить с Дмитрием Плотниковым, экспертом по автоматизации бизнес-процессов (Microsoft MVP), о том, кому на самом деле пора начинать переживать за свои рабочие места.

Ты много работаешь в сфере автоматизации бизнес-процессов. Можешь поделиться наблюдениями о том, места каких сотрудников скоро займут роботы?

Вообще, в интернете уже несколько лет публикуются разные списки профессий, которые уничтожат роботы (например, вот и вот), — там всё время называют рабочих с фабрик, водителей или официантов. На самом деле из того, что мы видим, раньше других проблемы могут возникнуть как раз у офисных сотрудников.

Это, например, у кого?

Например, сотрудники колл-центров, которые занимаются холодными продажами с помощью телефонных звонков. Обычно у оператора есть четкий сценарий разговора (скрипт), в котором прописано, что и как он должен говорить. Отклоняться от него чаще всего запрещается. И даже если возникает ситуация, которая скриптом не обрабатывается, операторам полагается повторять только те фразы, что есть в их скрипте, — остальное под запретом.

То есть человек, как робот, будет повторять одни и те же слова. А раз так, то почему бы не заменить его роботом, ведь это позволит сэкономить: программу не нужно обучать, она может работать круглосуточно и без выходных.

Но в данном случае получается, что система должна будет вести голосовую беседу, а это еще сложнее, чем чат-бот. Есть ли в этой сфере сейчас какие-то заметные успехи?

Да, мне довелось поучаствовать в проекте, где нужно было реализовать как раз такую систему — приложение, которое использует базу SharePoint в качестве CRM и ведет коммуникацию в ходе холодных звонков. Эта система уже запущена и работает у одного из заказчиков из западного региона (компанию назвать, к сожалению, не могу).

Подобных решений на рынке довольно много, большинство из них используют подход, при котором компьютер синтезирует голос человека. Это почти всегда звучит неестественно, разговаривать с таким роботом человеку не очень приятно.

Поэтому в нашем проекте было решено отказаться от синтеза речи и использовать в коммуникациях заранее записанный голос живого человека. В итоге система зачитывает собеседнику предложения из скрипта компании и на лету расшифровывает его ответы, преобразуя их в текст. Одна из важнейших задач здесь — это анализ содержания звонка. По ключевым словам можно понять, как именно человек реагирует на то, что слышит (в этом в том числе помогает поиск по базе знаний), и в зависимости от этого выстраивать дальнейшую коммуникацию — закончить разговор, воспроизвести следующее предложение заранее записанного текста и т. п.

Насколько эффективно это работает?

К удивлению, работает система довольно эффективно и позволяет серьезно экономить и повышать продуктивность холодных звонков. Приложение само может расставлять статусы по итогу бесед в CRM, что очень удобно, и одна программа за день может позвонить сотням клиентов. Затраты на колл-центр, который смог бы выполнить такой же объем работ, были бы очень существенными.

Есть ли какие-то сложности при создании такого рода приложений?

Да, конечно. В том подходе, что мы использовали, есть и свои сложности — например, воспроизвести записанную речь так, чтобы она звучала естественно, не так уж просто. К примеру, в ходе разговора между двумя людьми длительные паузы возникают редко, поэтому и робот должен реагировать на реплики собеседника быстро. При этом в реальной жизни человек, которому поступает звонок, может находиться в шумном месте — и роботу непросто в реальном времени понять, когда адресованная ему фраза закончилась и на нее нужно реагировать.

Точно так же некоторые слова могут звучать одинаково, но иметь разное значение и по-разному записываться (омофоны). Например, в английском языке слово bot и bought звучат одинаково, но обозначают совершенно разные понятия.

Как можно решить эти проблемы и повысить точность?

Машинное обучение, нейросети. У любого колл-центра есть база знаний, как правило довольно обширная: там и скрипты разговора, и их записи (их часто делают, например, для оценки качества работы операторов). Для начала можно создать нейронную сеть и обучить ее на этих данных — расшифрованных записях разговоров. В итоге получится полноценный виртуальный оператор для совершения холодных звонков.

В заключение можно ли дать какие-то советы тем, кто собирается создавать аналогичные системы автоматизации рутинных офисных задач?

В этом деле, пожалуй, самое главное — выбрать подходящие технологии и инструменты. Вряд ли у вас хватит ресурсов на то, чтобы всё делать с нуля самостоятельно, поэтому придется использовать готовые продукты и всевозможные API. И здесь важно, чтобы они имели нужную функциональность и хорошую документацию.

Например, мы в ходе проекта хотели использовать инструменты от Google и Microsoft, но выяснили, что один из них не поддерживает нужные нам языки, а документация второго оказалась настолько плохой, что некоторые моменты прояснялись только в ходе экспериментов. Если этого удастся избежать, вы сэкономите много времени и сил.

Интересные статьи по теме влияния автоматизации на рынок труда: