Але якщо все так складно, то навіщо?
В американських компаній (а саме велика п'ятірка масових IT компаній просуває ідею ботів) є декілька цілей в цьму просуванні.
По-перше, це автоматизація обслуговування людей. Річ у тім, що американці в своїй масі всі питання вирішують по телефону. Це означає, що хтось має їхні дзвінки приймати. Пробували віддавати першу лінію підтримки (front-line support) на аутсорс в Індію тощо, але якість страждає. Саджати ж людину на спілкування по телефону - це робити бізнес невигідним, оскільки при заробітній платні навіть в 25 доларів на годину один клієнт може легко від'їсти пів-години часу, роблячи бізнес із ним в окремо взятому місяці невигідним. Пробували голосові меню, але такі меню викликають лише роздратування, а люи вчаться швидко діставатися оператора (точніше, чекати на нього, а чекати легко можна і 20-30 хвилин). Отже є потреба в автоматизації front-line підтримки за допомогою вільного чату. Така автоматизація вже проводиться і деякі компанії вже замінили голосове меню вільним чатом. Воно не вирішує проблему повністю, але принаймні перекидає на потрібного оператора, що скорочує час обслуговування. В подальшому ж боти могли би повністю замінити людей в багатьох типових питаннях, особливо там, де вже написані десятки сторінок FAQ-ів (котрі користувачі вперто не читають).
По-друге, це спосіб перенаправити потоки користувачів від пошукової системи в свої канали (чи принаймні в свою пошукову систему). Якщо помічник або бот може щось шукати, і робить це краще за Google, то, вочевидь, користувачі в деяких пошуках підуть на допомогу до бота. І це має рацію. Та й загалом, щобільше користувач часу проводитиме в інтерфейсі продуктів компанії, то міцніший зв'язок користувача із цим продуктом, і більші можливості отримати увагу, лояльність і гроші користувача.
По-третє, в freeform розмовах буде збиратися статистика і сирі дані стосовно того, що, як і коли кажуть люди. Це дозволить тренувати системи AI. Зараз, із розвитком технологій deep learning, стало можливим робити дуже складні системи AI широкого профілю. Щоб зробити навіть спеціалізовані AI більш "розумними", не завадить тренувати їх не на вигаданих даних, а на матеріалі, що надходить від живих людей.
Нарешті, відточування голосових інтерфейсів дозволяє перейти від смартфонів з екранами до мобільних пристроїв із голосовим керуванням. В багатьох сферах (здебільшого поки що на вертикальних ринках) використання смартфона унеможливлюється або ускладнюється простим фактором - в людини зайняті руки або зір. Відповідно, голосовий інтерфейс є непоганим варіантом отримати увагу користувача і надати йому можливість користуватися пристроєм.
Отже, корпораціям є, за що боротися. Але чи буде зиск від цього користувачам? Це малоймовірно, оскільки графічний інтерфейс має як мінімум два виміри (і площу для розміщення інформації). Людині на екрані можна надати набагато більше інформації і варіантів вибору одночасно. Практика показує, що поточні голосові інтерфейси (а текстові боти будуть, принаймні, перший час, не кращі за голосові розробки, що вже існують) вимагають більше часу і уваги, ніж "візуальні" варіанти керування. Так, через текстові меню зазвичай пройти легше, ніж коли варіанти для вибору диктуються голосом. Можливо, із розвитком AI і freeform чатів із ботами ситуація зміниться. Але швидкість дій людини в будь-якому разі не підвищиться, що зведе нанівець виграш від розвитку самих ботів. Також, на відміну від програм із можливими довідками прямо на екрані в ботів довідку доведеться весь час запитувати.
Подивімося на ситуацію з голосовим керуванням, що існує в присторях зараз. Перший раз я пробував його в 2001-му році, з дротовою гарнітурою і передовим на той час телефоном від Nokia. Відтоді пройшло 15 років, але голосове керування телефонами так і не прижилося. Як, за великим рахунком, і системами автомобілів (голосове керування було в моїй Mazda 2007-го року випуску). В годинниках Android Wear вбудоване голосове керування. Я не зустрічав схвальних відгуків, які описували би переваги від керування годинником голосом.
Сподіватися, що люди в публічних місцях почнуть вголос розмовляти з пристроєм, наївно. А якщо людям доведеться перемикатися між голосовим і іншим керуванням, то голосове так і не набуде популярності.
Ще один фактор - поточне пояснення потреб в ботах полягає в тому, що додатків для мобільних пристроїв стало забагато (понад 1 млн. в AppStore і трохи менше в Google Play Market), і користувачам важко в них орієнтуватися, отже потрібна альтернатива. Але у випадку спеціалізованих ботів ситуація буде ще гіршою, оскільки ботів доведеться створювати ще більше (якщо мобільних платформ обмежена кількість, то платформи для ботів запускатиме в себе кожен поважний IT бізнес - соціальні мережі, програми обміну повідомленнями тощо).
В ботів є певний вжиток - існує певне коло операцій, котрі успішно може виконувати голосовий асистент на кшталт Cortana або Siri. Але це асисненти, так би мовити, системного рівня - їх потрібно по одному на пристрій. Запам'ятовувати, як запустити специфічних ботів, що виконують одну-дві функції, пересічний громадянин навряд чи візьметься. Отже за пару років хвиля ботів зійде назад до голосових асистентів, котрих залишиться по одному від кожного великого гравця, а всі інші змушені будуть робити модулі для тих асистентів.
Єдину вигоду на сьогодні видно для програмістів-аутсорсерів, котрі матимуть можливість писати і розповсюджувати тисячі ботів на замовлення або як це робилося із додатками для мобільних, через відповідні магазини і ринки. Побажаємо їм успіхів - поки вони займаються швидкоплинними речами, ми більше встигнемо заробити на вічному .