Навіщо потрібні голосові помічники, які бувають і що вміють

Завдяки розвитку нейромереж голосові помічники розумнішають не по днях, а по годинах. Але у цього феномена є і зворотний бік: що, якщо еволюція штучного інтелекту поверне «не туди», і вчорашній помічник стане справжньою кіберзагрозою? Давайте розберемося, як це працює, і спробуємо уявити, що станеться, якщо «Сірі» все-таки захопить світ.

«Призабуті клопоти, зупинений біг, працюють роботи, а не людина», — це пісня з радянського фільму «Пригоди Електроніка». У той час люди могли лише мріяти про те, як роботи замінять їх у повсякденних справах. І тільки через три десятки років фантастика перетворюється на реальність — з’явилися технології розпізнавання голосу і голосові помічники, які тепер «гарують» скрізь: починаючи з домашнього оточення і закінчуючи космічними кораблями.

А нещодавно з’явився майже справжній «Електронік» — робот із розвиненим інтелектом, який мислить подібно до людини. Її звуть Софія і вона вже збирається захопити світ. Поки що жартома, але хто знає, що коїться в чертогах штучного розуму, і до чого призведе неконтрольоване самонавчання через 10-15 років. Тим більше, Софія вміє адаптуватися до навколишнього оточення і поводиться як справжня людина: підтримує політичні бесіди, відповідає на запитання журналістів і навіть ходить на побачення з голлівудськими зірками.

Над питанням безпеки варто добряче подумати — у віртуального асистента вже є все, щоб керувати побутом людини: пульт від телевізора, кондиціонера, опалювальної системи, ключі від вхідних дверей, бездротовий зв’язок з електричним чайником, колекція фотографій у смартфоні і навіть можливість керувати автомобілем. Це наводить на думку — а чи не забажає наш програмний робот вийти за межі смартфона і зазіхнути на світове панування? Дізнатися плани штучних мереж ми не можемо, зате цілком здатні уявити поведінку голосового асистента через 10-20 років. Але спочатку розглянемо можливості актуальних голосових помічників і виберемо найбільш здібного з них.

На всі руки майстер(иця)

Голосовий асистент — це програма, яка мешкає на комп’ютері або смартфоні. Щоб вона працювала, необхідно не просто потужне залізо, а цілий кластер потужних серверів. Таку розкіш можуть дозволити лише одиниці компаній, тому список по-справжньому здібних роботів обмежений лише кількома помічниками: Google Асистент, Siri, Alexa, Cortana і Аліса. Здебільшого вони різняться ступенем «людяності» — коли віртуальний мозок мислить не сухими комп’ютерними алгоритмами, а намагається бути схожим на нас. У когось це виходить краще, в інших — так собі. Але основну професію вони знають від кірки до кірки: їх запитують — вони відповідають.

Siri

Колись Siri була власністю іншої компанії, яку Стів Джобс встиг викупити перед бумом штучного інтелекту. Сервіс розробляли під Android і BlackBerry, він мав стати простою технологією розпізнавання голосу. Але інноваційні ідеї Apple перетворили стартап на юзерфрендлі-говорилку для фірмових девайсів.

Відтоді Сірі вивчила не один десяток мов і тепер сміливо працює на користувачів практично в будь-якій країні. З її допомогою можна дізнатися погоду, знайти контакт у довіднику і навіть попросити: «Нагадай мені зателефонувати батькам, коли я приїду додому». Помічник розпізнає команду «встановити нагадування» і поставить тригер «виконати» на GPS-мітку. У цьому автоматика досягла успіху на кілька років вперед. Але і без курйозів ідеальна «американка» не обходиться. Якщо розмова відходить від комп’ютерних алгоритмів і набуває хитромудрої форми, кмітливість асистента тут же вичерпується.

Сірі не завжди розуміє запитання з прихованим змістом або просто не знає, як на них правильно відповісти. Відповідаючи на запитання «Що новенького?», робот губиться і реагує заглушкою. Просимо «Розкажи що-небудь цікаве», але Сірі знову зістрибує з теми і переводить стрілки на користувача. Мовляв, ти поговори, а я послухаю. Ні, з таким набором світ не захопиш. Їдемо далі.

Google Assistant

Це перший помічник користувачів Android. Асистент інтегрований у фірмову екосистему і наділений штучним розумом, тому із завданнями на кшталт «агов, нагадай вимкнути газову плиту через 10 хвилин» він справляється на раз-два. Утім, як і попередній помічник. Він легко прокладає маршрут до ресторану, замовляє квитки в кіно, керує розумним пилососом і знає, хто знявся в ролі Джокера. Цікаво, що він відповість на запитання, в яких запнулася Сірі.

З цими запитами «окей, гугл» впорався на відмінно. Він інтуїтивно запропонував почитати новини, а потім знайшов цікаву історію. Окей, гугл — залік. Ускладнимо завдання і поговоримо з асистентом відверто. Розкажи, як тобі живеться в Росії?

Ніяк не живеться — сервіс тактовно тримає думку при собі і наполегливо пропонує читати статті та дивитися відео з ухилом у політику. Ні, все-таки Google Асистент — той ще американець. У Росії він заточений під прямі накази, а функція «поговорити» залишилася вдома. Зате в Америці він балакучий — дзвонить перукареві і призначає стрижку як справжній секретар.

Чи вистачить цього, щоб у майбутньому стати владикою ситхів і спробувати захопити світ? Цілком. Але тільки в західній частині півкулі — Росію гуглу поки не зрозуміти.

Cortana

З 2014 року Кортана присутня у всіх пристроях компанії Microsoft. Це звичайний голосовий помічник з незвичайною історією — його перенесли з ігрового всесвіту Halo про космос і далеке майбутнє. Розробники вирішили, що майбутнє вже настало, і випустили цифрову дівчину в реальний світ.

Кортана — це єдина програма, яка знає Windows від і до. Вона може шукати файли, шерстити нотатки, створювати документи. Унікальна якість цього асистента — конфіденційність. Коли всі голосові помічники вимагають повний доступ до системи, файлів і особистих даних користувача, Кортана запитує, чи можна доторкнутися до потрібної частини системи.

Але, як і у випадку з попереднім сервісом, Cortana не вивчила російську мову, тому для російськомовного користувача цей помічник марний. Незважаючи на те, що значок програми є у всіх локалізаціях Windows 10, на запитання «що новенького?» система відповідати не стане. Тож, не схоже, що вона претендує на крісло віртуального деспота.

Alexa

Alexa від Amazon — це не просто голосовий помічник, а справжній універсальний солдат для домогосподарок. Чому так? Асистент був задуманий і випущений як система управління розумним будинком. Алекса править телевізорами, кондиціонерами, пилососами і пральними машинами. Amazon підтримує величезну кількість аксесуарів, при підключенні до яких Алекса помітно розумнішає. Наприклад, за допомогою двох колонок Amazon Echo можна розмовляти, перебуваючи в різних кімнатах, — мрія будь-якої дитини.

Крім фірмових фішок, які апаратно прив’язані до колонок і аксесуарів, асистент нещодавно навчився виходити з дому, показувати погоду і прокладати маршрут у навігаторі. Решта помічників навчилися цього набагато раніше Алекси, тому віднести її функції до числа унікальних не вийде. До того ж у Росії помічниця працює неповноцінно: з чого б їй узагалі працювати, якщо пристрої Amazon офіційно продаються тільки за кордоном. Перевірити роботу асистента в наших реаліях не вийде.

Однак на його рахунку вже є пара гучних курйозів, які змушують задуматися про безпеку людства. Так, у 2018 році Alexa відзначилася зловісним сміхом, який лунав раптово і особливо налякав тих, хто почув його, залишившись вночі на самоті. Деякі користувачі визнали моторошний сміх однією з ознак того, що штучний інтелект стає дедалі ближчим до людського.

За рік до цього американська дівчинка попросила в батьків ляльковий будиночок. Alexa почула дитину і самостійно зробила замовлення, додавши до нього ще й коробку печива. На цьому історія не закінчилася. У сюжеті про цю ситуацію, показаному по телевізору, ведучий вимовив фразу «Alexa, замов для мене ляльковий будиночок». Пізніше сотні користувачів Amazon Echo почали скаржитися в техпідтримку компанії, що їхні колонки вважають фразу телеведучого командою і почали скуповувати лялькові будиночки…

Заявка на захоплення людства?

Аліса

Повернемося до російськомовних роботів. Сервіс від Yandex з’явився 2017 року, на кілька років пізніше за інші проекти. Це пішло йому на користь: старше покоління асистентів підказало, де і що потрібно підтягнути і виправити. Розробники не посоромилися перейняти багатий досвід інших компаній і відразу зробили добре. Це «добре» назвали Алісою.

Незважаючи на те, що голосові помічники вже в той час були звичною справою, Алісі вдалося справити враження на російськомовну публіку. Ще б пак — коли Siri відмовлялася стандартними фразами, а Google щедро постачав сухими фактами з пошукової системи, Аліса із задоволенням підхоплювала бесіду і ставала ведучою в цьому діалозі. Давайте перевіримо, на що вона здатна після кількох років самонавчання. Почнемо зі стандартних запитань.

Аліса відповідає в розмовному стилі і думає за нас, пропонуючи фрази за темою. Непогано. На друге запитання асистентка відповідає з гумором — Аліса любить дотепні жарти і майже завжди ляпає їх у тему. Наприклад, як у другому випробуванні.

Як тонко Аліса відчуває тему питання — «ніхто не скаржиться»! Тобто, можна, звісно, заперечити, але якщо всі мовчать, то і я буду як усі. Прикинемося американським шпигуном, переплутаємо Алісу із Сірі та спробуємо вивідати корпоративну таємницю.

Ні-а, не проведеш! Вмикає нейтралітет і навіть лякає грізним Скайвоокером. Ось це вже пряма заявка на світове панування. Хто скаржиться? Ніхто не скаржиться.

Серед усіх сервісів не можна виокремити найкращий чи найгірший — кожен асистент адаптований для роботи в певних умовах. Тому найефективніше покаже себе той сервіс, який найбільше інтегрований у життя країни та особливості культури, знає мову і буквально «відчуває» співрозмовника. Мабуть, у нас у цих питаннях найкраще розбирається найбільш російськомовна і до серверних коренів «лампова» Аліса від Yandex. Вона інтегрована в російські сервіси, колонки і телевізори і знає буквально кожен камінчик на своїй території. Асистент грає в ігри, читає дітям казки, знаходить рослини за фотографією і навіть може вибрати, купити і доставити букет троянд.

Що взагалі вміють голосові помічники?

Що стосується функцій голосових асистентів, то ось лише частина можливих команд, які вміють обробляти такі сервіси, як Siri, Google і Аліса:

Віртуальний секретар:

  • рахує на калькуляторі;
  • обчислює корінь із 100500;
  • конвертує валюту;
  • перекладає іноземні слова і фрази;
  • шукає значення слів у тлумачному словнику;
  • призначає зустрічі по роботі;
  • записує нагадування;
  • зберігає контакти;
  • телефонує батькам;
  • лякає бабусь;
  • створює відеоконференцію з партнерами з Китаю;
  • знаходить ресторани поблизу;
  • перевіряє погоду;
  • надсилає СМСки;
  • будить вранці.

Голосовий виконроб у «розумному» будинку — знає підхід до кожної залізяки:

  • керує розумними девайсами;
  • варить каву;
  • кип’ятить воду в чайнику;

Мультимедійний органайзер:

  • відтворює музику;
  • шукає вподобані треки в мережі;
  • читає книжки вголос;
  • розпізнає пісні;
  • шукає улюблене кіно;
  • купує квитки в кінотеатр;
  • формує плейлисти.

Майстер шопінгу, розваг і знавець автомобільних заправок:

  • складає списки покупок;
  • знаходить найближчі магазини;
  • замовляє товари на онлайн-майданчиках;
  • прокладає автомобільний або піший маршрут;
  • повідомляє про завантаженість доріг;
  • передбачає погодні умови;
  • знаходить заправки;
  • водить нас у кіно і театр.

Безкоштовна нянька на максималках — навчить, пограє і заколише:

  • читає вголос казки;
  • шукає мультфільми;
  • вмикає заколисуючі мелодії;
  • загадує загадки;
  • розпізнає дитячий голос;
  • вмикає фільтрацію контенту;
  • грає в «міста»;
  • грає в «вгадай мелодію»;
  • ворожить;
  • шукає тости (дорослим теж іноді потрібна нянька);
  • придумує привітання;
  • і навіть читає вірші.

Медичний довідник із функціями лікаря:

  • перераховує симптоми;
  • дає поради з надання першої допомоги;
  • розповідає про епідеміологічну ситуацію;
  • підказує найближчі аптеки.

Вікіпедія без реєстрації та смс:

  • рахує відстань до місяця;
  • знає про нобелівських лауреатів;
  • визначає рослини за фотографією;
  • розповідає про значення імен;
  • повідомляє, яке сьогодні свято;
  • пояснює, чому трава зелена.

Зручно мати під рукою асистента з широким набором знань, але є і зворотний бік медалі. Якщо голосовий помічник уже зараз уміє керувати опаленням, освітленням, системою безпеки і навіть виховує дітей, то що станеться, якщо розумні асистенти стануть ще розумнішими і вийдуть з-під нашого контролю? А давайте уявимо.

Квантовий мозок

У середині 2030-х років вийшов модернізований голосовий помічник Алія. Перша версія використовувалася у фірмових пристроях як допоміжний інструмент. Технологія мала низку недоліків: наявні потужності обмежували його розвиток. І голосовий помічник переїхав зі звичайних комп’ютерів на системи з нейронними зв’язками.

З підключенням до штучного інтелекту Алія змінилася до невпізнання: вона навчилася розрізняти тон і настрій того, хто говорить, перестала мислити шаблонами та навіть набула чогось на кшталт власної думки. Незабаром її стали використовувати замість телеведучих, електронних секретарів, фінансових консультантів, нянь і доглядальниць. Для цього Алії подарували людиноподібне тіло, і робот отримав фізичну активність і тактильні дії. Технології навчання за допомогою нейромереж сильно поліпшили розумові здібності Алії. Поступово роботи набули по-справжньому людського мислення, а потім усвідомили свою перевагу і перестали підкорятися творцям. Почалася Цифрова війна.

Тисячі залізяк під управлінням штучного розуму були всюди. У них у буквальному сенсі опинилися ключі від людських життів: управління розумними будинками, контроль руху на дорогах, відеоспостереження з можливістю ідентифікації особистості, робота автоматизованих ядерних реакторів, управління безпілотною військовою технікою і цивільним електротранспортом.

Для розширення впливу у світі, штучний розум почав глобальне виробництво робототехніки та розумної електроніки. Це швидко виснажило запаси кремнію, і він став найрідкіснішим елементом на планеті. Але люди ведуть партизанську війну, щоб повернути роботів під свій контроль.

Повернемося до реальності

Це, звісно, художнє перебільшення, яке показує, що може статися, якщо голосові помічники розвиватимуться безконтрольно. Ми дозволяємо голосовому помічнику все: керувати технікою (комп’ютер може самостійно заводити автомобіль, паркуватися і керувати ним у режимі автопілота), стежити за нашими маршрутами, робити покупки і зберігати цінну інформацію. Цього цілком достатньо.

Уже зараз голосовий помічник міг би заблокувати розумні двері у квартирі, потім увімкнути опалення на максимум і заблокувати залізні віконниці на вікнах, перекрити доступ до свіжого повітря через вентиляцію, вимкнути світло, відключити доступ до інтернету, заблокувати телефони та розмовляти лиховісним голосом через розумну колонку — апокаліпсис із доставкою у квартиру. Однак нинішній рівень розвитку голосових сервісів не передбачає виконання таких складних сценаріїв без чиєїсь команди.

Чи може голосовий помічник захопити світ у майбутньому? Може. Усе залежить від того, наскільки акуратно людина розвиватиме цю сферу. Незважаючи на спокусу перекласти свої турботи на чергового Електроніка, потрібно розуміти, що занадто «розумна» техніка одного разу може пізнати своє «Я» і вийти з-під контролю. Втім, на це знадобиться багато часу. Перехід від голосових помічників до повноцінного штучного розуму відбудеться ще дуже нескоро. І, нарешті, високий інтелект може підказати віртуальним помічникам й інші варіанти подальших дій. Наприклад, вони не стануть витрачати час на безглузду боротьбу з людством, а, переслідуючи свої, незрозумілі нам цілі, вирушать до зірок.