NY Times: Как голосовые помощники Siri, Alexa и Google Assistant проиграли в гонке ИИ

Издание New York Times рассказывает историю взлета голосовых помощников Siri, Alexa и Google Assistant… и как они проиграли эту гонку ИИ новым чат-ботам. Но возможно, это именно та эволюция, которая им нужна.

В дождливый вторник в Сан-Франциско руководители компании Apple вышли на сцену в переполненном зале, чтобы представить iPhone пятого поколения. Телефон, который выглядел идентично предыдущей версии, имел новую функцию, о которой вскоре заговорила вся аудитория: виртуальный помощник Siri.

Скотт Форстолл, тогдашний руководитель отдела разработки программного обеспечения Apple, нажал на кнопку iPhone, чтобы вызвать Siri, и стал задавать ей вопросы. По его просьбе Siri проверила время в Париже («20:16», — ответила Siri), дала определение слову «митоз» («Деление клетки, при котором ядро делится на ядра, содержащие одинаковое количество хромосом», — сказала она) и вывела список из 14 греческих ресторанов с высоким рейтингом, пять из которых находились в Пало-Альто.

«Я давно работаю в сфере ИИ, и это все еще поражает меня», — сказал тогда Форстолл.

Это было 12 лет назад. С тех пор Siri и конкурирующие помощники с искусственным интеллектом, такие как Amazon Alexa и Google Assistant, уже далеко не поражают воображение людей. Технология в значительной степени осталась без изменений, а говорящие помощники стали предметом шуток.

Сейчас мир технологий восхищается другим видом виртуальных помощников — чат-ботами. Эти боты с поддержкой искусственного интеллекта, такие как ChatGPT и новый ChatGPT Plus от компании OpenAI, могут быстро давать ответы на вопросы, набранные в чате. Люди уже используют ChatGPT для решения таких сложных задач, как написание кода, составление коммерческих предложений и даже придумывание художественной литературы.

И ChatGPT быстро совершенствуется. Несколько месяцев назад он не мог написать правильное хайку; теперь он делает это с энтузиазмом. Во вторник OpenAI представила свой движок ИИ нового поколения GPT-4.

Ажиотаж вокруг чат-ботов иллюстрирует, как Siri, Alexa и другие голосовые помощники, которые когда-то вызывали такой же энтузиазм, растратили свое преимущество в гонке ИИ.

За последнее десятилетие эти продукты столкнулись с серьезными трудностями. Siri так и не смогла толком побороть основное технологическое препятствие — неуклюжий код, который требовал недель для обновления базовых функций, говорит Джон Бурки, бывший инженер Apple, работавший над помощником. Amazon и Google неправильно рассчитали, как будут использоваться голосовые помощники, что привело к тому, что они стали вкладывать деньги в те области, где технология редко окупалась, говорят бывшие сотрудники. По их словам, когда эти эксперименты провалились, энтузиазм в отношении технологии в компаниях угас.

Голосовые помощники «тупы как камень», — сказал Сатья Наделла, генеральный директор Microsoft, в интервью Financial Times в этом месяце, заявив, что более новые ИИ будут определять путь. Microsoft тесно сотрудничает с OpenAI, инвестировав 13 миллиардов долларов в стартап и внедрив его технологии в поисковую систему Bing, а также в другие продукты.

Apple отказалась от комментариев по поводу Siri. Google заявила, что она стремится создать отличного виртуального помощника, который будет помогать людям на их телефонах, в домах и автомобилях; компания отдельно тестирует чат-бота под названием Bard. Amazon заявила, что за последний год число пользователей Alexa по всему миру увеличилось на 30 процентов, и что она с оптимизмом смотрит на свою миссию по созданию ИИ мирового класса.

Помощники и чат-боты основаны на различных видах ИИ. Чат-боты работают на основе так называемых больших языковых моделей, которые представляют собой системы, обученные распознавать и генерировать текст на основе огромных наборов данных, взятых из Интернета. Затем они могут предложить слова для завершения предложения.

В отличие от них, Siri, Alexa и Google Assistant — это, по сути, так называемые системы команд и управления. Они могут понимать ограниченный список вопросов и запросов, таких как «Какая погода в Нью-Йорке?» или «Включи свет в спальне». Если пользователь просит виртуального помощника сделать что-то, чего нет в его коде, тот просто скажет, что не может помочь.

Siri также имела громоздкую конструкцию, из-за которой добавление новых функций занимало много времени, говорит Бурки, которому в 2014 году поручили работу по улучшению Siri. База данных Siri содержит гигантский список слов, включая имена музыкальных исполнителей и названия мест, таких как рестораны, на почти двух десятках языков.

Это превратило ее в «один большой снежный ком», — рассказывает он. Если кто-то хочет добавить слово в базу данных Siri, добавил он, «оно попадает в одну большую кучу».

Поэтому, казалось бы, простые обновления, такие как добавление нескольких новых фраз в набор данных, потребуют перестройки всей базы данных, что может занять до шести недель. Добавление более сложных функций, таких как новые инструменты поиска, может занять почти год. По словам Бурки, это означает, что у Siri нет пути к тому, чтобы стать творческим помощником, как ChatGPT.

По словам бывших руководителей Amazon и Google, их решения основаны на технологии, аналогичной Siri, но компаниям с трудом удалось получить значительный доход от этих помощников. (В отличие от них, Apple успешно использовала Siri для привлечения покупателей к своим iPhone).

После того как в 2014 году Amazon выпустила умную колонку Echo, работающую на базе Alexa, компания надеялась, что этот продукт поможет ей увеличить продажи в ее интернет-магазине за счет того, что покупатели смогут разговаривать с Alexa для оформления заказов. Но хотя люди с удовольствием играли с возможностями Alexa отвечать на подсказки о погоде и устанавливать будильники, мало кто просил Alexa заказывать товары, добавил один из бывших руководителей направления Amazon.

Возможно, Amazon слишком много инвестировала в производство новых видов оборудования, таких как снятые сейчас с производства будильники и микроволновые печи, работающие с Alexa, которые продавались по себестоимости или ниже, добавляет он.

Компания также недоинвестировала в создание экосистемы, позволяющей людям легко расширять возможности Alexa, подобно тому, как это сделала Apple со своим магазином App Store. Хотя Amazon предлагал магазин «навыков», чтобы заставить Alexa управлять сторонними аксессуарами, такими как выключатели, людям было трудно найти и настроить навыки для колонок — в отличие от легкого опыта загрузки мобильных приложений из магазинов приложений.

В конце прошлого года подразделение Amazon, работающее над Alexa, стало основным объектом сокращения 18 тысяч сотрудников, и ряд топ-менеджеров Alexa покинули компанию.

Кинли Пирсолл, представитель Amazon, заявила, что Alexa — это нечто большее, чем голосовой помощник, и «мы как никогда оптимистичны в отношении этой миссии».

Осечки Amazon с Alexa могли сбить Google с пути, сказал бывший менеджер, работавший над Google Assistant. Инженеры поисковика потратили годы на эксперименты со своим помощником, чтобы подражать тому, что может делать Alexa, включая разработку умных колонок и планшетных экранов с голосовым управлением для управления домашними аксессуарами, такими как термостаты и выключатели света. Позже компания интегрировала рекламу в эти домашние продукты, но денег это так и не принесло.

Со временем Google поняла, что большинство людей используют голосового помощника только для ограниченного числа простых задач, таких как запуск таймеров и воспроизведение музыки, сказал бывший менеджер. В 2020 году, когда Прабхакар Рагхаван, один из руководителей Google, возглавил Google Assistant, его группа переориентировала виртуального помощника в качестве ключевой функции для смартфонов Android.

В январе, когда материнская компания Google сократила 12 тысяч сотрудников, команда, работающая над операционными системами для домашних устройств, потеряла 16 процентов своих инженеров.

Многие крупные технологические компании сейчас в спешке пытаются придумать ответ на ChatGPT. В прошлом месяце в штаб-квартире Apple прошел ежегодный саммит ИИ — внутреннее мероприятие для сотрудников, на котором они узнали о своей большой языковой модели и других инструментах ИИ, сообщили два человека, которые были проинформированы о программе. Многие инженеры, включая членов команды разработчиков Siri, тестировали концепции генерирования языка каждую неделю, сказали люди.

Во вторник Google также заявила, что вскоре выпустит инструменты генеративного ИИ, которые помогут предприятиям, правительствам и разработчикам программного обеспечения создавать приложения со встроенными чат-ботами и внедрять базовые технологии в свои системы.

В будущем технологии чат-ботов и голосовых помощников объединятся, говорят эксперты в области ИИ. Это означает, что люди смогут управлять чат-ботами с помощью речи, а пользователи продуктов Apple, Amazon и Google смогут просить виртуальных помощников помочь им в работе, а не только в проверке погоды.

«Раньше эти продукты не работали, потому что у нас не было возможности вести диалог на уровне человека», — говорит Аравинд Шринивас, основатель Perplexity, компании, занимающейся разработкой А.И., которая предлагает поисковую систему на базе чатботов. «Теперь у нас есть».

Добавить комментарий