Джон Грубер: «Apple Intelligence — это не отдельная модель ИИ, но целый зонтик из них»

Джон Грубер весьма толково рассказывает про предполагаемую механику работы искусственных интеллектов Apple. По его словам, за Apple Intelligence и вообще ИИ-функциях Apple стоит много моделей разного калибра, которые и призваны обеспечить связанность и масштабируемость. Получилось многословно, но интересно.

Часто рассказывают, что в 2009 году — через два года после дебюта Dropbox и за два года до того, как Apple представила iCloud — Стив Джобс позвал соучредителей сервиса Дрю Хьюстона и Араша Фердоуси в Купертино, чтобы попытаться убедить их продать компанию Apple. Джобс сказал им, что Dropbox — это «функция, а не продукт».

Сегодня легко забыть, насколько революционным продуктом был Dropbox. Простая установка на Мак и бум — у вас есть папка, которая синхронизируется между всеми используемыми вами устройствами — автоматически, надежно и быстро. В то время в штаб-квартире Dropbox висела большая вывеска «It Just Works» и они соответствовали этому идеалу — в то время, когда ни один другой сервис синхронизации не мог этого сделать.

В преддверии WWDC на прошлой неделе я думал о том, что это же описание в полной мере относится и к генеративному ИИ LLM. Фантастически полезный, временами просто потрясающий, но это функции. Не продукты. Или, по крайней мере, не универсальные продукты. Чатботы — это, конечно, продукты. Люди платят за доступ к лучшим из них или за их длительное использование. Но люди платят и за Dropbox.

Чатботы могут быть полезными. Есть люди, которые делают с их помощью потрясающую работу. Но они сродни терминалу и инструментам командной строки.

На прошлой неделе Apple представила не столько новые продукты, сколько новые функции — и весьма много — для существующих продуктов, созданные на основе генеративного ИИ.

Safari? Теперь лучше с генеративными резюме страниц на основе ИИ. Сообщения? Еще веселее с генмодзи. Заметки, Почта и Pages (а также любые другие приложения, использующие системные текстовые фреймворки)? Теперь лучше, благодаря встроенным инструментам корректуры и переписывания. Фотографии? Еще лучшие рекомендации для воспоминаний и автоматическая классификация фотографий в «умные» коллекции. Siri? Эта разочаровывающая, тупая, как скала, сукина дочь, Siri? Возможно, теперь она довольно полезная и умная. Это не новые приложения или новые продукты. Это самые используемые, самые важные приложения, которые делает Apple. Основные приложения, определяющие экосистему. Apple использует генеративный ИИ, чтобы сделать их лучше и полезнее — ни в коем случае не делая их незнакомыми.

Перед началом WWDC у нас было много вопросов о стратегии Apple в области генеративного ИИ. Теперь, когда мы получили ответы, все выглядит очень очевидно и в основном просто. Во-первых, их модели почти полностью основаны на персональном контексте, посредством семантического индекса устройства. В общих чертах, этот семантический индекс на устройстве можно представить как Spotlight нового поколения. Apple фокусируется на том, что она может сделать такого, чего не может никто другой на устройствах Apple, и даже не пытается конкурировать с ChatGPT и др. в области всемирного контекста знаний. Они сосредоточены на уникальной дифференциации и избегают коммодитизации.

Во-вторых, они выполняют как обработку на устройстве для небольших/простых задач, так и облачную обработку (под названием Private Cloud Compute) для более сложных задач. Все это полностью дело рук Apple: модели, серверы (на основе чипов Apple), весь стек программного обеспечения, работающий на серверах, и центры обработки данных, в которых расположены серверы. Это огромный объем работы, и он не очень бьется с сообщениями о том, что руководители Apple заинтересовались генеративным ИИ всего 18 месяцев назад. И если они добились всего этого всего за 18 месяцев, то это выдающееся достижение.

Сделать чатбота может каждый. Apple, что примечательно, не сделала ни одного.

Вместо этого Apple делает то, что не может сделать никто другой: интегрирует генеративный ИИ во фреймворки iOS и macOS, используемые разработчиками для создания нативных приложений. Приложения, созданные на основе системных API и фреймворков, получат функции генеративного ИИ бесплатно, как в том смысле, что они будут работать автоматически, когда приложение будет запущено на устройстве, соответствующем минимальным характеристикам для использования Apple Intelligence, так и в том, что Apple не будет взимать плату с разработчиков или пользователей за использование этих функций.

Что я вижу в качестве основных выводов:

— Apple продолжает развивать функции машинного обучения и генеративного ИИ на своих основных платформах iOS и macOS. Они добавляли такие функции в течение многих лет и анонсировали много новых в этом году. Ничто из того, что Apple анонсировала за весь первый час выступления, не было частью «Apple Intelligence». Math Notes появится на всех устройствах под управлением iOS 18 и MacOS 15 Sequoia. Smart Script — новая функция персонализированного почерка при использовании Apple Pencil, которая призвана улучшить разборчивость вашего почерка при письме, а также имитирует ваш почерк при вставке текста или создании ответов в Math Notes — появится на всех iPad с чипом A14 или лучше. Категоризация входящих сообщений и «умные» сводки сообщений появятся в Apple Mail на всех устройствах. Резюме веб-страниц в Safari появится на всех устройствах. Улучшенная обрезка фона для видеоконференций. Ни одна из этих функций не входит в зонтик Apple Intelligence. Они предназначены для всех, чьи устройства получат релиз ОС в этом году…

— Один из вопросов, который мне неоднократно задавали: почему устройства, не соответствующие требованиям Apple Intelligence, не могут просто делать все через Private Cloud Compute? Все понимают, что если устройство недостаточно быстрое или мощное для обработки данных на нем, то так оно и есть. Но почему старые iPhone (или, в случае с непрофессиональными iPhone 15, новые iPhone с чипами двухлетней давности) не могут просто использовать Private Cloud Compute для всего? Насколько я понял, Apple Intelligence просто не так устроена. Модели, работающие на устройстве — это совершенно другие модели, чем те, что работают в облаке, и одна из этих моделей на устройстве — эвристика, определяющая, какие задачи могут выполняться с помощью обработки на устройстве, а какие требуют Private Cloud Compute или ChatGPT. Но наверняка у Apple тоже есть проблемы с масштабированием. При нынешнем положении дел, когда в устройствах используются только чипы серии M или A17 и более поздних версий, Apple будет вынуждена выполнять огромное количество вычислений на стороне сервера с помощью Private Cloud Compute. Они будут в разы больше, если включат Apple Intelligence для старых iPhone, при этом старые iPhone не будут выполнять никаких вычислений на устройстве. Компонент Apple Intelligence, связанный с обработкой данных на устройстве — это не просто приятная мелочь, это краеугольный камень всей затеи.

— Я по-прежнему скептически отношусь к тому, что интеграция ChatGPT на уровне ОС принесет пользователям какие-либо значительные практические преимущества по сравнению с использованием приложений для чатботов от производителей этих LLM. Но, возможно, если убрать несколько шагов и избавиться от необходимости выбирать, загружать и регистрироваться в сторонних чатботах, такие функции станут доступны гораздо большему числу пользователей. Но я не могу отделаться от ощущения, что интеграция этих сторонних чат-ботов в ОС — это как минимум в равной степени игра на доходы от услуг, чем игра на пользовательский опыт.

— Самым неосвещенным аспектом Apple Intelligence является то, что дата-центры, которые Apple строит для Private Cloud Compute, не только не загрязняют окружающую среду, но и полностью работают на возобновляемых источниках энергии. Это необычно и, как мне кажется, уникально для всей отрасли. Но это осталось практически незамеченным, потому что сама Apple не упомянула об этом во время выступления на WWDC. Крейг Федериги впервые сказал об этом в интервью Джастину Эзарику после презентации. Оглядываясь назад, я жалею, что не спросил на сцене, почему Apple даже не упомянула об этом во время ключевой презентации, не говоря уже о том, чтобы трубить об этом. Подозреваю, что истинный ответ заключается в том, что Apple посчитала невозможным хвастаться своими собственными дата-центрами, работающими полностью на возобновляемой энергии, во время того же мероприятия, на котором они объявили о партнерстве с OpenAI, чьи дата-центры не могут делать подобных заявлений. Углеродный след OpenAI держится в секрете, и эксперты подозревают, что он плох. Неприлично бросать своего партнера под автобус…

— Если вы не хотите или не доверяете Apple Intelligence, вы сможете отключить ее. А для использования интегрированной функции ChatGPT вам придется согласиться и каждый раз, когда Apple Intelligence решит отправить вас в ChatGPT для решения какой-либо задачи, вы должны будете явно разрешить это. В нынешнем виде никто не собирается случайно взаимодействовать с ChatGPT, не говоря уже о передаче ему личной информации. Я подозреваю, что чаще всего жалобы будут поступать от людей, которые хотят использовать ChatGPT без подтверждения каждый раз. Некоторые люди захотят иметь опцию «Всегда разрешать» для передачи запросов в ChatGPT, но, по словам представителей Apple, с которыми я общался, такой опции пока не существует.

— На техническом уровне Apple использует непрямые связи для анонимизации устройств от ChatGPT. OpenAI никогда не увидит ваш IP-адрес или точное местоположение. На уровне политики OpenAI согласился не хранить данные пользователей и не использовать их в целях обучения, если пользователи не вошли в аккаунт ChatGPT. Если вы хотите использовать Apple Intelligence, но не ChatGPT, вы можете это сделать. Если вы хотите использовать ChatGPT анонимно, вы можете это сделать. А если вы хотите, чтобы ChatGPT сохранял историю ваших взаимодействий, вы можете сделать это, войдя в свою учетную запись. Пользователи полностью контролируют ситуацию, как и должно быть.

Apple Intelligence — это не одна вещь и не одна модель. Или даже две модели — локальная и облачная. Это зонтик для десятков моделей, некоторые из которых очень специфичны. Одна из лучших — новая модель, которая позволит Siri отвечать на вопросы технической поддержки о продуктах и сервисах Apple. Эта модель была подготовлена на основе обширной базы знаний Apple, содержащей документацию по технической поддержке. Извечное недовольство заключается в том, что «никто не читает документацию», но, возможно, теперь это больше не проблема, потому что Siri читает ее. Платформы Apple настолько богаты и глубоки, но большинство пользователей знают о них очень мало; получение правильных ответов от Siri на конкретные вопросы о том, как это сделать, может стать переломным моментом в игре. Сгенерированный искусственным интеллектом мусор загрязняет результаты поиска технической помощи в Интернете; Apple использует целевой искусственный интеллект, обученный на собственной документации, чтобы избежать необходимости искать информацию в Интернете в первую очередь. Техническую документацию нельзя назвать сексуальной, но раскрытие ее содержания с помощью запросов на естественном языке может стать одним из хитов анонсов этого года.

Fixed.One: новости мира Apple и не только…, [28.06.2024 13:00]
И наконец надо сказать, что нам пока не удалось опробовать ни одну из этих функций Apple Intelligence. Ни одна из них пока не доступна в бета-версиях ОС для разработчиков, и ни одна из них не будет доступна даже в бета-версии до «конца этого лета». На прошлой неделе я был свидетелем нескольких демонстраций некоторых из этих функций вживую во время брифингов для прессы в Apple Park. Среди демонстраций были инструменты для написания писем («сделайте это письмо более профессиональным»), завершение кода в Xcode и Swift Assist. Но эти демонстрации проводили сотрудники Apple; мы, представители СМИ, не смогли попробовать их сами.

Все это выглядит очень впечатляюще, и почти все эти функции кажутся очень практичными. Но все это очень, очень рано. Все это не считается реальностью, пока мы не сможем использовать это сами. Мы не знаем, насколько хорошо это работает. Мы не знаем, насколько хорошо он масштабируется.

Тем не менее, приятно видеть, как Apple старается. Я по-прежнему считаю, что неверно считать Apple «отстающей» в области генеративного ИИ. Но очевидно, что они чувствуют огромное конкурентное давление на этом фронте, что хорошо для них и хорошо для нас.

Больше на Новости Fixed.one

Оформите подписку, чтобы продолжить чтение и получить доступ к полному архиву.

Continue reading