Эй, Сири, неужели Apple упускает еще одну возможность для ИИ?

Издание Macworld смотрит на последние новости из мира искусственного интеллекта и задается резонным вопросом: а где тут Apple? И вот пока ответа на этот вопрос нет.

О ChatGPT в последнее время говорит весь мир технологий, и не без оснований. Инструмент, работающий на основе искусственного интеллекта, насколько впечатляет, настолько и рождает множество поводов для беспокойства — нарушение авторских прав, плагиат, использование в учебном процессе, даже потеря работы у ряда людей — поэтому неудивительно, что люди, зарабатывающие на жизнь написанием текстов, переживают по поводу искусственного интеллекта, который, как вдруг оказалось, может писать хорошо. Но есть и технологические компании с горящими глазами, которые видят будущее — способность компьютеров вести естественную беседу и создавать контент, который компании действительно могут использовать, в масштабах, скорости и стоимости, с которыми люди не могут сравниться.

Но ChatGPT, Google Bard и чат Bing от Microsoft — это лишь небольшая часть революции генеративного ИИ. Мир искусства уже который год шумит о новых инструментах генеративного искусственного интеллекта и волнуется по поводу тех же проблем — предвзятости, авторских прав, потери рабочих мест и т.д. Дипфейки, где нейронные сети меняют местами людей в видео с потрясающим реализмом, были лишь верхушкой айсберга.

Эти инструменты — не просто вспышка на Солнце. Они находятся в зачаточном состоянии и очень быстро становятся лучше. Крупные технологические компании, такие как Google и Microsoft, рассматривают этот новый генеративный ИИ как важную часть нашего будущего. Заявить о себе и занять лидирующие позиции для них так же важно, как в 90-е годы доминировать в Интернете.

Но есть один игрок, который не участвует в игре: Apple. Самая дорогая технологическая компания на Земле, похоже, полностью упускает возможность совершить революцию в компьютерных технологиях. Apple не чужда искусственному интеллекту — она спровоцировала революцию голосовых помощников с помощью своей Siri, но она уже растратила свое преимущество, не вкладывая достаточно средств, чтобы отбиться от конкурентов.

Повторяется ли история с генеративным ИИ? Или у Apple есть что-то потрясающее в рукаве и она просто невероятно скрытна, как всегда?

Анализирующий ИИ — старое, создающий ИИ — новое

Все крупнейшие технологические компании уже много лет твердят об искусственном интеллекте. ИИ, который выделяет и разбирает вашу речь для диктовки и голосовых помощников и может различать голоса для персонализации результатов. ИИ, который собирает вместе записанные звуки, чтобы «поговорить» с вами. ИИ, который выделяет части изображений, чтобы легко их редактировать. ИИ, который идентифицирует объекты и людей для облегчения поиска. ИИ, позволяющий выделить текст на любом изображении.

Apple делает все это. Это настолько важно для компании, что во все свои чипы они встраивают нейронный движок — специализированный процессор, который ускоряет выполнение подобных задач машинного обучения. Apple даже работает над самой большой задачей в области ИИ — самодвижущимися автомобилями.

Но генеративный ИИ — это нечто другое. Это более новый класс ИИ, который создает нечто совершенно новое практически без ввода текста. Да, обучение моделей занимает тонну времени и горы данных, но затем эти модели, которые будут запускать пользователи, сравнительно малы и могут создавать бесконечное количество новых вещей. ИИ, который может найти все картофелины в вашей фототеке — это совсем другое дело, чем тот, который может нарисовать картошку с нуля в самых разных художественных стилях.

ChatGPT, Bard и Bing

Самой громкой технологией генеративного ИИ в настоящее время является ChatGPT от OpenAI. Этот продвинутый чат-бот и инструменты, созданные на его основе, уже используются в деловом мире для создания статей, электронных писем, шаблонов и многого другого. Студенты используют его для написания целых работ на основе небольшой подсказки, и результаты настолько хороши, что началась гонка за разработкой хороших инструментов для преподавателей, чтобы выявлять задания, написанные ChatGPT.

Поскольку он был обучен на тонне веб-данных, которые, хотя и устарели, но все еще актуальны для многих вещей, он может быть почти как поисковая система, с которой вы общаетесь. Это так напугало Google, что компания анонсировала свой собственный конкурирующий продукт разговорного ИИ, Bard, который еще не совсем готов к реальной жизни, но скоро появится. Публичная демонстрация предоставила неверную информацию о космическом телескопе Джеймса Вебба, так что Google явно есть над чем работать.

Компания Microsoft также объявила о новой функции разговорного поиска, которую можно начать использовать уже сейчас в Bing и браузере Edge. Она создана на основе ChatGPT с некоторыми улучшениями и модификациями.

Это не просто игрушки или диковинки. Это реальные инструменты, которые люди используют для выполнения реальной работы и реализации творческих проектов. Все это только начинается, и иногда кажется, что это еще не готово для мира в целом, но темпы совершенствования и инноваций поражают — модели ИИ удваиваются по сложности и изощренности каждые шесть месяцев.

Stable Diffusion, Midjourney, DALL-E

В прошлом году мы все вдоволь посмеялись над глупыми подсказками в DALL-E 2, но с дальнейшим обучением и усовершенствованием эти генеративные художественные инструменты ИИ стали способны на гораздо большее, чем просто создавать изображения кошек в стиле аниме, ныряющих с аквалангом и с аквариумами на голове.

Midjourney и Stable Diffusion стали настолько хороши, что создают искусство, которое вполне могло бы украсить обложку журнала, и могут создавать десятки рисунков за несколько минут.

Эти инструменты могут делать гораздо больше, чем просто создавать совершенно новые изображения в широком диапазоне стилей. Они могут изменять исходные изображения. В App Store уже полно приложений для создания аватаров и профилей, которые используют это программное обеспечение для того, чтобы сделать несколько фотографий вашего лица и изменить их потрясающим образом, изменяя физические особенности. Например, надеть солнцезащитные очки, которые выглядят совершенно настоящими.

В прошлом году это была диковинка, но технология развивается так быстро, что это уже инструмент. Adobe уже усовершенствовала многие свои приложения, добавив в них инструменты генерации изображений на основе искусственного интеллекта, для восстановления фотографий одним щелчком мыши и значительно улучшенного удаления объектов. Но в скором времени компания планирует добавить в свой инструментарий генеративный ИИ, который позволит вам буквально вставлять изображения в существующие фотографии и произведения искусства, которые будут выглядеть так, как будто они вписаны в них.

Узкое окно возможностей

И где же во всем этом Apple? Компания позиционирует себя как технологический лидер, особенно в творческой сфере. Но за исключением нескольких сообщений в блоге одного из исследовательских сайтов по машинному обучению и некоторых относительно малозатратных оптимизаций библиотек для собственных процессоров, Apple остается где-то в стороне. Я имею в виду, что DiffusionBee — это очень круто, но это небольшое независимое стороннее приложение, которое не обновлялось уже довольно давно и уже отстаёт от передового уровня в области создания изображений с помощью искусственного интеллекта.

Эта технология будет полностью изменена. Не верите мне? Посмотрите на исследования OpenAI в области генерации музыки. Он создает новую музыку в различных стилях, включая пение, совершенно из ниоткуда. VALL-E от Microsoft может генерировать шокирующе реалистичные голоса, которые звучат очень близко к реальному человеку, используя лишь крошечный фрагмент голоса этого человека в качестве входных данных. Он даже может имитировать различные эмоциональные состояния.

Многие из этих проектов, а также десятки других, все еще находятся на стадии исследований. Нетрудно найти недостатки в любом из них. Но путь от исследований к реальному миру будет быстрым, и найти недостатки будет все труднее.

У Apple, безусловно, есть инструменты для создания собственного генеративного ИИ-чатбота. Каждый новый Mac и iPhone оснащён нейронным движком, способным выполнять до 15,8 триллионов операций в секунду, а также мощными API Core ML и машинного обучения. Но мы не видим никаких подвижек со стороны Купертино. Точность и скорость имеют первостепенное значение для чат-ботов с искусственным интеллектом — акции и авторитет Google упали на этой неделе после ошибки в чат-боте Bard, поэтому вполне возможно, что компания ведет закулисную работу над Siri и, в истинно яблочной манере, не будет ничего выпускать, пока не доведет ее до совершенства. Но даже имея в своем распоряжении множество инструментов, вопрос остается открытым: Обращает ли Apple на это внимание?

Если компания не следит за развитием ИИ, она может не осознавать, насколько быстро он развивается. Всего год понадобился для того, чтобы генеративный ИИ прошел путь от «глупой игрушки для исследовательского проекта в Интернете» до «дуэли анонсов от Microsoft и Google». Еще через два года эти инструменты станут в десять раз лучше, и их будет гораздо больше. Вам будет трудно определить, что из них настоящее, а что полностью сгенерировано искусственным интеллектом. Если у вас есть большие идеи, но ограниченные художественные способности, генеративный ИИ значительно облегчит реализацию ваших мечтаний.

Создав Siri, Apple была на переднем крае внедрения голосового помощника с искусственным интеллектом в массы. По мере развития этой технологии Apple сильно отставала, и теперь Siri часто рассматривается как разочарование, которое не может сравниться с Google Assistant или Alexa. Когда речь заходит о генеративном ИИ, у Apple даже нет преимущества первого игрока, как это было с Siri. Большие и малые технологические компании уже выпускают мощные инструменты. Если не предпринять никаких действий, Apple просто станет производителем некоторых аппаратных средств, на которых будет работать наш генеративный ИИ.

Не реализовав возможности этой новой технологии в собственном программном обеспечении и сервисах, Apple позволит всем остальным определять уровень техники для того, что может стать самым важным сдвигом в компьютерной сфере за следующие десятилетия. Возможно, компанию это устраивает, но по мере того, как продажи аппаратного обеспечения падают, а программное обеспечение и сервисы растут, Apple действительно не может позволить себе не быть лидером в революции генеративного ИИ.

Конечно, Apple — одна из самых скрытных компаний в сфере технологий, особенно когда речь идет о программном обеспечении. Возможно, в Apple работают большие команды, чтобы привнести функции генеративного ИИ в iMovie, Final Cut Pro, Logic Pro, Photos, Mail, Messages и весь пакет iWork. Все эти приложения могут быть полностью преобразованы благодаря мощным инструментам генеративного ИИ. Мы знаем, что около года назад Apple купила как минимум одну компанию, занимающуюся генеративным искусственным интеллектом — AI Music. Было бы неразумно увидеть в этом году в продуктах Apple хотя бы инструмент «генерирования оригинального мгновенного саундтрека для вашего видео».

Мы можем вообще ничего не слышать о генеративном ИИ от Apple, а потом на WWDC — БАМ! Генеративный ИИ мирового класса по всей продукции Apple!

Я надеюсь, что так и будет, потому что если Apple опоздает с такой трансформационной технологией, это обречет ее программное обеспечение на отставание от конкурентов на годы вперед.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *