На фоне лавин новостей и массового энтузиазма вокруг искусственного интеллекта (ИИ) складывается впечатление, что практически каждая крупная технологическая компания или уже выпустила, или вот-вот собирается анонсировать свое инновационное предложение в этой бурно развивающейся отрасли. Когда все эти новинки выходят, обращает на себя внимание то обстоятельство, что каждая фирма применяет здесь свой уникальный, исторически сложившийся подход к информационным технологиям вообще. Конечно, в этом нет ничего особенно удивительного, но все-таки интересно наблюдать за тем, как многие решения в области генеративного ИИ отражают наиболее характерные черты или ключевые аспекты философии компании-разработчика.
Так, первая версия ИИ от IBM под названием Watson была представлена в 2011 году, когда этот образчик искусственного интеллекта в качестве игрока принимал участие в телевикторине «Jeopardy!»
Последние предложения IBM в этой области относятся к сфере услуг и генеративным моделям ИИ (то есть ИИ, который генерирует различный медиаконтент). На своей ежегодной конференции Think в Орландо компания представила ряд новых ИИ-продуктов, несущих на себе характерный отпечаток "IBM-ности", под общим названием watsonx. Они отражают инструментальный и открытый подход компании к информационным технологиям, а также отличное качество работы, которую проделали специалисты команды IBM Research.
В области ИИ компания IBM однозначно не новичок. Их оригинальная система Watson как пример искусственного интеллекта вполне могла претендовать на мировое представительство. Концепция watsonx открывает принципиально новые возможности программного обеспечения и гибридных облачных платформ IBM. В компании полагают, что в перспективе это позволит радикально обновить историю программных продуктов IBM.
На сегодняшнем первом этапе watsonx состоит из трех основных компонентов – watsonx.ai, watsonx.data и watsonx.governance – которые разработаны в расчете на совместное использование, но при этом, в духе IBM-овской философии открытости и готовности к взаимодействию, также потенциально совместимы с аналогичными компонентами от других разработчиков.
Watsonx.ai – это фундаментальный комплекс инструментов для построения, обучения, валидации и развертывания базисных моделей ИИ. Примечательно, что компании могут использовать его как для создания новых оригинальных моделей, так и для модификации существующих базисных моделей. Watsonx.data представляет собой хранилище данных, оптимизированное под ИИ-приложения и используемое для сбора, систематизации и очистки данных, которые поступают во встроенные источники моделей. Наконец, watsonx.governance – это инструмент для контроля процесса создания моделей, который также обеспечивает запись и учет всех данных, поступающих в модель.
Кроме того, IBM анонсировала несколько своих собственных новых базисных моделей, которые могут использоваться совместно с watsonx или самостоятельно. Как и другие разработчики, IBM в первую очередь предлагает большую языковую модель (LLM) для текстовых приложений, а также инструменты для генерации и чтения кода. Помимо этого компания объявила, что они намерены создать отдельную дополнительную индустрию разработки специализированных моделей для конкретных областей применения, включая геокосмический мониторинг, химию и другие области, имеющие дело с большими объемами данных.
Важно, что, по словам IBM, компании смогут запускать эти модели как через облачные сервисы, так и в собственных дата-центрах, или же использовать комбинированное решение, задействующее обе эти возможности. Это интересная опция, поскольку в настоящий момент большинство разработчиков пока не предлагают заказчикам такой «развесной» вариант запуска моделей.
IBM также представила три различные архитектуры базисных моделей – для каждого из этих вариантов использования; архитектурам даны названия горных пород. Идея состоит в том, что различные опции архитектуры рассчитаны на различные соотношения стоимости и производительности. Так как многие организации начинают приспосабливать базисные модели под свои нужды, запуск этих моделей часто требует задействования очень больших вычислительных и электрических мощностей, поэтому компании очевидно заинтересованы в наличии выбора в данном аспекте.
Базисная модель с архитектурой «Сланец» (Slate) предлагает только декодирование контента силами ИИ и требует специальной маркировки данных для конкретных задач в целях машинного обучения, но не предлагает каких-либо генеративных возможностей. Модель «Песчаник» (Sandstone) обладает возможностями кодирования и декодирования, что позволяет использовать ее в смешанных приложениях с генеративными и не-генеративными задачами; эта опция наиболее эффективна в приложениях с небольшим генеративным выходом. Наконец, «Гранит» (Granite) – это модель кодировочного типа, оптимизированная под полностью генеративные ИИ-приложения. Теоретически вы можете построить и/или использовать модель любого типа с любым типом архитектуры. Так, например, во многих случаях заказчику может понадобиться базисная модель для генеративных текстовых приложений и в то же время – модель для чтения, которая «понимает» предлагаемый ей код, но не генерирует новый код.
Еще больше опций от IBM – и, соответственно, больше сложности – добавят различные размеры этих моделей и различное число параметров (и, по-видимому, в будущих релизах разработчики IBM Research представят и другие архитектуры моделей). Хотя увеличение количества опций потенциально усложняет ситуацию выбора, для компаний выбор становится более гибким, так как различные архитектурные и модельные решения предъявляют различные требования к вычислительным мощностям. Это особенно важно в случаях, когда заказчик собирается использовать собственную версию базисной модели и при этом у него нет дополнительных серверов с мощными графическими ускорителями (и он не собирается их покупать), которые нужны для запуска моделей большего размера.
Обращая внимание на связь новых инструментов с базисными моделями, IBM подчеркивает, что они сами использовали инструменты watsonx для построения этих моделей как «заказчик нулевого порядка». Это подразумевает, что предприятия-заказчики смогут пользоваться инструментарием новой ИИ-платформы для создания широкого диапазона собственных предложений.
Еще один важный момент: хотя основное назначение watsonx – создание новых базисных моделей, его также можно использовать для совместного использования и модификации существующих моделей из открытых источников, от таких разработчиков, как, например, Hugging Face. Это важно, поскольку многие потенциальные заказчики не располагают квалификационной базой для построения своих собственных моделей.
В завершение презентации своей новой ИИ-платформы компания заявила также, что они используют имя Watson (с заглавной "W" и без "x") для обозначения ИИ-приложений, ориентированных на индивидуальные сценарии. IBM представила ряд своих текущих программных продуктов под такими названиями, как Watson Assistant, Watson Orchestrate, Watson Discovery и Watson Code Assistant; все они разработаны в целях повышения продуктивности пользователей в соответствующих задачах.
Все это является частью стратегии разработки высокоуровневого программного обеспечения IBM, которая включает в себя пять основных категорий: Digital Labor (сюда входят все вышеупомянутые продукты), IT Automation, Security, Sustainability и Application Modernization. Идея состоит в том, чтобы пользователи, взаимодействуя с системой подсказок Watson, получали от ИИ полезный отклик, облегчающий решение таких задач, как создание чат-ботов, автоматических скриптов, написание кодов и т.д. С другой стороны, линейка watsonx предлагает набор инструментов для разработчиков ИИ-приложений на предприятиях, заинтересованных в создании новых и/или модификации существующих базисных моделей.
Как и во многих других крупных ИИ-презентациях последнего времени, мы видим здесь яркий пример проекта, вбирающего в себя все инновации компании (в данном случае – IBM), и далее интересно будет наблюдать реакцию потенциальных заказчиков (и рынка в целом) на эти предложения. Однако лично я нахожу особенно замечательным то, что проект watsonx/Watson отражает определенные общие тенденции, которые сегодня просматриваются в быстро меняющемся мире высоких технологий генеративного ИИ.
Во-первых, очевидно, что это не просто еще один повод подогреть шумиху вокруг ИИ. Конечно, текущий момент к этому располагает, но принципиальное отличие проекта IBM определяется фундаментом, на котором строится подход компании к разработке программных продуктов. Предлагаемые новые возможности берут свое начало в стратегической концепции программных платформ, о которой компания говорит уже не первый год. Они определяют важный поворотный пункт, который в дальнейшем повлияет на всю линейку программных продуктов компании. В контексте общей ситуации данная презентация подчеркивает, насколько серьезно и глубоко генеративный ИИ трансформирует ставший уже привычным мир информационных технологий. Коротко говоря, это больше, чем очередная фантазия на тему технологической революции, которая изменит будущее.
Во-вторых – и это особенно характерно для IBM – развитие бренда Watson отражает перспективы эволюции ИИ в целом. После первого громкого успеха, который принесла ИИ-система Watson (не только компании IBM, но и всей отрасли), последовали несколько лет разочарований, которые даже называли зимой для ИИ. Однако в прошлом году на сцену вышел чат-бот ChatGPT, который вызвал новую вспышку внимания к генеративному ИИ, показав эффективность и потенциал искусственного интеллекта следующего поколения на основе базисных моделей. Таким образом, мы видим, что IBM, представляя свою модернизированную версию генеративного ИИ в проекте watsonx/Watson, движется в русле новых перспективных технологий искусственного интеллекта.
Некоторые могут возразить, что для ИИ скоро может наступить новая зима. Однако, как показывает презентация IBM, сегодня искусственный интеллект может предложить рынку намного более широкий диапазон решений, чем когда-либо ранее. Серьезные препятствия для массового внедрения ИИ и другие проблемы остаются, но для предприятий и организаций, заинтересованных в возможностях генеративного ИИ, сейчас самый подходящий момент для начала исследований и разработок в этой области. Посмотрим.
Источник: TechSpot