Компания Baidu, ведущий китайскоязычный интернет-поисковик, и компания Samsung Electronics, мировой лидер в области современных полупроводниковых технологий, объявили, что процесс разработки первого ИИ-ускорителя облачных вычислений и обмена данными в системе Baidu – Baidu KUNLUN – полностью завершен и в начале следующего года он будет запущен в массовое производство. В основе чипа Baidu KUNLUN лежит продвинутая нейропроцессорная архитектура XPU, разработанная компанией Samsung для облачных сервисов, краевых серверов и приложений, использующих возможности искусственного интеллекта; чип будет изготавливаться на базе 14-нм техпроцесса Samsung с применением компоновочного решения I-Cube (Interposer-Cube).
Этот чип предлагает пропускную способность памяти 512 Гбит/с и обеспечивает скорость вычислений до 260 трлн операций в секунду (260 TOPS) при энергопотреблении 150 Вт. Кроме того, новый чип позволяет Ernie – машине для анализа и обработки естественного языка с предварительным обучением – принимать решения в три раза быстрее, чем позволяют общепринятые схемы ускорителей в GPU/FPGA. Используя запредельную по сегодняшним меркам вычислительную мощность и энергетическую эффективность этого чипа, Baidu сможет выполнять самые разнообразные функции, как то: сортировка результатов поисковых запросов, распознавание речи, анализ изображений и текста, беспилотное автовождение, – максимально задействуя возможности искусственного интеллекта, а также поддерживать платформы с глубоким обучением, например, PaddlePaddle.
В результате этого первого совместного проекта обе компании получат свою выгоду: Baidu будет предоставлять клиентам продвинутые ИИ-платформы с максимальной производительностью, которую может обеспечивать искусственный интеллект, а Samsung будет расширять свой высокотехнологичный бизнес за счет сегмента высокопроизводительных вычислений (HPC), выпуская чипы, разработанные специально для облачных вычислений и многофункциональной обработки данных.
"Мы рады возглавить индустрию HPC в партнерстве с Samsung Foundry," – сказал Джан У-Янг (Jian Ou-Yang), системный архитектор Baidu. "Baidu KUNLUN – это очень сложный, бросающий нам вызов проект, поскольку он требует не только сочетания высокой надежности с высокой производительностью, но также объединения самых продвинутых технологий полупроводниковой индустрии. Благодаря наработкам Samsung в области информационных и полупроводниковых технологий мы рассчитываем выполнить свою задачу и предоставить нашим клиентам возможность получить самый передовой опыт использования ИИ."
"Мы с радостью начинаем производство новых чипов по заказу Baidu на базе нашего 14-нм техпроцесса," – сказал Райан Ли (Ryan Lee), вице-президент департамента производственного маркетинга Samsung Electronics. "Baidu KUNLUN – это важная веха в истории Samsung Foundry, расширяющая границы нашего бизнеса и выводящая его за пределы мобильного сегмента, к технологиям крупных дата-центров, для которых предназначены наши серийные ИИ-чипы. Со своей стороны Samsung обеспечит производство новых чипов комплексными инженерными решениями, включающими в себя такие передовые технологии изготовления микросхем, как 5LPE, 4LPE и 2.5D."
Поскольку в таких областях, как высокопроизводительные вычисления и ИИ-приложения, требуется все более и более высокая производительность, все большее и большее значение приобретают технологии изготовления интегральных микросхем. Технология Samsung I-Cube, объединяющая логический кристалл и память HBM2 в единое целое с использованием общей подложки (interposer), обеспечивает более высокую плотность данных/ пропускную способность при минимальном размере чипа, который включает в себя отдельные решения от Samsung.
По сравнению с предыдущей технологией, это компоновочное решение улучшает целостность сигнала более чем в полтора раза и максимизирует суммарную производительность чипа. Ожидается, что технология I-Cube откроет новую страницу в истории гетерогенных вычислений. Samsung также разрабатывает еще более продвинутые технологии компоновки микросхем, использующие, например, общую подложку с перераспределением слоев (RDL-interposer) и интегрированную память HBM в количестве четырех и восьми стеков.
Источник: www.techpowerup.com