На конференции Supercomputing Conference 2010, прошедшей на прошлой неделе, Билл Далли (Bill Dally), главный научный сотрудник и вице-президент nVidia раскрыл некоторые подробности об исследованиях, которые компания ведёт с целью разработки следующего поколения высокопроизводительных вычислительных систем, и как это может привести к более производительным экза-вычислениям.
Производительность самых мощных суперкомпьютеров в мире в настоящее время составляет несколько петафлопс, или тысячи терафлоп, то есть эти системы способны обеспечивать выполнение нескольких квадриллионов операций в секунду. Система, обеспечивающая экза-вычисления, должна будет работать примерно в 1000 раз быстрее, обеспечивая, по крайней мере, триллион операций в секунду. Для справки,
видеокарта ATI Radeon HD 4870 была преподнесена производителем как первый "TeraScale" GPU, способный выполнять вычисления на уровне в один терафлоп.
Наиболее важным фактором, по словам Далли, будет эффективность. Он предусматривает появление отдельного графического ядра, которое сможет выполнить операцию с плавающей запятой, используя только 10 пикоджоулей энергии, вместо 200 пикоджоулей, характерных для архитектуры Fermi. Чип под кодовым названием Echelon будет включать в себя от 128 потоковых многопроцессорных блоков (SMS), каждый из которых будет содержать восемь таких ядер, то есть в целом Echelon будет представлять собой 1024-ядерный GPU. На картинке показан примерный вид схемы чипа Echelon.
Ещё один важный фактор ─ кэш, и Далли говорит, что у Echelon может быть кэш до 256Мб. Предполагается, что этот чип сможет динамически распределять память на целых шесть уровней в зависимости от текущих потребностей и обрабатываемого приложения.
Все эти архитектурные соображения добавят разработчикам много работы. Из-за того, что каждое ядро будет в состоянии иметь дело с четырьмя операциями в секунду, в отличие от одной в использующихся сейчас ядрах, чип Echelon, имея примерно в два раза больше ядер, чем у одного из современных производительных графических процессоров, будет способен обеспечивать производительность около десяти терафлоп.
Очевидно, такого рода разработки в конечном итоге найдут применение в широком диапазоне продуктов nVidia. Далли даже предположил, что один из восьмиядерных SM может в один прекрасный день стать основой нового поколения мобильных чипов компании. К сожалению, производственные процессы и линии теперь должны догнать теоретические разработки, конструкции и модели, над которыми в настоящее время работают учёные.
Исследования в рамках проекта Ubiquitous High Performance Computing, финансируемого DARPA, ведутся компанией nVidia совместно с Intel, MIT и Sandia National Labs. Целью проекта заявлена разработка
компьютера с производительностью порядка петафлоп с энергопотреблением не более 57кВт к 2014 году, который может быть использован в качестве основы для экза-суперкомпьютера, появление которого планируется к 2018 году.