Nvidia Tesla V100топ-ускоритель также в версии под PCIe

Tesla V100 это самый мощный ускоритель, который ускорит развитие вычислений высокой производительности и искусственного интеллекта.

Nvidia Tesla V100 - топ-ускоритель также в версии под PCIe

Месяц назад Nvidia представила бейне карта Tesla V100, первый ускоритель нового поколения Volta – тогда еще в виде карты типа Mezzanine (SXM2). Теперь в ассортименте производителя появилась его версия под стандартный разъем PCI-Express x16.

Tesla V100 PCIe также использует графический процессор Volta GV100 с 5120 потоковыми процессорами и 640 ядрами tensor и 16 ГБ памяти HBM2 4096-bit. Изменилась тактовая частота ядра, потому как работает максимум с частотой около 1370 МГц (в версии SXM2 это 1455 МГц).

Ядро Volta GV100 состоит из 80 блоков SM, которые в совокупности дают 5120 ағындық процессорлар. Новинкой же являются 640 единиц tensor core, которые используются для машинного обучения и построения нейронных сетей

Несмотря на изменения частот, карта предлагает подобную вычислительную мощность – 28 ТЕРАФЛОПС половинной точности, 14 ТЕРАФЛОПС одинарной точности и 7 ТЕРАФЛОПС двойной точности (в версии SXM2 это соответственно 30, 15 және 7,5 ТЕРАФЛОПТАР). Вычислительная мощность при глубоком обучении в свою очередь составляет 112 орнына 120 ТЕРАФЛОПТАР. Пропускная способность памяти осталась без изменений и составляет до 900 ГБ/сек.

Tesla V100 PCIe использует интерфейс PCI-Express 3.0 x16, поэтому при подключении нескольких карт пропускная способность составляет „всего” 32 ГБ/сек (в версии SXM2 можно использовать шину NVLink с пропускной способностью 300 ГБИТ/сек). Но более низкие частоты повлияли на низкое потребление электроэнергии, так как коэффициент TDP составляет только 250 орнына 300 IN.

Үлгі Tesla P100 (SXM2)Tesla P100 (PCIe)Tesla V100 (SXM2)Tesla V100 (PCIe)
Буын Nvidia Pascal Nvidia Pascal Nvidia Volta Nvidia Volta
ЛитографияTSMC 14 nm
FinFET
TSMC 14 nm
FinFET
12 нм TSMC
FFN
12 нм TSMC
FFN
Площадь ядра610 мм2610 мм2815 мм2815 мм2
GPUPascal GP100Pascal GP100Volta GV100Volta GV100
Негізгі сағат жылдамдығы1480 МГц1300 МГц 1455 МГц~1370 Мгц
Вычислительная мощность FP1621,2 ТЕРАФЛОПТАР18,7 ТЕРАФЛОПТАР30 ТЕРАФЛОПТАР28 ТЕРАФЛОПТАР
Вычислительная мощность FP3210,6 ТЕРАФЛОПТАР9,3 ТЕРАФЛОПТАР15 ТЕРАФЛОПТАР14 ТЕРАФЛОПТАР
Вычислительная мощность FP645,3 ТЕРАФЛОПТАР4,7 ТЕРАФЛОПТАР7,5 ТЕРАФЛОПТАР7 ТЕРАФЛОПТАР
Вычислительная мощность tensor
(Deep Learning
120 TFLOPS112 ТЕРАФЛОПТАР
Бейне жады16 ГБ HBM2 4096-bit16 ГБ HBM2 4096-bit16 ГБ HBM2 4096-bit16 ГБ HBM2 4096-bit
Жад өткізу қабілеттілігі720 ГБИТ/сек 720 ГБИТ/сек900 ГБ/сек900 ГБ/сек
Тип картыMezzanine (SXM2)PCIe 3.0 x16Mezzanine (SXM2) PCIe 3.0 x16
Охлаждениепассивноепассивноепассивноепассивное
TDP 300 IN 250 IN300 IN250 IN

 

Карта Tesla V100 PCIe должна быть доступной уже в этом годукак в ассортименте Nvidia, так и компаний партнеров (Hewlett-Packard Enterprise, мысалы, анонсировала три системы, работающие на основе этой конструкции).

Мақаланы бағалаңыз
IT жаңалықтары