Nvidia Tesla V100 — топ-ускоритель также в версии под PCIe

Tesla V100 это самый мощный ускоритель, который ускорит развитие вычислений высокой производительности и искусственного интеллекта.

Nvidia Tesla V100 - топ-ускоритель также в версии под PCIe

Месяц назад Nvidia представила видеокарту Tesla V100, первый ускоритель нового поколения Volta – тогда еще в виде карты типа Mezzanine (SXM2). Теперь в ассортименте производителя появилась его версия под стандартный разъем PCI-Express x16.

Tesla V100 PCIe также использует графический процессор Volta GV100 с 5120 потоковыми процессорами и 640 ядрами tensor и 16 ГБ памяти HBM2 4096-bit. Изменилась тактовая частота ядра, потому как работает максимум с частотой около 1370 Мгц (в версии SXM2 это 1455 Мгц).

Ядро Volta GV100 состоит из 80 блоков SM, которые в совокупности дают 5120 потоковых процессоров. Новинкой же являются 640 единиц tensor core, которые используются для машинного обучения и построения нейронных сетей

Несмотря на изменения частот, карта предлагает подобную вычислительную мощность – 28 ТЕРАФЛОПС половинной точности, 14 ТЕРАФЛОПС одинарной точности и 7 ТЕРАФЛОПС двойной точности (в версии SXM2 это соответственно 30, 15 и 7,5 ТЕРАФЛОПС). Вычислительная мощность при глубоком обучении в свою очередь составляет 112 вместо 120 ТЕРАФЛОПС. Пропускная способность памяти осталась без изменений и составляет до 900 ГБ/сек.

Tesla V100 PCIe использует интерфейс PCI-Express 3.0 x16, поэтому при подключении нескольких карт пропускная способность составляет „всего” 32 ГБ/сек (в версии SXM2 можно использовать шину NVLink с пропускной способностью 300 ГБИТ/сек). Но более низкие частоты повлияли на низкое потребление электроэнергии, так как коэффициент TDP составляет только 250 вместо 300 В.

Модель Tesla P100 (SXM2)Tesla P100 (PCIe)Tesla V100 (SXM2)Tesla V100 (PCIe)
Поколение Nvidia Pascal Nvidia Pascal Nvidia Volta Nvidia Volta
ЛитографияTSMC 14 нм
FinFET
TSMC 14 нм
FinFET
12 нм TSMC
FFN
12 нм TSMC
FFN
Площадь ядра610 мм2610 мм2815 мм2815 мм2
Графический процессорPascal GP100Pascal GP100Volta GV100Volta GV100
Тактовая частота ядра1480 Мгц1300 Мгц 1455 Мгц~1370 Мгц
Вычислительная мощность FP1621,2 ТЕРАФЛОПС18,7 ТЕРАФЛОПС30 ТЕРАФЛОПС28 ТЕРАФЛОПС
Вычислительная мощность FP3210,6 ТЕРАФЛОПС9,3 ТЕРАФЛОПС15 ТЕРАФЛОПС14 ТЕРАФЛОПС
Вычислительная мощность FP645,3 ТЕРАФЛОПС4,7 ТЕРАФЛОПС7,5 ТЕРАФЛОПС7 ТЕРАФЛОПС
Вычислительная мощность tensor
(Deep Learning
120 TFLOPS112 ТЕРАФЛОПС
Память видео16 ГБ HBM2 4096-bit16 ГБ HBM2 4096-bit16 ГБ HBM2 4096-bit16 ГБ HBM2 4096-bit
Пропускная способность памяти720 ГБИТ/сек 720 ГБИТ/сек900 ГБ/сек900 ГБ/сек
Тип картыMezzanine (SXM2)PCIe 3.0 x16Mezzanine (SXM2) PCIe 3.0 x16
Охлаждениепассивноепассивноепассивноепассивное
TDP 300 В 250 В300 В250 В

 

Карта Tesla V100 PCIe должна быть доступной уже в этом году — как в ассортименте Nvidia, так и компаний партнеров (Hewlett-Packard Enterprise, например, анонсировала три системы, работающие на основе этой конструкции).

Оценить статью
Новости IT
Добавить комментарий