IT жаңалықтары

Nvidia Tesla V100 – топ-ускоритель также в версии под PCIe

Tesla V100 это самый мощный ускоритель, который ускорит развитие вычислений высокой производительности и искусственного интеллекта.

Месяц назад Nvidia представила бейне карта Tesla V100, первый ускоритель нового поколения Volta – тогда еще в виде карты типа Mezzanine (SXM2). Теперь в ассортименте производителя появилась его версия под стандартный разъем PCI-Express x16.

Tesla V100 PCIe также использует графический процессор Volta GV100 с 5120 потоковыми процессорами и 640 ядрами tensor и 16 ГБ памяти HBM2 4096-bit. Изменилась тактовая частота ядра, потому как работает максимум с частотой около 1370 МГц (в версии SXM2 это 1455 МГц).

Ядро Volta GV100 состоит из 80 блоков SM, которые в совокупности дают 5120 ағындық процессорлар. Новинкой же являются 640 единиц tensor core, которые используются для машинного обучения и построения нейронных сетей

Несмотря на изменения частот, карта предлагает подобную вычислительную мощность – 28 ТЕРАФЛОПС половинной точности, 14 ТЕРАФЛОПС одинарной точности и 7 ТЕРАФЛОПС двойной точности (в версии SXM2 это соответственно 30, 15 және 7,5 ТЕРАФЛОПТАР). Вычислительная мощность при глубоком обучении в свою очередь составляет 112 орнына 120 ТЕРАФЛОПТАР. Пропускная способность памяти осталась без изменений и составляет до 900 ГБ/сек.

Tesla V100 PCIe использует интерфейс PCI-Express 3.0 x16, поэтому при подключении нескольких карт пропускная способность составляет „всего” 32 ГБ/сек (в версии SXM2 можно использовать шину NVLink с пропускной способностью 300 ГБИТ/сек). Но более низкие частоты повлияли на низкое потребление электроэнергии, так как коэффициент TDP составляет только 250 орнына 300 IN.

Үлгі Tesla P100 (SXM2) Tesla P100 (PCIe) Tesla V100 (SXM2) Tesla V100 (PCIe)
Буын Nvidia Pascal Nvidia Pascal Nvidia Volta Nvidia Volta
Литография TSMC 14 nm
FinFET
TSMC 14 nm
FinFET
12 нм TSMC
FFN
12 нм TSMC
FFN
Площадь ядра 610 мм2 610 мм2 815 мм2 815 мм2
GPU Pascal GP100 Pascal GP100 Volta GV100 Volta GV100
Негізгі сағат жылдамдығы 1480 МГц 1300 МГц 1455 МГц ~1370 Мгц
Вычислительная мощность FP16 21,2 ТЕРАФЛОПТАР 18,7 ТЕРАФЛОПТАР 30 ТЕРАФЛОПТАР 28 ТЕРАФЛОПТАР
Вычислительная мощность FP32 10,6 ТЕРАФЛОПТАР 9,3 ТЕРАФЛОПТАР 15 ТЕРАФЛОПТАР 14 ТЕРАФЛОПТАР
Вычислительная мощность FP64 5,3 ТЕРАФЛОПТАР 4,7 ТЕРАФЛОПТАР 7,5 ТЕРАФЛОПТАР 7 ТЕРАФЛОПТАР
Вычислительная мощность tensor
(Deep Learning
120 TFLOPS 112 ТЕРАФЛОПТАР
Бейне жады 16 ГБ HBM2 4096-bit 16 ГБ HBM2 4096-bit 16 ГБ HBM2 4096-bit 16 ГБ HBM2 4096-bit
Жад өткізу қабілеттілігі 720 ГБИТ/сек 720 ГБИТ/сек 900 ГБ/сек 900 ГБ/сек
Тип карты Mezzanine (SXM2) PCIe 3.0 x16 Mezzanine (SXM2) PCIe 3.0 x16
Охлаждение пассивное пассивное пассивное пассивное
TDP 300 IN 250 IN 300 IN 250 IN

Карта Tesla V100 PCIe должна быть доступной уже в этом году – как в ассортименте Nvidia, так и компаний партнеров (Hewlett-Packard Enterprise, мысалы, анонсировала три системы, работающие на основе этой конструкции).

Exit mobile version