навіны IT

Nvidia Tesla V100 – топ-ускоритель также в версии под PCIe

Tesla V100 это самый мощный ускоритель, который ускорит развитие вычислений высокой производительности и искусственного интеллекта.

Месяц назад Nvidia представила відэакарту Tesla V100, первый ускоритель нового поколения Volta – тогда еще в виде карты типа Mezzanine (SXM2). Теперь в ассортименте производителя появилась его версия под стандартный разъем PCI-Express x16.

Tesla V100 PCIe также использует графический процессор Volta GV100 с 5120 потоковыми процессорами и 640 ядрами tensor и 16 ГБ памяти HBM2 4096-bit. Изменилась тактовая частота ядра, потому как работает максимум с частотой около 1370 Мгц (в версии SXM2 это 1455 Мгц).

Ядро Volta GV100 состоит из 80 блоков SM, которые в совокупности дают 5120 потоковых процессоров. Новинкой же являются 640 единиц tensor core, которые используются для машинного обучения и построения нейронных сетей

Несмотря на изменения частот, карта предлагает подобную вычислительную мощность – 28 ТЕРАФЛОПС половинной точности, 14 ТЕРАФЛОПС одинарной точности и 7 ТЕРАФЛОПС двойной точности (в версии SXM2 это соответственно 30, 15 і 7,5 ТЕРАФЛОПС). Вычислительная мощность при глубоком обучении в свою очередь составляет 112 вместо 120 ТЕРАФЛОПС. Пропускная способность памяти осталась без изменений и составляет до 900 ГБ/сек.

Tesla V100 PCIe использует интерфейс PCI-Express 3.0 x16, поэтому при подключении нескольких карт пропускная способность составляет „всего” 32 ГБ/сек (в версии SXM2 можно использовать шину NVLink с пропускной способностью 300 Гбіт/сек). Но более низкие частоты повлияли на низкое потребление электроэнергии, так как коэффициент TDP составляет только 250 вместо 300 У.

мадэль Tesla P100 (SXM2) Tesla P100 (PCIe) Tesla V100 (SXM2) Tesla V100 (PCIe)
пакаленне Nvidia Pascal Nvidia Pascal Nvidia Volta Nvidia Volta
Літаграфія TSMC 14 нм
FinFET
TSMC 14 нм
FinFET
12 нм TSMC
FFN
12 нм TSMC
FFN
Площадь ядра 610 мм2 610 мм2 815 мм2 815 мм2
Графічны працэсар Pascal GP100 Pascal GP100 Volta GV100 Volta GV100
Тактавая частата ядра 1480 Мгц 1300 Мгц 1455 Мгц ~1370 Мгц
Вычислительная мощность FP16 21,2 ТЕРАФЛОПС 18,7 ТЕРАФЛОПС 30 ТЕРАФЛОПС 28 ТЕРАФЛОПС
Вычислительная мощность FP32 10,6 ТЕРАФЛОПС 9,3 ТЕРАФЛОПС 15 ТЕРАФЛОПС 14 ТЕРАФЛОПС
Вычислительная мощность FP64 5,3 ТЕРАФЛОПС 4,7 ТЕРАФЛОПС 7,5 ТЕРАФЛОПС 7 ТЕРАФЛОПС
Вычислительная мощность tensor
(Deep Learning
120 TFLOPS 112 ТЕРАФЛОПС
Память видео 16 ГБ HBM2 4096-bit 16 ГБ HBM2 4096-bit 16 ГБ HBM2 4096-bit 16 ГБ HBM2 4096-bit
Прапускная здольнасць памяці 720 Гбіт/сек 720 Гбіт/сек 900 ГБ/сек 900 ГБ/сек
Тип карты Mezzanine (SXM2) PCIe 3.0 x16 Mezzanine (SXM2) PCIe 3.0 x16
Астуджэнне пасіўнае пасіўнае пасіўнае пасіўнае
TDP 300 У 250 У 300 У 250 У

Карта Tesla V100 PCIe должна быть доступной уже в этом году – как в ассортименте Nvidia, так и компаний партнеров (Hewlett-Packard Enterprise, напрыклад, анонсировала три системы, работающие на основе этой конструкции).

Exit mobile version