Nvidia Tesla V100 – топ-прискорювач також у версії під PCIe

Tesla V100 це найпотужніший прискорювач, який прискорить розвиток обчислень високої продуктивності і штучного інтелекту.

Nvidia Tesla V100 - топ-прискорювач також у версії під PCIe

Місяць тому Nvidia представила відеокарту Тесла V100, перший прискорювач нового покоління Volta – тоді ще як карти типу Mezzanine (SXM2). Тепер в асортименті виробника з'явилася його версія під стандартне роз'єм PCI-Express x16.

Tesla V100 PCIe також використовує графічний процесор Volta GV100 з 5120 потокових процесорів і 640 ядрами tensor і 16 ГБ пам'яті HBM2 4096-bit. Змінилася тактова частота ядра, тому як працює максимум з частотою близько 1370 Мгц (в версії SXM2 це 1455 Мгц).

Ядро Volta GV100 складається з 80 блоків SM, які в сукупності дають 5120 потокових процесорів. Новинкою ж є 640 одиниць tensor core, які використовуються для машинного навчання і побудови нейронних мереж

Незважаючи на зміни частот, карта пропонує подібну обчислювальну потужність - 28 Терафлопс половинної точності, 14 Терафлопс одинарної точності і 7 ТЕРАФЛОПС подвійної точності (в версії SXM2 це відповідно 30, 15 і 7,5 терафлопс). Обчислювальна потужність при глибокому навчанні у свою чергу складає 112 замість 120 терафлопс. Пропускна здатність пам'яті залишилася без змін і складає до 900 Гб / сек.

Tesla V100 PCIe використовує інтерфейс PCI-Express 3.0 х16, тому при підключенні декількох карт пропускна здатність складає "всього" 32 Гб / сек (в версії SXM2 можна використовувати шину NVLink з пропускною спроможністю 300 Гбіт / сек). Але нижчі частоти вплинули на низьке споживання електроенергії, так як коефіцієнт TDP становить лише 250 замість 300 В.

Модель Тесла P100 (SXM2)Тесла P100 (PCIe)Тесла V100 (SXM2)Тесла V100 (PCIe)
покоління Nvidia Pascal Nvidia Pascal Nvidia Volta Nvidia Volta
літографіяTSMC 14 нм
FinFET
TSMC 14 нм
FinFET
12 нм TSMC
FFN
12 нм TSMC
FFN
Площа ядра610 мм2610 мм2815 мм2815 мм2
графічний процесорПаскаль GP100Паскаль GP100Вольта GV100Вольта GV100
Тактова частота ядра1480 Мгц1300 Мгц 1455 Мгц~ 1370 Мгц
Обчислювальна потужність FP1621,2 терафлопс18,7 терафлопс30 терафлопс28 терафлопс
Обчислювальна потужність FP3210,6 терафлопс9,3 терафлопс15 терафлопс14 терафлопс
Обчислювальна потужність FP645,3 терафлопс4,7 терафлопс7,5 терафлопс7 терафлопс
Обчислювальна потужність tensor
(глибоке вивчення
120 TFLOPS112 терафлопс
пам'ять відео16 ГБ HBM2 4096-bit16 ГБ HBM2 4096-bit16 ГБ HBM2 4096-bit16 ГБ HBM2 4096-bit
Пропускна здатність пам'яті720 Гбіт / сек 720 Гбіт / сек900 Гб / сек900 Гб / сек
Тип картимезонін (SXM2)PCIe 3.0 х16мезонін (SXM2) PCIe 3.0 х16
охолодженняпасивнепасивнепасивнепасивне
TDP 300 В 250 В300 В250 В

 

Карта Tesla V100 PCIe повинна бути доступною вже в цьому році – як в асортименті Nvidia, так і компаній партнерів (Hewlett-Packard Enterprise, наприклад, анонсувала три системи, що працюють на основі цієї конструкції).

Оцінити статтю
Новини IT
Додати коментар