Новини IT

Nvidia Tesla V100 – топ-прискорювач також у версії під PCIe

Tesla V100 це найпотужніший прискорювач, який прискорить розвиток обчислень високої продуктивності і штучного інтелекту.

Місяць тому Nvidia представила відеокарту Тесла V100, перший прискорювач нового покоління Volta – тоді ще як карти типу Mezzanine (SXM2). Тепер в асортименті виробника з'явилася його версія під стандартне роз'єм PCI-Express x16.

Tesla V100 PCIe також використовує графічний процесор Volta GV100 з 5120 потокових процесорів і 640 ядрами tensor і 16 ГБ пам'яті HBM2 4096-bit. Змінилася тактова частота ядра, тому як працює максимум з частотою близько 1370 Мгц (в версії SXM2 це 1455 Мгц).

Ядро Volta GV100 складається з 80 блоків SM, які в сукупності дають 5120 потокових процесорів. Новинкою ж є 640 одиниць tensor core, які використовуються для машинного навчання і побудови нейронних мереж

Незважаючи на зміни частот, карта пропонує подібну обчислювальну потужність - 28 Терафлопс половинної точності, 14 Терафлопс одинарної точності і 7 ТЕРАФЛОПС подвійної точності (в версії SXM2 це відповідно 30, 15 і 7,5 терафлопс). Обчислювальна потужність при глибокому навчанні у свою чергу складає 112 замість 120 терафлопс. Пропускна здатність пам'яті залишилася без змін і складає до 900 Гб / сек.

Tesla V100 PCIe використовує інтерфейс PCI-Express 3.0 х16, тому при підключенні декількох карт пропускна здатність складає "всього" 32 Гб / сек (в версії SXM2 можна використовувати шину NVLink з пропускною спроможністю 300 Гбіт / сек). Але нижчі частоти вплинули на низьке споживання електроенергії, так як коефіцієнт TDP становить лише 250 замість 300 В.

Модель Тесла P100 (SXM2) Тесла P100 (PCIe) Тесла V100 (SXM2) Тесла V100 (PCIe)
покоління Nvidia Pascal Nvidia Pascal Nvidia Volta Nvidia Volta
літографія TSMC 14 нм
FinFET
TSMC 14 нм
FinFET
12 нм TSMC
FFN
12 нм TSMC
FFN
Площа ядра 610 мм2 610 мм2 815 мм2 815 мм2
графічний процесор Паскаль GP100 Паскаль GP100 Вольта GV100 Вольта GV100
Тактова частота ядра 1480 Мгц 1300 Мгц 1455 Мгц ~ 1370 Мгц
Обчислювальна потужність FP16 21,2 терафлопс 18,7 терафлопс 30 терафлопс 28 терафлопс
Обчислювальна потужність FP32 10,6 терафлопс 9,3 терафлопс 15 терафлопс 14 терафлопс
Обчислювальна потужність FP64 5,3 терафлопс 4,7 терафлопс 7,5 терафлопс 7 терафлопс
Обчислювальна потужність tensor
(глибоке вивчення
- - 120 TFLOPS 112 терафлопс
пам'ять відео 16 ГБ HBM2 4096-bit 16 ГБ HBM2 4096-bit 16 ГБ HBM2 4096-bit 16 ГБ HBM2 4096-bit
Пропускна здатність пам'яті 720 Гбіт / сек 720 Гбіт / сек 900 Гб / сек 900 Гб / сек
Тип карти мезонін (SXM2) PCIe 3.0 х16 мезонін (SXM2) PCIe 3.0 х16
охолодження пасивне пасивне пасивне пасивне
TDP 300 В 250 В 300 В 250 В

Карта Tesla V100 PCIe должна быть доступной уже в этом году – как в ассортименте Nvidia, так і компаній партнерів (Hewlett-Packard Enterprise, наприклад, анонсувала три системи, що працюють на основі цієї конструкції).

Exit mobile version