Tesla V100 це найпотужніший прискорювач, який прискорить розвиток обчислень високої продуктивності і штучного інтелекту.
Місяць тому Nvidia представила відеокарту Тесла V100, перший прискорювач нового покоління Volta – тоді ще як карти типу Mezzanine (SXM2). Тепер в асортименті виробника з'явилася його версія під стандартне роз'єм PCI-Express x16.
Tesla V100 PCIe також використовує графічний процесор Volta GV100 з 5120 потокових процесорів і 640 ядрами tensor і 16 ГБ пам'яті HBM2 4096-bit. Змінилася тактова частота ядра, тому як працює максимум з частотою близько 1370 Мгц (в версії SXM2 це 1455 Мгц).
Ядро Volta GV100 складається з 80 блоків SM, які в сукупності дають 5120 потокових процесорів. Новинкою ж є 640 одиниць tensor core, які використовуються для машинного навчання і побудови нейронних мережНезважаючи на зміни частот, карта пропонує подібну обчислювальну потужність - 28 Терафлопс половинної точності, 14 Терафлопс одинарної точності і 7 ТЕРАФЛОПС подвійної точності (в версії SXM2 це відповідно 30, 15 і 7,5 терафлопс). Обчислювальна потужність при глибокому навчанні у свою чергу складає 112 замість 120 терафлопс. Пропускна здатність пам'яті залишилася без змін і складає до 900 Гб / сек.
Tesla V100 PCIe використовує інтерфейс PCI-Express 3.0 х16, тому при підключенні декількох карт пропускна здатність складає "всього" 32 Гб / сек (в версії SXM2 можна використовувати шину NVLink з пропускною спроможністю 300 Гбіт / сек). Але нижчі частоти вплинули на низьке споживання електроенергії, так як коефіцієнт TDP становить лише 250 замість 300 В.
Модель | Тесла P100 (SXM2) | Тесла P100 (PCIe) | Тесла V100 (SXM2) | Тесла V100 (PCIe) |
покоління | Nvidia Pascal | Nvidia Pascal | Nvidia Volta | Nvidia Volta |
літографія | TSMC 14 нм FinFET |
TSMC 14 нм FinFET |
12 нм TSMC FFN |
12 нм TSMC FFN |
Площа ядра | 610 мм2 | 610 мм2 | 815 мм2 | 815 мм2 |
графічний процесор | Паскаль GP100 | Паскаль GP100 | Вольта GV100 | Вольта GV100 |
Тактова частота ядра | 1480 Мгц | 1300 Мгц | 1455 Мгц | ~ 1370 Мгц |
Обчислювальна потужність FP16 | 21,2 терафлопс | 18,7 терафлопс | 30 терафлопс | 28 терафлопс |
Обчислювальна потужність FP32 | 10,6 терафлопс | 9,3 терафлопс | 15 терафлопс | 14 терафлопс |
Обчислювальна потужність FP64 | 5,3 терафлопс | 4,7 терафлопс | 7,5 терафлопс | 7 терафлопс |
Обчислювальна потужність tensor (глибоке вивчення |
– | – | 120 TFLOPS | 112 терафлопс |
пам'ять відео | 16 ГБ HBM2 4096-bit | 16 ГБ HBM2 4096-bit | 16 ГБ HBM2 4096-bit | 16 ГБ HBM2 4096-bit |
Пропускна здатність пам'яті | 720 Гбіт / сек | 720 Гбіт / сек | 900 Гб / сек | 900 Гб / сек |
Тип карти | мезонін (SXM2) | PCIe 3.0 х16 | мезонін (SXM2) | PCIe 3.0 х16 |
охолодження | пасивне | пасивне | пасивне | пасивне |
TDP | 300 В | 250 В | 300 В | 250 В |
Карта Tesla V100 PCIe повинна бути доступною вже в цьому році – як в асортименті Nvidia, так і компаній партнерів (Hewlett-Packard Enterprise, наприклад, анонсувала три системи, що працюють на основі цієї конструкції).