Tesla V100 это самый мощный ускоритель, который ускорит развитие вычислений высокой производительности и искусственного интеллекта.
Месяц назад Nvidia представила видеокарту Tesla V100, первый ускоритель нового поколения Volta – тогда еще в виде карты типа Mezzanine (SXM2). Теперь в ассортименте производителя появилась его версия под стандартный разъем PCI-Express x16.
Tesla V100 PCIe также использует графический процессор Volta GV100 с 5120 потоковыми процессорами и 640 ядрами tensor и 16 ГБ памяти HBM2 4096-bit. Изменилась тактовая частота ядра, потому как работает максимум с частотой около 1370 Мгц (в версии SXM2 это 1455 Мгц).
Ядро Volta GV100 состоит из 80 блоков SM, которые в совокупности дают 5120 потоковых процессоров. Новинкой же являются 640 единиц tensor core, которые используются для машинного обучения и построения нейронных сетейНесмотря на изменения частот, карта предлагает подобную вычислительную мощность – 28 ТЕРАФЛОПС половинной точности, 14 ТЕРАФЛОПС одинарной точности и 7 ТЕРАФЛОПС двойной точности (в версии SXM2 это соответственно 30, 15 и 7,5 ТЕРАФЛОПС). Вычислительная мощность при глубоком обучении в свою очередь составляет 112 вместо 120 ТЕРАФЛОПС. Пропускная способность памяти осталась без изменений и составляет до 900 ГБ/сек.
Tesla V100 PCIe использует интерфейс PCI-Express 3.0 x16, поэтому при подключении нескольких карт пропускная способность составляет „всего” 32 ГБ/сек (в версии SXM2 можно использовать шину NVLink с пропускной способностью 300 ГБИТ/сек). Но более низкие частоты повлияли на низкое потребление электроэнергии, так как коэффициент TDP составляет только 250 вместо 300 В.
Модель | Tesla P100 (SXM2) | Tesla P100 (PCIe) | Tesla V100 (SXM2) | Tesla V100 (PCIe) |
Поколение | Nvidia Pascal | Nvidia Pascal | Nvidia Volta | Nvidia Volta |
Литография | TSMC 14 нм FinFET |
TSMC 14 нм FinFET |
12 нм TSMC FFN |
12 нм TSMC FFN |
Площадь ядра | 610 мм2 | 610 мм2 | 815 мм2 | 815 мм2 |
Графический процессор | Pascal GP100 | Pascal GP100 | Volta GV100 | Volta GV100 |
Тактовая частота ядра | 1480 Мгц | 1300 Мгц | 1455 Мгц | ~1370 Мгц |
Вычислительная мощность FP16 | 21,2 ТЕРАФЛОПС | 18,7 ТЕРАФЛОПС | 30 ТЕРАФЛОПС | 28 ТЕРАФЛОПС |
Вычислительная мощность FP32 | 10,6 ТЕРАФЛОПС | 9,3 ТЕРАФЛОПС | 15 ТЕРАФЛОПС | 14 ТЕРАФЛОПС |
Вычислительная мощность FP64 | 5,3 ТЕРАФЛОПС | 4,7 ТЕРАФЛОПС | 7,5 ТЕРАФЛОПС | 7 ТЕРАФЛОПС |
Вычислительная мощность tensor (Deep Learning |
– | – | 120 TFLOPS | 112 ТЕРАФЛОПС |
Память видео | 16 ГБ HBM2 4096-bit | 16 ГБ HBM2 4096-bit | 16 ГБ HBM2 4096-bit | 16 ГБ HBM2 4096-bit |
Пропускная способность памяти | 720 ГБИТ/сек | 720 ГБИТ/сек | 900 ГБ/сек | 900 ГБ/сек |
Тип карты | Mezzanine (SXM2) | PCIe 3.0 x16 | Mezzanine (SXM2) | PCIe 3.0 x16 |
Охлаждение | пассивное | пассивное | пассивное | пассивное |
TDP | 300 В | 250 В | 300 В | 250 В |
Карта Tesla V100 PCIe должна быть доступной уже в этом году – как в ассортименте Nvidia, так и компаний партнеров (Hewlett-Packard Enterprise, например, анонсировала три системы, работающие на основе этой конструкции).