Tesla V100 это самый мощный ускоритель, который ускорит развитие вычислений высокой производительности и искусственного интеллекта.
Месяц назад Nvidia представила бейне карта Tesla V100, первый ускоритель нового поколения Volta – тогда еще в виде карты типа Mezzanine (SXM2). Теперь в ассортименте производителя появилась его версия под стандартный разъем PCI-Express x16.
Tesla V100 PCIe также использует графический процессор Volta GV100 с 5120 потоковыми процессорами и 640 ядрами tensor и 16 ГБ памяти HBM2 4096-bit. Изменилась тактовая частота ядра, потому как работает максимум с частотой около 1370 МГц (в версии SXM2 это 1455 МГц).
Ядро Volta GV100 состоит из 80 блоков SM, которые в совокупности дают 5120 ағындық процессорлар. Новинкой же являются 640 единиц tensor core, которые используются для машинного обучения и построения нейронных сетейНесмотря на изменения частот, карта предлагает подобную вычислительную мощность – 28 ТЕРАФЛОПС половинной точности, 14 ТЕРАФЛОПС одинарной точности и 7 ТЕРАФЛОПС двойной точности (в версии SXM2 это соответственно 30, 15 және 7,5 ТЕРАФЛОПТАР). Вычислительная мощность при глубоком обучении в свою очередь составляет 112 орнына 120 ТЕРАФЛОПТАР. Пропускная способность памяти осталась без изменений и составляет до 900 ГБ/сек.
Tesla V100 PCIe использует интерфейс PCI-Express 3.0 x16, поэтому при подключении нескольких карт пропускная способность составляет „всего” 32 ГБ/сек (в версии SXM2 можно использовать шину NVLink с пропускной способностью 300 ГБИТ/сек). Но более низкие частоты повлияли на низкое потребление электроэнергии, так как коэффициент TDP составляет только 250 орнына 300 IN.
Үлгі | Tesla P100 (SXM2) | Tesla P100 (PCIe) | Tesla V100 (SXM2) | Tesla V100 (PCIe) |
Буын | Nvidia Pascal | Nvidia Pascal | Nvidia Volta | Nvidia Volta |
Литография | TSMC 14 nm FinFET |
TSMC 14 nm FinFET |
12 нм TSMC FFN |
12 нм TSMC FFN |
Площадь ядра | 610 мм2 | 610 мм2 | 815 мм2 | 815 мм2 |
GPU | Pascal GP100 | Pascal GP100 | Volta GV100 | Volta GV100 |
Негізгі сағат жылдамдығы | 1480 МГц | 1300 МГц | 1455 МГц | ~1370 Мгц |
Вычислительная мощность FP16 | 21,2 ТЕРАФЛОПТАР | 18,7 ТЕРАФЛОПТАР | 30 ТЕРАФЛОПТАР | 28 ТЕРАФЛОПТАР |
Вычислительная мощность FP32 | 10,6 ТЕРАФЛОПТАР | 9,3 ТЕРАФЛОПТАР | 15 ТЕРАФЛОПТАР | 14 ТЕРАФЛОПТАР |
Вычислительная мощность FP64 | 5,3 ТЕРАФЛОПТАР | 4,7 ТЕРАФЛОПТАР | 7,5 ТЕРАФЛОПТАР | 7 ТЕРАФЛОПТАР |
Вычислительная мощность tensor (Deep Learning |
– | – | 120 TFLOPS | 112 ТЕРАФЛОПТАР |
Бейне жады | 16 ГБ HBM2 4096-bit | 16 ГБ HBM2 4096-bit | 16 ГБ HBM2 4096-bit | 16 ГБ HBM2 4096-bit |
Жад өткізу қабілеттілігі | 720 ГБИТ/сек | 720 ГБИТ/сек | 900 ГБ/сек | 900 ГБ/сек |
Тип карты | Mezzanine (SXM2) | PCIe 3.0 x16 | Mezzanine (SXM2) | PCIe 3.0 x16 |
Охлаждение | пассивное | пассивное | пассивное | пассивное |
TDP | 300 IN | 250 IN | 300 IN | 250 IN |
Карта Tesla V100 PCIe должна быть доступной уже в этом году – как в ассортименте Nvidia, так и компаний партнеров (Hewlett-Packard Enterprise, мысалы, анонсировала три системы, работающие на основе этой конструкции).