Що се отнася до графичните процесори, Nvidia е водещ експерт. Произвеждайки бизнес от 1993 г., Nvidia произвежда широка гама от професионални и потребителски графични процесори с най-високо качество. Уважаваните архитектури на техните процесори стоят зад успеха на техния продукт, особено на основната им линия, GeForce. Графичните процесори на Nvidia излязоха отвъд игровото пространство, разширявайки присъствието си в дълбоко обучение, AI (изкуствен интелект) и ускорен анализ. Nvidia проникна на пазара на центрове за данни преди десетилетие, започвайки с чиповете Fermi. Последваха повторения и компанията непрекъснато пускаше графични процесори, които запълват ненаситното търсене на по-бърза скорост на обработка в центровете за данни. Графичните процесори на Nvidia са се развивали през годините и архитектурният дизайн главно еволюция.
Архитектурата на Ampere на Nvidia
Конкуренцията е сериозно засилена сред производителите на графични процесори, но Nvidia не сдържа нищо, за да заеме първото място. Всъщност Nvidia доминираше на пазара на изкуствен интелект през последното десетилетие. През 2020 г. новината за първия 7nm (8nm за потребителски части) графичен процесор на Nvidia с 54 милиарда транзистора, компресирани в такава малка матрица, предизвика доста шум. Кодово име Ампер след френския математик Андре-Мари Ампер, Архитектурата на процесора на Nvidia има значително подобрение спрямо своите предшественици, Turing и Volta, обещавайки повече функционалности, по-добра ефективност и по-висока производителност при по-ниски нива на мощност. Ampere стои зад второто поколение RTX графични процесори на Nvidia, серията RTX 30 и се казва, че е два пъти по-бърз от аналозите от серията RTX 20. Архитектурата на Ampere също е силата зад графичните процесори на центъра за данни на Nvidia A100.
Спецификации на Ampere
Ampere е първият 7nm / 8nm графичен процесор на Nvidia, второто поколение трасиране на потребителски лъчи и има трето поколение тензорни ядра. Ampere е основната архитектура на графичните процесори GA100, GA102 и GA104, които са вградени в GeForce RTX 3090, RTX 3080, RTX 3070 и наскоро RTX 3060. Nvidia също трябва да пусне RTX 3050 през следващите месеци. Междувременно корпоративният графичен процесор GA100 осигурява 20 пъти повече изчислителна мощност от предишните поколения графични процесори за центрове за данни. Ето преглед на базираните на Ampere Nvidia професионални и потребителски графични процесори [1]:
GPU | GA100 | GA102 | GA102 | GA104 |
---|---|---|---|---|
Графична карта | Nvidia A100 | GeForce RTX 3090 | GeForce RTX 3080 | GeForce RTX 3070 |
Процес (nm) | TSMC N7 | Samsung 8N | Samsung 8N | Samsung 8N |
Транзистори (милиард) | 54 | 28.3 | 28.3 | 17.4 |
Размер на матрицата (mm ^ 2) | 826 | 628.4 | 628.4 | 392.5 |
GPC конфигурация | 8 × 16 | 7 × 12 | 6 × 12 | 6 × 8 |
СМС | 108 | 82 | 68 | 46 |
Ядра на CUDA | 6912 | 10496 | 8704 | 5888 |
RT ядра | Нито един | 82 | 68 | 46 |
Ядра на тензора | 432 | 328 | 272 | 184 |
Усилващ часовник (MHz) | 1410 | 1700 | 1710 | 1730 |
VRAM скорост (Gbps) | 2.43 | 19.5 (GDDR6X) | 19 (GDDR6X) | 14 (GDDR6) |
VRAM (GB) | 40 (48 макс.) | 24 | 10 | 8 |
Ширина на автобуса | 5120 (6144 макс.) | 384 | 320 | 256 |
ROP | 128 | 112 | 96 | 96 |
TMU | 864 | 656 | 544 | 368 |
GFLOPS FP32 | 19492 г | 35686 | 29768 | 20372 |
RT TFLOPS | Няма данни | 69 | 58 | 40 |
Тензор TFLOPS FP16 (оскъден) | 312 (628) | 143 (285) | 119 (238) | 81 (163) |
Честотна лента (GB / s) | 1555 | 936 | 760 | 448 |
TBP (вата) | 400 (250 PCIe) | 350 | 320 | 220 |
Nvidia A100
Nvidia A100 е първият графичен процесор, който използва архитектурата на Ampere. Корпоративният чип е насочен към центрове за данни и е предназначен за интензивни GPU задачи като дълбоко обучение и AI. Построен чрез 7nm процес на TSMC, той събира огромно количество от 54 милиарда транзистори. Той превъзхожда предишните поколения корпоративни графични процесори с 20-кратно увеличение на производителността, включваща 6 912 ядра CUDA, 432 единици за картографиране на текстури, 160 ROP, ядра от трето поколение Tensor и 40 GB VRAM с честотна лента на паметта, която достига до 1.6TB / сек. DGX A100 е първата в света система за изкуствен интелект с клъстер от осем A100 и солидна цена от 199 000 долара.
GeForce RTX 30 Series
Освен доминирането на корпоративния пазар, Nvidia винаги има предвид потребителите, особено геймърите и създателите. Архитектурата на Ampere е възприета и в потребителските графични карти на Nvidia. Второто поколение GeForce RTX носи графичните процесори, базирани на Ampere, повишавайки производителността до два пъти повече от предишното поколение.
В повечето аспекти Ampere притежава повече от два пъти процесорната мощност на Turing. Той е удвоил производителността на шейдър на Тюринг с два пъти повече ядра FP32 CUDA. По-конкретно, той има 30 Shader-TFLOPS, 2.7 пъти повече от тази на Тюринг, която е само 11 Shader-TFLOPS. По същия начин Tensor Core на Turing измерва 89 Tensor-TFLOPS, но Ampere е удвоил повече тази скорост със своите 238 Tensor-TFLOPS. Да не забравяме и неговите Core Tracing Core, които са 58 RT-TFLOPS, 1.7 пъти по-бързо от 34 RT-TFLOPS на Тюринг и за да работят графичните процесори още по-бързо, чипът Ampere се свързва с най-бързата памет в света, Micron G6X.
Серията RTX 30 е направена с помощта на Samsung 8N Nvidia Custom Process с 28 милиарда транзистора за GA102 и 17 милиарда транзистори за GA104. Класът Titan RTX 3090 се захранва от графичния процесор GA102 и осигурява изключително мощна производителност на потребителските карти. За разлика от предишните поколения, RTX 3090 е отворен за трети страни за персонализиран дизайн.
RTX 3080 също използва графичен процесор GA102, предоставяйки двойно по-голяма производителност от RTX 2080 и впечатляваща 4K игрална мощ. RTX 3070, захранван от GA104 GPU, е наравно с RTX 2080 Ti на половин цена. Наскоро пуснатият RTX 3060 също никога не пропуска да впечатли със своята зашеметяваща производителност, задвижвана от усъвършенствани ядра на Ray Tracing, ядра Tensor, нови стрийминг мултипроцесори и високоскоростна G6 памет.
Въпреки огромното увеличаване на производителността, новите графични процесори RTX не са много тежки. Много по-бързите графични карти са лесно достъпни, що се отнася до ценообразуването. Флагманът на Nvidia GeForce, RTX 3080, започва от $ 699, RTX 3070 се продава на цена $ 499, а RTX 3060 има цена от $ 329. RTX 3090 от по-висок клас струва $ 1499; все още е значително по-ниска, като се има предвид производителността на ниво Titan.
Само месеци след пускането му, има недостиг на графични карти, базирани на Ampere, и не е изненада от зашеметяващото представяне на Ampere на разумна цена. За тези, които обмислят надстройка на графичния процесор, сега е най-доброто време да се докопате до графичните процесори, базирани на Ampere на Nvidia.
Източници
[1] Уолтън, Джаред. “Nvidia RTX 30-Series Ampere Architecture Deep Dive: Всичко, което знаем”. https: // www.tomshardware.com / features / nvidia-ampere-architecture-deep-dive. 13 октомври 2020 г.