Тензорні ядра NVIDIA – це високопродуктивні ядра, чия потужність досягається завдяки динамічній оптимізації обчислень. У нових тензорних ядер є унікальна перевага: вони прискорюють навчання штучного інтелекту в 10 разів з Tensor Float 32 (TF32) і збільшують швидкість математичних обчислень в 2,5 рази з FP64. Тензорні ядра NVIDIA забезпечують передові можливості для тренування алгоритмів глибокого навчання.
Тензорні ядра NVIDIA дозволяють виконувати операції різної точності: TF32, FP16, INT8 і INT4. Вони забезпечують універсальність та максимальну продуктивність. Тензорні ядра дозволили NVIDIA поставити рекорд у MLPerf 0.5, бенчмарці для інференса штучного інтелекту. Більш того, тензорні ядра також дозволили NVIDIA поставити рекорд у MLPerf 0.6, бенчмарці для навчання алгоритмів штучного інтелекту.
Важливо відзначити те, що без SDK NVIDIA для HPC не було б високопродуктивних обчислень. SDK NVIDIA - це набір основних компіляторів, бібліотек та інструментів для розробки HPC-додатків для платформи NVIDIA. Цей набір значно впливає на розвиток штучного інтелекту, він надає безліч можливостей для розробників.
На даний момент є 3 архітектури, які використовують тензорні ядра – NVIDIA A100, NVIDIA Turing, NVIDIA Volta.
Найпродуктивнішою архітектурою з тензорними ядрами вважається NVIDIA A100. Тензорні ядра підтримують FP64, TF32, bfloat16, FP16, INT8, INT4, INT1, а ядра CUDA FP64, FP32, FP16, bfloat16, INT8. Архітектура NVIDIA A100 скорочує час навчання алгоритмів штучного інтелекту з кількох тижнів до кількох годин. Архітектура NVIDIA Ampere наймогутніша і найуніверсальніша у порівнянні з NVIDIA Turing і NVIDIA Volta.
NVIDIA Turing – друга по продуктивністю архітектура після NVIDIA A100. Тензорні ядра підтримують FP16, INT8, INT4, INT1, а ядра CUDA FP16, INT8, INT4, INT1. Функціоналу цієї архітектури досить для максимально ефективного інференса штучного інтелекту. NVIDIA Turing володіє величезною продуктивністю в порівнянні з NVIDIA Pascal.
NVIDIA Volta – перше покоління тензорних ядер, малофункціональне. Тензорні ядра підтримують тільки FP16, а ядра CUDA FP64, FP32, FP16, INT8. Незважаючи на малофункціональність цієї архітектури, в порівнянні з NVIDIA Pascal вона дуже продуктивна і зручна. Множення матриць FP16 і FP32 показує значний результат у порівнянні з NVIDIA Pascal – пікові показники терафлопс збільшуються у 12 разів, а для інференса у 6 разів.
Тензорні ядра – це той елемент, який штовхає розвиток комп'ютерної техніки вперед. Вони значно полегшили роботу з штучним інтелектом, а також зменшили час, необхідний для його комплексного навчання. Без тензорних ядер не було б максимально реалістичних відеоігор. NVIDIA A100 – найдосконаліша архітектура з тензорними ядрами в 2020 році, яка максимально ефективно взаємодіє зі штучним інтелектом.