Тензорные ядра NVIDIA – это высокопроизводительные ядра, чья мощность достигается благодаря динамической оптимизации вычислений. У новых тензорных ядер есть уникальное преимущество: они ускоряют обучение ИИ в 10 раз с Tensor Float 32 (TF32) и увеличивают скорость математических вычислений в 2,5 раза с FP64. Тензорные ядра NVIDIA обеспечивают передовые возможности для тренировки алгоритмов глубокого обучения.
Тензорные ядра NVIDIA позволяют выполнять операции различной точности: TF32, FP16, INT8 и INT4. Они обеспечивают универсальность и максимальную производительность. Тензорные ядра позволили NVIDIA поставить рекорд в MLPerf 0.5, бенчмарке для инференса ИИ. Более того, тензорные ядра также позволили NVIDIA поставить рекорд в MLPerf 0.6, бенчмарке для обучения алгоритмов ИИ.
Важно отметить то, что без SDK NVIDIA для HPC не было бы высокопроизводительных вычислений. SDK NVIDIA – это набор основных компиляторов, библиотек и инструментов для разработки HPC-приложений для платформы NVIDIA. Этот набор значительно влияет на развитие искусственного интеллекта, он предоставляет множество возможностей для разработчиков.
На данный момент есть 3 архитектуры, которые используют тензорные ядра – NVIDIA A100, NVIDIA Turing, NVIDIA Volta.
Самой производительной архитектурой с тензорными ядрами считается NVIDIA A100. Тензорные ядра поддерживают FP64, TF32, bfloat16, FP16, INT8, INT4, INT1, а ядра CUDA FP64, FP32, FP16, bfloat16, INT8. Архитектура NVIDIA A100 сокращает время обучения алгоритмов ИИ с пары недель до пары часов. Архитектура NVIDIA Ampere самая мощная и самая универсальная по сравнению с NVIDIA Turing и NVIDIA Volta.
NVIDIA Turing – вторая по производительности архитектура после NVIDIA A100. Тензорные ядра поддерживают FP16, INT8, INT4, INT1, а ядра CUDA FP16, INT8, INT4, INT1. Функционала этой архитектуры достаточно для максимально эффективного инференса ИИ. NVIDIA Turing обладает огромной производительность по сравнению с NVIDIA Pascal.
NVIDIA Volta – первое поколение тензорных ядер, малофункциональное. Тензорные ядра поддерживают только FP16, а ядра CUDA FP64, FP32, FP16, INT8. Несмотря на малофункциональность этой архитектуры, по сравнению с NVIDIA Pascal она очень производительна и удобна. Умножение матриц FP16 и FP32 показывает значительный результат по сравнению с NVIDIA Pascal - пиковые показатели Терафлопс увеличиваются до 12 раз, а для инференса до 6 раз.
Тензорные ядра – это тот элемент, который толкает развитие компьютерной техники вперед. Они значительно облегчили работу с искусственным интеллектом, а также уменьшили время, необходимое для его комплексного обучения. Без тензорных ядер не было бы максимально реалистичных видеоигр. NVIDIA A100 – самая совершенная архитектура с тензорными ядрами в 2020 году, которая максимально эффективно взаимодействует с искусственным интеллектом.