Тензорные ядра NVIDIA – уникальное изобретение, которое дало начало многим инновационным технологиям. Ядра осуществляют максимально точные и быстрые вычисления. Они автоматически оптимизируют свою работу, чтобы оптимально улучшить качество результата. Однако так было в предыдущем поколении тензорных ядер. Третье поколение – это что-то невообразимо производительное и новое.
Третье поколение тензорных ядер имеет большее количество возможностей по сравнению со вторым поколением. Например, новые ядра уменьшают общее время тренировки алгоритмов искусственного интеллекта в 10 раз с TF32 и ускоряют высокопроизводительные вычисления в 2,5 раза с FP64.
Тензорные ядра третьего поколения заметно изменили высокопроизводительные вычисления. Поскольку эти ядра основа современной науки, они помогли осуществить множество новых открытий. Новые ядра выполняют любые операции, даже FP64. Они увеличивают количество выполняемых вычислений за определенный промежуток времени и при этом сохраняют оптимальную точность.
Компания разработала SDK для высокоскоростных вычислений – набор компиляторов, библиотек и инструментов, которые оптимизируют время разработки специализированных приложений.
Тензорные ядра третьего поколения используются в архитектуре Ampere (линейка видеокарт RTX 30). A 100 (NVIDIA Ampere) заметно увеличивает производительность, поддерживает весь спектр операций: TF32, FP64, FP16, INT8 и INT4. Такой подход упрощает процесс внедрения искусственного интеллекта в нашу повседневную жизнь и помогает извлекать преимущества для HPC.
Кстати, A100 предлагает более высокую точность TF32, работающую также как и FP32, но до 20 раз ускоряя инференс искусственного интеллекта (без потребности внесения изменений в код).
Для наглядности сравним возможности тензорных ядер в 3 разных архитектурах:
- A100 – FP64, TF32, bfloat16, FP16, INT8, INT4, INT1.
- Turing – FP16, INT8, INT4, INT1.
- Volta – FP16.
Как мы видим, тензорные ядра A100 очень сильно эволюционировали по сравнению с предыдущими поколениями. Их функционал значительно вырос, также как и мощность. С ядрами CUDA та же ситуация – A100 поддерживает FP64, FP32, FP16, bfloat16, INT8.
Тензорные ядра третьего поколения – основа современных дата-центров, созданная компанией NVIDIA и позволяющая получать результаты в реальном времени и создавать решения на различных устройствах.