Blackwell B200: Революция в мире нейросетей
Blackwell B200 в 4 раза мощнее Hopper H100 и при этом потребляет на 75% меньше энергии во время тренировки нейросетей.
Презентация NVIDIA на GTC 2024
Вчера NVIDIA провела свою значимую презентацию на мероприятии GTC 2024, в рамках которой была представлена новая архитектура Blackwell. Главное внимание получило новейшее устройство для ускорения обучения искусственного интеллекта — Blackwell B200. NVIDIA продемонстрировала, что многие крупные клиенты, такие как Amazon, Microsoft и Google, уже готовы выстраиваться в очередь за новейшим GPU.
Производственный процесс и архитектура Blackwell B200
Как и в случае с предыдущими поколениями, Blackwell B200 производит компания TSMC на улучшенном 4-нанометровом техпроцессе 4NP. Хотя уменьшения техпроцесса не произошло, компания решила увеличить площадь кристалла, что привело к росту количества транзисторов с 80 миллиардов до 104 миллиардов.
Уникальная структура чипа
Полный чип Blackwell B200 состоит из двух базовых GPU, соединенных магистральной линией с пропускной способностью в 10 ТБ/с. Таким образом, совокупно чип содержит 208 миллиардов транзисторов. Вокруг GPU расположено восемь чипов памяти HBM3e суммарной емкостью 192 ГБ. Пропускная способность памяти достигает рекордных 8 ТБ/с.
Гибкость и масштабируемость архитектуры
NVIDIA разработала очень гибкую архитектуру, которая позволяет создавать высокопроизводительные системы. GB200 — это решение, объединяющее на одной плате два чипа Blackwell B200 с CPU Grace, обеспечивающее 40 петафлопс производительности в вычислениях AI.
Создание мощных дата-центров
GB200 поддерживает объединение в стеки и серверные стойки GB200 NVL72, которые могут быть объединены в целые дата-центры. Производительность таких дата-центров может быть ограничена только бюджетом, так как базовый чип B200 стоит десятки тысяч долларов.
Эффективность и производительность
Производительность систем GB200 удивляет. Если для обучения нейросети GPT-MoE с 1,8 трлн параметров предыдущему поколения Hopper H100 требовалось 90 дней, 15 мегаватт мощности и 8000 GPU, то с Blackwell B200 для той же задачи потребуется всего 2000 систем GB200 и 4 мегаватта мощности.
НVIDIA добилась увеличения мощности систем в 4 раза при увеличении эффективности в 75%.
Будущее с Blackwell B200
Если предыдущий чип Hopper H100 стал революцией на рынке ускорителей ИИ, то с появлением Blackwell B200 можно ожидать еще более быстрого роста. Системы искусственного интеллекта будут обучаться быстрее, а стоимость этого обучения снизится благодаря более экономному потреблению энергии. Новые возможности и сферы применения ИИ значительно расширяться, что сделает системы ИИ более доступными как для бизнеса, так и для обычных пользователей.