NVIDIA показала самый мощный чип для ИИ в мире Новости

01.04.2024

Blackwell B200: Революция в мире нейросетей

Blackwell B200 в 4 раза мощнее Hopper H100 и при этом потребляет на 75% меньше энергии во время тренировки нейросетей.

Презентация NVIDIA на GTC 2024

Вчера NVIDIA провела свою значимую презентацию на мероприятии GTC 2024, в рамках которой была представлена новая архитектура Blackwell. Главное внимание получило новейшее устройство для ускорения обучения искусственного интеллекта — Blackwell B200. NVIDIA продемонстрировала, что многие крупные клиенты, такие как Amazon, Microsoft и Google, уже готовы выстраиваться в очередь за новейшим GPU.

Производственный процесс и архитектура Blackwell B200

Как и в случае с предыдущими поколениями, Blackwell B200 производит компания TSMC на улучшенном 4-нанометровом техпроцессе 4NP. Хотя уменьшения техпроцесса не произошло, компания решила увеличить площадь кристалла, что привело к росту количества транзисторов с 80 миллиардов до 104 миллиардов.

Уникальная структура чипа

Полный чип Blackwell B200 состоит из двух базовых GPU, соединенных магистральной линией с пропускной способностью в 10 ТБ/с. Таким образом, совокупно чип содержит 208 миллиардов транзисторов. Вокруг GPU расположено восемь чипов памяти HBM3e суммарной емкостью 192 ГБ. Пропускная способность памяти достигает рекордных 8 ТБ/с.

Blackwell B200

Гибкость и масштабируемость архитектуры

NVIDIA разработала очень гибкую архитектуру, которая позволяет создавать высокопроизводительные системы. GB200 — это решение, объединяющее на одной плате два чипа Blackwell B200 с CPU Grace, обеспечивающее 40 петафлопс производительности в вычислениях AI.

Создание мощных дата-центров

GB200 поддерживает объединение в стеки и серверные стойки GB200 NVL72, которые могут быть объединены в целые дата-центры. Производительность таких дата-центров может быть ограничена только бюджетом, так как базовый чип B200 стоит десятки тысяч долларов.

GB200 Стойки

Эффективность и производительность

Производительность систем GB200 удивляет. Если для обучения нейросети GPT-MoE с 1,8 трлн параметров предыдущему поколения Hopper H100 требовалось 90 дней, 15 мегаватт мощности и 8000 GPU, то с Blackwell B200 для той же задачи потребуется всего 2000 систем GB200 и 4 мегаватта мощности.

НVIDIA добилась увеличения мощности систем в 4 раза при увеличении эффективности в 75%.

Производительность Blackwell B200

Будущее с Blackwell B200

Если предыдущий чип Hopper H100 стал революцией на рынке ускорителей ИИ, то с появлением Blackwell B200 можно ожидать еще более быстрого роста. Системы искусственного интеллекта будут обучаться быстрее, а стоимость этого обучения снизится благодаря более экономному потреблению энергии. Новые возможности и сферы применения ИИ значительно расширяться, что сделает системы ИИ более доступными как для бизнеса, так и для обычных пользователей.