У вівторок на конференції Nvidia GTC 2025 в Сан-Хосе, Каліфорнія, генеральний директор Дженсен Хуанг (Jensen Huang) представив кілька нових графічних процесорів для прискорення ШІ, які компанія планує випустити в найближчі місяці і роки. Він також розкрив більше специфікацій про раніше анонсовані чіпи.
Центральним анонсом став Vera Rubin, представлений на виставці Computex 2024 і запланований до випуску на другу половину 2026 року. Цей графічний процесор, названий на честь a , матиме десятки терабайт пам’яті та постачатиметься з власним процесором, розробленим Nvidia, під назвою Vera.
За словами Nvidia, Vera Rubin забезпечить значне поліпшення продуктивності в порівнянні зі своїм попередником , особливо для навчання ШІ та висновків.

Vera Rubin має два графічні процесори на одному кристалі, які забезпечують 50 петафлопс продуктивності виведення FP4 на чип. У повній конфігурації в стійці NVL144 система забезпечує 3,6 ексафлопс обчислень виведення FP4 – в 3,3 рази більше, ніж 1,1 ексафлопс Blackwell Ultra в аналогічній конфігурації в стійці.
ЦП Vera має 88 кастомних ядер ARM з 176 потоками, підключених до графічних процесорів Rubin через високошвидкісний інтерфейс NVLink з пропускною здатністю 1,8 ТБ/с.
Хуанг також анонсував Rubin Ultra, який буде представлений у другій половині 2027 року. Rubin Ultra буде використовувати конфігурацію стійки NVL576 і оснащений окремими графічними процесорами з чотирма матрицями розміром з приціл, забезпечуючи 100 петафлопс точності FP4 (4-розрядний формат з плаваючою комою, який використовується для представлення і обробки чисел в моделях ШІ) на чіп.
На рівні стійки Rubin Ultra забезпечить 15 ексафлопс обчислень виводу FP4 і 5 ексафлопс продуктивності навчання FP8 – приблизно в чотири рази більше, ніж конфігурація Rubin NVL144. Кожен графічний процесор Rubin Ultra матиме 1 ТБ пам’яті HBM4e, а повна стійка міститиме 365 ТБ швидкої пам’яті.

У найближчому майбутньому Nvidia випустить Blackwell Ultra B300 у другій половині 2025 року. Цей чіп має два графічні процесори, що забезпечують 15 петафлопс щільної обчислювальної продуктивності FP4 на чіп. У повній конфігурації в стійці NVL72 Blackwell Ultra забезпечить 1,1 екзафлопс щільних обчислень FP4 – в 5 разів більше, ніж поточна конфігурація Blackwell B200. Кожен графічний процесор B300 має 288 ГБ пам’яті HBM3e в порівнянні з 192 ГБ у Blackwell.

Хуанг коротко згадав про архітектуру графічного процесора наступного покоління під назвою “Feynman”, названу на честь американського фізика-теоретика. Він надав небагато додаткових деталей про дизайн і можливості Feynman, зазначивши лише, що в ньому буде використовуватися процесор “Vera” замість очікуваного “Richard”, виходячи з шаблону іменування, і що він з’явиться десь у 2028 році.

Під час виступу Хуанг також виклав оптимістичну дорожню карту майбутнього ШІ, успіх якого життєво пов’язаний з подальшим успіхом його компанії, де він назвав центри обробки даних “”, які виробляють токени (одиниці даних, які в даний час обробляють моделі ШІ) замість фізичних об’єктів. Він поділився своїм баченням майбутнього “фізичного ШІ”, який одного дня дасть змогу людиноподібним роботам виконувати роботу, подібну до людської. Наразі Nvidia допомагає моделям ШІ, що керують роботами, тренуватися у віртуальних світах.
Тим часом Хуанг припустив, що чіпи Nvidia незабаром забезпечуватимуть роботу “10 мільярдів цифрових агентів”, які виконуватимуть корисну роботу для людей, і зазначив, що до кінця цього року 100 відсотків інженерів Nvidia отримуватимуть допомогу від моделей ШІ.


