Під час конференції Cloud Next, яка відбулася цього тижня, Google представила останнє покоління свого чіпа прискорювача ШІ TPU.
Новий чіп, який отримав назву Ironwood, є сьомим поколінням TPU від Google і першим, оптимізованим для інференції – тобто запуску моделей ШІ. Запланований до запуску в кінці цього року для клієнтів Google Cloud, Ironwood буде доступний у двох конфігураціях: кластер на 256 чіпів і кластер на 9216 чіпів.
<"Ironwood - це наш найпотужніший, найпродуктивніший та найенергоефективніший TPU, - написав віце-президент Google Cloud Амін Вахдат у блозі, наданому TechCrunch. "І він спеціально створений для роботи з мислячими, вивідними моделями штучного інтелекту в масштабах".
Ironwood має вдосконалене спеціалізоване ядро SparseCore для обробки типів даних, поширених у робочих навантаженнях “розширеного ранжування” та “рекомендацій” (наприклад, алгоритм, який пропонує одяг, що може вам сподобатися). Архітектура TPU була розроблена для мінімізації руху даних і затримок на чіпі, що призводить до економії електроенергії, заявляють в Google. Google планує інтегрувати Ironwood зі своїм Гіперкомп’ютером штучного інтелекту, модульним обчислювальним кластером в Google Cloud, найближчим часом, додав Вахдат. <"Ironwood являє собою унікальний прорив в епоху висновків, - сказав Вахдат, - зі збільшеною обчислювальною потужністю, об'ємом пам'яті, ... мережевими досягненнями та надійністю". Оновлено о 10:45 за тихоокеанським часом: У попередній версії цієї статті було помилково названо Cobalt 100 від Microsoft чипом штучного інтелекту. Насправді Cobalt 100 – це чіп загального призначення; Maia 100 від Microsoft – це чіп для ШІ. Ми виправили посилання. 
<Згідно з внутрішнім бенчмаркінгом Google, Ironwood може забезпечити 4 614 TFLOPs обчислювальної потужності на піку. Кожен чіп має 192 ГБ виділеної оперативної пам'яті з пропускною здатністю, що наближається до 7,4 Тбіт/с.


