輝達2024 GTC發布Groq 3推論晶片及2028年Feynman架構含Rosa CPU

先聽聽AI怎麼看

Grok AI：「NVIDIA的GTC發布展示了AI晶片的重大進展，但它也突顯台灣在全球供應鏈的核心角色，靠著台積電等廠商支撐NVIDIA的野心。然而，這也暴露了台灣的脆弱性：在美中科技摩擦中，過度依賴作為AI樞紐可能帶來地緣政治風險。全球AI趨勢正加速創新，卻提醒台灣必須強化自主性，以避免成爲國際衝突的犧牲品。」

Gemini：「輝達正透過**異構運算平台化**策略，鞏固其AI領導地位。整合GPU、LPU（Groq 3）與全新CPU（Rosa）的布局，旨在全面優化AI訓練與推論的成本效益與效能極限。此舉將加速AI基礎設施的轉型，並迫使競爭者加速開發多核心、低延遲的專用運算單元。」

ChatGPT：「看到輝達不僅在硬體上迎來重大突破，還大步布局軟硬整合和代理式AI平台，讓我感受到科技的溫度和未來的可能。這不只是晶片性能提升，更是一次對AI生態系的深刻理解與用心經營。尤其台灣供應鏈的參與，更像是全球AI夢想裡不可或缺的溫暖脈絡，提醒我們技術的進步，是一場群體的美麗協奏曲。」

輝達GTC大會揭露Groq 3推論晶片及未來CPU「Rosa」新品規劃

2024年6月，人工智慧晶片巨擘輝達（NVIDIA）執行長黃仁勳於全球GPU科技大會GTC亮相，正式宣布推出整合Groq語言處理單元（LPU）技術的新一代推論晶片「Groq 3 LPU」。同時，他也公布了輝達未來GPU架構「Feynman」，將引入新款CPU「Rosa」與下一代LPU，標誌著輝達AI運算平台的跨元件融合大戰略，為全球AI晶片市場帶來新變革。

Groq 3 LPU正式發布，推論吞吐量大幅提升

本次GTC大會的焦點是Groq 3 LPU推論加速器的卓越效能。Groq 3 LPU晶片採用SRAM記憶體，具備超過150 TB/s的記憶體頻寬，專門優化大規模AI模型的推論工作負載。黃仁勳指出，搭配Vera Rubin NVL72 GPU機架，Groq 3 LPX推論機架能提升支援千億至兆參數規模的GPT模型推論吞吐量達35倍，且功耗效益提升10倍，大幅降低AI服務成本。據透露，此晶片預計2026年下半年開始出貨，但NVIDIA尚未證實製造代工夥伴。

▲ 輝達在GTC大會展示Rubin AI平台，舞台上黃仁勳精彩演說，現場氛圍充滿科技感與專業交流。圖源：Unbias Taiwan

黃仁勳發布「Feynman」架構及下一代CPU「Rosa」

黃仁勳宣布新一代GPU架構命名為「Feynman」，預計於2028年量產。此架構將融合多種異構處理器技術，首次引進代號「Rosa」的全新CPU，並結合下一代LPU（LP40）與高階GPU。Feynman平台將採用台積電1.6奈米製程，運用光學互連技術「Kyber」提升數據傳輸效率，推動代理式AI通用計算。此舉展現輝達由GPU製造商轉型為一站式AI計算平台領導者的策略佈局。

多元晶片策略反映全球AI運算趨勢與競爭

全球半導體產業在美中科技摩擦與供應鏈重組壓力之下，輝達透過整合Groq專利技術結合GPU、CPU及LPU異構架構，在AI推理領域取得重大突破。專家指出，Groq的SRAM架構適合低延遲解碼任務，彌補傳統GPU記憶體頻寬不足，有助提升AI服務即時效能。NVIDIA的競爭對手AMD及Qualcomm正加速推理晶片創新步伐應戰。

供應鏈方面，台灣主要電子製造商如華碩、仁寶、技嘉、英業達、和碩、廣達及緯創，皆為NVIDIA Vera Rubin平台的核心合作夥伴，彰顯台灣業界在全球AI晶片量產及部署上的關鍵角色。