獨家對話天數智芯呂堅平:一家實現2億營收的中國GPU晶元獨角獸是如何煉成的

图片alt

盡管下游需求出現波動,資本市場不斷承壓,但半導體產業的投融資情緒依然處於高位。

近日,鈦媒體App 從企查查方面獲悉,2021年,中國晶元半導體賽道投融資事件為492起,披露融資總金額超3876億元人民幣,同比增長253.1%。而2022年前三個月,晶元行業投融資事件共310起,是2021年同期的4.6倍,披露融資總額超350億元。

“這段時間(部分)半導體股可能會跌,主要原因包括,過去全球半導體產業體系,是圍繞智能手機轉的,如今當手機(消費電子)需求量降低後,晶元半導體產業整體會看起來低落;而且國內半導體產業本來就是要看久一些,這是一個回收成本周期很長的產業,股市不瞭解半導體行業走向。”天數智芯首席技術官(CTO)呂堅平博士接受鈦媒體App獨家採訪表示,經過長時間的堅持,如今半導體好不容易走向正軌,需要良性發展。

實際上,晶元是一個典型的受資本周期影響的行業,處於“需求過熱—投資擴張—產能過剩—投資回落—下一輪需求過熱”這樣的往復循環當中。拉通來看,晶元行業在一個周期中的整體回報率是不高的。

呂堅平強調,半導體一定是一個長期技術積累,以及收割期長的產業體系,大家應該要走正確的路,不要被資本或互聯網模式帶偏。

呂堅平任職的天數智芯,是中國第一家通用GPU(GPGPU)雲端晶元及超級算力系統提供商。公司現任董事長兼CEO刁石京,曾任工信部電子信息司司長、紫光集團聯席總裁等。2021年3月,天數智芯完成C輪12億元融資,投資方包括大鉦資本、沄柏資本、粵民投資管、聯通資本等。根據長城戰略咨詢以及CB Insights發布的最新報告顯示,天數智芯已成為全球獨角獸企業。

同年的3月31日,天數智芯發布全自研的通用GPU“天垓100”晶元及天垓100加速卡,成為中國唯一量產的通用GPU產品。

呂堅平畢業於耶魯大學並獲電腦科學博士學位。去年9月加入天數智芯之前,他曾任三星全球副總裁、聯發科資深總監、英偉達全球資深GPU架構師、高級架構經理等職務,擁有近30年晶元研發技術經驗,是GPU技術領域的專家。

今年4月1日,天數智芯宣佈,目前天垓100產品累計訂單金額已經接近2億元,覆蓋新華三等多個頭部企業。而且,天垓100已支撐近百個客戶在人工智慧(AI)領域進行超過兩百個不同種類模型訓練,性能接近國際市場主流產品。

本次鈦媒體App獨家專訪中,呂堅平博士向我們詳細闡述了天數智芯在技術與產品、人才、商業化方面的方案與進展,詳細闡述天數智芯這家中國GPU晶元公司,到底是如何實現2億營收,並擠進行業頭部的。

堅持自研通用GPU體系思路,下一代晶元今年量產

2021年3月31日,天數智芯正式發布7nm 通用GPU(GPGPU)“天垓100”晶元及天垓100加速卡。

通用GPU(GPGPU),也有人稱之為GP2U(GP的兩次方U)。兩個GP代表着不同的含義:後邊的GP表示圖形處理(Graphics Processing ),和U組合一起是GPU(圖形處理器);前一個GP則表示“通用目的”(General Purpose)。

自從英偉達推出首款GPU晶元,以及隨着GPU晶元技術不斷演進,逐漸進化出越來越多的通用屬性,也即可編程性,實現高性能異構計算。最終,通用GPU這種解決方案成為行業新的發展方向。
通用GPU與AI、圖形關系圖(來源:受訪者提供)

通用GPU與AI、圖形關系圖(來源:受訪者提供)

據介紹,天垓100晶元基於7nm工藝,採用全自研的架構、計算核、指令集及基礎軟體棧,2.5D CoWoS晶圓封裝技術,包括240億個晶體管,據稱能以同類產品1/2的晶元面積、更低的功耗,提供匹敵主流廠商產品的性能。

天數智芯堅持自研通用GPU體系思路,天垓100適配x86、ARM、MIPS等架構CPU指令集,業界標準的軟體API(應用程序編程介面)支持垂直類行業應用開發,支持國內外各種深度學習開發框架,以及軟硬體全棧支持等,廣泛應用於互聯網、運營商、生物醫療、教育科研、智算中心等不同行業眾多應用場景。

如生物醫療領域,天垓100能夠支持基因檢測、X光圖像識別、遠程腸胃鏡圖像識別等應用場景;智能安防領域,天垓100能夠支持視頻圖像分析、監控物體識別、跨街區事件分析、物品檢測等應用場景;智慧教育領域,天垓100能夠滿足姿態識別及糾正、智能教學等。

不過,行業內有一種觀點認為,相比於英偉達長期實踐的GPU大晶元,通用GPU技術與產品表現上難度不大,更像是AI 加速器。但呂堅平指出,這種看法是錯誤的。

“我覺得廣意的GPU有三大挑戰:一是圖形的硬體基礎,二是(從手機,桌面到)數據中心等場景需要的可擴充性,三是通用計算性。這三個技術都很難,尤其我們團隊大部分都在解決後面兩個問題。”呂堅平對鈦媒體App表示,不管是GPU,還是DPU、IPU晶元,都屬於高精尖技術領域,很難用是否容易來簡單形容。

呂堅平強調,天數智芯研發的天垓100就是GPU晶元,並非外界認知的 AI 加速器產品。
天數智芯CTO 呂堅平博士(來源:受訪者提供)

天數智芯CTO 呂堅平博士(來源:受訪者提供)

呂堅平表示,天數智芯堅持走自研通用GPU體系思路,不受國外IP制約,研發團隊一半以上都在做演算法技術調試,可以為客戶提供更安全的技術保障。天眼查顯示,天數智芯旗下專利信息和著作權共79件。

關於下一代晶元產品,呂堅平透露,新品會沿用天垓100 自研架構,其中AI推理晶元“智鎧100”今年5月回片,預定今年量產;天垓200將在今年底流片,明年量產;今年團隊將利用天垓100加速卡組成的計算集群,不斷獲取新客戶及提高交付量。預計2024年,天數智芯將量產AI與圖形融合的通用GPU晶元“天垓300”。

“我們不會跟隨英偉達路線,要走出自己的一條路,後期計算、AI、圖形融合發展一定是重要發展路徑,也是客戶未來的根本需求所在。”呂堅平說。

擁有頂尖CTO和完整的端到端研發團隊

當“金三銀四”來臨時,互聯網大廠裁員、90後不想工作而回歸校園、考公務員,成為了社會的新課題,也是半導體產業的新現象。

據半導體行業協會數據顯示,2020年,中國直接從事集成電路產業的人員約54.1萬人,預計到2023年前後,全行業人才需求將達到76.65萬人左右,但其中有經驗的行業專家,和應用技術研發人才嚴重不足。

呂堅平對鈦媒體App表示,人才不足的主要原因,在於國內沒有一個良好的產學研體系,集成電路教育存在“一窩蜂”現象。尤其下游製造端需要化工人才,但現在有相關技術經驗的人才越來越少。

他認為,很多年輕技術人員沒有實際經驗,也沒有累積技術失敗的過程,就難以領導晶元研發。而晶元設計不能靠幾個少數的領頭人就能解決問題。此外,畢業人才直接在晶元領域創業,做PPT拿到資本支持,本身就違背行業規律。

图片alt

“我覺得核心還是在於人才的虛浮、不合理的估值。目前晶元行業的畢業生,能拿到最高三倍的薪水,甚至亂開價。”呂堅平表示,從技術人才搭建來說,通常具有多次在成功與挫敗中不斷歷練成長的二、三十年的經驗,才能成為晶元行業頂尖領導人才。

呂堅平告訴鈦媒體App,公司各個環節上的各種崗位都非常需要大量人才,包括性能優化工程師、IC驗證工程師等。

目前,天數智芯團隊規模超300人,其中研發團隊占比公司總人數80%以上,既有一批行業經驗超過20年的世界級技術專家,也有一批擁有10年以上業界經驗的核心技術骨乾。

“天數智芯擁有全球頂尖的CTO和完整的端到端研發團隊,提出AI與圖形融合的發展新思路。”天數智芯認為,這是其最大的人才獨特優勢。因為晶元產品的流片到量產,需要完整團隊有成熟的流片經驗,而團隊是具備的。

呂堅平表示,晶元產業不僅是製造業,更是腦力密集型產業。

“晶元從一個設計變成多個,是製造業。但對於晶元設計來說,我認為更是腦力密集型產業,因為它有智能軟體虛擬體系,經過一些工具鏈,把軟體轉成晶體管,還需要保持溫度下進行驗證,這一步驟比製造部分更重要。”他對鈦媒體App表示。

呂堅平強調,“晶元人才的薪資貴,不僅是行業熱潮來臨,更是腦力密集這個過程被產業所關註。最後製造封裝中,只有大量生產才能賺回腦力的投資、成本,所以很多人都想做晶元設計。”

從底層到軟體實現獨立開發,確保自主知識產權

此前有國內外媒體報道,部分國內企業量產的GPU晶元,IP(知識產權)方面並非自研,而是採購了英國晶元設計商Imagination公司的授權,從而晶元研發周期從3-5年,大大縮短至18個月內。

對此,呂堅平表示,目前很多公司GPU核心之外,都是取自國外GPU IP授權,而且這種IP並非買斷式,更多是花錢在固定的時限內使用授權。

“國內很多企業都在採用GPU IP 授權,但這種晶元並非產業自主,而且海外 IP也很難保障國內客戶的信息安全。”呂堅平對鈦媒體App表示,中國GPU賽道不能忽視“開發全自主、技術廣通用”重要性。

從天數智芯自身來看,呂堅平表示,他們團隊從底層硬體到上層軟體獨立設計開發,一行一行地寫代碼來實現GPU的核心功能。“不拿國外GPU IP授權的捷徑,才能確保完全自主知識產權,掌握未來發展的自主性。”

而他也認為,從底層到軟體實現獨立開發、確保自主知識產權的整個過程需要行業一起來執行。

在呂堅平看來,中國GPU產業要實現快速發展,GPU企業之間需要自主創新、深層合作及良性競爭。

图片alt

天數智芯在2021世界人工智慧大會上展示首款通用GPU晶元“天垓100”(來源:由鈦媒體App編輯拍攝)

據悉,此前英偉達發布的最新H100 GPU,是通過DSA(領域專用架構)帶來性能加倍。在製程以外,相較於A100貢獻30%效能提升。

呂堅平認為,這種DSA優化趨勢是GPU長久以來的一種底層基礎演化方向,並非所謂人工智慧DSA晶元所獨有。但在GPU框架下,DSA能與GPU編程生態兼容,達到DSA通用化。國內GPU發展還需要不斷探索自己DSA通用化方向。而更多GPU晶元企業應該與國內客戶合作,做出適合國內市場的DSA通用化,實現國內自主發展優勢。

盡管互聯網廠商都在投資或自研晶元,但呂堅平指出,從全球規模來說,目前只有蘋果公司做在晶元領域發展壯大。

“蘋果的特色就是內需非常強,內需就足以支撐晶元開發的風險跟投資。”呂堅平表示。

對於良性競爭話題,呂堅平對鈦媒體App表示,行業存在一些“良幣驅逐劣幣”的現象,他認為這應該避免,且需要良性看待行業長期發展。

他表示:“中國企業要想在GPU行業取得突破,需要走不一樣的路,不管是自主創新,還是技術深度及廣度上都有實現深度優化,並且在國內晶元生態方面實現深層合作及良性競爭,彼此互相合作,做大聯盟。當前全球復雜情況下,國內晶元企業需同心一致。”

呂堅平強調,對於天數智芯來說,接下來他們將在測試、客戶適配、穩定供貨,成功量產並實現規模應用等方面與國際晶元巨頭對標,實現產業大規模商用。

(本文首發鈦媒體App,作者|林志佳)