今天小編分享的科技經驗:智駕芯片隐形之王(上),歡迎閱讀。
" 他們要在 AM62A 上做純視覺和規控,如果做出來,那就是一個詞:離譜。"
一家中國智駕創業公司,要帶着這套基礎方案大戰 CES(拉斯維加斯消費科技展),卷出中國、卷向國際。
AM62A,是德州儀器( 簡稱 TI )在 2023 年推出的 Arm 架構的芯片。
在主機廠采購眼裡,它最大的優點可能是 " 不足 10 美刀 ";而在智駕工程師眼裡,它絕對是個麻煩:盡管其架構設計繼承了 TI 做處理器 " 多一分則肥,少一份則瘦 " 的好品質,但它的深度學習算力,卻不到 2 Tops。
真真是 " 屎上雕花 "。
可以說," 低階 " 卷土重來的 2023 年,一下子将自動駕駛之戰拉回了 10 年前,明明那時主機廠的最愛便是 TI 的 TDA2。而 AM62A 這個處理器,卻是 TI 的應季新品。
但它其實既不新也不快。
某種程度上,AM62x 是 TI 芯片定義者們按照它上一代,甚至上上一代同胞兄弟們微調出的低階變種。
而它的異卵兄弟之一,便是大名鼎鼎的 TDA 系列。
後者使用了比 AM62 更高一級的 Arm 架構,幾乎可以被視為汽車產業智駕芯片的 " 入門級通行證 "。
" 面對主機廠采購們,你說這好那好都沒用。但你說比 TDA 既便宜性能又好,他們眉頭就會舒展開,因為他們認識 TDA。"
一位產品經理說,TI 的智駕芯片 TDAx,約等于一枚同類型產品的 " 通用貨币 "。
但顯然," 價格戰 " 讓主機廠與智駕方案商都開始瘋魔化:有時候,幾十美刀的 TDA 也不能彌補他們對銷量陷入遲滞的畏懼。
" 沒關系,從 3 美刀到 100 美刀,每隔兩三刀,我都有一枚趁手的芯片。"
TI 的銷售露出狡黠之笑時,像一個賣煙的老煙槍。而這樣密集的產品定位與定價,與其說是 TI 的傳統,不如說是傳統芯片巨頭們的慣常策略—— 15% 高端市場與高單價帶來的豐厚利潤,都給英偉達;而剩下 85% 的薄利多銷,我們參戰。
這家 72 歲的芯片老骨頭歷來低調又狡猾。
與直擊大部分遊戲青年靈魂的英偉達相比,吃盡模拟芯片紅利的 TI ,恪守着 " 悶聲發大财 " 的半導體老一輩行事準則——沒人關心 TI 現任老大。報道大多只有寥寥數語的财報數字與產品參數,還不如官網詳細。
此外,在各種奇奇怪怪工程師喜歡扎堆的 Reddit 論壇,每天都飄着 " 英偉達赢麻了,但我絕逼不用 " " 英特爾要嗝屁了嗎 " 的胡言亂語。甚至還有人 po 出 "8 塊英偉達 A100" 的照片公然炫富 ……
但搜索 TI 的相關關鍵詞,讨論度,為 0。
然而,從 " 智駕 " 這個概念開始,如果沿着汽車供應鏈往上摸,即便是數字芯片,網關、座艙、ADAS,還有毫米波與激光雷達 …...
一切竟然都繞不過 TI 。
甚至于,汽車人會覺得關于 TI 的一切屬于老生常談:" 豐田那糟糕的 ADAS,還在用 TDA2 呢。"
但 2022 年的确格外特殊。
雖然大疆車載絕不是第一個用 TDAx 的企業,但他們智駕方案 " 性價比 " 的出圈,卻讓 TDA 真正觸達到了 " 英偉達 er 認知層 "。
當然,還有一點也可以實打實佐證 TDA4 有出圈的态勢。
下半年,在 TI 自己建立的工程師論壇裡,關于 TDA 與 AM62 系列芯片的讨論度驟然上升。
各項數據顯示,它們成了 TI 數字處理器裡讨論度最高的產品線。
事情變得越來越有趣。市場推動下,高算力往低走,低算力往高迭代。高與低總會在一個恰當的算力點相撞。
而不少智駕工程師,大多是從驕傲的英偉達時代 " 下放 " 至車載。圍繞 TI 的争議,也随即放大。
屎上雕花
即便是面對 TDA4VH 這種 32Tops 的中算力芯片,年輕算法工程師的态度也是略帶蔑視的。這跟年輕人對豐田燃油車的态度非常像:" 不就是入門款嘛。要用也不會用這種入門級。均衡卻不出彩,沒毛病卻很無聊。"
" 均衡 ",便是產業對 TI 定義 ADAS 芯片的一致評價。
表面上它是說,當架構師把 A 核(這裡通常指代 Arm 的 A 系列)、MCU、DSP 以及深度學習芯片(MMA)等大小器件捏合在一起時,不會任由一家獨大,每一塊大小都恰到好處。
但本質則是,每個型号的功耗與性能,都被巧妙控制在 " 成本 " 的邊界上。
這種設計上的均衡美學,曾讓一位產業人士感嘆:當你掌握了 TDAx 的架構,那麼你幾乎可以掌握全世界的 SoC 芯片架構。
TDA4VM 的深度學習為 8Tops,該圖為配置。
譬如,無論是 CNN 還是 Transformer,本質都是 " 矩陣運算 "。它基本可以涵蓋深度學習裡 90% 以上的運算形式。
而看透 AI 計算本質後,講究均衡的 TI,便不會為了某一個特定神經網絡去自己耗費資源猛下功夫:
" 這世界上有 1000 種網絡,TI 只要做到 cover 900 種,就很顧全大局了 "。
或者說," 均衡 " 的另一個含義,是 " 兼顧大多數 "。
TI 對 TDA4VM 深度學習加速的設定,是 " 一個時鍾周期内做 4096 次乘累加(MAC,1 MAC=2ops)運算 "。
而周期次數如果為 1Ghz,那麼便是要做 4096 *2 *1 次 Gflops 運算,也就是 8 Tops。
這便是 TDA4VM 真實的深度學習算力。
當然,為什麼矩陣運算不能是 4096 的兩倍,或者頻率憑什麼是 1Ghz?
" 如果要變大,GPU 和 A 核便會被擠兌。也确實可以改動晶圓尺寸,那麼成本就得增加。"
無怪乎 TDAx 的技術支持工程師說,PPA(功耗、性能與面積)才是設計者的終極 KPI。
" 所以,市面上的芯片,各種吹高算力和大算力,你其實都可以算出來。而這些門道,做芯片編譯器和神經網絡的人心裡都非常清楚。"
因此,受算力脅迫,算法工程師們要在一個有限的框裡,塞入一堆矩陣遠比 4096 大的模型,難度不比英偉達低。
畢竟,滿分命題作文也不比發散性創作好寫。
譬如,在英偉達上,數據可以放進 DDR 内存裡一層一層讀取。但在 TI 的芯片上,則不得不把數據塞進片内的緩存裡,不然就會變慢。
但是一個大到幾十兆的 256*256 卷積特征圖,幾乎不可能塞入一個只有 8K 的空間裡。
" 那就只有切成小條了。"
據一位工程師描述,就像切方塊一樣,切完再一點一點送進去,算完再導出來。來來回回不勝其煩。
但事情遠沒有這麼簡單。
譬如,把卷積切開時,交接處的 " 縫 " 怎麼辦?這又會涉及到一堆復雜計算。此外,在 DMA 負責搬運數據的過程裡,A 核與 DSP 也不能閒置。
" 每個模塊在多條時間線上各司其職,就要思考如何切,切多大,切多少次,一切都是有講究的。切得越多越細,bug 也就越多。"
這就能解釋,為何很多在 TDAx 上做智駕方案的工程師,都會吐槽抱怨 "TDA 真太 tnd 難用了 "" 不是人能吃得了苦 "" 編譯器稀爛 "。
而真正在 TDAx 上智駕效果做得好的企業,不多。
這也能解釋,大疆突出重圍,不是智駕技術做得頂級優秀,而是在 TI 的便宜芯片上,做得比别人好一些。
所以,如果說英偉達是以錢為代價的話;那麼 TI,還是得講究一點兒智慧。
摳的精髓
與英偉達和高通動辄幾千萬美金的芯片開發費相比,TI 的确做到了 " 一個臭賣芯片的 " 本分。
它用一套 SDK 去覆蓋所有 SoC,也不用服務和人海戰術去加持,至于 " 智駕做不做得出來 " 或 " 做得好不好 ",TI 也不是很 care。
TI 只在乎這顆芯片的出貨量到底能有多少。
曾有產業專家信誓旦旦指出,不同產業的處理器很難做到復用,即便強大如英偉達與高通,也都不是按照汽車產業來定義的。
這話聽起來略顯好笑。
因為孵化 TI ADAS 芯片那顆最原始的蛋,就是手機。
諾基亞手機使用的 Arm 芯片,便是 TI 的 OMAP 系列,在 21 世紀第一個十年的最高全球市占率曾高達 85%。只不過,在諾基亞被時代抛棄後,TI 也在 2012 年絲毫沒有猶豫斬斷了這條胳膊。
然而,即便業務部門人走茶涼,研發工程師、產業錦囊和各種 IP 卻被保留下來了。
事實上,對于一家能活 70 年,市值多年保持在 1500 億美元以上的企業,最好的商業品質,便是把一項巨額投入換來的技術 " 復用 " 到極致。
因此,OMAP 的 IP 研發費用,不可能只攤銷于手機產業。
于是接下來,TI 芯片定義者們瞄準了安防產業的需求,手伸進盛滿自研 IP 的大缸裡,攪一攪選出合适的部分,又憑借自己的認知捏成了一枚安防芯片。
很難想象,TDA1 一開始的最大客戶,其實是海康與大華,出貨量曾按照 " 億 " 來計算。
而正是同一款芯片,過了車規後,用在全景泊車上,則叫做 Jacinto 5。這還是一家國際 Tier1 跟 TI 提出的訴求,後者順手給他們寫了套軟體。
有趣的是,這家 Tier1 的全景泊車,名字叫做 BEV(歷史總是驚人地相似)。
很快,這顆全景泊車芯片不僅推廣至全國主機廠,還同時進了座艙和網關。
當年,比亞迪還僅有一輛電動車型 F3 的時候,便是用了 Jacinto5 做了全景泊車和前視攝像頭。這麼來看,它現在選擇大疆給自己新車型基于 TDA4 做智駕,歷史的 Knowhow 或許還在。
而新勢力代表小鵬,早在 2018 年,還在管智駕這攤子事兒的谷俊麗團隊,便是用 TDA2 做了低階行泊一體。
"TI 做東西,從來都是一顆芯片給到很多市場,不然根本沒法攤平研發(成本)。因此,它絕不專為監控、工業還是汽車做設計,而是采用了市面上不先進但必須最主流的 IP。" 一位 TI 技術支持工程師說,TDA4 僅僅是一顆很好的 SoC,而不是一枚智駕芯片。
"SOC 需要啥,Arm、DSP、DDR 以及 Capture 和 Display 等等,業内很都清楚。或者說,我們做了一枚不錯的視頻處理器,哪個市場需要,就往哪兒推。"
只不過,TI 在裡面發揮的作用,都是隐性的。
譬如,關鍵部分 DSP(數字信号處理器)本就是 TI 的最大發明之一;
而負責搬運數據的 DMA,其觸角覆蓋芯片各個角落。僅這項技術,便則耗費了 TI 大量研發資源。
此外,芯片公司喜歡炫耀的安全認證體系其實也沒什麼大不了。
實際上,在一枚嚴格的車規芯片上,哪怕總線上的一個端口,都必須有配合的診斷單元與自檢單元。各種 " 小零件 " 隐藏在巨量細節裡,大部分不會被看到。
"TI 真正值錢的東西,是這幾十年存放各種 IP 和架構的大缸。而這口大缸的持有者,是研發和架構師。"
2016 年,阿裡說自己首次提出 " 中台 " 一詞。然而在半導體面前,互聯網玩的都是被歷史遺忘的文字遊戲。
某種程度上,TI 的研發與芯片架構師,便以一種 " 技術中台 " 的形式而存在——無論 TI 每個業務單元有什麼動蕩,巋然不動的是這些研發工程師;與之相比,銷售與 FAE 則像是撒向全球上空的一把鹽。
或者說,前者是 TI 金字塔頂上的人物。就像等級森嚴的蔡司,數學家屬于高階層級,只需要沉浸在光學矩陣的研究裡,俯視下方。
在 TI,很多工程師一畢業就進入 TI 位于達拉斯總部的辦公室,一坐就是二三十年。每個人半輩子幾乎只看一條線——攝像頭就做攝像頭,PCIE 就做 PCIE。
因此,他們對 TI 的忠誠強烈且徹底。而 TI 也幾乎不會解雇研發,願意給予他們極大的自主性。
這種自主性,對應在組織架構上,便顯得格外奇特——盡管規模龐大,但 TI 的指揮系統卻相當短。明明看起來像頭大象一樣笨重,但組織架構,卻扁平得像一條鳐魚。
譬如,TI 在國内沒有研發,幾乎由銷售與技術支持工程師(FAE)組成。
而從最底層的普通銷售,再到中國區總裁姜寒,一共就只有四級。
這便能解釋,中國市場如走馬燈一樣的需求,為什麼能迅速反饋給達拉斯研發本部。
不過,盡管 TI 對分布在各個國家的龐大業務線給予自主權,但絕對不會花太多時間寵愛失敗者。畢竟它完全可以依賴模拟芯片而活。
2012 年見勢不好,TI 徹底退出全球手機市場;
後來,安防市場卷入價格戰,TI 在利潤驟降後再次當機立斷選擇退出;
座艙市場在高通強勢進入後,TI 吃完 Jacinto 紅利也選擇退避三舍。
當然,如果再回溯歷史,你會發現一切皆有源頭。
TI 在 1975 年做出第一枚電腦微處理器,借此強勢進入家用電腦市場,卻在 1982 年被迫卷入價格戰。就在财務出現第一次季度虧損的 1983 年,TI 僅用三個月便砍掉了整個家庭電腦業務。
"TI 并非不打價格戰。畢竟它最大的财產還囊括十幾座工廠。從制造到設計,它完全可以用價格壓死人。TI 只是不想做利潤趨于 0 的買賣。"
這就導致 TI 的決斷力是敏銳且超前的。就像 10 年前它就在搞并購,10 年後别人搞并購它卻在收購工廠一樣。
又年長又靈活,同時卻殺伐果決。以良性的方式遵守财報約定。
當然,這種 " 摳搜 " 的復用精神,以及植根于美式工程師體系的動手文化,讓 TI 與 Mobileye 一樣,被國内诟病缺乏基本的服務精神。
" 論壇網址一扔,叫你自己去看,基本就是這樣。" 一位 Tier1 吐槽說他們都是愛理不理的。
但同樣,軟體與算法工程師真正的技術體面,在 TDAx 上,或許還能續上一段。