今天小編分享的汽車經驗:吳強:L2+不是智能駕駛終點,歡迎閲讀。
撰文 / 牛跟尚
編輯 / 張 南
設計 / 琚 佳
當前,汽車領網域科技革命和產業變革蓬勃興起,中國汽車行業站在了轉型更新的十字路口。
在後摩智能創始人兼 CEO 吳強看來,這幾年,中國電動智能化的發展已經走到了世界前列,這是一個難得的歷史機遇,中國企業應該乘勢而上,抓住機遇,聯合產業鏈上下遊,推動智能駕駛繼續向前發展。
6 月 16 日,這家高科技新創公司負責人在 2023 第十五屆中國汽車藍皮書論壇上説,發表題為 " 存算一體創新引擎,力破智能駕駛僵局 " 的演講。
他認為,長期來看,智能駕駛的漸進式發展,會從 L2+ 逐漸向 L3、L4 迭代、演進,L2+ 是智能駕駛必經之路,但一定不是終點,高階智能駕駛一定會來。
怎麼才能打破目前的智能駕駛僵局?吳強認為,第一,需要技術和算法上的突破;第二,需要數據的大量積累;第三,需要用芯片實現計算效率的階躍。只有這三個方面同時滿足,才有可能打破目前看到的僵局。
後摩智能要做的就是用創新的存算一體底層架構,打造高能效比的智駕芯片,實現計算效率數量級地提升。
自 2020 年成立以來,作為國内率先采用存算一體技術打造智能駕駛計算芯片的硬科技企業,後摩智能致力于突破芯片算力和功耗瓶頸。
2023 年 5 月 10 日,後摩智能在上海發布首顆高性能、低功耗的存算一體智駕芯片——後摩鴻途 H30。該芯片提供高達 256TOPS 的物理算力,為智能駕駛、泛機器人等邊緣場景提供強大的計算核心。
在算力需求蓬勃爆發的時代下,存算一體技術走過概念、走出實驗室,開始走向量產及市場。它颠覆性地将芯片的計算單元與存儲單元融合,能夠從根本上解決 54 年前馮 · 諾伊曼架構計算與存儲分離帶來的能效瓶頸。
吳強介紹,存算一體跟傳統的方式相比,它的計算效率可以實現一個數量級的提升。這種計算效率體現在算力、功耗、能效比、延時和成本等等方面。
作為創新力量的另一個方面,它對技術底線有保障。在當下的國際環境中,基于存算一體自身的架構特點,它可以用相對落後的工藝制程,依然能做出媲美基于常規架構用先進制程做出來的芯片產品。
吳強打比方説,可用 28nm 的工藝做出一款算力和功耗媲美 7nm 常規架構的芯片,這就是後摩爾時代底層架構創新能夠帶來的價值。在今天的國際環境下,它能夠為國產供應鏈自主可控帶來一些特殊意義。
以下是後摩智能創始人兼 CEO 吳強的演講實錄,此處有删節。
各位嘉賓、各位新老朋友:
大家好!我是後摩智能的吳強。
當組委會找我選演講課題的時候,他們給了我一個清單,列了一些選擇的話題,我最後選了 " 智能駕駛僵局 " 這個話題。因為我覺得在過去幾年裏邊對智能駕駛來説,我們經歷了一個特别樂觀又到特别悲觀的這麼一個過程。
今天。我想談談如何用存算一體這樣一個創新的技術,從芯片的角度來分析如何去打破智能駕駛這樣一個僵局。
智能駕駛的僵局
僵局主要體現在兩個方面。
一方面是,L4、L3 這種高級智能駕駛落地沒有大家想象那麼快。前幾年大家特别樂觀,覺得很快就可以落地,并且可以形成商業閉環。
但是大家後來發現其實沒有想象得那麼快,這兩年突然間業内出現很多聲音,説 L3、L4 也許十年二十年都不可能到來,我們一直 L2+++,無限 + 下去。
另外一個方面體現在,用户對 L2+ 或者 L2 的價值認同不強。大家覺得 L2 智能化是好,但是這個東西到底是不是一個噱頭,我有就可以了。至于我有了以後用不用,用得好不好可能我不在乎。所以大家覺得這個東西也許沒有那麼多的價值,我也不願意為它付很多的價錢,所以就開始了所謂的 " 價格戰 "。
我最近一直思考的一個問題,智能駕駛真的沒有價值的嗎?L3、L4 真的十年二十年都不可能到來嗎?我們用户真的覺得 L2+ 這個東西是一個雞肋,只是便宜就行了嗎?
這個問題我一直思考了很多。當然業内對這種觀點有人樂觀,有人悲觀,剛才唐鋭總説的覺得十年二十年都不可能到來 L3、L4,但也有人説 2025 年、2030 年就可以到來。所以大家各有各的樂觀或者悲觀的預計。
我的想法是,如果拿不準的時候會退一步從更深層、更底層的邏輯去做判斷,去看底層的邏輯和趨勢。
首先,智能化它本身是一個剛需,比如説我作為一個用户來説,L2+ 最終對客户產生價值并不是 L2+,真正能把客户解放出來的是 L3、L4。所以從客户的需求上來説,其實我們需要有這個剛需,大家需要從每天的駕駛中解放出來。
第二,從歷史的發展趨勢看,其實很多的這種智能化已經成為了一個不可逆的浪潮,就像我們從蒸汽機到内燃機,從燃油車到電動車,這個趨勢已經在發生。
這幾年中國從電動車智能化已經走到了前列,這本身是一個難得歷史機遇,所以我們不應該被暫時的這種困境、挫折困住,我們應該乘勢而為,抓住這個歷史機遇,去推動智能駕駛的發展。
這是我思考的一個過程。我的觀點是更樂觀的,從未來來看,L2+ 智能駕駛一定是一個漸進的過程,它會從 L2+ 逐漸向 L3、L4 去迭代、去演進,并且 L2+ 是智能駕駛一個必經之路,但是 L2+ 一定不是終點。
怎麼才能打破
需要幾個方面。第一,我們需要在技術和算法上突破。第二,我們需要在數據上的積累和突破。第三,我們需要從芯片、從算法有一些更深層的效率上的階躍。只有這三個方面同時滿足才有可能打破目前我們看到的僵局。
短期來看,我們要做的事情是盡快地讓 L2 量產普及。
這裏面有兩個方面。第一方面,我們要讓更便宜的車都能用到 L2+,有更多的車跑在路上收集更多的數據。第二方面,我們要用真正的能給客户帶來價值的 L2+,而不是讓大家覺得這就是一個噱頭,只是有而已。
我希望它能夠給客户帶來實實在在的價值,盡管不能是完全替代,但是希望能帶來價值。
我們不單單需要高速 NOA,我們需要環線,需要繞城,甚至最後能不能到城市 NOA,這個我覺得是未來幾年裏面我們希望各個同行們咱們一起去努力的事情。
因為我們是做智能駕駛芯片的,對我們來説:第一,我們希望能夠提供更便宜、性價比更高的芯片。這裏面包括一方面是説讓更多的車能夠付得起這個費用;同時,這不單單是價格問題,還有功耗能不能降到最低,我可以不用液冷,我用自然風冷,我可以讓很便宜的車都能夠安裝得起這種不太復雜的智能駕駛系統。
我們的效率、算力要進一步大幅度提升,真正能做到給客户帶來真正價值的智能駕駛體驗,讓客户感受到它是有實實在在的價值,提高這樣的認同感,這可能是我們所有同行們可以在短期共同努力的方向,讓 L2+ 真正量產普及。
随着 L2+ 的量產普及,我們會收集大量的數據,積累大量的數據,實現數據的積累和突破。
如果説我們有些算法上的突破,比如説現在的大模型,它也給我們的算法突破提供了一個非常有前途的方向。
其實就是我們算力、芯片。算力芯片如果到 L4 這個級别,長期來説我們的目标是向 L4,這才是真正的終極的目标,真正把人類從繁重的駕駛中解脱出來。這種情況下,我們需要的算力和效率提升不是一個簡單的提升,其實是希望一個數量級的階躍,才能真正達到 L4 這樣一個級别。
對我們來説,這是一個非常挑戰的目标,我相信這個事情不是遙不可及。
如何才能實現數量級的計算效率提升
它不是一個簡單的改良就能做到,我們需要更多的一些在底層架構上的創新。
特别是随着摩爾定律逼近極限,其實我們需要一些更契合後摩爾時代的這種底層架構創新,才能實現我們説的數量級的效率提升。
存算一體式後摩爾時代的新技術之一,它的基本原理是説,我們在 AI 的計算當中,打破傳統的馮 · 諾依曼架構,不再用計算和存儲分開的方式,而是把計算和存儲完全融合的方式,去實現計算效率數量級地提升,這是一種計算底層架構的重構。
存算一體的創新力量,它體現在兩個方面。
一方面是説它的技術上限特别高。存算一體跟傳統的方式相比,它的計算效率可以實現一個數量級的提升。這種計算效率體現在算力、功耗、能效比、延時和成本等等方面。
作為創新力量的另外一個方面,是技術底線有保障。在當下的國際環境中,基于存算一體自身的架構特點,它可以用相對落後的工藝制程,依然能做出媲美基于常規架構用先進制程做出來的芯片產品。
打個比方説,我們曾經用 28nm 的工藝做出了一款算力和功耗可以媲美 7nm 常規架構的芯片,這個本身就是後摩爾時代底層架構創新能夠帶來的價值。在今天的國際環境下,它能夠為國產供應鏈自主可控帶來一些特殊的作用。
後摩是一家成立時間不長的公司,但是我們是國内最早用存算一體做大算力 AI 芯片的公司,今年 5 月份我們發布了首款量產的存算一體智駕芯片——鴻途 H30。
簡單説一下它的規格, 鴻途 H30 AI 算力最高可以達到 256TOPS,這是物理算力,不是虛拟算力,但它的典型功耗只有在 35 瓦左右。這樣的效率,跟市場上面國際巨頭 254TOPS 虛拟算力的芯片比,我們的性能大概是它的 2 倍。所以我們 AI 性能是它的 2 倍,但我們功耗只有它的 1/2,這裏面大概有幾倍效率的提升。
這個效率提升來源于兩個方面,一方面是我們底層核心 IP 完全自研,後摩創新自研了量產級的存算一體 IP,只有這種存算一體的技術,才能達到幾倍的 AI 計算效率的提升,常規架構其實很難做到。我們應該是國内存算一體大算力 IP 方面走得最前面的。
另外就是我們自研的 IPU,基于存算一體的底層架構,為 AI 計算設計的 IPU。
鴻途 H30 芯片是基于我們第一代的天樞架構,我們也正在研發第二代的天璇架構,天璇架構增加了對 Transformer 等大模型更好的支持,為後續大模型的應用遷移打基礎。
當然我們後面還有第三代天玑架構。我們完全自研的 IPU 架構是我們能夠有如此高計算效率的另外一個原因。
天樞架構采用多核、多硬體線程的方式擴展算力,實現了計算效率與算力靈活擴展的完美均衡,AI 計算可以在核内完成端到端處理,保證通用性。
這是我們第一代芯片鴻途 H30 性能的測試,這是實測的結果,對一些比較典型的網絡,我們和一個國際巨頭的數據做了比較,鴻途 H30 基于 Resnet 50 模型的 Benchmark,在 Batch Size 等于 1 和 8 的條件下分别達到了 8700 幀 / 秒和 10300 幀 / 秒的性能。
從能效比的角度,我們的芯片實現了性能 2 倍提升的同時,還降低了 50% 功耗,所以我們在效率方面大概是有 4 倍以上的提升。這些都是得益于存算一體這個創新架構帶來的一些價值。
鴻途 H30 是針對智能駕駛而設計的芯片,我們基于最新的智能駕駛的一些算法和網絡做了适配,包括 BEV 模型、PointPillar 網絡模型 ,用鴻途 H30 打造的智能駕駛解決方案已經在合作夥伴的無人小車上完成部署。
芯片之外,我們還做了一個叫力馭的智能駕駛計算平台,它只有一個單顆的 AI 芯片,我們的鴻途 H30。整個這個平台上面大概有 200KDMIPS 的 CPU 算力、高達 256TOPS 的 AI 算力,包括還有一些其他的接口。這個我們可以提供給合作夥伴作為參考設計,也可以直接作為產品提供給我們的合作夥伴。
我們還做了智能駕駛計算使能平台—— Sailing 平台,來幫助我們的客户,不管是 Tier1 還是 OEM,來幫助他們把芯片更好地應用起來。
這裏面有三個部分,最底層是我們作為產品提供的,包括了我們的芯片、系統軟體、軟體工具鏈。這是我們提供給客户的產品。
同時,我們還有一系列的參考設計,包括剛才説的網域控、一些參考算法,例如 Model Zoo 這些東西是作為參考設計提供給客户。最上面是客户自己的軟體或者他們應用層的軟體。
我重點説一下後摩大道這個軟體工具鏈。芯片既要性能強,又要好用,這是業内的一個共識。
我們希望提供一個具有差異化的、性能好的芯片,還有一個好用的編譯器工具鏈幫助客户盡快地落地。這個工具鏈叫 " 大道 ",大道至簡、大道至臻,我們希望為客户提供一個開放易用的軟體工具鏈。
一個年輕的公司
很多朋友之前問我,説你們存算一體,是不是軟體不好用?但事實上存算一體是一種底層的架構創新,它其實解決的是底層計算單元的效率問題,它對上層的用户是無感知的。
而上層的軟體開發或者使用,其實更多的是在 IPU 這一層,所以我們在 IPU 這一層做了很多的設計,可以讓用户體驗更好。相對于早年那種黑盒式的或者封閉的模式,我們選擇走向一個更開放的、更通用的編程模式,這是我們軟體工具鏈最初的設計理念。
後摩大道首先是説我們提供了一套 Model Zoo,可以讓大家用我們的參考模型去快速落地。
我們提供了一個模型開發的 SDK、提供了一系列的算子庫,客户可以根據我們的算子庫去開發自己的模型。
對更高級的用户,我們提供了一套算子開發的工具,就是我們開發了一層類似主流的編程語言,我們叫 HDPL,你可以用這套語言訪問我們最底層的接口,可以開發出自己的這種算子,這個也是我們工具鏈的一部分。
總的目标是,希望打造一個開放易用的軟體工具鏈,幫助我們的客户把我們芯片盡快落地。
我們 5 月份剛剛發布的是第一代的量產產品鴻途 H30,這個是為智能駕駛而設計,包括商用車和乘用車。
我們正在研發的還有第二代的鴻途 H50,這個是基于第二代的天璇架構,對大模型、對存算支持更好。
它還有一個特點,可以在自然散熱條件下提供更大的有效算力。我們希望将存算一體能效比高的技術優勢,盡可能發揮到我們產品中去。這是我們正在自研的明年提供給客户的第二代產品 H50。
總結一下,後摩是一個年輕的公司,我們希望在長久的發展過程中一直堅持兩個原則。
第一個原則,我們堅持底層技術創新的原則。就是用底層的架構創新去給我們的客户提供一個差異化的、互補的、優質的產品,讓大家多一個更好的國產替代的選擇。
第二個原則,我們一直是堅守 Tier2 的定位和邊界,我們希望和 Tier1 或者 OEM 的客户更多地合作,我們整個供應鏈上下遊的夥伴們一起去努力打破僵局,共同奔赴智能駕駛的美好終局。
加入軒轅之學 成就新汽車人
巨浪班——頂級產業鏈創新課程
鈴軒班——頂級供應鏈創新課程
金軒班——頂級營銷創新課程
軒轅之學與裏昂商學院共創課程
第十五屆中國汽車藍皮書論壇首日,50 位行業大咖論 " 不負 "
點擊閲讀原文
▼