今天小編分享的科技經驗:智澄 AI CEO 胡魯輝:下一個 GPT 是物理智能,歡迎閱讀。
2022 年底,ChatGPT 一經推出,不多久便點燃了全球的科技熱情,一眾圍繞大模型創業的公司紛紛湧現。一片喧鬧中,彼時在西雅圖 Meta 的胡魯輝,将目光越過了生成式人工智能大模型,望向注重感知與理解世界的物理智能模型。
所謂物理智能(Physical Intelligence),其核心在于使機器能夠感知、理解物理世界,并與之互動。近幾年,物理智能成了熱門話題,不僅能在各路技術大牛的演講中頻頻聽到,斯坦福大學李飛飛老師更是直接創辦公司 World Labs,進行物理智能領網域的探索。
在胡魯輝老師看來,物理智能會是繼 GPT 等信息智能之後、更具想象力的下一站,而機器人将是其最佳載體。正值國内具身智能浪潮,胡魯輝決定結束西雅圖的安逸生活,回國創業,親自下場将自己的想法付諸實踐。
今年 4 月,胡魯輝在杭州創辦智澄 AI,短短四個月後即推出了 TR1 和 TR2 兩款人工智能機器人產品,并開啟了商業化進程。在他的設想裡,智澄 AI 會依據實際應用場景,進行 " 沿途下蛋 ",推出适配的機器人產品。
胡魯輝在機器人圈或許是個 " 生面孔 ",但在人工智能領網域,他卻是一個地道的行業老炮。作為一名資深的人工智能專家,胡魯輝的職業旅程遍布了全球科技行業的一些重要地标。從早年留學美國,歷經微軟、亞馬遜、華為美國研究院,再到卸任的 Meta,胡魯輝在人工智能領網域積澱了十餘年行業經驗。
此次創業,似乎是一場跨界行動,但對胡魯輝而言,是因為看到了其中蘊藏的機會。" 目前機器人有許多難點、痛點,如成本高、泛化性差,要解決這些問題,僅靠硬體遠遠不夠,還需要從軟體和模型入手。"
" 我們的核心技術是物理智能,但我們不是只做物理智能模型,而是要做軟硬體兼具的機器人。" 這也是他對智澄 AI 的願景,做一個具有挑戰性的智能機器人,最終推動機器人時代的到來。
圍繞此次創業,AI 科技評論與胡魯輝進行了一次深度對談。在交談中,他向我們展現了對物理智能領網域的深刻見解,同時,我們也能感受到胡魯輝對此次創業的熱情與信心。過往豐富的行業經歷,讓他為團隊拉來了一眾志同道合的優秀人才;此外,多元的產業背景、此前成功的創業經歷,讓他對如何運營一家商業化科技公司有了自己的解法。
以下是 AI 科技評論與胡魯輝的對話。
相信機器人是未來
AI 科技評論:您什麼時候有了創業想法?
胡魯輝:我一直都有創業的熱情。早在 2018 年 AI 1.0 時代,我第一次回國創業将人工智能與千億級零售業務智慧更新相結合,此外在 Meta、華為、微軟、亞馬遜等科技巨頭的經歷我也深度參與了 AI 模型訓練、AI+ 信息流、AI+ 雲計算、AI+ 物流商流等一次次技術變革浪潮。這次 AI 2.0 時代來臨,我覺得機會比之前的浪潮更大,而且論創業環境,我認為國内機會更多,所以就決定回來了。
AI 科技評論:您此前從事的方向更偏向于算法軟體這塊,現在做機器人會不會又是另一個領網域?
胡魯輝:其實機器人并非新東西,已有十來年、甚至更久。機器人此前也火過,後來由于各種原因又歸于平靜了。此次我們創業的初衷和主要目的,是因為相信機器人是未來、是下一個時代——機器人時代。
目前機器人發展處于一個尴尬階段,因為有兩大痛點。第一個是機器人特别貴,随便一個人形機器人也需要好幾萬、幾十萬。相比之下,一輛不錯的汽車也就 20 來萬,但一個能表演的機器人也都要幾十萬,甚至功能不夠完善,只能表演;第二個痛點,是泛化技術有難度,可靠性、穩定性、工程性根本不行。然而這兩個問題相互關聯,要解決不能單靠硬體,還得要從模型和軟體入手,讓機器人變得更好、更智能,能夠完成泛化作業。我們想解決機器人根本性問題,也就是機器人的數據和智能的問題,大數據和人工智能正是我的強項。
AI 科技評論:您曾發表許多關于 AI 大模型相關内容,如今跨界做機器人,您的創業方向具體是什麼?
胡魯輝:針對機器人領網域的挑戰,我們認為人工智能是有效的解決方案,尤其是大模型。目前,大模型在人工智能領網域備受關注,如 ChatGPT 和國内月之暗面、智譜等,它們主要開發多模态大模型,用于構建互動式對話系統,即 Chatbot。
但是我們的產品将采用不同的技術路徑。我們專注于開發機器人,核心技術不是生成式多模态大模型,而是物理智能,即對物理世界的感知和理解。今年 4 月,我在生成式人工智能大會上也介紹了我們的創業方向,強調了物理智能在機器人技術中的重要性。我們的目标是通過物理智能技術,提升機器人的自主性和智能化水平。
AI 科技評論:所以你們做的不是單純的文本模型,而是理解物理世界的模型?
胡魯輝:我們正在自研物理世界模型,取名為 " 澄靈物理世界模型 ",它專注于理解物理世界,與多模态大模型不同。我們區分這兩種智能:多模态大模型屬于信息智能,如 Chatbot 這類人工智能,主要處理信息和互動;而我們的產品則屬于物理智能,專注于感知和理解現實世界的物理規律。
AI 科技評論:怎麼理解物理智能?
胡魯輝:人工智能的終極目标也許是實現通用人工智能,而當前階段我們正處于生成式人工智能的發展時期。這一觀點并非我首次提出,我與張亞勤院士交流時,了解到他在五年前就已提出人工智能的發展路徑,從信息智能到物理智能,最終達到通用人工智能,這是一個逐步實現的過程。Meta 多年來也一直在讨論世界模型的概念。今年 6 月,黃仁勳在台灣的演講中也提到,下一個人工智能的發展方向是物理智能。
生成式人工智能處理的是一維或二維信息的輸入,如文字、圖片、音頻或視頻,并輸出相同類型的信息。物理智能則在兩個層面上有所不同:首先,在輸入層面,我們處理的是感知和理解世界的數據,包括視覺和觸覺等感官信息;其次,在輸出層面,我們生成的是 TSD 數據,即時間(T)序列(S)數據,這種數據可以直接用于控制機器人。
此外,生成式大模型和物理智能的產品形态和應用場景也有所不同。生成式大模型不需要實時反饋,例如 ChatGPT 中有些信息可能只更新到去年 9 月。而我們的系統必須實時處理輸入信息,以确保機器人能夠及時響應。
AI 科技評論:你們機器人的研發是基于人工智能模型,演繹物理世界模型?
胡魯輝:對的。我們核心技術是物理世界模型,同時也做本體,打造一系列產品,目前已經推出了機器人產品 TR1,TR2。
AI 科技評論:你們已經驗證了這條鏈路了是嗎?
胡魯輝:是的,除了清晰的 Northstar,也能逐步驗證和產品落地。
下一個 GPT 是物理智能
AI 科技評論:物理智能是不是一定會和機器人結合?
胡魯輝:物理智能不一定非要和機器人結合,只是我認為機器人領網域或具身智能是最理想的應用場景。好比,生成式人工智能目前最好的應用是 Chatbot,但其實它也有很多其他場景可以用。
AI 科技評論:一個能夠感知和理解世界的機器人,它的技術棧會包含哪幾塊?
胡魯輝:我認為主要是三個方面:第一,與物理世界的互動。與信息智能不同,物理智能需要與現實世界進行互動;第二,算法能力。物理智能需要具備和生成式人工智能一樣的算法能力,因為它得要有泛化能力和推理使用能力;第三,實時性。物理智能需要從三維、甚至四維(包含時空)的角度理解信息,這與信息智能有本質的不同,因而要能夠實時處理和響應信息。
AI 科技評論:其實這也是具身智能追求的目标。
胡魯輝:對,這就是個通用人工智能。
AI 科技評論:您是什麼時候有了要做物理智能的這一想法?
胡魯輝:2022 年年底,ChatGPT 出來的時候。ChatGPT 一經推出就在美國迅速走紅,因為大家看到了它不錯的泛化能力。國内對它的關注應該是在幾個月後逐漸升溫。當時我還在西雅圖,我開始思考我們應該如何跟進這一趨勢,也有不少創業公司開始圍繞 ChatGPT 進行創業。
那時,我也在 Meta 了解到世界模型的概念,而 Meta 首席 AI 科學家楊立昆對大模型并不特别熱衷。我也認為,繼 ChatGPT 之後,下一個重要的發展将是物理智能,它将擁有更廣泛的應用前景。
AI 科技評論:您會認為大模型對于機器人的發展是一個機遇?
胡魯輝:大模型是一種技術手段,類似于我們開發的世界模型,它也是一種大模型的表現形式,盡管具體的實現方式有所不同。這些模型都屬于基礎模型(foundation model),我們自主研發的世界模型同樣具備這樣的基礎模型特性。
AI 科技評論:您怎麼看待通用人工智能與通用機器人間的關系?
胡魯輝:通用人工智能是人工智能領網域的終極目标,它指的是達到人類水平的智能,這主要是從技術層面來講的。而通用機器人則是指具體的產品或應用。無論是通用人工智能還是通用機器人,它們的核心目标都是實現 " 通用性 ",而實現這一目标的關鍵在于掌握通用人工智能的技術。
AI 科技評論:基于物理世界模型開發機器人的路徑,國内目前還沒有相似公司?
胡魯輝:應該是沒有的。由于我司比較低調,我先提出這個想法時,并沒有引起太多人的興趣。但自從李飛飛老師和一些美國企業開始讨論這個概念後,它就迅速受到了廣泛關注。
AI 科技評論:在這波具身智能浪潮中,你們的優勢是什麼?
胡魯輝:我覺得我們的優勢還是蠻多的,主要是四個方面。第一,我們專注于物理智能領網域,這是我們的核心技術和主要創新點;第二,我們的團隊成員基本都是來自頂級企業的高管,不僅擁有豐富的行業經驗,也有很多業務資源;第三,我們在敏捷交付方面展現出了強大的工程化實力,TR1 和 TR2 的出色表現證明了我們的執行力和交付能力;第四,我們與哈佛、清華等頂尖高校建立了合作關系,并得到了地方政府的支持,這為我們提供了強大的資源後盾。
讓通用世界模型成為硬體平台
AI 科技評論:你們團隊今年才成立,但產品發布很快,你們是不是很早就布局了?
胡魯輝:應該說是我們的團隊非常優秀,并且我們采用了亞馬遜的敏捷開發模式。亞馬遜的開發模式使我們每兩個月進行一次迭代,我們從今年 5 月份開始,大約兩個月推出一款新產品的節奏。在四個月的時間裡,我們成功推出了 TR1 和 TR2 兩款產品原型。
AI 科技評論:你們現在團隊規模有多大?
胡魯輝:現在有 20 來人,基本以研發人員為主,研發團隊都是碩士以上,畢業于國内外名校。
AI 科技評論:TR1 和 TR2 兩款產品已經量產了嗎?
胡魯輝:目前我們已經開始與意向客戶進行合作落地。
AI 科技評論:這兩款產品的功能定位是什麼?
胡魯輝:我們致力于開發通用人工智能和通用機器人,是因為想推動機器人時代的到來。與許多僅用于表演和研發的機器人不同,我們的目标是讓機器人能夠實際執行任務。要實現這一點,機器人的 " 手 " 是最關鍵的部分,因此我們的開發從手臂開始。我們的產品 TR1 是一款單臂機器人,而 TR2 則是一款雙臂機器人。我們希望能夠開發出更復雜、更具挑戰性的機器人,這也是我們的願景。
AI 科技評論:那你們是做專用機器人,還是通用機器人?
胡魯輝:我們并不局限于機器人本體,而是會依據業務場景來做不同的機器人。
移動互聯網時代的一大标志是 iPhone 的到來,iPhone 帶來的是硬體平台化,上面可以有不同 app,而每一個 app 對應一個應用,說白了就是一個特定業務場景的解決方案。因此,我們希望将這一概念應用到物理世界智能領網域,打造一個平台化的模型,支持不同的硬體和機器人,以适應配送、工廠作業、家庭服務等多種場景。
AI 科技評論:聽起來,你們是以人工智能算法為中心,再加不同本體,如人形、四足等,你們自己也做本體嗎?
胡魯輝:我們也會做本體。我們自己做設計,但我們不做生產。
AI 科技評論:你們技術核心是不是在算法驅動這塊?
胡魯輝:應該說是物理智能層面,我們要打造物理智能,也就是理解物理世界的人工智能。
AI 科技評論:你們接下來的產品計劃是什麼?
胡魯輝:我們的 TR1 和 TR2 產品将會持續進行迭代更新,在這個過程中,我們會繼續投入創新和研發工作。同時,我們會将產品與實際應用場景結合,逐步推動商業化進程," 沿途下蛋 "。目前,我們已經收到了多家企業的合作意向。
AI 科技評論:您覺得國内機器人領網域的融資環境好嗎?你們融資困難嗎?
胡魯輝:整體環境我覺得一般,應該說沒有以前好,但現在人工智能、AI 2.0 還是很火爆的。
AI 科技評論:與國内廠商競争,你們會遇到什麼挑戰?
胡魯輝:我們的發展主要受兩大因素影響。一是科技發展的内在趨勢,二是商業環境的實際需求。作為一家商業化的科技公司,我們不僅要适應市場的變化,還要在技術上不斷實現突破。當然,這種情況也是許多企業在發展過程中需要面對的挑戰。
雷峰網雷峰網