智澄 AI CEO 胡魯輝：下一個 GPT 是物理智能

今天小編分享的科技經驗：智澄 AI CEO 胡魯輝：下一個 GPT 是物理智能，歡迎閱讀。

2022 年底，ChatGPT 一經推出，不多久便點燃了全球的科技熱情，一眾圍繞大模型創業的公司紛紛湧現。一片喧鬧中，彼時在西雅圖 Meta 的胡魯輝，将目光越過了生成式人工智能大模型，望向注重感知與理解世界的物理智能模型。

所謂物理智能（Physical Intelligence），其核心在于使機器能夠感知、理解物理世界，并與之互動。近幾年，物理智能成了熱門話題，不僅能在各路技術大牛的演講中頻頻聽到，斯坦福大學李飛飛老師更是直接創辦公司 World Labs，進行物理智能領網域的探索。

在胡魯輝老師看來，物理智能會是繼 GPT 等信息智能之後、更具想象力的下一站，而機器人将是其最佳載體。正值國内具身智能浪潮，胡魯輝決定結束西雅圖的安逸生活，回國創業，親自下場将自己的想法付諸實踐。

今年 4 月，胡魯輝在杭州創辦智澄 AI，短短四個月後即推出了 TR1 和 TR2 兩款人工智能機器人產品，并開啟了商業化進程。在他的設想裡，智澄 AI 會依據實際應用場景，進行 " 沿途下蛋 "，推出适配的機器人產品。

胡魯輝在機器人圈或許是個 " 生面孔 "，但在人工智能領網域，他卻是一個地道的行業老炮。作為一名資深的人工智能專家，胡魯輝的職業旅程遍布了全球科技行業的一些重要地标。從早年留學美國，歷經微軟、亞馬遜、華為美國研究院，再到卸任的 Meta，胡魯輝在人工智能領網域積澱了十餘年行業經驗。

此次創業，似乎是一場跨界行動，但對胡魯輝而言，是因為看到了其中蘊藏的機會。" 目前機器人有許多難點、痛點，如成本高、泛化性差，要解決這些問題，僅靠硬體遠遠不夠，還需要從軟體和模型入手。"

" 我們的核心技術是物理智能，但我們不是只做物理智能模型，而是要做軟硬體兼具的機器人。" 這也是他對智澄 AI 的願景，做一個具有挑戰性的智能機器人，最終推動機器人時代的到來。

圍繞此次創業，AI 科技評論與胡魯輝進行了一次深度對談。在交談中，他向我們展現了對物理智能領網域的深刻見解，同時，我們也能感受到胡魯輝對此次創業的熱情與信心。過往豐富的行業經歷，讓他為團隊拉來了一眾志同道合的優秀人才；此外，多元的產業背景、此前成功的創業經歷，讓他對如何運營一家商業化科技公司有了自己的解法。

以下是 AI 科技評論與胡魯輝的對話。

相信機器人是未來

AI 科技評論：您什麼時候有了創業想法？

胡魯輝：我一直都有創業的熱情。早在 2018 年 AI 1.0 時代，我第一次回國創業将人工智能與千億級零售業務智慧更新相結合，此外在 Meta、華為、微軟、亞馬遜等科技巨頭的經歷我也深度參與了 AI 模型訓練、AI+ 信息流、AI+ 雲計算、AI+ 物流商流等一次次技術變革浪潮。這次 AI 2.0 時代來臨，我覺得機會比之前的浪潮更大，而且論創業環境，我認為國内機會更多，所以就決定回來了。

AI 科技評論：您此前從事的方向更偏向于算法軟體這塊，現在做機器人會不會又是另一個領網域？

胡魯輝：其實機器人并非新東西，已有十來年、甚至更久。機器人此前也火過，後來由于各種原因又歸于平靜了。此次我們創業的初衷和主要目的，是因為相信機器人是未來、是下一個時代——機器人時代。

目前機器人發展處于一個尴尬階段，因為有兩大痛點。第一個是機器人特别貴，随便一個人形機器人也需要好幾萬、幾十萬。相比之下，一輛不錯的汽車也就 20 來萬，但一個能表演的機器人也都要幾十萬，甚至功能不夠完善，只能表演；第二個痛點，是泛化技術有難度，可靠性、穩定性、工程性根本不行。然而這兩個問題相互關聯，要解決不能單靠硬體，還得要從模型和軟體入手，讓機器人變得更好、更智能，能夠完成泛化作業。我們想解決機器人根本性問題，也就是機器人的數據和智能的問題，大數據和人工智能正是我的強項。

AI 科技評論：您曾發表許多關于 AI 大模型相關内容，如今跨界做機器人，您的創業方向具體是什麼？

胡魯輝：針對機器人領網域的挑戰，我們認為人工智能是有效的解決方案，尤其是大模型。目前，大模型在人工智能領網域備受關注，如 ChatGPT 和國内月之暗面、智譜等，它們主要開發多模态大模型，用于構建互動式對話系統，即 Chatbot。

但是我們的產品将采用不同的技術路徑。我們專注于開發機器人，核心技術不是生成式多模态大模型，而是物理智能，即對物理世界的感知和理解。今年 4 月，我在生成式人工智能大會上也介紹了我們的創業方向，強調了物理智能在機器人技術中的重要性。我們的目标是通過物理智能技術，提升機器人的自主性和智能化水平。

AI 科技評論：所以你們做的不是單純的文本模型，而是理解物理世界的模型？

胡魯輝：我們正在自研物理世界模型，取名為 " 澄靈物理世界模型 "，它專注于理解物理世界，與多模态大模型不同。我們區分這兩種智能：多模态大模型屬于信息智能，如 Chatbot 這類人工智能，主要處理信息和互動；而我們的產品則屬于物理智能，專注于感知和理解現實世界的物理規律。

AI 科技評論：怎麼理解物理智能？

胡魯輝：人工智能的終極目标也許是實現通用人工智能，而當前階段我們正處于生成式人工智能的發展時期。這一觀點并非我首次提出，我與張亞勤院士交流時，了解到他在五年前就已提出人工智能的發展路徑，從信息智能到物理智能，最終達到通用人工智能，這是一個逐步實現的過程。Meta 多年來也一直在讨論世界模型的概念。今年 6 月，黃仁勳在台灣的演講中也提到，下一個人工智能的發展方向是物理智能。

生成式人工智能處理的是一維或二維信息的輸入，如文字、圖片、音頻或視頻，并輸出相同類型的信息。物理智能則在兩個層面上有所不同：首先，在輸入層面，我們處理的是感知和理解世界的數據，包括視覺和觸覺等感官信息；其次，在輸出層面，我們生成的是 TSD 數據，即時間（T）序列（S）數據，這種數據可以直接用于控制機器人。

此外，生成式大模型和物理智能的產品形态和應用場景也有所不同。生成式大模型不需要實時反饋，例如 ChatGPT 中有些信息可能只更新到去年 9 月。而我們的系統必須實時處理輸入信息，以确保機器人能夠及時響應。

AI 科技評論：你們機器人的研發是基于人工智能模型，演繹物理世界模型？

胡魯輝：對的。我們核心技術是物理世界模型，同時也做本體，打造一系列產品，目前已經推出了機器人產品 TR1，TR2。

AI 科技評論：你們已經驗證了這條鏈路了是嗎？

胡魯輝：是的，除了清晰的 Northstar，也能逐步驗證和產品落地。

下一個 GPT 是物理智能

AI 科技評論：物理智能是不是一定會和機器人結合？

胡魯輝：物理智能不一定非要和機器人結合，只是我認為機器人領網域或具身智能是最理想的應用場景。好比，生成式人工智能目前最好的應用是 Chatbot，但其實它也有很多其他場景可以用。

AI 科技評論：一個能夠感知和理解世界的機器人，它的技術棧會包含哪幾塊？

胡魯輝：我認為主要是三個方面：第一，與物理世界的互動。與信息智能不同，物理智能需要與現實世界進行互動；第二，算法能力。物理智能需要具備和生成式人工智能一樣的算法能力，因為它得要有泛化能力和推理使用能力；第三，實時性。物理智能需要從三維、甚至四維（包含時空）的角度理解信息，這與信息智能有本質的不同，因而要能夠實時處理和響應信息。

AI 科技評論：其實這也是具身智能追求的目标。

胡魯輝：對，這就是個通用人工智能。

AI 科技評論：您是什麼時候有了要做物理智能的這一想法？

胡魯輝：2022 年年底，ChatGPT 出來的時候。ChatGPT 一經推出就在美國迅速走紅，因為大家看到了它不錯的泛化能力。國内對它的關注應該是在幾個月後逐漸升溫。當時我還在西雅圖，我開始思考我們應該如何跟進這一趨勢，也有不少創業公司開始圍繞 ChatGPT 進行創業。

那時，我也在 Meta 了解到世界模型的概念，而 Meta 首席 AI 科學家楊立昆對大模型并不特别熱衷。我也認為，繼 ChatGPT 之後，下一個重要的發展将是物理智能，它将擁有更廣泛的應用前景。

AI 科技評論：您會認為大模型對于機器人的發展是一個機遇？

胡魯輝：大模型是一種技術手段，類似于我們開發的世界模型，它也是一種大模型的表現形式，盡管具體的實現方式有所不同。這些模型都屬于基礎模型（foundation model），我們自主研發的世界模型同樣具備這樣的基礎模型特性。

AI 科技評論：您怎麼看待通用人工智能與通用機器人間的關系？

胡魯輝：通用人工智能是人工智能領網域的終極目标，它指的是達到人類水平的智能，這主要是從技術層面來講的。而通用機器人則是指具體的產品或應用。無論是通用人工智能還是通用機器人，它們的核心目标都是實現 " 通用性 "，而實現這一目标的關鍵在于掌握通用人工智能的技術。

AI 科技評論：基于物理世界模型開發機器人的路徑，國内目前還沒有相似公司？

胡魯輝：應該是沒有的。由于我司比較低調，我先提出這個想法時，并沒有引起太多人的興趣。但自從李飛飛老師和一些美國企業開始讨論這個概念後，它就迅速受到了廣泛關注。

AI 科技評論：在這波具身智能浪潮中，你們的優勢是什麼？

胡魯輝：我覺得我們的優勢還是蠻多的，主要是四個方面。第一，我們專注于物理智能領網域，這是我們的核心技術和主要創新點；第二，我們的團隊成員基本都是來自頂級企業的高管，不僅擁有豐富的行業經驗，也有很多業務資源；第三，我們在敏捷交付方面展現出了強大的工程化實力，TR1 和 TR2 的出色表現證明了我們的執行力和交付能力；第四，我們與哈佛、清華等頂尖高校建立了合作關系，并得到了地方政府的支持，這為我們提供了強大的資源後盾。

讓通用世界模型成為硬體平台

AI 科技評論：你們團隊今年才成立，但產品發布很快，你們是不是很早就布局了？

胡魯輝：應該說是我們的團隊非常優秀，并且我們采用了亞馬遜的敏捷開發模式。亞馬遜的開發模式使我們每兩個月進行一次迭代，我們從今年 5 月份開始，大約兩個月推出一款新產品的節奏。在四個月的時間裡，我們成功推出了 TR1 和 TR2 兩款產品原型。

AI 科技評論：你們現在團隊規模有多大？

胡魯輝：現在有 20 來人，基本以研發人員為主，研發團隊都是碩士以上，畢業于國内外名校。

AI 科技評論：TR1 和 TR2 兩款產品已經量產了嗎？

胡魯輝：目前我們已經開始與意向客戶進行合作落地。

AI 科技評論：這兩款產品的功能定位是什麼？

胡魯輝：我們致力于開發通用人工智能和通用機器人，是因為想推動機器人時代的到來。與許多僅用于表演和研發的機器人不同，我們的目标是讓機器人能夠實際執行任務。要實現這一點，機器人的 " 手 " 是最關鍵的部分，因此我們的開發從手臂開始。我們的產品 TR1 是一款單臂機器人，而 TR2 則是一款雙臂機器人。我們希望能夠開發出更復雜、更具挑戰性的機器人，這也是我們的願景。

AI 科技評論：那你們是做專用機器人，還是通用機器人？

胡魯輝：我們并不局限于機器人本體，而是會依據業務場景來做不同的機器人。

移動互聯網時代的一大标志是 iPhone 的到來，iPhone 帶來的是硬體平台化，上面可以有不同 app，而每一個 app 對應一個應用，說白了就是一個特定業務場景的解決方案。因此，我們希望将這一概念應用到物理世界智能領網域，打造一個平台化的模型，支持不同的硬體和機器人，以适應配送、工廠作業、家庭服務等多種場景。

AI 科技評論：聽起來，你們是以人工智能算法為中心，再加不同本體，如人形、四足等，你們自己也做本體嗎？

胡魯輝：我們也會做本體。我們自己做設計，但我們不做生產。

AI 科技評論：你們技術核心是不是在算法驅動這塊？

胡魯輝：應該說是物理智能層面，我們要打造物理智能，也就是理解物理世界的人工智能。

AI 科技評論：你們接下來的產品計劃是什麼？

胡魯輝：我們的 TR1 和 TR2 產品将會持續進行迭代更新，在這個過程中，我們會繼續投入創新和研發工作。同時，我們會将產品與實際應用場景結合，逐步推動商業化進程，" 沿途下蛋 "。目前，我們已經收到了多家企業的合作意向。

AI 科技評論：您覺得國内機器人領網域的融資環境好嗎？你們融資困難嗎？

胡魯輝：整體環境我覺得一般，應該說沒有以前好，但現在人工智能、AI 2.0 還是很火爆的。

AI 科技評論：與國内廠商競争，你們會遇到什麼挑戰？

胡魯輝：我們的發展主要受兩大因素影響。一是科技發展的内在趨勢，二是商業環境的實際需求。作為一家商業化的科技公司，我們不僅要适應市場的變化，還要在技術上不斷實現突破。當然，這種情況也是許多企業在發展過程中需要面對的挑戰。

雷峰網雷峰網