今天小編分享的科技經驗:對話 Rokid AR 創始人祝銘明:做 AR 硬體要有一顆軟體之心,歡迎閱讀。
對話丨張鵬
整理丨Li Yuan
編輯丨鄭玄
6 月蘋果發布的 Vision Pro,可能是今年甚至過去三年以來最受關注也最具争議的硬體產品。
大眾和部分行業分析師眼中,Vision Pro 價格昂貴卻沒有提供「超乎想象」的體驗,加上缺少内容、產銷預期一跌再跌——雖然還沒正式發售,唱衰的聲音已經不絕于耳。
外行看熱鬧,作為行業老兵,Rokid 創始人祝銘明清楚裡面的「門道」。昂貴價格的背後是蘋果超越時代的技術和工業能力,Vision Pro 集成了當下最先進的芯片、傳感器和軟體算法,将真實世界映射到數字空間,并在數字化的真實世界中疊加數字信息,從而實現了真正的 VST——這與之前的 HoloLens、Magic Leap、Oculus Quest 等 VR/AR 設備有本質的不同。
蘋果定義了新的技術範式,但這個範式能否普及還需要時間驗證——一方面成本需要下降,性能需要提升,内容應用也有待開發;另一方面,想讓用戶真正從上一代計算終端轉移,需要大幅度提升新範式的體驗,「體驗改善 20% 是不夠的,只有提升了 80%,才會真正迎來爆發的機會。」祝銘明在幾天前的 Rokid 新品發布會上說到。
蘋果開啟了新的機會,但 Rokid 并沒有選擇第一時間「跟風」,最新發布的 Rokid AR Studio,依然采用 OST 的技術路線,其原理是在用戶看到的真實世界疊加數字信息,實現增強現實的效果——這是谷歌眼鏡發布以來 AR 行業已經堅持了 10 年的技術路線。
我們好奇祝銘明的個人思考,包括為什麼要推出 Rokid AR Studio 這個產品,包括如何看待 OST 與 VST 的技術路線,也包括一名 AR 創業者對如何渡過黎明前黑夜的思考。
以下是極客公園創始人張鵬與祝銘明的對話,由極客公園整理。
一個不同于蘋果的 AR 眼鏡
極客公園:8 月 26 日,Rokid 在杭州發布了消費級 OST(Optical see-through 光學透視)個人空間計算平台 Rokid AR Studio,這一代產品有什麼新鮮的亮點?
Misa:新發布的 Rokid AR Studio 是一個真 AR 產品,實際上包含 Max Pro(眼鏡部分),Station Pro(計算主機)兩部分。
Rokid AR studio 產品圖
Rokid Max Pro 在光學上,仍然沿襲了上一代的 Rokid Max,因為 Rokid Max 仍然是最好的產品,但是新加入了一顆攝像頭,可以和外界進行互動。
不要小看這個攝像頭,它是一個專門為 Rokid 定制的攝像頭,超廣角、90 赫茲的刷新率,能夠做到空間探測、手勢識别,這樣就能夠真的把 AR 帶到真實的場景當中去。
最早 Rokid Air 推出的時候,可以說是一個頭戴顯示器,後來推出的 Rokid Max 的 FOV(Field of View 視野)達到了 50 度,很爽,包括亮度各方面都有了很大的進步。這些設備,雖然具有 3 DoF(Degree of Freedom 自由度),但是還沒有特别多真正的 AR 應用。
之前大家會吐槽,包括我們自己内部也有人說,Rokid Max 到底是不是 AR?是不是最多算是頭戴顯示器?而到了 Rokid Max Pro,現在所有人都不會懷疑這個就是真正的 AR。
極客公園:真 AR 是如何在 Rokid AR Studio 上體現的?
Misa:前面提到我們的產品中會有一顆前置的攝像頭——之前展出的體驗款的攝像頭還是平視的,真正量產時攝像頭會是略微向下的。通過這顆攝像頭,可以檢測手勢動作。手都不用抬起來,放在大腿上,就可以非常輕松地可以進行微手勢的操作,達到與空間的互動。
再舉一個真 AR 的情景:真 AR 能帶來一種無限屏的感覺。比如通常我自己現在每天的工作的狀态是左邊看 B 站,就是刷刷視頻或者看看直播,旁邊放一個網頁浏覽器,查一些資料,正前方通常是我的雲電腦,我跑了個 Ubuntu Linux,在上面寫代碼。右邊我會放聊天工具。你的眼鏡戴着往哪看就是一個現實的空間,多個任務同時在做,它已經不像是一個簡單的一個娛樂終端。
極客公園:互動也是一種計算,虛實融合本身也是一種計算。支持真 AR,需要很強的空間計算能力,這方面 Rokid 的產品表現如何?
Misa:Rokid AR Studio 的計算主機 Station Pro 的計算能力非常強。它用的是和 Meta 的 Quest Pro 相同的芯片,應該是當前量產的 XR 產品裡的最強芯片,這也是高通對于 Rokid 大力的支持。
最強芯片帶來的是空間計算的能力大大加強,所以它是名副其實空間計算的主機,針對 6 DOF、手勢的探測的計算基本上都只有非常短的延遲。
除了計算之外,芯片也增強了 Rokid AR Studio 的渲染和引擎能力。不管是跑 Unity 還是其他的影像引擎,都可以渲染出非常精美的畫面。發布會上可以看到,有很多第三方開發者,都開發出了非常精美的畫面,比如生命演化的畫面,精美的戰棋畫面等等,大量用到高性能的 GPU。
我們還不斷地在推動高通給我們提供算力更強的產品。為支持這麼強的計算能力,Rokid Station Pro 采用了主動散熱,内置了 7600 毫安時的電池,相當于兩個手機的電池,日常使用大家不用擔心。
除了高通的芯片,Rokid 從上一代 Rokid Max 開始,就開始強調雲端計算和邊緣計算進行結合。Rokid AR Studio 可以在雲端跑性能更強的應用,尤其比如編程、編譯這種重任務。
除了重算力的任務,還有協同問題也需要使用雲端的技術。比如我們如果大家各自戴上設備,一起在同一個空間裡進行戰棋對戰,需要在雲端做大量的同步。再比如,如果我在這裡辦公,中間我走了,那麼再回到這裡辦公的時候,我還要再把這個辦公的場景呈現出來,永久化,固定化,錨定這個世界。行業的人都知道,這叫點雲技術,也是需要雲端的技術。我個人感覺雲和端的計算比例是四六分,40% 在端上跑,60% 在雲上跑。
極客公園:Rokid 做出這一代的真 AR 產品,克服了什麼技術難點嗎?
Misa:最難的地方是我們只有一顆攝像頭。
這就是我們和蘋果技術路線最大的不同,我們想要做成眼鏡形态,從物理上就要盡量地減少傳感器的數量。蘋果公司推出的 Vision Pro 裡裡外外有 12 顆攝像頭。它的產品形态放得下。空間探測一定需要攝像頭,我們就努力減少需要的攝像頭的數量,一顆已經是能減少的極限了,再少就沒有了。
通常來講空間探測需要的攝像頭最少要有兩個。就像人的眼睛一樣,一個眼睛感受不到深度,至少是不能那麼精準的感覺到深度。這是我們面臨的第一個挑戰,我們連續做了将近三四年的時間,達到一個比較好的效果。
事實上,傳感器越少,後端軟體要做的工作就要越多,你可以理解為減一個攝像頭,後端的 AI 能力、作業系統能力、復雜度就要往上翻一番。
比如,手勢的角度和手大手小和最後識别的精度是有關系的,這個裡面需要大量的進行數據訓練。我們用的方法也很簡單,就是采集足夠的數據完成這件事,和自動駕駛沒有什麼區别,就靠 AI 自己去掌握這個規律。我們最後有一個保險是做人工的校對,把手伸直的時候機器記住你的手有多大。
還有另一個大眾可能不太知道的,一顆攝像頭對于作業系統能力的挑戰。原生的安卓 AOSP 作業系統,一個攝像頭在系統層面只能完成一個對應的任務,比如安卓手機,如果你在用手機錄屏,就沒有辦法做别的需要用攝像頭做的事情,因為在作業系統層面就是這樣設計的。
而我們的一顆攝像頭同時要做四個任務:空間識别、手勢識别、簡單視頻會議、空間搜索,即直接對物理世界的物體進行識别搜索,至少是四個任務。而這四個任務要通過一個攝像頭完成。我們有一個全球的專利,就是作業系統層面,如何讓一個攝像頭完成這些事。
用戶使用攝像頭和微手勢進行互動
極客公園:做了這麼難的優化,達到了用一顆攝像頭進行空間識别和互動,有什麼好處嗎?
Misa:第一個好處是減輕了解決延時問題的難度。
Rokid 為了把眼鏡做輕,同時解決散熱的問題,把電池和芯片都放在了 Rokid Station Pro 這個主機上了。蘋果的 Vision Pro 很大,但它也有一個優勢是芯片和攝像頭挨在一起,通過非常快的内部組線進行溝通。而 Rokid 是要通過一根長線連接在 Station Pro 上的算力,這根線天然是有延遲的,而且 Rokid 為了讓用戶佩戴體驗更好,把這根線做的很細。
而我們要盡可能地消除這根線帶來的延時。一顆攝像頭的好處是我的通信量也減少,你可以想象如果我做兩顆三顆攝像頭,它在這一根線上跑的通信總量也有增加。
第二個帶來的好處是整個結構簡單,包括裡面硬體的重量。Rokid Max Pro 增加了攝像頭,帶來了天上地下的體驗差别,但只比上一代的 Rokid Max 多 1 克。這就是一顆攝像頭所帶來的優勢,包括功耗、續航和重量。
我們也想把所有的東西都放進眼鏡裡,但最終我們做出的取舍是只用一顆攝像頭。我們會一直堅持一顆攝像頭的技術路線,或許未來會考慮加入深度傳感器,不過目前,我們主要是靠 AI 的能力解決深度信息的問題。
有點像有人說的,想寫最好的軟體要搞硬體,要做最好的硬體,必須要有軟體甚至要有 AI。
OST 與 VST 之争
極客公園:之前的 Rokid 設備有調節度數的功能,Rokid AR Studio 也可以調度數嗎?
Misa:Rokid AR Studio 的眼鏡 Rokid Max Pro 不能調整度數。上一代 Rokid Max 可以調度數的原因是 Rokid Max 主要是消費虛拟數據,它和真實世界缺少互動。Rokid AR Studio 強調的是虛實互動,所以要求你的視力保持内外都能夠看清楚,所以從 Rokid Max Pro 開始,我們建議用戶去佩戴眼鏡。
極客公園:這和 Rokid 選擇的技術路線是有關系的,對吧?Rokid 選擇的是 OST(Optical see-through 光學透視),而不是 VST(Video see-through 視頻透視)的路線。
Misa:是的。蘋果 Vision Pro 就是采取的 VST 的技術,通過攝像頭将外面的環境傳遞到内部顯示屏上,做完顏色的重建,坐标系的對齊,環境的重建再給你顯示出來,這個是典型的 VST。其實你的肉眼是沒有直接觀察到外面的世界的,但你确實能夠看到外面,也能看到疊加在環境上的數據,原來行業的人也把這個技術路線叫做 MR(Mixed Reality 混合現實)。不過蘋果發布會上來就說自己是一個 AR 設備,這個我們也攔不住。
我們的技術是 OST,簡單講肉眼能夠觀察到這個世界,然後把數字世界融合到真實世界裡面去。OST 的技術不止有我們的眼鏡形态,也有護目鏡(goggle)的形态。微軟的 Hololens 也是采取 OST 技術,Magic Leap 也是 OST 技術。不過,可以預見的是,護目鏡形态的 OST 產品會被 VST 擠壓得很厲害,做的比較重的情況下,OST 的優勢比不過 VST。所以未來我們 OST,通常指的是眼鏡形态的 OST。
極客公園:為什麼 Rokid 選擇了 OST 路線?
Misa:有兩個非常重要的原因。
第一個重要原因是理念上的,我們一直認為人和真實世界、物理世界不要剝離開。在心理上我們不大認同割裂開的方式,總覺得人還是要盡量保持和自然的直接接觸,最小程度進行隔離。
第二個客觀講是能力的問題,今天即便是蘋果 VST,花了這麼多的力氣,這麼高的成本,實際上也沒有打造出大家理想中的產品,如果看客觀的評價,會發現也沒有那麼好,這也是為什麼它的發布時間要一再往後延。
我們想想,Vision Pro 裡面可是跑了一個 M2 芯片,最強的芯片,還有專門的微處理芯片,協處理芯片在做這個事,再加上有一堆傳感器,再加上極高成本的顯示成本,最後才能做出這麼好的顯示效果。
蘋果 Vision Pro 圖片來源:視覺中國
VST 是不能忍受物理世界毛毛糙糙的,所以它需要盡量把清晰度、分辨率做的足夠高,這就牽扯到算力、延遲、色彩、坐标諸多方面的準确性,坦白來說今天我們還沒有看到其他公司完整具備這些能力。對于 Rokid 來講我們要非常清醒的認識到,它至少今天不在 Rokid 的能力範圍内。除此之外,我們認為 OST,作為另外一種形态,也會給用戶多一個選擇。
極客公園:之所以不能選擇 VST 的路線,核心難點在哪裡?
Misa:VST 涉及到的問題很多,芯片是大家看得到的難點,目前沒有第二家公司能夠做成 M2,即便開卷考試也做不到。但它不是最主要的,對于創業公司最核心的難點是定價權。
VST 是無法妥協的,舉一個例子我們有 8000 塊錢的手機,1 萬塊錢的手機,它的妥協是在我觸碰螢幕的時候有一點延遲感,這個我可以接受。如果 VST 的模式下,你畫面有阻隔、花屏、不清晰,我們從身體上是受不了這個東西的,有一個基本的要求是不能往下降的,決定你上面用的所有東西,代價都是比傳統的產品要高很多。
我們要扪心自問的問題,Rokid 有沒有能力去定義定價 2 萬塊錢的產品?如果這樣的話,我估計直播間都是罵我的。這個能力是最重要的能力,剩下的就是堆料。今天來看 Vision Pro,它的超能力就是它的鈔能力,裡面堆的料都是整個行業内拿到最好供應商的東西,包括 VST 形态能夠往裡面放一堆傳感器,導致的結果是基本的成本就會放在這裡。
Rokid 今天非常有自知之明,目前還沒有能力号召市場和客戶接受這麼高價格的產品,這個價格在電子產品當中算是奢侈品。
所以我覺得還是要客觀的認識到這個問題。我們也不是非這條路不可,明明另一條路也有機會,甚至我個人更堅信那條路是未來的路,為什麼要打大概率打不赢的仗?
很多人認為創業公司比大公司有更多的選擇其實是不對的。創業公司都是華山一條路,赢就要赢在那條小道上。
極客公園:剛才說了 VST,OST 技術應該也有它的難點和問題?
Misa:OST 有一個問題是坐标無法統一,你肉眼看到的是物理世界坐标是改變不了的。眼鏡呈現的世界會根據你的佩戴來決定,不容易對齊。如果鼻子高一點或者低一點,眼窩深一點或者窄一點,都會有影響。我好不容易把它對齊了,戴到換一個人的臉上也不能對齊。我們在做產品設計的時候,默認精度就不會那麼高。
我前兩天和產品工程師講一句話,把今天客觀上的不完美,當做一個產品特點去設計。從場景的角度,意味着你要丢掉毫米級精度的場景,如果你做的東西真的是毫米級精度的東西,坦白來說 AR 空間計算不适合你,但是我們又有多少的東西是真的需要毫米級精度呢?
另外,做 OST 眼鏡,最大的難度叫螺絲殼裡做道場,你只能在硬體當中做減法。
如果做過技術的人,尤其是做過產品設計的人,一定會發現一個規律:硬體上每減掉一個東西。都會帶來一個指數的軟體難度。拿前面提到的攝像頭來講,你把一顆攝像頭拿掉,對于 AI 的算法和整個能力就是數量級難度的差距。
Rokid AR Studio 采用單顆攝像頭方案
此外,為了保證輕便,OST 眼鏡目前采取分體的模式,VST 體積大,可以放很多傳感器和芯片,它們之間的通信和協同可以做的非常實時,數據通信吞吐量也是比較大的,我們的吞吐量至少受一根線的控制。哪怕 USB 3.0 這個技術,能夠讓線的通信速度變快,可以保證帶寬,但是仍然很難保證不延遲。
我們在開發產品的時候,工程師一開始都十分頭疼:原來默認的攝像頭數據到 CPU 的延時是幾毫秒,而做了分體,默認就是 10 毫秒到 50 毫秒,整個熟悉的基準都被打亂了,這個時候如何做到保持實時穩定是不容易的。
所有公司都會面臨這個問題,這也是很多公司寧可把設備做的重一點,也要做一體機的產品的原因。分體是一個很難跨越的難題,能把穩定性、延時、預測、算法各方面做好,其實已經是行業中比較一流的公司。
極客公園:有人說 OST 未來真的能做的很好,可能還要做大環境建模、建圖等一系列的技術。
Misa:我認同他的看法,未來需要做大環境建模。這個未來需要放到雲上做,本地就是一個更實時的,下載更新同步的功能。坦白來說,現在很多的技術,雲上就可以解決。即使我們現在擁有最強的芯片高通 XR2+,也沒辦法去真正承擔大的計算量的任務。但硬體你只能等,軟體可以通過做一些架構去解決問題,
選擇做 OST,本身是一種較勁方式的選擇。我更喜歡和軟體較勁,而不是硬體。
這個和我從小的技術信仰是有關系的。自己也寫代碼,我相信軟體能夠定義一切,因為一旦你對硬體的東西過于痴迷和依賴之後,你的能力是不可改變的,我不喜歡這種感覺。
我還是希望盡量少對硬體產生依賴,因為 Rokid 對硬體掌控的力度是不多的。大部分的創業者,尤其是創新的創業者,你要想推動硬體的變化,即便你有這個能力,周期也是很長的。
我舉一個最簡單的例子,比如說我們想要嘗試一顆攝像頭的方案,光做這一件事我們要推動行業拿到這個結果也是很長時間的事。有的時候,過于把希望寄托于硬體上,你會發現你經常無能為力,你做的很多事都特别的無助。
很多人問我,能不能做一體機,能不能做無線,FOV 能不能做到 100 度,重量能不能做到 50g,坦白來講,Rokid 可以回答一部分問題,但是 70%-80% 的問題不是由 Rokid 來回答的,是電池、材料、CPU、GPU、半導體、傳感器產業來回答的。
AR 產業典型的特點是國内外的大公司,一直在等產業成熟,這個是沒錯的。因為大公司最熟悉和最有優勢的是供應鏈形成之後快速做集成,最後拿出一個不錯的產品。我并不是認為他們不想創新,這個是在他們的情況下,最适合他們的戰略。Rokid 這樣的初創公司是不能等的,我們等到别人都成功的時候,就沒有你什麼事了,所以我們一定是要往前走。
硬體的外表,軟體的心
極客公園:Rokid AR Studio 的底層系統是什麼?
Misa:Rokid AR Studio 搭載 Rokid 最新的 YodaOS-Master。簡單講,YodaOS-Master 是 Rokid 重寫了整個架構的 AOSP 系統。為什麼要用 AOSP?因為 AOSP 屬于全人類,生态體系非常全面,不需要重復造輪子,包括鴻蒙也是基于 AOSP 做的。
在 AOSP 之上,我們做了很多的事。包括做了大量低延遲的設計,這一次 Rokid 發布會上,Unity 中國團隊也來參與了,因為我們與 Unity 團隊之間有緊密的合作,也貢獻了很有意思的針對他們的優化。
我們在系統層面做了大量優化,等到硬體上 FOV 更大,分辨率更高,電池的密度更長時,我們不需要再去補足軟體這一塊,我們現在就是準備好了的。大公司才能去等硬體準備好了再去補足軟體,創業公司把握改變世界的機會,在于軟體。
極客公園:一年全球 AR 眼鏡的出貨量也就幾十萬台,目前看起來還是冷啟動階段。怎麼能把把應用做起來,讓開發者和行業用戶進來?
Misa:實際上你的問題非常有挑戰性,Rokid 用很長的時間去思考這個問題。我分享幾個思考:
首先,Rokid 希望能夠定義出一個獨立的 AR 生态,而不是成為其他生态的附庸。Rokid 很早就不再将自己定位為手機的附屬設備,也沒有以很高的優先級在開發 Rokid 的電腦應用。因為 Rokid 希望整個生态能夠不依托于别人,不是在别人的土地上種地。
這也是為什麼我們的 AR 設備中包含着一個分體式的計算部分,一開始是 Station,新設備中變成 Station Pro。我在發布會上講過,自從 Rokid Station 推出之後,90% 的上一代 Rokid Air 的用戶不再連接手機和電腦,會直接連接 Rokid Station。這給了我們很大信心。這一代的 Rokid Station Pro 推出之後,不想更換眼鏡部分的 Rokid Max 的用戶,也可以更換新的 Rokid Station Pro。
其次,Rokid 希望能夠連接到一個相對成熟的生态中,而不是自己定義一個新生态。
Misa 在 Rokid 發布會上
我們現在去看 AR,它是新產品、新形态、新互動。如果你的内容和應用也是新的,同時冷啟動兩個領網域,我們認為對于創業公司這是無法成立的。我們去看 Meta,它就是既想定義新生态,也想定義新硬體。
Rokid 沒有辦法燒錢,我們希望能夠長久走下去,這個是我們的風格。在這個情況下,我們想希望我們連接的另一頭是過去相對成熟市場的生态。
Rokid 的設備上,愛優騰芒、抖音、B 站全部能上,包括雲遊戲、雲電腦這些技術全部能上,這個是 Rokid 做的嘗試,結果非常成功,我跟大家分享一個數據,我們的產品,月活用戶達到 40%。用戶平均日使用時長超過 1 個小時,這也是行業中舉不出第二個例子的。
我沒有那麼自大,我沒有信心說改變你們所有人互動的習慣,同時改變你們的内容習慣,我沒有這個信心。當用戶在一個新的生态上,原來他所熟悉的那些生态和内容都在的時候,他會非常有安全感,而且願意去使用它。在用戶在使用新互動的時候,能夠看得到他熟悉的内容,或者說在熟悉的内容的基礎上疊加一些新互動,才能讓他慢慢習慣一些新的互動。
極客公園:在這點上,Rokid 和 Vision Pro 是很像的?
Misa:我們很多的設計和最新成果,其實和 Vision Pro 在軟體上的想法非常接近,我看 Vision Pro 的發布會時,其實心理咯噔了一下。
我們去看 Vision Pro,它推出的時候,非常強調 2D 内容的自然兼容和遷移,上來表達的第一個觀點,就是是過去傳統 2D 的應用,直接能在它的空間當中進行呈現,這點和 Rokid 的想法不謀而合。
我們 YodaOS-Master 的作業系統,默認界面就是桌面環境,即一個操作台,環繞的 2D 螢幕,裡面放一堆應用。安卓任何的應用,不需要做任何的改變,一行代碼都不用改,甚至不需要給 Rokid 源代碼,使用标準的 apk,用戶裝上去就可以在你眼前浮現出來,這就是我們做的事情。
當然在作業系統層面,我們做了大量的工作,讓安卓的應用跑在 3D 的空間裡。我們做了一個沙箱,騙這個應用說你是跑在硬體上,實際上被我養在一個沙箱裡,一個蜜罐裡。我們做了大量的工作去做這件事,所以蘋果做了這個事,我們也做了這個事。
大家要清楚,為什麼我們不再連手機?是因為我們沒有辦法說服手機公司,讓他們在作業系統中為我們做這麼一個事。有很多人問我,為什麼不去改造一個手機?因為我們對這個作業系統的改動是内核級别的,這個級别的改動,上面的影像引擎,數據管道等等架構全部都要做改造。手機公司不會為你做這個改動的,因為改完之後也會是很難用的手機。
我們内部有一個簡單的概念叫三七,70% 往回看迎接過去的生态,30% 給大家有想象力的東西,比如手表、空間搜索,比如 6 DOF 的應用,包括我們發布會上展示的,有人用我們的眼鏡做 MR 電影,我戴上之後從來沒有想過有這麼美好的體驗。
只給你這 30% 的東西,你是會猶豫的。而我現在用它來做什麼?我首先在上面用 2 個小時檢查代碼,然後上網看東西,使用浏覽器 1 個小時,剩下就是玩一點小遊戲,比如說扔飛镖、投籃放松一下自己。
極客公園:Rokid 做了很多系統層面的兼容性的工作,讓開發者不需要做兼容工作就能接入 AR 生态。
Misa:是的。原生引擎應用,Rokid 可以兼容。OpenAI 與 Rokid 有很多合作,OpenAI 的東西,Rokid 可以兼容。Hololens 所主導的 MRTK1-3 的 AR 開發架構,我們也能完整接入。
開發者都能感覺到這是多方便。我舉個例子,有一個開發者,為我們開發了 8 個遊戲,用了多久呢?大概一個月的時間。而且這八個遊戲都不是很簡單的遊戲,都是很精彩的遊戲,用的就是 Hololens 所主導的 MRTK 架構。
我們甚至專門為 Unity 做了一套 Rokid 的自研 JS Engine。插到 Unity 裡,前端工程師可以直接用 JavaScript 開發 AR。我們提供了引擎,提供了模拟器,在網頁上,不需要眼鏡就可以提供模拟和開發。
在我們的系統負一屏,有一些小組件,比如小狗,星系,你可以把它們拖出來玩。你知道一個有 web 和 JS 開發經驗的工程師開發一個這樣的小組件要多久嗎?只要一天。
Rokid 會幫助大家把大部分的難度解決掉。AR 眼鏡已經不是一個硬體層級的產品了,早就是到了作業系統、架構、AI AR Engine 層級的產品了。
影像引擎當然我們還是老老實實用 Unity 做好的東西,但是你可以從發布會上看到,用戶界面,JS AR 這些東西都是 Rokid 原生的了。這些東西都是普通用戶看不見的。
極客公園:這些 Rokid 的創新會開源嗎?
Misa:我自己就是一個開源者,未來我們一定會考慮。
至少有一點是肯定的,只要大家兼容我們系統 YodaOS-Master 的标準,我們就可以接你的眼鏡。現階段為什麼不這麼做?大家喜歡的設計風格不同,有的人喜歡墨鏡的設計感,有的人喜歡科技的設計感,Rokid 不可能設計出各種眼鏡,為什麼不讓大家一起做這個事?所以我們會非常的開放。
我經常和大家講,Rokid 是一家隐藏在精致硬體下的軟體公司,所以我們一定會把所有的東西都告訴大家,大家可以去上 Rokid AR Platform 這個網站,看看我們開放了多少數據。包括攝像頭的原始數據我們都是開放的,其他公司不會開放這種數據給大家的。
我們覺得行業實在太早了,我們只是黑暗森林裡的先行者,還沒有掉到懸崖下面去而已,但是我們的路一定對嗎?不一定。不如把這條路給到大家,看看最後誰走出去了,有人做的比 Rokid 好,我就跟着你們。
極客公園:在社交、遊戲或者其他方向,你有沒有已經看到了哪些創業者帶來了新設備互動範式下的創新?
Misa:我剛才講到 MR 電影,就是一個我沒想到的創新。它在 360 度的空間中講地球生命的誕生。首先地球充滿單細胞生物,慢慢會凝聚成大的爆炸進入寒武紀,恐龍誕生。
大家都知道 MR 產品對觀影是不友好的,可能精彩的瞬間你轉過頭了,就錯過了。我看到的這個電影做了一些精彩的設計,如果精彩的事情即将發生而你沒有面對那個方向,他會設計一個蝴蝶或者一個其他東西,吸引你的注意力,把你自然地引過去看到那個東西,所以你發現這種創新影響的不僅僅是互動,甚至是編劇。這種東西是過去導演和影片沒有的。
裡面還有一個創新,恐龍的行為是用 AI 驅動的,是不可預測的,每一個人看到的它是不一樣的。其中還有一個互動是把手掌伸出來,變出一塊肉,恐龍就過來吃,既有互動又有情節非常的有趣。
AR 產品一定會帶來更大想象力,但我也很關心人們怎麼解決這些新的技術給人們有時候會帶來的不适感。這個 MR 電影通過設計讓用戶不錯過好的情景,讓我覺得真的非常精彩。
用戶體驗微手勢應用
AR 公司如何商業化
極客公園:Rokid 成立到今天也過了八九年的時間,一個公司能夠持續八九年在不成熟的技術路線上投入,最終做出來一代代產品走向市場,肯定是因為這個創業公司能夠印證自己的價值。Rokid 的現金牛業務是什麼?
Misa:Rokid 的現金牛業務來自于 To B 業務。
其中一個我非常自豪的事情是,天宮一号太空站上的 AR 眼鏡就是我們的眼鏡,央視的空間課堂報道中就能看到。
此外,Rokid 在文博領網域市占率達到 90% 以上。我給你們分享一個數字,我們開發布會的那天,正值暑假,那一天有 2 萬人在博物館使用我們的眼鏡。
極客公園:那麼在 To C 業務上呢?
Misa:To C 業務上,Rokid 不虧錢賣產品。我們希望賣的越多公司越健康,而不是賣的越多風險越大,到時候買了產品都不知道找誰來維修。
購買了硬體後,又買過我們的會員,或者買過我們單項内容的付費用戶數,占所有用戶的 20%。
Rokid 不強調内卷,壓榨各個層面的利潤以及渠道、供應鏈、合作夥伴、内容商為了讓自己賺那麼一點毛利。我希望 Rokid 讓每一個環節的合作夥伴都賺到錢的情況下,讓用戶體驗更好的東西,我們希望能建立一個健康的體系。
一個公司的創新力最終回歸于這個公司的利潤,Rokid 該賺錢還是賺,創業公司沒有那麼飄在天上,它也得賺錢。
極客公園:Rokid 每年支持開發者花上千萬,也是需要利潤來支撐。
Misa:是的。Rokid 支持開發者每年花上千萬,哪怕學生給我們做的作品和比賽,我們的獎金都是幾萬塊。Rokid AR Studio 新發布,也需要激勵開發者。開發者可以申請樣機來開發。
我們希望開發者都來給我們提意見,和 Rokid 一起改變世界。如果你能罵我一句讓我做出很好的產品,我一定是非常開心的。在我們公司也一樣,指着老板的鼻子罵,最後是有價值的我一定會支持,我希望大家一起參與進來。
極客公園:在這方面,Rokid 抱着非常開放的心态?
Misa:我們現在最缺的就是 3D 的内容,在未來,一定要借助 AI 的生成能力來填補 3D 的内容空缺。
我們有一個商業訂單,AR内容是由第三方公司制作的。因為時間比較緊,盡管花了總收入的接近四分之一請第三方公司制作内容,最後效果也沒有非常完美。我們後來嘗試用 AIGC 重做了一遍那個單子,成本只需之前的八分之一,不到兩天就做出來了。AIGC 技術的最大貢獻就将在 XR 領網域。
如果有誰在做這個方面的研究,尤其是 3D 内容的生成,你們來找我。
Rokid 是一家很有開放的心态的公司。現在已經投入正式運營的有 100 多家博物館和景區用的是 Rokid 產品。但是沒有一家是 Rokid 做的,全部是合作夥伴做的。我們一開始做樣本的第一家博物館,良褚博物院,在合适的時候我們也交由合作夥伴運營。
Rokid 就是要告訴大家,我們做好平台,我們做好技術服務,做好產品。圍繞 Rokid 有好多的内容和服務商在為我們提供服務。理論上來講我如果想多賺一點錢,什麼東西都自己做能賺到更多的錢。但是 Rokid 想專注做好自己的事,手不往前伸。
希望大家能夠有信心與 Rokid 一起合作,長久合作,多支持我們的產品。