今天小編分享的科技經驗:國產集體發力!AI眼鏡擺脫“索尼依賴”,視覺攝像頭才是未來?,歡迎閱讀。
索尼在 AI 眼鏡的王座,開始動搖了。
Ray-Ban Meta 的市場成功、AI 帶來的全新叙事,都讓 AI 眼鏡正在成為消費電子市場的全新戰場,甚至被稱為「百鏡大戰」。
這場競争中,AI 眼鏡配備攝像頭幾乎成了一個共識,除了界環 AI 音頻眼鏡等極少數產品,絕大部分已發布以及爆料中的 AI 眼鏡,都默認配置了攝像頭,以便提供影像拍攝以及基于 AI 視覺的功能。
但在核心的 CMOS 影像傳感器上,索尼的 IMX681 幾乎是目前所有 AI 眼鏡的默認選擇—— Ray-Ban Meta 到 雷鳥 V3,再到李未可 View、Rokid Glasses,甚至将在年内推出的三星、小米 AI 眼鏡,幾乎清一色采用了索尼 IMX681。
雷鳥 V3 商品頁,圖 / 雷鳥創新
然而就在上周,中國機器視覺網報道了韋爾股份(旗下有 CMOS 廠商豪威)成功拿下亞馬遜 AI+AR 眼鏡項目的消息。
這周,行業媒體 XR 研究院也爆料出,有兩家中國企業成功研發出面向 AR/AI 眼鏡的新型 CMOS 影像傳感器,參數性能上甚至優于目前 AI 眼鏡普遍都在采用的索尼 IMX681。按照透露,這兩家企業是:
豪威和思特威。
對于豪威大家都不陌生,旗下產品在手機 CMOS 領網域已經被小米、華為應用到了最新旗艦機型的主攝上。至于思特威,作為 CMOS 廠商也活躍在手機市場,在 2023 年全球手機攝像頭 CMOS 出貨量上僅次于索尼、三星、格科微以及豪威。
圖 / 潮電智庫
不過在 AI 眼鏡上,豪威和思特威面對的是在事實上處于技術壟斷的索尼。
為什麼索尼 IMX681 能在當下的 AI 眼鏡市場占據統治地位?核心還是在于它适配了這一品類的需求:足夠小、功耗低,還有足夠好的拍攝質量以及成熟的開發生态。
先拿尺寸來說。從 Ray-Ban Meta 的官方資料來看,索尼 IMX681 像素排列為 3024x4032(比例為 3:4),像素數達到了 1200 萬,再加之像素間距(及大小)為 1 微米,可以得出 CMOS 寬邊長度應該略大于 4.032mm,長邊長度應該略大于 3.024mm。
Ray-Ban Meta 官方資料提供的技術參數,圖 /Ray-Ban
而按照雷鳥創新的說法,傳感器(IMX681)的大小約為手機攝像頭的 25%。這也符合我們大體的估算,現代手機主攝 CMOS 通常在 1/1.3 英寸到 1/1.5 英寸之間(長寬約為 9mm × 7mm),而 IMX681 傳感器明顯要小得多。
與此相對的是,AI 眼鏡的電池體積受限,功耗控制至關重要。IMX681 采用背照式堆棧工藝(BSI Stacked),優化了能耗管理,相比手機級 CMOS 傳感器更節能。低功耗的 CMOS 也能降低 AI 眼鏡整體的發熱問題,避免眼鏡佩戴時因發熱而影響體驗。
此外,IMX681 還有不錯的 HDR 支持以及用上全局快門(Global Shutter)技術。
AI 眼鏡用于 AR 體驗、物體識别時,經常需要拍攝運動物體,全局快門能避免傳統滾動快門(Rolling Shutter)帶來的運動畸變問題。用于實時場景識别(OCR、手勢檢測、人臉識别等),全局快門也能可提供更清晰的影像,有助于 AI 算法的處理。
但 IMX681 的優勢,并不只在技術規格上,還在于索尼在智能手機上早已構建的影像生态,以及它與骁龍 AR1 平台的深度适配。
雷鳥 V3,圖 / 雷鳥創新
最直觀的一個例子就是年前剛剛推出的雷鳥 V3 AI 拍攝眼鏡,核心配置上采用了骁龍 AR1 Gen 1+ 索尼 IMX681 的組合,同時搭配手機廠商常用的虹軟算法,直接給出了一個相當不俗的影像表現。
但這種局面可能将被徹底改寫。
一方面是消息指出,豪威、思特威研發出來的新一代 CMOS 至少在性能參數上超越了索尼 IMX681。IMX681 再好,也終究是前幾年研發的產品,而 AI 眼鏡正處于從小眾探索走向大眾消費的關鍵階段,用戶對影像質量、AI 計算能力、續航的需求正在更新,廠商們需要新的、更強的解決方案。
當索尼的技術迭代速度跟不上市場需求,挑戰者的機會就來了。
另一方面是在成本和配合度上。一般來說,采購索尼高端 CMOS 的成本都不低,而國產廠商的一大優勢就是更低的價格,通過更強的性價比來扭轉市場格局。并且不同于索尼這類國際巨頭,國產供應鏈廠商也被證明更看重終端廠商的需求,更願意與終端廠商共同「定制」產品。
光影獵人 900 對應的就是豪威 OV50H,圖 / 小米
當然,最好的證明還是訂單。盡管在先前路透 . 社的報道中,亞馬遜的 AI+AR 眼鏡主要是面向自家的配送員,用以提升配送效率,但至少在與索尼的競争中,豪威已經初步拿下了一局。
不過正如前文所提,索尼的生态優勢也是國產 CMOS 廠商需要越過的一環。
得益于智能手機時代長期占據高端市場,索尼 CMOS 幾乎稱得上移動影像的标杆,甚至是用戶選擇手機的關鍵「參數」之一。這也讓索尼在影像 ISP 調校、算法優化、開發者适配等方面積累了龐大的經驗。
也包括與高通骁龍 AR 平台的協同優化。實際上我們可以看到除了普遍采用索尼 IMX681 作為 CMOS 影像傳感器,AI 眼鏡還普遍采用了骁龍 AR1 Gen 1 作為計算平台。
而這些都意味着,在廠商采用骁龍 AR1 方案時,不需要額外投入大量人力在影像優化上,就能獲得相對成熟的影像體驗。對于 AI 眼鏡廠商來說,這是一條穩妥且快速的開發路徑。
事實上,復盤 Ray-Ban Meta 的成功,不難發現除了基礎體驗的大幅優化,很成功的一點就集中在 Ray-Ban Meta「攝像頭」的優化和使用場景擴張上。
通過攝像頭,Ray-Ban Meta 用戶可以用更好的畫質,随時随地無感地記錄畫面,并且無縫地分享到社交網絡上。通過攝像頭,Ray-Ban Meta 用戶還可以随時随地基于現實世界與 AI 進行對話。
Ray-Ban Meta,圖 / Meta
如果說智能手機的影像能力是讓用戶「随時拍」,那麼 AI 眼鏡的影像能力則是讓用戶「無感拍」。它的價值在于解放雙手,讓拍攝變得更加順暢自然。這也是 Ray-Ban Meta 能夠成為目前市場上最受歡迎 AI 眼鏡的核心因素——第一人稱視角 + 社交分享,使得它在短視頻時代具備了天然的傳播優勢。
在大量的體驗和評測視頻中,「頭上長攝像頭」也是 Ray-Ban Meta 最核心的產品認知。
影像拍攝只是 AI 眼鏡攝像頭的一部分價值,更大的潛力在基于攝像頭的 AI 視覺能力——即攝像頭不僅僅是記錄影像的工具,而是 AI 眼鏡理解外部世界的「眼睛」。
沒有攝像頭的 AI 眼鏡,在本質上更像是在眼鏡中集成了 AI 耳機,只能被動接收指令。而配備攝像頭的 AI 眼鏡,則具備主動感知環境的能力,這直接決定了 AI 眼鏡能否提供真正的智能互動體驗。
圖 / Rokid
這一點在 Ray-Ban Meta、Rokid Glasses、雷鳥 V3 這些 AI 眼鏡上已經有初步體現,基于 AI 視覺,AI 眼鏡不僅能夠作為「百曉生」解答人類關于真實世界的好奇心,也能提供無感的 AI 實時翻譯體驗。
誠然,AI 視覺的實際應用還處于早期階段,還有很多地方需要挖掘。但不可否認的是,AI 眼鏡要真正成為日常佩戴的「智能設備」,攝像頭幾乎必不可少,而 AI 計算适配能力,可能也會比拍攝能力越發關鍵。
總結一下,從本質出發,攝像頭對于 AI 眼鏡上并不僅僅是一個承載拍照和錄像的影像組件,在一定程度上已經是 AI 眼鏡能否真正成為「智能設備」的關鍵分界點:
沒有攝像頭,AI 眼鏡就只是一個「帶耳機功能的眼鏡」,或者說佩戴在臉上的語音助手;有了攝像頭,它才具備環境感知能力,才能在 AI 互動、AR 體驗、智能識别等方面真正發揮作用。
界環 AI 音頻眼鏡做的,AI 耳機也能做,圖 / 界環
換言之,當攝像頭的功能從影像記錄拓展到 AI 視覺,它不僅是用戶拍攝的工具,更是 AI 感知世界的關鍵。
而國產 CMOS 廠商打破索尼技術壟斷的意義,也遠不止于提供了一個新的影像傳感器選擇,更是直接改變了 AI 眼鏡核心零部件的「供給」,更多、也更好,在 DeepSeek 借助開源力量被所有人擁抱的當下,一起推動 AI 眼鏡在終端產品上的體驗優化。
在這個角度看,從索尼一家獨大,到多家廠商競逐,這不僅是市場和技術演進的必然,更可能成為 AI 眼鏡邁向更廣泛市場的關鍵節點。