今天小編分享的科技經驗:AI Phone的開局戰,手機拍照為什麼重要,歡迎閱讀。
生成式 AI 是新的數字世界和用戶世界之間的橋梁。拍照會是智能手機最容易告别 " 過度優化 ",走向新一輪軟硬體創新起點的開始?
vivo 剛剛嘗到冠軍選手該有的味道。vivo X200 系列眩光門這種極限概率的問題,被關注以及廣泛讨論,都是當下智能手機末世和卷局的表現。動辄見觀瞻,以及得咎于人,始終相伴。
手機大廠豢養的評測媒體和自媒體對手機功能的評測本身,不足以公平、客觀地評價產品已經是眾人皆知。北京大學某位教授所提到的語言腐敗,是這個社會的每個人,每個行業,以及方方面面。
終有一日,大廠們要為此付出一定的代價。這一話題本身不足多論。
手機大廠們非常取巧地在共用一個 " 蘋果設計師 "。當小米去年最早開始全面借鑑蘋果的直板復古外觀,vivo 也又借鑑了小米這種直板外觀設計,X200 系列沿用了這種風格。其他大廠又會繼續借鑑 vivo 的外觀?
庫克、雷軍、沈炜這些大廠的領袖,看來目标是一致的,就是投資效率。雖然,庫克曾經口頭對 ROI 這個詞加之自己和蘋果,表示過強烈的憤慨。GoogleVC 的合夥人 Siegler 的評論十分确當,現在的 iPhone 就是 Over-Optimized,過度優化。
AI 影像的變化,會對手機軟硬體創新帶來機會
小米、vivo 的新產品也都屬于優化過度,未必有太多新意。優化了多年的螢幕之後,現在影像似乎正在成為這群企業領袖們着力優化的方向,蘋果、三星、華為、小米以及此次意外事故瑕疵的 vivo,都在發力這一領網域。有了生成 AI 的技術潛力,Marc Levoy 在谷歌 Pixel 開辟的計算影像路線,正在被幾個大廠更新到一種 " 智能影像 " 的新高度。
vivo 此前确定的賽道技術路線當中,影像是唯一表現突出的,該公司的影像負責人也已獲得了重要的晉升。幾個月前上市的谷歌 Pixel 9 系列,除了相機之外,幾乎沒有任何重大的提升和改善。
抛開個别公司和個别人事不論,相機會是未來一兩年,手機大廠們唯一真實在做的努力方向?
AI 影像的話題價值在于,作為智能手機最重要的功能,這個功能的 AI 化是否會影響到手機產品本身的進化?從所謂的智能手機,進化到智慧手機的第一個突破口,是否會與影像相關?
簡單的邏輯,手機 AI 影像的更新并不會影響到智能手機大廠們賣廣告,代理遊戲運營的收入模式,不會影響到庫克、雷軍、沈炜們的 ROI,可以積極投入,而不用擔心會影響到 " 廣告機模式 " 的短期收益。
生成式 AI 對手機硬體型态的變化和影響,甚至超過了此前通信制式的變化,端側智能對本地存儲、算力、數據傳輸技術的影響已經在發生。
典型的例子是,從 4G 手機到 5G 的更新,iPhone 繼續沿用了傳統的石墨片散熱方案,沿用了讓人不齒的 6G 内存方案。現在,要想手機更好地運行一個本地化的 ChatGPT 架構,而不是訪問一個 APP,蘋果也不得不更新 iPhone 的存儲方案,并且對 iPhone 的硬體架構更新。
明年的 iPhone 17 系列,蘋果将會跟随安卓生态的腳步,引入 VC 散熱的方案。中國大陸的一家企業,以及中國台灣的兩家企業會蘋果供應相應的方案。此外,蘋果正在考慮一些新的 VC 方案。
當優化、過度優化都難以解決問題的時候,革命就會發生。此前,Marc Levoy 在谷歌所開創的人像模式、夜間模式、HDR+ 等玩法,後來蘋果以及安卓生态發揚光大。2020 年,此人在 Pixel 團隊的内亂時離開了谷歌,加入 Adobe,繼續其計算影像之路。
Marc Levoy 此後只有不多的幾次對外發言。2020 年,剛剛加入 Adobe 時,Marc Levoy 接受了 The Verge 的訪談當中,他談到了對計算影像技術方向的看法,不認同中國大廠們一味追求 " 大底 " 的技術路線。
他認為,未來的戰場是加速器和背後的計算能力。
也是在這一年,他因為在計算影像方面的貢獻而被授予美國工程院院士。在接受 Adobe Life 的訪談時,他提到了一個重要的趨勢和方向,一些原來專業的影像的處理、編輯的平台,應用到手機上時,往往受制于硬體的性能。随着硬體平台技術能力的提升,計算影像的新天地在被開啟。
這一表述,發生在多模态技術剛剛興起,以及 ChatGPT 誕生之前。
兩年之後,再接受 CNET 的訪問時,Marc Levoy 開始很明确地提到了 Adobe 和他本人正在努力的方向——在智能手機上,用一款通用的 APP 軟體,為那些有一定能力的攝影者提供幫助,讓那些原來需要手動控制的功能更為方便,比如,iPhone 當中的 Halide,以及安卓上的 Open Camera。
如今來看,安卓和 iPhone 生态似乎應該積極擁抱 Adobe 的這種創意工具軟體和生态。《智物》此前提到過,每一個智能硬體平台之上,會有一個全新的作業系統,用以支持用戶數據和應用之間的智慧服務,其實,就像是 ChatGPT 大模型和模型之上的各種 middle layer 的關系,替代此前安卓、iOS 的應用商店模式。
回顧 Adobe 公司和喬布斯以及 Mac 生态的恩怨,在 AI 時代的起點,Adobe 這樣的公司有幾個重要的優勢,天生對各種 IT 技術應用敏感,願意嘗試,更重要的是,創意人群天生具有付費的意願和能力。在生成式 AI 大潮之下,Adobe 的股價曾經一度被打壓,跌勢兇猛。
《智物》曾經跟多個投資機構交流過,Adobe 反而是最容易拿到 AI 時代船票的公司。過去兩年的進展來看,Adobe 的進度似乎也驗證了這個看法。
Adobe 傳統的軟體平台 Camera RAW 目前适配支持多款手機,包括最新的 iPhone 16 以及三星旗艦版本,當然更是支持 Marc Levoy 老東家的 Pixel 系列,國内手機當中包括小米 15 系列,以及一加系列。
AI 軟體對手機影像的優化,可能會帶來手機架構的本質變化
當智能手機可以完善地支持自身的 AI 影像,以及 Adobe 這種原本非常復雜的影像編輯、處理軟體,會對其他的應用帶來怎樣的變化和影響?是不是會動搖到現有智能手機運算架構系統的基礎?是否會動搖到如今,這些手機大佬們萬分不舍的 APP 分發和流量廣告的商業模式?
那個時候,或許應該有產品經理和創業者和投資人,不屑于再去構思 " 過度優化 " 的手機,而是去從新做一款手機。就像最近 Marc Andreessen 所提到的,不是再在一個成熟的蛋糕上撒面粉,而是重新設計,烘焙一個新的蛋糕。
李飛飛在其自傳當中反復提到過《第一只眼》這本書,視覺能力在生物進化過程中所扮演的關鍵角色。手機這樣的硬體設備,能夠具備更強的影像拍攝能力,會對整個硬體系統本身帶來如何的影響嗎?
簡單地描述這個問題。特斯拉的自動駕駛攝像頭和系統,除了規劃道路之外,也在識别整個周邊的世界,既包括行人,也包括車主,這會讓車輛的系統和架構非常不同于傳統意義上的電動車。
從這個意義上來說,多模态和生成式 AI 技術是用戶和數字世界之間新的橋梁,機器系統準确記錄物理世界的能力,理解物理世界的能力,和生成一個虛幻的數字世界的能力,本來就是一種能力。
接近 10 年前,三星、華為都曾經試圖用攝像頭感知,讓手機去識别、判斷用戶的簡單行為意圖,以今天的算法能力,和軟硬體系統來看,會不會有新的成果?