今天小編分享的科技經驗:OpenAI 與全世界最新鋭的團隊,想要用 AI 完成對浏覽器的「復興」,歡迎閲讀。
網景公司創始人 Marc Andreessen 曾過説:浏覽器可以説是有史以來對人們生活影響最大的一個軟體。
無論桌面 PC 世代還是智能手機世代的用户,都離不開浏覽器這個工具——它太過重要,甚至可以説是互聯網迄今為止最重要的發明。在互聯網過去三十年的數次時代變遷中屹立不倒。
但這不意味着浏覽器在 AI 時代中不會發生改變:據 The Information 報道,OpenAI 正在打造一款與 ChatGPT 深度整合的網絡浏覽器工具,并且已經就 ChatGPT 在網頁互動上的功能整合,與旅遊、食品、房地產以及零售等主要網站服務商進行了溝通。
OpenAI 已經組建相關團隊計劃開發「AI 浏覽器」|圖片來源:The Information
除此之外,OpenAI 在近幾個月已經挖來了 Google Chrome 創始團隊成員 Ben Goodger:他同時也是 Firefox 的首席工程師,這意味着 OpenAI 可能已經為 AI 浏覽器項目可組建了相關的團隊。
關于 AI 浏覽器這個概念,其實我們已經不陌生:如果你是一個 Mac 用户,又恰好是一個效率工具愛好者,那你肯定聽説過 Arc 浏覽器這款產品:這是一款基于 chromium 内核打造的第三方浏覽器。它将浏覽器的平台化應用做到了極致,旨在幫助用户「靈活調度所有網頁内容」,并由此衍生出了自己獨特的标籤頁管理與互動邏輯。
這套如同效率工具一般的邏輯經過浏覽器的功能整合,迅速收獲眾多擁趸,開發團隊 The Browser Company 也在 2024 年以 5.5 億美元的估值,融資 5000 萬美元。
但在似乎一切都在向好的方向前進時,開發團隊卻自己選擇按下了終止鍵,選擇另起爐灶,原因無他,只是開發團隊認為「能在 AI 被 時代用户喜愛的浏覽器應該是别的樣子」。
無獨有偶,從 2024 年秋開始,諸如 Claude 3.5 發布的 computer use、Google 泄露了下一代浏覽器工具 Project Jarvis 這樣基于浏覽器人機互動流程優化的產品相繼誕生。
似乎在近兩年的生成式 AI 浪潮後,終于輪到我們最熟悉的浏覽器被 AI 來「更新」了。但 AI 浏覽器,究竟會以一種怎樣的面貌出現在我們的設備中?
01
Arc 走過的彎路
2024 年 10 月底,按照 The Browser Company 聯合創始人的 Josh Miller 在公告視頻中公布的信息,盡管 Arc 在過去一年中用户數量增長了四倍,但其復雜性和獨特性使其難以成為主流產品。
因此,團隊決定不再在現有產品上進行改進,而是着手開發一款全新的浏覽器,旨在從根本上改變用户與網絡的互動方式,成為一個更具主動性和智能化的平台。
我用 ChatGPT 翻譯了一下,Josh Miller 説的話意思大概就是「Arc 浏覽器現在挺好的,但我們覺得這不是我們想要的未來,因此我們不會繼續更新它了」。
這種「棄坑聲明」一般的内容即使被包裝的像是「新產品發布預告」,不出意外還是被網友普遍理解成了:
「給 Arc 浏覽器出殡」。
即使創始人将這個「下一步」吹的天花亂墜,但不難想象這樣一通騷操作肯定犯了眾怒——尤其是那些伴随着 Arc 浏覽器一路走來的老用户們。
在 Josh Miller 發布的視頻評論區,高贊評論幾乎全是關于吐槽這份宣言,因為它等同于将 Arc 浏覽器宣判死刑:即使是當下,Arc 也并沒有做到真正意義上的完美,它還有着眾多的問題需要修補。
視頻下評論區用户對于「棄坑聲明」的吐槽 | 圖片來源:YouTube 評論區
能讓開發團隊冒着如此風險去開發的新產品,足見這次「轉向」在 The Browser Company 眼中的重要性:按照 Josh 在視頻中的説法:他們認為 AI 能力「即将徹底改變浏覽器」,因此他們要做的新產品也将會是再一次颠覆浏覽器使用體驗的一款產品。
雖然罵聲一片,但對于打造了 Arc 浏覽器這樣明星產品的團隊來講,在光環圍繞的情況下保持清醒激流勇退,尤其是從創業公司的角度,确實稱得上是做「難但正确的事」。
站在此時反思,其實 Arc 浏覽器雖然一開始标榜「讓每一個用户都能高效使用浏覽器」,但實際上在誕生後兩年多的迭代中,Arc 浏覽器逐漸偏離了這個目标:過多的新元素同時也意味着高昂的工具學習成本,Arc 被很多用户诟病的「上手困難」,很多習慣了 Chrome 的用户對于切換到這樣一款新產品的興趣并不強。
或許也是因為看到了 Arc 浏覽器現在存在的這種問題,開發團隊在預告他們的下一款浏覽器產品時,表示「讓(上手的)前 90 秒變得毫不費力」将會是全新浏覽器的重要特征。
這幾乎已經是在明示在這款全新的浏覽器中「用 AI 能力幫你快速上手」将會是主要賣點:Arc 浏覽器至今存在的「評價兩極分化」,也是在一定程度上解釋了用户并非不需要效率工具,而是在不希望在這個過程中本末倒置,為了學習使用效率工具花費更多的成本。
不只是 Arc 浏覽器,實際上在 2024 年,包括 Google Apple 這樣的系統大廠都在做相應的功能跟進,「用 AI 幫你接管繁瑣的初步設定」這個概念已經初具規模:這些功能如同一個帶你參觀房子的向導,不僅能替你解答其中的具體問題,更能在背景中,自動根據用户的個人喜好,将眾多設定選項調整至完美的狀态。
iOS18.1 中,Apple intelligence 能力可以自動幫助用户完成部分手機設定 | 圖源:Apple 官網
02
「在信息的海洋中滑行」
回顧互聯網歷史,幾乎每一個十年的互聯網操作體驗變革,背後都有浏覽器產品之王易主的影子。
浏覽器在很多時候是構成互聯網體驗的重要視窗,因此浏覽器的操作變革一直走在互聯網工具更新的最前沿:從 1994 年網景打造的 Mosaic 浏覽器占據當時 80% 的市場份額,到微軟通過 Windows 預裝 IE 浏覽器迅速成為新時代的霸主,再到新世紀初 Firefox、Chrome 為代表的操作效率與移動端革命,浏覽器的一次次革命,都如同預言般奠定了未來數年的互聯網技術發展趨勢。
雖然大模型能力已經成為所有人公認、即将改變互聯網面貌的重要技術革命,但作為工具的浏覽器似乎在這一輪演變中慢了一拍:以 OpenAI 為代表的第三方大模型廠商通過直接抓取網頁信息,給出用户反饋的方式,大有取浏覽器而代之,成為新世代互聯網最主要互動工具的趨勢。
目前的 Arc 浏覽器中,其實已經能看到不少 AI 功能的身影:比如直接在網頁中提問問題,Arc 浏覽器就能根據網頁中顯示的内容給出最相關的信息整合反饋,以及浏覽器中對于 ChatGPT 的整合,網頁 / 下載檔案自動重命名等功能。
Arc 浏覽器中現有的網頁内容問答功能 | 圖片來源:Arc Search
尤其是在誕生時間更短的手機版 Arc Search 上,開發團隊還設計了「捏合總結網頁信息」的功能:只需要在手機螢幕上捏合網頁,Arc Search 就能自動調用語言模型能力,幫你匯總網頁中的内容并整理一份摘要。以及 AI 搜索功能:搜索後不會返回傳統搜索引擎的詞條,而是參考至少六個相關網頁内容,然後以總結的形式精準給你一個關于你的問題的答案。
移動端 Arc Search App 的 AI 搜索功能 | 圖片來源:The Brower company
如果這些都不算開發團隊眼中的「AI 浏覽器」,那真正的 AI 浏覽器應該是什麼樣,就成了新的問題:按照 The Brower company 的介紹,他們已經花了五年的時間在這款產品的開發上,當下 Arc 的平台化能力将會繼續成為全新浏覽器產品的特征之一。
雖然 LLM 如今明顯有「取代搜索引擎」的趨勢,但這并不代表浏覽器将會在下一個時代中被淘汰。相反浏覽器作為 AI 能力平台的屬性将會進一步得到強化:當前 Chrome 浏覽器的第三方插件應用商店中,就已經能看到不少調用第三方語言模型能力的插件。
目前已經能在 Chrome 浏覽器中調用 Claude 的插件|圖片來源:Chrome 應用商店
Google 目前尚未發布的 Project Jarvis,據稱也是一款利用 Gemini 2.0 能力,改變用户與網頁内容的互動的一款插件工具。
Josh 在視頻中提到,他設想中的、屬于 AI 時代的浏覽器應該有的體驗,應該是他在舊金山乘坐 Waymo 自動駕駛出租車服務時,有過的那種「在物理世界中輕盈滑過」的感覺。
具體到互聯網世界,這顯然就是「浏覽器應該幫助用户從網頁中高效提取有用的信息」,甚至幫助用户完成一些必要的互動:例如填寫相關的賬号、地址等信息。
類似的概念其實不只局限于浏覽器:Claude 3.5 發布的 Computer Use 功能,其實已經能實現初步的「電腦接管」,例如你提問「幫我總匯總最近的數碼新聞」,它可以自動完成「打開浏覽器 - 輸入關鍵字 - 總結反饋内容 - 生成一份日歷視圖的表格」這樣的流程。
但 Computer Use 目前暴露出的問題,其實也與浏覽器有關:例如當你想要執行一個「幫我查詢機票最低價格并預定一個旅遊套餐」時,不僅涉及到「搜索 - 反饋」的動作,其中還涉及到大量「輸入個人信息 / 銀行賬号」這樣的驗證信息,類似 Claude 這樣的自然語言機器人,難以順暢地完成其中所有關鍵操作。
Conputer Use 自動幫你訂票時,涉及到用户信息填充的部分仍然比較繁瑣|圖片來源:Anthropic
從這一步其實已經能看出,如果類似的功能是浏覽器本身自帶,這樣的問題就都能迎刃而解——實際上,Google Project Jarvis 目前已經泄露的消息中,就已經出現了類似的功能:作為 Google 官方發布的產品,Project Jarvis 的官方介紹是「您上網衝浪時的有用伴侶」。不僅有可能完全基于端側運行,而且能在确保用户數據安全的情況下,幫助用户處理更多涉及到諸如賬号密碼、相冊分類,内容查找等基于浏覽器實現、包含大量用户隐私數據的操作。
在掌握了足夠的事實信息以及用户數據後,如今還不具備多少可行性的「直接幫我買某某產品」,實現的可能性就急劇提升:由于不少人依賴浏覽器訂閲服務以及訂購各種數字產品,浏覽器已經事實上成為很多人的信用卡與密碼管理工具。
此外,由于有了浏覽器本身的支持,讀取各種網頁内容,就再也不用像 Claude 3.5 那樣,需要依賴多模态識别螢幕截圖,效率極低地完成各種操作:這個難題,包括 Apple 與微軟這樣的作業系統級廠商都難以解決,而浏覽器作為訪問網頁内容的「視窗」,本身就掌握着網頁最為豐富的原始信息,不僅能夠提升操作效率,也能大大提升操作準确率。
這些操作,在開發術語中需要借助大量的浏覽器 API 接口,才有可能獲得,而 Arc 浏覽器此前作為遵循平台化思想開發的一款浏覽器產品,實際上就已經初步具備了這樣「接管用户數據」的能力,接下來能做的,顯然是讓浏覽器「想用户所想」,并最終進化成為一款「替做用户盡可能做更多想做的事」的這樣一款工具。
聽起來很美好,但實際上關于「浏覽器在 AI 工具的浪潮中何去何從」的讨論,如今才剛剛燃起星星之火:不僅有 Chrome 這樣浏覽器巨頭的早期探索,也有類似 OpenAI、Anthropic 這樣試圖完全颠覆浏覽器操作體驗的廠商,Arc 浏覽器團隊的「急轉向」,也恰恰表明了他們要第一批加入這場競争的信心。
在 AI 能力的支持下,浏覽器能做的,顯然不只是如同 ChatGPT 一樣,總結并返回搜索結果這樣簡單。
但目前,随着 Arc 浏覽器的停止更新,有一件事已經塵埃落定:至少在今天,我們需要最新鋭的團隊,投入到對下一代浏覽器的探索,而不是再來一場「浏覽器的文藝復興」。
但目前,随着 Arc 浏覽器的停止更新,以及 OpenAI、The Browser Company 這樣的團隊全力投入「AI 浏覽器」的開發之中,關于這個話題的結論已經塵埃落定:
無論巨頭還是創業公司,其浏覽器產品想要在 AI 時代中繼續生存下去,對 AI 浏覽器的探索必不可少。