今天小編分享的科技經驗:最牛的 AI 應用開發者,都在做 AI 浏覽器,歡迎閲讀。
The Browser Company 是一家明星且特别的公司。
它創辦于 2019 年,base 在紐約,累計融資 1.28 億美元,估值超過 5.5 億美元。
核心產品 Arc 浏覽器,以颠覆性的產品體驗吸引了上百萬高粘性用户,在硅谷極客們眼中,Arc 是過去五年最酷的浏覽器產品,有着遠超 Chrome 等傳統浏覽器的產品設計。
但在 2024 年春天完成了 5000 萬美元融資之後,他們悄悄做出了一個決定——将團隊重心轉向新產品「全新設計的 AI 浏覽器」的研發,原產品 Arc 僅保持維護,用户期待的 Arc 2.0 也許再也不會有了。
半年後,新產品 Dia 浏覽器官宣。創始人 Josh Miller 説,他們對這個 demo 中的新產品,有數不清的 good idea。
現在, Dia 終于開啓了邀請碼公測。
01
為 AI 重新設計浏覽器
這支產品創新能力很強的團隊,一開始就目标明确:從頭開始,打造一款原生 AI 浏覽器。
為了做到這一點,開發團隊認為必須「推翻重來」;即使他們傾注數年心血的 Arc 浏覽器已經初步形成規模效應。開發團隊從未公布過 Arc 浏覽器的用户總量,但僅 Windows 版本上線首月就吸引了 20 萬用户,iOS 端 App Arc Search 上線之後用時三個月日活躍用户數量就突破了 10 萬。
雖然 Arc 浏覽器堪稱「古典浏覽器時代」的最高潮,但它無力對 AI Agent 對浏覽器帶來的這場革命產生關鍵影響;開發團隊也曾試圖在 Arc 浏覽器中整合一部分 AI 功能,但仍然無力改變 Arc 浏覽器本身并不是為 AI 而生這一事實。
Dia 官網上的一條信息寫道:Dia 并非僅僅是在現有浏覽器上添加 AI 功能,而是将 AI 作為核心構建理念,旨在打造一個全新的、由 AI 驅動的浏覽環境。
開發團隊認為,AI 不應該只是一個應用或一個按鈕,而應該成為浏覽器底層的能力。
Dia 作為從一開始就「深度整合 AI 能力進入浏覽器中」的產品,實際體驗能帶來哪些改變?
02
極簡但優雅的產品體驗
表面上,Dia 浏覽器是一款同時集成了 GPT-4o 與 Gemini Flash 2.0 的多模态 AI 浏覽器,支持個性化對話、視頻分析與多任務處理,并且免費、無使用限制。
但如果你已經或曾經是 Arc 浏覽器的用户,在打開 Dia 的首頁,你就能通過 Dia 首頁,意識到兩款浏覽器產品迥然不同的開發邏輯,即從「復雜極客工具」到「極簡 AI 入口」的產品邏輯巨大變化。
作為開發團隊對「AI 浏覽器應該是什麼樣」的一個實現方式,Dia 在首頁的一個角落加入了「Personalize Dia」功能,你可以通過輸入包括「你崇拜誰?」「你喜歡怎樣的學習方式?」以及「Dia 的回答風格」三個角度,來幫助 Dia 快速理解用户本身,将 AI 快速設定為用户更熟悉的一個形态。
無論是 Steve Jobs 的創新精神,還是《The Atlantic》、《NYT》、《New Yorker》等媒體的視角,用户的選擇都将潛移默化地影響 Dia 的知識結構搭建與思考方式,使其在某種程度上成為用户所崇拜對象的「投影」。
在 AI 融入浏覽器的浪潮中,Dia 團隊并非簡單地将 AI 生硬地塞入既有的框架,而是試圖從用户與 AI 的互動入手,構想「AI 浏覽器」的個性化定制方案。
更進一步,Dia 提供了多達 20 檔的「Dia 的回答風格」強度調節。這就像早期的作業系統允許用户調整字體大小和界面主題一樣,Dia 讓用户能夠精細地控制 AI 的表達方式和情感色彩。默認的中間檔位提供了一個平衡點,而用户可以根據自己的喜好,微調 Dia 的「個性」。
簡單設定好 Dia 的風格後,你能感受到開發團隊在「讓 AI 能説人話」這件事上,一定下足了功夫。「舒服」是最準确的描述。
對于經常使用浏覽器打開眾多視窗、處理復雜工作的用户,Dia 浏覽器的 @Tabs 中包括網頁内容分析、自動推薦提示詞等功能,确實能有效幫助用户理清思路、用最簡單的方式梳理復雜内容的結構脈絡。
在此前開發團隊的早期演示中,Dia 還能幫助用户完成更加復雜的任務,例如自動将郵件中的商品添加到亞馬遜購物車中 —— 彼時 AI Agent 概念還沒有興起。而在現階段版本的體驗中 Dia 對網頁讀取的顆粒度非常細致,但同時也更加強調借助 AI 能力,大幅簡化用户界面和操作流程,通過設計上的「克制」來獲取更加高效的使用體驗。
Dia 的預示着未來的 AI 浏覽器,将不再是冰冷的工具,而是能夠理解用户、貼近用户,甚至在某種程度上成為用户在數字世界中的延伸。
這與 Manus 團隊為 AI 單獨打造浏覽器的思路異曲同工,都指向一個核心目标:讓 AI 更好地服務于人類,同時以更自然、更個性化的方式融入我們的數字生活。
03
與 Manus 不同的產品哲學
對于原生 AI 應用來講,浏覽器作為平台讓模型能力可以更深入地理解用户的浏覽習慣和上下文,從而提供更個性化和高效的服務。快速地将 AI Agent 概念中的產品交付給用户,因此今年的情況,實際已經變成了「優秀的 AI 應用開發者,會打造自己的浏覽器」。
即使過去三十年互聯網領網域已經發生了數次重大的技術變遷,但浏覽器仍然是構成當代互聯網最前沿用户體驗的重要部分。但這也讓浏覽器市場變得「極端保守」。
或許會有一些極客用户,會為了屏蔽廣告等功能去嘗鮮一款新浏覽器工具,但絕大部分用户并不會為了一點新鮮感,放棄自己原本已經熟悉的體驗 —— 這才是讓 Chrome 過去十餘年一家獨大的根本原因。
如果説 Dia 浏覽器現階段哪一點最讓人印象深刻,或許仍然是「新鮮感」。但它的新鮮感與充滿「極客工具箱」屬性的 Arc 又有着明顯不同,Dia 浏覽器更像是開發團隊打造的一片「适合 AI 應用生長的土壤」。
這個思路與此前打造出 Manus AI 的 Monica.im 團隊異曲同工:在開發 Manus 的過程中,Monica.im 曾經一度想打造一款 AI 浏覽器,但他們很快遇到了一個問題:AI 和人類共用一個浏覽器界面,體驗極差。
最終 Monica.im 的解決方案是:為 AI 單獨打造一款浏覽器,讓人與 AI 互動,AI 操作浏覽器完成執行命令。作為基于浏覽器的 Agent 而存在,它需要用户在「想用 AI」 的時候使用。
針對同一個問題,在浏覽器互動上有着極強創新能力的 Dia 團隊,給出的答案是:在 AI 能夠更好地融入浏覽器之後,重新設計浏覽器的互動邏輯。
雖然 The Browser Company 聲稱自己「不做 App」,但浏覽器本質上仍然是一個巨型 App。除了 Dia 這樣的挑戰者,包括谷歌、Opera 等在上一個時代掌握浏覽器入口的選手,也在主動擁抱 AI Agent 給浏覽器帶來的轉型機會。
在當前 AI 應用發展處于早期,并未提供手機系統級别的生态入場機會的前提下,無論是 The Browser Company 還是 Perplexity 的 Comet,都選擇了浏覽器作為布局 LLM 深度互動生态的「船票」。
由于浏覽器這個形态的產品自承接端側用户信息以及互聯網入口的屬性,因此一些硬體 / 手機 OS 廠商,都又在這個領網域嘗試突破,落地一部分 AI Agent 的能力,因此這個賽道會迅速變得「百花齊放」,也會是 AI Agent 短期内最讓人興奮的突破口之一。
問題實際上變成了:對于創業公司來講,AI 浏覽器是否已經是現有生态下的 AI App 終點?
04
創業公司和大廠都在做浏覽器
回到一個根源的問題,「浏覽器」是什麼?
它是互聯網歷史的第一個「入口」。PC 互聯網的最初期,以網景、Mosaic 為代表的圖形界面浏覽器改變了用户訪問互聯網的方式,微軟 IE 浏覽器更是因為反壟斷案改變了科技競争格局。
随後,Office、Adobe 等桌面軟體一度興起,占據大量市場份額,但 Web 端依然出現了 G-Suite 和 Canva、Figma、Notion 等新鋭產品,随着 SaaS 模式在全球市場的成功,最終網頁應用和移動 App 成為了開發者 top 2 的選擇。
至少在桌面平台上,浏覽器是聚攏價值的金山。用户浏覽信息(新聞、博客、流媒體),執行操作(郵件、創作、視頻會議),所有這些,在大模型時代,我們稱之為 context(上下文)。
這意味着,AI 有極大的發揮空間,以及被 augmented 的機會。
如果你關注過去數月關于 Agentic AI 的讨論,你會發現 browser 浏覽器作為產品形态,頻繁地被讨論和使用。
Manus 内置了浏覽器,Opera 發布 AI 助手 Aria,Perplexity 和 OpenAI 都在做浏覽器產品,當然還有 The Browser Company 的新產品 Dia。
一些原本定義并非浏覽器的產品,也選擇了浏覽器的形态。比如豆包,它的桌面端基于 Chromium 開發。另一家大廠也有類似形态的產品——誇克的桌面端。這兩家大廠的產品,功能極其全面,且用户量遠遠領先創業團隊的新產品,最重要的,它們都是各自集團 AI to C 的重點發力產品。
豆包希望成為你的默認浏覽器
還有 Claude 的桌面端應用,基于 Electron 框架的 PWA 應用——還是 Chromium。(當然 Claude 大概率是個暫時性的產品,他們應該沒準備一輩子用這個形态。 )
還有很多廠商在琢磨怎麼讓 AI 能夠更好地「使用浏覽器」,比如剛剛完成融資的 browser-use,以及 Amazon 剛剛發布的 Nova Act SDK,這些項目更多在框架層,為開發者提供調取浏覽器的服務。
從 AI 接入方式的層面上,AI 浏覽器產品大多可以分為三類:
傳統浏覽器 + AI,通常以 copilot 的形式存在,最早有 Mircosoft Edge,以及 Chrome 上包括 Monica.im 在内的各種浏覽器插件。
讓 AI built-in 浏覽器的更底層,有更多權限。比如 Arc Max 能夠整理 tab,Opera Aria 能夠像 Manus 一樣執行操作,Dia 未來能夠擁有記憶,知道用户拿浏覽器做過什麼。豆包和誇克的桌面端產品,看起來「上網」不再是最核心的 feature ——就像打電話之于智能手機。OpenAI 和 Perplexity 正在研發的產品,大概率也在這個範疇内。
打造一款給 AI 用的浏覽器。這是 Manus 主要的產品哲學,他們讓用户與 AI 互動,AI 去操作跑在虛拟機上的浏覽器,是個更加終局的解決方案。
功能性的 roadmap 是明确且共識的:
最開始,AI 處理一個信息單元,讀取單個網頁,閲讀文字,抽取 YouTube 字幕,或者理解用户當前所處的網頁環境;
然後,context 延展,AI 能夠理解更多的信息,比如其他已經打開的 Tab,甚至能夠記住用户過去打開的網頁、執行的操作;
最終,AI 必然會代替用户執行操作,比如挑選商品、發送郵件、寫文檔、做設計,所有用户在浏覽器内能做的事,AI 都可以執行。
這是一個非常清晰的,能夠颠覆過去浏覽器體驗的機會。
只是我們還不知道,這個機會屬于拿到 5000 萬美元融資的 The Browser Company,還是傳統巨頭 Chrome 和 Edge,又或者,下一個像 Manus 一樣的創業新秀會橫空出世,将想象中的用户體驗變成現實。
你對 AI 浏覽器有什麼不一樣的理解?你覺得浏覽器領網域還存在創業者的機會嗎?極客公園和 Founder Park 正在針對 Agentic AI 進行系列研究,歡迎掃描下方作者名片的二維碼,加好友與我們交流。