今天小編分享的教育經驗:AI工具,讓8小時分析工作縮至5分鍾:紅杉資本采訪OpenAI 的DeepResearch團隊(附視頻),歡迎閲讀。
以下文章來源于 AI 深度研究員 ,作者 AI 工作坊
作者 | AI 工作坊
來源 | AI 深度研究員 管理智慧
咨詢合作 | 13699120588
文章僅代表作者本人觀點
OpenAI 剛剛宣布,DeepResearch 正在向所有 ChatGPTPlus、Team、Edu 和 Enterprise 用户推出。就在這一重大消息發布前,紅杉資本合夥人 SonyaHuang 和 LaurenReeder 昨天主持了一場備受關注的采訪,深入對話了 OpenAI 的 DeepResearch 產品負責人 IsaFulford 和 JoshTobin。這款三周前首次亮相的智能體產品已迅速在科技界獲得認可,吸引了從知名人士 cisin 到眾多行業專家在内的廣泛用户群。
" 它能在 5 到 30 分鍾内完成人類需要數小時才能完成的任務 "
作為 OpenAI 繼 "Operator" 之後推出的第二個智能體產品,DeepResearch 通過端到端強化學習訓練,能夠像經驗豐富的研究員一樣思考、搜索并生成報告。JoshTobin 在采訪中透露:"DeepResearch 是第二個智能體,你知道,我們未來會發布更多。" 當被問及 2025 年的技術突破點,Josh 和 Isa 不約而同地回答:" 智能體。"
" 這不僅僅是讓你節省 5% 的時間,而是将原本需要 8 小時的任務縮減至 5 分鍾 "
更為重要的是,DeepResearch 可能标志着知識工作的轉捩點。雖然 Isa 強調 " 我不認為這是勞動替代之類的事情 ",但這種效率質變必将重塑工作本質。一項原本需要數天的研究,現在只需幾分鍾,不僅節省時間,更擴展可能性邊界。如 Isa 所言:" 如果你有無限的時間,你會做什麼?現在也許你可以做很多很多份工作。"
DeepResearch 特點
DeepResearch 不只是一個普通的搜索工具,而是 OpenAI 精心打造的專業研究助手。根據 IsaFulford 在紅杉資本采訪中的描述,這款產品的核心價值在于其整合信息的能力:" 它能夠進行更深入的研究,并以比常規 ChatGPT 響應更詳細和更具體的來源回答你的問題。" 這種能力直接解決了當今信息爆炸時代的一個核心痛點:如何從海量數據中提取有價值的、相關的信息。
1、核心功能
從功能角度看,DeepResearch 具備多項關鍵能力。首先,它可以搜索眾多在線網站,不局限于單一信息源;其次,它能創建結構化、全面的報告,而非僅提供簡單答案;第三,它支持影像嵌入和圖表創建功能,豐富了輸出形式。正如 JoshTobin 在采訪中所強調的,DeepResearch" 非常擅長在互聯網上找到非常晦澀、奇怪的事實 ",這一能力使其在專業研究領網域尤為有價值。
此外,該產品還具備強大的綜合分析能力。Josh 在采訪中指出:" 它通常會使用帶有大量引文等的表格 ",這種方式不僅提高了信息的可讀性,也增強了結論的可信度。Isa 進一步補充,模型 " 能夠嵌入影像 " 并 " 創建圖表 ",這些功能未來将進一步集成到 ChatGPT 中。
2、技術架構
從技術角度看,DeepResearch 代表了 OpenAI 在智能體開發方面的最新突破。IsaFulford 在采訪中詳細解釋了其技術基礎:" 驅動 DeepResearch 的模型是我們最先進的推理模型 o3 的微調版本,我們專門在收集的困難浏覽任務以及其他推理任務上訓練了它。它還可以訪問浏覽工具和 Python 工具。"
這種架構設計反映了 OpenAI 對端到端強化學習方法的重視。JoshTobin 解釋道:" 直觀地,你可以這樣想:你提出一個請求,最好是一個詳細的請求,關于你想要什麼,模型會認真思考,搜索信息,提取信息,閲讀信息,理解它與請求的關系,然後決定接下來搜索什麼,以接近你想要的最終答案。"
與傳統的智能體構建方法不同,DeepResearch 采用了端到端訓練方法,而非預定義操作圖。Josh 在談到此前在創業公司的經驗時指出:" 大多數人在互聯網上描述構建智能體的方式,基本上是,你構建一個操作圖,其中一些節點是語言模型 ... 但在現實世界中很快就會失敗,因為很難預測模型可能面臨的所有場景。" 相比之下,DeepResearch" 是直接端到端訓練來解決用户使用它來解決的任務類型 ",這使其能夠更靈活地應對復雜、多變的研究場景。
Isa 進一步補充了這種方法的優勢:" 因為我們有能力進行端到端訓練,在做研究的過程中有很多事情是你事先無法預測的,所以我不認為可以編寫某種語言模型程式或腳本,能夠像模型通過訓練學到的那樣靈活,它實際上是對實時網絡信息的反應,并根據看到的内容改變策略等。"
3、與 OpenAI 其他產品關系
DeepResearch 是 OpenAI 不斷擴展的產品矩陣中的重要一環。JoshTobin 在采訪中解釋了它與其他產品,尤其是 Operator 的關系:" 今天,這些是相當獨立的,但你可以想象我們正在朝哪個方向發展,對吧?最終的智能體,人們在未來某個時候能夠訪問的智能體,應該能夠做的不只是網絡搜索或使用計算機或你希望像人類助理做的那樣做任何其他類型的行動,而是應該能夠以更自然的方式融合所有這些東西。"
在功能定位上,DeepResearch 與 O 系列模型也有明确的區分。Josh 解釋道:"DeepResearch 真正擅長的是,如果你有一個關于你想要什麼的詳細描述,并且為了得到最佳答案需要閲讀大量互聯網内容。" 相比之下," 使用 O 系列模型,如果我要求與編碼有關的事情,通常不需要模型從預訓練中知道的知識之外的知識,所以你通常會使用 01Pro 或 o1 進行編碼,或者 o3minihigh。" 用户互動流程與澄清機制設計
DeepResearch 的用户互動設計體現了 OpenAI 對用户體驗的深入思考。最具特色的是其澄清流程,Isa 解釋道:" 如果你使用過 DeepResearch,模型會在開始研究之前問你問題,通常 ChatGPT 可能會在響應的末尾問你一個問題,但它通常不會在前面有這樣的行為,這是故意的。"
這一設計源于一個重要認識:" 如果你想要研究模型的最佳響應,提示必須非常具體和詳細,而且我認為用户在第一個提示中提供所有信息并不是自然的行為。" 因此,團隊添加了這個額外步驟," 以确保用户提供我們需要的所有細節 ",特别是考慮到用户可能需要等待 5 到 30 分鍾才能獲得響應。有趣的是,這一設計已經催生了新的用户行為模式。Isa 提到:" 我在 Twitter 上看到很多人説他們有這個流程,或者他們會與 o1 或 o1Pro 交談,以幫助使他們的提示更詳細,然後一旦他們對提示感到滿意,他們就會将其發送給 DeepResearch,這很有趣,所以人們正在找到自己的工作流來使用這個。"
產品開發歷程
DeepResearch 的誕生源于 OpenAI 團隊對新推理模式的探索和應用。JoshTobin 在接受紅杉資本采訪時回憶道:" 我想大概一年前,我們在内部看到了一種新的推理範式取得了很大的成功,即訓練模型在響應前進行思考。我們當時主要關注數學和科學領網域,但我認為這種新的推理模型範式解鎖的另一件事是,能夠執行更長期的任務,這些任務涉及類似智能體的能力。"
1、產品的演變
這一洞察為 DeepResearch 的開發奠定了概念基礎。團隊認識到,許多真實世界的任務 " 需要大量的在線研究或大量外部背景知識,這涉及到很多推理和區分來源的能力,而且你必須非常有創造力才能完成這些任務 "。随着模型能力的提升,OpenAI 終于找到了解決這類復雜任務的技術路徑:" 我想我們終于有了模型或訓練模型的方法,使我們能夠應對這些任務。所以,我們決定嘗試開始訓練模型來執行浏覽任務,使用與訓練推理模型相同的方法,但在更真實世界的任務上。" 從初始概念到成熟產品,DeepResearch 的發展過程體現了 OpenAI 對產品迭代和用户需求的高度重視。雖然采訪中沒有詳細披露具體的開發時間線,但可以看出團隊經歷了從技術原型到功能完善的產品演進過程,并對特定場景(如醫學研究、市場分析)進行了專門優化。
2、產品開發團隊
DeepResearch 的開發匯集了 OpenAI 内部多位傑出人才的智慧。根據采訪内容,產品最初由 IsaFulford 和其他同事共同構思。Isa 回憶道:" 一開始是我和 OpenAI 的其他同事,正在做一個類似的項目,未來某個時候會發布,我們對此非常興奮。"
在早期開發階段,ThomasDimson 發揮了關鍵作用,Isa 這樣評價他:" 他是那種非常出色的工程師,會深入鑽研任何事情,完成大量工作,所以非常有趣。" 這反映了項目在技術實現上的專業性和嚴謹性。JoshTobin 則是在項目後期階段加入的重要力量。他在采訪中説道:" 我是最近才加入的,大約六個月前,我從我的初創公司重新加入 OpenAI。我在早期曾在 OpenAI 工作過,重新加入後,我在項目中四處看看,對我們的一些 Human-MachineTeamwork 工作非常感興趣,包括這個項目,于是就參與進來了。"Josh 帶來了在初創企業積累的智能體開發經驗,為項目提供了新的視角。
此外,采訪中還提到了 EdwardSun,Josh 稱他為 " 項目中的另一個人 ",并強調他在數據集優化方面的卓越能力:" 他會優化任何數據集,所以這是成功的秘訣,找到你的 Edward。"
這些核心團隊成員的背景與專長各不相同,但共同的目标是構建一個能夠有效處理復雜研究任務的智能體產品。他們的努力最終促成了 DeepResearch 的成功發布和廣泛應用。
3、技術突破點
開發 DeepResearch 的過程中,團隊面臨并克服了多項技術挑戰。其中最核心的挑戰之一是如何訓練模型執行靈活、開放式的研究任務,而非固定流程的操作。
JoshTobin 分享了他在此前創業過程中的關鍵發現:" 大多數人在互聯網上描述構建智能體的方式,基本上是,你構建一個操作圖,其中一些節點是語言模型,所以語言模型可以決定下一步做什麼,但發生的步驟序列的總體邏輯是由人類定義的。我們發現這是一種快速構建原型的有力方式,但在現實世界中很快就會失敗,因為很難預測模型可能面臨的所有場景,并思考你可能想要采取的所有不同路徑的分支。" 這一洞察促使團隊轉向端到端訓練方法,讓模型直接學習如何執行復雜的研究任務,而不是預定義操作流程。Josh 解釋道:" 我認為這個模型真正強大的地方在于,它是直接端到端訓練來解決用户使用它來解決的任務類型,所以你不必在後端設定圖或做出這些節點決策,所有這些都由模型本身驅動。"
IsaFulford 進一步闡述了端到端訓練的獨特優勢:" 因為我們有能力進行端到端訓練,在做研究的過程中有很多事情是你事先無法預測的,所以我不認為可以編寫某種語言模型程式或腳本,能夠像模型通過訓練學到的那樣靈活,它實際上是對實時網絡信息的反應,并根據看到的内容改變策略等。所以我們實際上看到它進行了相當有創意的搜索,你可以閲讀思維鏈摘要,我相信你有時會看到它在想出下一步要查找什麼時非常聰明。"
另一個重要挑戰是确保模型生成内容的可靠性。正如 JoshTobin 所強調的:" 這顯然是這個模型和產品的核心部分,我們希望用户能夠信任輸出,所以其中一部分是我們有引文,用户可以看到模型從哪裏引用信息,我們在訓練期間實際上會努力确保這一點是正确的,但模型仍然有可能犯錯誤或幻覺,或者信任一個可能不是最值得信賴的信息來源,所以這絕對是我們希望繼續改進模型的活躍領網域。"
4、高質量數據集
在 DeepResearch 的開發過程中,高質量數據集的構建被視為成功的關鍵因素之一。JoshTobin 作為後期加入的團隊成員,對此有着清晰的觀察:" 嗯,我的意思是,也許我可以作為一個觀察者來説,而不是從一開始就參與其中的人,但似乎 Isa 和團隊其他成員非常努力地工作,并且是成功的關鍵之一是制作高質量的數據集。你知道,這是機器學習中人們不斷重新學習的古老教訓之一,但你輸入模型的數據質量可能是你獲得的模型質量的最大決定因素。"
EdwardSun 在數據集優化方面發揮了突出作用,團隊反復強調了高質量訓練數據在實現模型卓越性能中的重要性。這反映了 OpenAI 在 AI 開發中的一貫理念——盡管模型架構和訓練方法至關重要,但沒有高質量的訓練數據,即使是最先進的神經網絡也無法發揮最佳性能。
對于 DeepResearch 這樣需要在復雜、多樣化場景中執行開放式任務的智能體,數據集質量的重要性更加凸顯。團隊不僅需要收集各類研究任務的樣本,還需要确保這些樣本覆蓋不同領網域、不同難度級别的研究場景,以培養模型的通用研究能力。
DeepResearch 應用場景
1、專業領網域應用
DeepResearch 在專業領網域展現出強大的應用潛力,為各行各業的知識工作者提供了前所未有的研究效率。IsaFulford 在紅杉資本的采訪中明确指出:" 它真的是為那些在日常工作或生活中從事知識工作的人準備的。所以,我們看到很多使用來自工作中的人們,比如,作為工作的一部分進行研究,了解市場、公司、房地產,還有很多科學研究、醫學研究,我認為我們也看到了很多醫學示例。"
在商業分析領網域,DeepResearch 能夠快速整合市場信息、競争對手數據和行業趨勢,幫助決策者制定更明智的戰略。主持人 LaurenReeder 分享了一個實際案例:" 我的一個朋友正在考慮創辦一家 CPG 公司,他一直在用它來尋找類似的產品,看看特定的名稱是否已經被使用,網域名是否已經被占用,市場規模等等,所有這些不同的東西。" 這種全方位的市場研究能力,大大降低了創業者的信息收集成本。
醫學研究是另一個備受關注的應用場景。JoshTobin 表示:" 我對很多醫學用例感到非常興奮,只是能夠找到某個病情的所有文獻或所有最近的病例,我認為我已經看到很多醫生發帖關于這個,或者他們聯系我們説,哦,我們用它來做這個,我們用它來幫助為這個病人找到臨床試驗或其他東西。" 在醫療環境中,DeepResearch 的快速文獻綜述能力可以幫助臨床醫生掌握最新研究成果,為患者提供更精準的治療方案。
令人意外的是,技術文檔檢索也成為了 DeepResearch 的熱門應用場景。Isa 承認這超出了團隊的預期:" 我認為我最驚訝的是有多少人用它來編碼。是的,這并不是我真正考慮過的用例,但我看到很多人在 Twitter 和我們收到反饋的各種地方用它來進行編碼和代碼搜索,還用于查找某個包的最新文檔或幫助他們編寫腳本之類的東西。所以,是的,我有點尴尬,我們沒有想到這個用例,因為對于 ChatGPT 用户來説,這似乎很明顯,但它的表現确實令人印象深刻。" 這表明,DeepResearch 在技術領網域的應用遠比最初設想的更加廣泛。
2、個人使用場景
除了專業應用外,DeepResearch 在個人生活場景中也展現出強大潛力。IsaFulford 特别強調了這一點:" 我們還非常興奮的是,這種風格的—— ' 我只需要花很多時間去做某件事,我必須進行一堆網絡搜索并分類一堆信息 ' ——這不僅僅是工作上的事情,對購物和旅行也很有用。"
在消費決策方面,DeepResearch 能夠整合產品評價、技術參數和用户反饋,幫助消費者做出更明智的購買決定。Isa 分享了自己的親身體驗:" 對我來説,天哪,我在考慮買一輛新車,我想知道這款車的下一個型号什麼時候發布,有很多推測性的博客文章,比如制造商的模式等等。所以我問 DeepResearch,你能分解關于這款車的所有八卦嗎?還有他們之前做過什麼,這家汽車制造商的歷史。它整理了一份驚人的報告,告訴我也許等幾個月,但今年,比如在接下來的幾個月裏,它應該會發布。"
旅行規劃是另一個主要的個人應用場景。Isa 提到:" 我們在日本為 DeepResearch 的發布做了很多準備,所以它在尋找有非常特定要求的餐廳和找到我本來不會找到的東西方面非常有幫助。" 對于旅行者來説,DeepResearch 能夠整合目的地信息、用户評價和當地文化背景,提供比傳統旅行指南更加個性化、全面的行程建議。
個性化學習則是 LaurenReeder 特别提到的應用場景:" 個人化教育也是一個非常有趣的用例,比如,如果你一直想學習某個主題,你知道,如果你需要復習你的生物學,或者你想了解某個世界事件,它非常擅長讓你輸入你覺得不理解的信息,以及你想研究哪些方面,它會為你整理一份漂亮的報告。" 這種個性化學習體驗,可能徹底改變人們獲取知識的方式。
3、與傳統搜索引擎對比
DeepResearch 與傳統搜索引擎及其他 AI 工具相比,展現出明顯的差異化特征。JoshTobin 提供了一個清晰的對比框架:"DeepResearch 真正擅長的是,如果你有一個關于你想要什麼的詳細描述,并且為了得到最佳答案需要閲讀大量互聯網内容。" 與之相對," 如果你有一個更模糊的問題,它會幫助你澄清你想要什麼,但我的意思是,當你尋找一組特定的信息時,它的表現最好。" 與傳統搜索引擎相比,DeepResearch 最大的優勢在于其綜合分析能力。傳統搜索引擎提供的是相關網頁的列表,用户需要自行浏覽、提取和整合信息。而 DeepResearch 則直接提供經過整合的報告,大大節省了用户的時間和精力。JoshTobin 強調了這一點:" 它非常擅長綜合遇到的信息,非常擅長找到特定且難以找到的信息。"
與 OpenAI 的其他模型相比,DeepResearch 也有明确的功能定位。Josh 説道:" 對于我來説,使用 O 系列模型,如果我要求與編碼有關的事情,通常不需要模型從預訓練中知道的知識之外的知識,所以你通常會使用 01Pro 或 o1 進行編碼,或者 o3minihigh。" 這表明在不同場景下,用户應選擇最适合的工具。值得注意的是,DeepResearch 與其他搜索增強型 AI 工具的關鍵區别在于其端到端訓練方法。正如 Isa 強調的:" 因為我們有能力進行端到端訓練,在做研究的過程中有很多事情是你事先無法預測的,所以我不認為可以編寫某種語言模型程式或腳本,能夠像模型通過訓練學到的那樣靈活,它實際上是對實時網絡信息的反應,并根據看到的内容改變策略等。" 這種靈活性使 DeepResearch 在處理復雜、開放式研究任務時具有明顯優勢。
信息獲取的未來
DeepResearch 的出現代表了人工智能與人類知識工作協作模式的重要進步。通過端到端強化學習的創新應用,OpenAI 成功打造了一款能夠大幅提升研究效率的智能助手,為用户節省了寶貴的時間和精力。
更為深遠的是,這款產品可能預示着 " 智能體之年 " 的到來。正如 JoshTobin 和 IsaFulford 在采訪中異口同聲所言,智能體技術将成為 2025 年 AI 領網域的核心突破點。DeepResearch 作為這一趨勢的先行者,展現了 AI 智能體如何重塑我們獲取和處理信息的方式。盡管面臨信息準确性和響應時間等挑戰,DeepResearch 的價值已得到廣泛認可。它不僅能夠處理從醫學研究到旅行規劃的多種場景,還能發掘傳統搜索引擎難以發現的晦澀信息。這些能力使其成為知識工作者的有力助手,正如 Isa 所強調的,賦予人們 " 超能力 " ——不僅僅是節省時間,更是擴展了人類可能性的邊界。
随着 OpenAI 繼續完善這一技術,DeepResearch 的能力邊界将不斷拓展,其應用場景也将更加多元化。無論是專業研究還是日常決策,這款智能體產品都有望成為我們信息世界中不可或缺的向導,引領我們進入一個信息獲取更高效、知識工作更智能的新時代。
參考資料:https://www.youtube.com/watch?v=bNEvJYzoa8A&t=533s