大模型扎堆「趕考」，語文還是國產AI行，文言文能力超過95%考生

今天小編分享的科學經驗：大模型扎堆「趕考」，語文還是國產AI行，文言文能力超過95%考生，歡迎閱讀。

ChatGPT 誕生後的第一場全國高考，考生忙，大模型們也很忙。

這不，高考還沒結束，AI 挑戰高考題就成了刷屏熱搜話題，各家大模型都被拉出來寫起了高考作文，甚至是參與整場考試。

（不知是不是巧合，Bard 還在下午數學高考後，緊急更新了一波數學推理能力……）

結果，竟然有大模型寫的作文，把資深高中老師都騙過了！

就在考試當天，百度搜索正在内測的 "AI 夥伴"，現場直播挑戰了一套語文試題。

從 " 基礎題 " 文言文翻譯、閱讀填空、古詩詞賞析，到 " 拉分題 " 微寫作和作文，AI 夥伴全部上手做了一遍。

結果，當 9 份 " 混進 " 了 AI 夥伴作品的高考作文送到語文老師莊臨旭手上時，他完全沒發現有篇是 AI 寫的：

我是真沒想到，AI 還能寫文言文作文。

緊接着，AI 夥伴展現的文言文理解能力，更是把資深老師吓了一跳：

憑借我的教學經驗來看，超過 95% 的同學沒問題。

一整場直播下來，就連圍觀了 AI 夥伴考試全程的畢導都感慨：

再來一次高考語文，我可能考不過它……

所以，集成了百度語義檢索技術 + 大模型能力于一身的AI 夥伴，整場考試表現具體如何？

咱們一項一項展開來看。

"AI 考生 " 現場挑戰語文高考

先來看看大模型的 " 基礎題 " ——古詩詞賞析。

面對情感和寫法的 " 找不同 " 問題，百度搜索 AI 夥伴胸有成竹，不僅給出了明确的修辭手法，還進一步分析了古詩的來歷和情感，屬實是閱讀理解十分到位了：

再到閱讀填空。面對文章解讀和 " 續寫句子 " 能力，AI 夥伴同樣毫不遜色：

那麼，來看看大模型的 " 拉分題 " 寫微作文，依舊沒什麼問題！

要是小作文體現不出來，再來看看 AI 夥伴作詩的能力。不僅現代詩手到擒來，甚至連藏頭詩都能搞定：

不過，要是再仔細一點搞搞提示詞工程，AI 夥伴似乎就答得更好了。

以高考語文題目中的古詩詞理解為例，這裡我們先在不給提示詞的情況下，把題目原樣 " 喂 " 給 AI 夥伴：

AI 夥伴給出來的答案雖然也不錯，但對于高考題目來說，這答案着實有億點長，也有點太仔細了：

接下來，給 AI 夥伴換上強調 " 最重要的三個意象 " 的提示詞。

果然，AI 給出了更精準的回答，指出包括病柏、丹鳳和鸱鸮在内的三個意象，是最關鍵的：

但是，上述都還只是直播中展現出來的效果。像 AI 夥伴這類有大模型加持的功能，其使用效果是否真的和提示詞工程強相關？

為了測測 AI 夥伴的 " 真正實力 "，我們親自上手測了測它做高考題的效果。

直播中已經做過了全國甲卷的作文題目，那麼我們再來試試今年上海卷的作文。

第一輪，我們直接把題目甩過去：

看起來，AI 夥伴雖然理解了文章 " 主旨 "，但寫出來還差點意思：論點不夠明确，作文的結構也不太清晰。

第二輪，我們試着換了一下提示詞，給 AI 夥伴設定一個 " 角色扮演 " 效果。

首先，強調它是一名高考考生，然後給它 " 灌輸 " 一些高考作文的寫作技巧：

這一輪，AI 夥伴寫得就有高考作文内味了。

不僅給出了 10 字以内的标題，還按照總分總、夾叙夾議的方式，很好地寫出了一篇議論文：

看起來，挖掘大模型的潛力，很大程度上确實要依靠提示詞工程。

在直播中，百度集團副總裁、搜索平台負責人肖陽還給我們列舉了一個非常簡潔的提示詞公式：

提示詞 = 任務 + 角色 + 上下文背景 + 細節補充。

有了它，不用再擔心大模型輸出和設想無關的答案了。

當然，作為百度 "用大模型重塑搜索能力" 的終極殺器，AI 夥伴能實現的功能，也遠不止是做做高考題而已。

最早在 2023 萬象 · 百度移動生态大會上官宣發布的 AI 夥伴，目前已經開啟内測，獲得試用資格後，可以直接從百度搜索界面進入：

它的本職工作，更像是一個搜索引擎端的全能 AI 助理，不僅具有智能搜索能力，還兼具創作生成技藝：

一方面，AI 夥伴相當于一個對話版智能搜索工具。用它查資料，不需要再按關鍵詞搜索，直接 " 用人話 " 提問就行：

不僅如此，每一句回答都有理有據，如果想要 " 追根溯源 "，直接點鏈接就能跳轉到對應的網站：

這樣一來，就不用擔心它會出現像 ChatGPT 整理檔案那樣，出現 " 無中生有 " 一些案件的操作了。

另一方面，它又相當于一個多模态大模型創作助手。

不僅可以幫助查資料、寫周報、畫頭像，還能陪你模拟面試、甚至替你約會（？）。

這裡我們借助 AI 夥伴的 " 程式猿小助手 "，來試試生成一段代碼的能力。

以面試可能會考到的冒泡排序算法為例。

很快啊，幾乎沒有怎麼思考，AI 夥伴就給出了一段帶注釋的冒泡排序算法，最關鍵的是，它自己已經運行過，并成功輸出了一段結果！

這意味着我們不需要再自己去跑一遍這段代碼，而是能直接将它交給面試官了（doge）

從上面這些展現的能力來看，AI 夥伴所能做到的，遠非僅僅提供高考試題 " 參考答案 " 而已。

這次選擇用它挑戰高考題，大家夥可能看的是個新鮮勁兒，但 " 術 " 的表象之外，更值得關注的是 " 道 " 的變化：

使得 AI 夥伴能在高考題面前依舊 " 神采飛揚 " 的大模型技術，正在以搜索引擎的代際變革為基點，席卷各行各業，甚至改變每個人的工作方式。

正如 ChatGPT 攪動風雲之初，微軟 CEO 納德拉預測的那般：搜索正面臨巨變。

并且變化的不僅僅是搜索的技術、產品本身，這一次，更與每一個個體有了更緊密的關聯。

搜索三變

百度 CEO 李彥宏同樣認為，" 大模型即将改變世界 "。基于這樣的判斷，李彥宏 2023 年一季度 OKR，便指向了 " 引領搜索體驗的代際變革 "。

現在，三個月過去，大模型究竟如何變革搜索，現在答案已經越來越清晰。

從技術的角度出發，大語言模型的爆發，正在重新定義人機互動。

對于人類而言，最自然的交流方式就是語言溝通。而大模型的代際突破，最直觀的一點體現，就是機器自然語言聆聽和表達能力的飛速提升。

△回答來自百度搜索 AI 夥伴

搜索本身，就是一種人機互動的核心方式。其本質的技術追求，就是要讓機器更高效地理解、推理、表達，化復雜問題為直觀的第一條搜索結果。

因此可以說，大語言模型的突破，正在全面激發搜索全新的潛能。

值得關注的一點是，伴随着 AI 的發展，搜索始終都是最前沿 AI 技術最先落地的場景。

以百度搜索為例，圍繞 "降低用戶表達需求門檻"、"降低用戶獲取内容和服務的門檻"、"豐富搜索引擎的内容供給" 這三個目标，百度搜索一直在 AI 技術上大量投入。

引入大模型之前，百度搜索已經實現：

千億級全網索引；

全球領先的深度語義理解技術，相關成果曾獲 2020 年國家技術發明獎二等獎；

最大中文知識圖譜，覆蓋 50 億實體。

從產品的角度看，過去三個月，數據已經證明，對話式搜索正在成為搜索引擎市場的一個新變量。

百度集團副總裁、搜索平台負責人肖陽就透露，大模型加持下的 AI 夥伴，在内測階段就已爆火，相關搜索問答量激增。

這進一步佐證大模型帶來的新人機互動方式，更能滿足人們對搜索 " 快速 "、" 有效 " 的訴求。

牽一發而動全身，在現在這個時間節點，圍繞搜索的内容生產和創作領網域，創新模式也開始逐漸顯現，并被積極地探索實踐。

同樣是在萬象大會上，百度搜索還配合 AI 夥伴，推出了 AI BOT 解決方案。目的就是向内容、服務生產者釋放大語言模型和 AI 技術能力，降低其與新搜索模式融合的門檻。

具體來說，百度搜索提供了創作者、商家、機構、服務和品牌等各類型的 AI BOT，讓他們能夠利用自身優勢和獨特的内容、知識、服務，創造虛拟分身，直接回答用戶的問題。

在技術和產品之外，更與每個人息息相關的，是用戶搜索方式的改變。

正如前文所展示的，大模型時代，"提問題" 的能力正在變得越來越關鍵。

體現在現階段，就是提示詞寫得好不好，會直接影響搜索生成結果的質量。是否掌握提示詞工程能力，就像互聯網時代開啟時，是否掌握搜索能力一樣關鍵。

對此，肖陽提到了 "搜商" 的概念：

未來不僅要卷智商、情商，還要卷 " 搜商 "。

更好地使用提示詞，更好地使用 AI 夥伴，獲得的優勢會越來越大。

也就是說，找到合适提示詞的能力越強，越能在大模型落地應用的時代裡，充分利用大模型的強大生產力。

可以說，大模型刮起的時代風暴之下，搜索三變，既是内在技術瓶頸的代際突破，亦是外在人類接觸信息方式的徹底變革。

無怪乎肖陽作為技術變革的一線親歷者，會有這樣的判斷：

語義檢索技術與大語言模型結合，促進搜索的理解、推理、組織和創作潛能進一步釋放，有望在多方面催生颠覆式創新，促成搜索奇點降臨。

并且這一次，或許每一個人都會真真切切感受到這種代際變革帶來的影響。

One More Thing

說起來，就在高考這兩天，AI 加持下的百度搜索，忙的還不止有刷題這件事兒。

每年此時，百度都會啟動專門的高考服務，通過搜索和 AI 核心技術，為考生和家長提供便利。

今年，百度還基于 AI 技術，首次推出了高考搜索指數，涵蓋專業搜索熱度及變化趨勢、" 院校 PK" 等信息。考生家長在擇校選專業的時候，可以更方面地參考對比。

AI 志願助手也進行了重大更新，能更直觀地展示志願預測結果，提供相關數據來輔助考生家長做決策。

對了，利用高考搜索指數和其他高考相關搜索數據，百度還聯合中國教育在線掌上高考發布了不少有意思的數據：

高校方面，搜索熱度最高的本科院校裡，南方高校霸榜雙一流和非雙一流大學前十。

專科院校中，山東是搜索職業教育最多的省份。

專業方面，醫學搜索熱度斷層第一，航空航天熱度攀升最快。

而最有 " 錢 " 景的，是船舶電子電氣工程……

— 完 —

點這裡關注我，記得标星哦～

一鍵三連「分享」、「點贊」和「在看」

科技前沿進展日日相見 ~