今天小編分享的教育經驗:知乎CTO李大海:大模型是智能時代的蒸汽機,歡迎閲讀。
AI 是人類能力的擴增,人才是中心。
來源|多知網
演講嘉賓 |李大海
整理| 徐晶晶
攝 | 張蔚斐
ChatGPT 對教育的影響已引發諸多探讨,教育與大模型的結合會有哪些可能?在多知網近日舉辦的 OpenTalk 第 40 期 " ‘教育 + 大模型’的實踐與創想 " 活動上,知乎合夥人、CTO 李大海分享了知乎知海圖 AI 中文大模型的發展和應用前景和暢想。
核心觀點:
1.2022 年底發布的 ChatGPT 可以看成智能時代的第一台蒸汽機,雖然還有很多問題和限制,但無疑已經開啓了一個新的時代。
2. 未來一定會出現很好的大模型通用智能,但在這個過程中,當通用還不夠的時候,我們也需要用很多場景裏面的專有知識去做對齊。
3. 大模型特别有用的一個能力是理解能力,理解能力是比生成能力更早成熟的。對知乎這樣的場景來説,理解能力能夠更精細地描繪内容,從而可以更精細描繪用户,做内容跟用户連接的時候,效率和準确性會更高,這對分發體驗有很大的幫助。
4.AI 是人類能力的擴增,人才是中心。
5. 我們現在認為 ChatGPT 這個產品一定不是通用智能未來的終極產品形态。因為這種對話式的方式門檻還是蠻高的,問不出好的問題效果會很差,人類要學會用 AI 的方式提問。
以下為李大海分享全文 ( 經多知網整理編輯 ) :
大家下午好!首先非常感謝多知網邀請我來參與這個分享交流。我是李大海,2015 年加入知乎,是知乎的合夥人和 CTO。随着 AI 技術的進步,知乎也在不斷用更新的技術武裝整個技術體系。
ChatGPT 發布之後,讓整個技術圈都震動了。OpenAI 做得很了不起的一件事是,讓所有人在很短時間裏達成共識,即這是非常有應用前景的技術。如此大範圍的共識達成是非常不容易的。
我屬于技術激進派,我認為 ChatGPT 的面世是一件非常重要的事情,這是一個時代的開端。我當時的形容是" 這就是智能時代的蒸汽機 "。對于智能時代來説,ChatGPT 仍有很多缺點,但是三年後再看,一定會非常不一樣。今年 2 月份的時候,我周圍還有朋友對這件事表示懷疑,甚至有一些 NLP 領網域前輩們認為,這只是一個概率遊戲。任何一個新的事物出現,有不同的看法是非常正常的。但是到今天,我相信持有這種看法的人越來越少,哪怕非技術圈的人也對這個技術越來越 buy in 了。我們也可以看到技術圈的人非常焦慮,過去幾個月,每天早晨起來一刷新聞就看到又有新模型或者新應用方式出來了,連論文都讀不過來,更别説自己動手做了。所以整個技術圈的人都有點焦慮。
GPT4、PaLM2 或 StableDiffusion 這些大模型的進展非常快。在知乎 4 月舉行的發布會上,我講到過,客觀來看,現在大模型在中文跟英文上的語言能力還是有區别的,它的中文能力會稍微弱一點。這背後的原因主要還是數據。現在的大模型已經完完全全是一個 data centric 型的工作了。有多少數據就有多少智能,大模型時代,數據的量和質決定了模型的能力。
但是,我們在工作的過程中也能夠看到,整個中國的語料還是非常豐富的,只不過可以公開獲取的數據規模會少一些。不過,我們很高興看到北京市前幾天發布了一份檔案(《北京市促進通用人工智能創新發展的若幹措施(2023-2025 年)(征求意見稿)》),政府也意識到數據公開的重要性,所以組織工業界、學術界一起構建開放的數據庫。
我有信心,中美在大模型開發上的競争中,我們至少不會被甩開。因為 AI 的關鍵要素之一是數據,此外很多工作也屬于工程範疇,這些領網域中國都有自己的優勢。大模型在這條路上有模拟人腦的感覺了。有一本書叫《千腦智能》,它的核心邏輯就是,人的大腦功能結構是非常單一的,處理視覺信号的大腦區網域,跟做決策做邏輯分析的區網域結構一樣,只是人腦發育過程中通過學習會自動形成分區。現在大模型從模型結構上越來越簡單,越來越往這個思路上靠近。所以未來模型上的發展,更多是效率上的優化,是怎麼把推理效率和訓練效率提升起來,怎麼能支撐更大規模的訓練,這些都是工程方面的工作。中國的工程能力非常強,所以工程這塊中國是不會輸給美國的。所以我相信時間稍微拉長一點,我們在這個競争中一定能發揮自己的優勢。
01
知乎在大模型方向的探索歷程
簡單介紹一下知乎在大模型方向上的工作。ChatGPT 發布以後,我們跟業内很多公司交流。在新年前後,我們跟面壁智能做了深度溝通,他們的源代碼是開放的,也有 API,我們就做了一個比較深度的評測,非常認可這家公司的技術能力。所以我們對面壁智能做了一輪戰略投資,現在我們兩個團隊在一起無間地工作。
面壁智能是 2020 年開始做大模型開發的,他們聯合北京智源研究院一起研發出了 CPM-1 到 CPM-3 三個大模型。在這個基礎之上,面壁智能又做了 CPM-Ant 和 CPM-Bee 兩個大模型。
大模型本身是分三層,首先要有一個預訓練模型,邏輯上像是一個我們先培養一個人掌握通識教育,讓他不停背書學習,能夠達到一個中學生或者普通大學生的素質水平。然後在此基礎上去做對齊,也就是做專業訓練,比如把他培養成一個律師,培養成一個心理咨詢師等。預訓練模型的潛力決定它做對齊時的效率。預訓練潛力越高,對齊時教它的東西越少,舉一反三地越快。
知乎跟面壁智能一起做了大模型預訓練之後,今年 4 月份,用知乎自己的數據同步上線了一個功能,就是對熱榜問題下的觀點進行抽取和聚合,這個功能叫做 " 熱榜摘要 "。
這個功能現在只是小範圍内測,後續會全面開放。
知乎熱榜摘要現在大概是有兩種樣式:一種是很開放的條理樣式,一個問題底下用户有不同的表達,聚合起來一般是多種主要觀點,我們把這些觀點直接展現在這裏,讓用户一眼就可以看到這個問題下回答的大致方向。另一種是一些比較封閉的問題(比如是與否、會與不會等),我們會把所有的知友回答核心觀點抽取出來,按照回答的類型分類。
這是大模型在知乎的第一個應用,也是一次試水,目的是為了測試一下我們的大模型在内容理解、抽取等方面能做到什麼程度。
做這個產品的過程中我們也有一些經驗和收獲:未來一定會出現很好的大模型通用智能,但是在這個過程中,工作是混合的,當通用還不夠的時候,我們也需要用很多場景中的專有知識去做對齊。這個對齊是很有必要的,我們做了很多對齊的工作,也體會到數據的重要性。
我們現在只是嘗試了大模型在知乎場景的其中一個應用,未來還會有更多,這些應用都建立在整個模型工作的系統化框架之上。如果沒有這些框架,我們做很多事情的效率會低很多。
02
知海圖 AI 應用暢想
剛才講了熱榜摘要算是知乎的第一個大模型應用,我認為,大模型可以将知乎整個業務都重寫一遍、更新一遍。
第一是内部能力的提升。很多工作都可以通過大模型來提效,包括運營、設計、產品等等。
第二,知乎本身是一個在圖文領網域很有優勢的高質量社區。大模型特别有用的一個能力是理解能力。其實理解能力是比生成能力更早成熟的。它能夠更精細地描繪内容,有了對内容更精細的描繪,我們就可以更精細描繪用户,做内容跟用户連接的時候,效率和準确性會更高,這對分發體驗有非常大的幫助。
第三,對知乎來講,我們仍然是一家以人為本的社區,所以人是最重要的。我們一直在講,AI 是人類能力的擴增,人才是中心。大模型開發過程中,我們會考慮給創作者提供足夠的創作賦能,這個賦能是 Copilot 的角色,它不是主角。我們希望創作者拿到 AI 輔助功能之後,能在修辭、行文工作上迅速提效,但是創作的思想必須是自己的,這是非常重要的一個點。
回到今天分享的主題:教育。未來在教育領網域,我們相信也有非常多可以落地的地方。因為教育本身就是天然需要個性化、需要更多智能來做的。有教無類,要實現個人教育過程中的價值最大化,一定要貼向用户的獨特的特點來進行。基于這樣的邏輯,我相信在數據量足夠大的情況下,大模型定制化地給個人提供的價值,可能比設計好的千篇一律的教學方案要更大。
通過大模型的能力,構建智能化的學習方式和學習場景,用户在語言學習場景具有完整度的體驗。
在大模型推出之前,我們就看到很多頭部教育公司已經在這個方向探索,比如構建海量的題庫,根據他們收集的數據,通過不同的學生對這個題目做出來的準确率,來度量這個題目難度。反過來通過學生每道題做得怎麼樣,去衡量這個同學的掌握情況,再針對性地給他更有價值的題目等等。
有大模型推出之前,顆粒度是在題目上,題目是一個對象,會抽取一些知識點,但顆粒度比較粗糙。但在大模型時代,出眾的理解能力和生成能力可以把這些都打碎,大模型能夠根據自己的理解,讓顆粒度更細化,我相信這是大模型能帶給教育的非常高的價值。
在超真實體驗方面,大模型配上虛拟人,配上聲音,我相信它也能夠解決陪伴的問題。因為虛拟人跟每個學生的互動,能夠讓學生感覺到自己得到關注。在上大班課的時候,是否得到老師關注,學生感受是非常不一樣的。有了這樣陪伴式的體驗,我相信對學生來説是有額外的價值的。
目前市面上有一些結合大模型的教育應用。比如日韓的一款應用 speak,也是 OpenAI 投資的一家公司,該產品在日本和韓國的業務數據非常好。應用了大模型以後,speak 能夠非常個性化地貼近用户,用更地道的口語跟用户聊天,讓學習不再是一件枯燥的事情,而是一個以人為本的事情。
ChatGPT 這樣的產品現在還是智能時代的蒸汽機,還有很多不足。現在大模型還面臨着很多挑戰:
比如可信度方面,存在幻覺,會胡説八道;時效性方面也有待提升;使用門檻方面也存在問題。我們認為 ChatGPT 這個產品一定不是通用智能未來的終極產品形态。因為這種對話式的方式門檻還很高,問不出好的問題效果會很差,所以目前人類還要會用 AI 的方式提問。
就數據而言,整個中文開放語料相對英文來説,小了很多。所以,怎麼把現存的中文優秀語料讓大家更低成本地拿到,對于中國 AI 發展是非常重要的。我們可以看到,影像大模型的進展很快,就是因為海外有幾個英文的開源圖文對數據集,質量和數量都很好。因為有這些開放的語料,大模型卷起來會非常快。另外,數據的安全合規也會變成一個非常大的挑戰。因為數據采集越來越容易,怎樣在過程中把用户隐私與合法有效的數據區分開,不要讓 AI 脱缰,非常重要。
在标注方面,标注難度、标注成本、标注偏見都存在挑戰。對齊數據質量非常重要,需要在不同的标注員間仔細地拉齊标注的标準。另外,對齊數據标準太高,需要更多更專業的人來做,我們以前做簡單任務标注的同學,實踐中無法勝任這個工作。因此也對成本和配套的培訓提出很高的要求。
此外挑戰還包括算力和政策合規等,不多贅述。
面向未來,現在的 AI 還是一個在學走路的 " 小朋友 ",未來它逐步長大,到一定程度的時候,它的安全性也是一個非常大的問題。我們相信技術演進是非線性的,在某個階段可能有一定的爆發性,存在指數上升的可能,也許這天來得比我們想象的快,我們是不是準備好了 AI 安全性上的安全措施,是否能夠做得足夠到位?這也是很大的挑戰。
我今天的分享就到這裏,也希望跟行業裏的朋友們多交流,能夠跟大家一起提供足夠好的中文 AI 服務。大模型時代,讓中國用户享受與英文用户一樣優質的服務。謝謝大家。
03
Q&A
提問:因為知乎是問答社區,我們特别好奇,如果有人用 GPT 回答的内容在知乎上灌水,這樣的内容,知乎是怎麼過濾的?
李大海:我們很關注這個問題,也做了一些對抗性的工作。不過這個工作比較難,不可能全面準确地做出檢測。
第二點,我們也認為,以人為中心的工作,AI 是可以在其中起作用的。不是説有 AI 成分就是完全不對的。
結合在一起,我們更傾向于認為,如果你的内容本身非常有優勢,有你的洞見,我們并不關注其中有沒有 AI 參與。今年我們 3 月份上線了一個功能,叫做 AI 創作聲明,一旦創作者使用了這個聲明,我們就不會對内容做幹預。當然,對于濫用 GPT 的賬号,我們是不歡迎的。
提問:您提到的問一個好問題也是非常重要的,我以前在教育行業,現在我是記者,所以工作主要就是問問題,現在 ChatGPT 大模型可以生成很多回答,這個回答是不是本身就可以是好問題?我的問題是,要想讓大模型回答本身就是一個好問題,怎麼樣才能讓它生成這樣恰當的好問題?
李大海:大模型當然能提出很好的問題。最近跟一些行業裏的朋友聊天,看到有一些場景,是拿大模型去訓聊天機器人。聊天機器人這樣的場景,和 ChatGPT 這種場景其實不太一樣,AI 模型需要主動引發話題,才能聊起來,才會給用户帶來陪伴感。從一些產品的 demo 感受來看,大模型在這個場景的提問并不差。
您剛才問的問題可能跟您的職業比較相關,這是通用場景。我沒有試過怎麼引導模型提好問題,不過建議可以往這個方向嘗試一下:您平時本來就會問很多問題,可以拿這些所有問題來先問大模型,哪些是好問題,再讓它提出一些類似的好問題,模型是可以用啓發式的方式溝通的。
提問:我有一個關于模型大小的問題,我們都知道知乎是現在中國互聯網上語料或者數據優勢度相對來説最高的平台,在語料優勢達到一定程度的情況下,我們對于不同大小的模型,在業務實際場景下的效果評估上,大概是怎樣的?
李大海:模型的大小跟它訓練語料的數量和訓練的時長有一定的線性關系。如果你的模型特别大,但是給它的語料不夠,它是欠學習的狀态,還不如同等語料的情況下,讓一個小規模的模型充分學習,效果反而更好。
模型越大就需要越多高質量的數據。
回到業務上,模型規模的判斷涉及到具體的業務目标。因為不同大小的模型,在不同領網域的能力是不一樣的。比如目前我們的感覺是,大模型最難湧現的能力是邏輯推理,如果業務需要的是這個能力,那就需要非常大的模型。
提問:知乎我感覺更偏向内容社交,您也展示了内容方面比如語義提取,在社交領網域這塊有沒有一些提前的規劃或者方向?因為前一陣子比較火的一個 AI 社區,就是城市 AI 人,知乎在社互動動方面是不是也可以引入一些問答或者交流類的?是不是有這方面的規劃?
李大海:社交是知乎很重要的一個因素。所以我們也确實在思考,怎麼能夠用大模型來賦能產品,在社交上能有更好的效率。但是具體怎麼做,還需要好好的想一想。因為大模型的基礎能力怎麼跟業務結合在一起,需要很多思考。
提問:我想問關于數據的開放性的問題。其實教育行業一樣面臨這樣的問題。一方面希望模型比較好用,業務直接拿來就用。另一方面不願意開放自己的核心數據。因為涉及到是否開放的問題,可能知乎跟面壁是深度合作,但如果是百度阿裏等其他的大模型跟知乎合作,知乎會不會考慮數據開放性上的問題?
李大海:這确實是一個很難的問題。我們還是很開放的。2016 年 -2017 年的時候,我記得當時有一個高校的教授找到我們,想要對接 NLP 科研項目。對方説,知乎數據太難爬了,很累,問我們能不能直接給他們,我們就開放了部分數據。當然,和業界其它公司的合作,具體到什麼程度,這個需要更多業務上的思考。
我們最近也在跟開源界很多朋友交流,是不是可以開放一些高質量數據給到社區。其實從我們的角度來講,如果這個事對社區有幫助,同時也沒有顯著影響到我們日常運營,我們是願意開放的,但是我們也不能用自己的看法去要求所有人。總的來説這是一個難題,确實希望從政策和行業層面來組織推動破這個局。
OpenTalk 第 40 期相關内容: