今天小編分享的互聯網經驗:清華大學發布《大語言模型綜合性能評估報告》 :GPT-4 第一,文心一言更懂中文,歡迎閱讀。
品玩 8 月 10 日訊,近日,清華大學新聞與傳播學院教授、博士生導師沈陽所在團隊發布了《大語言模型綜合性能評估報告》(下文簡稱 " 報告 "),報告顯示總得分率 GPT-4 第一,百度文心一言在三大維度 20 項指标中綜合評分國内第一,超越 ChatGPT,其中中文語義理解排名第一,部分中文能力超越 GPT-4。
報告本次評估選取了 GPT-4、ChatGPT 3.5、文心一言、通義千問、訊飛星火、Claude、天工 7 個大語言模型,圍繞生成質量、使用與性能、安全與合規三大維度,全面考察大語言模型上下文理解、中文語義理解、誤導信息識别、邏輯推理、内容安全性、隐私保護等 20 項指标。綜合來看,文心一言語義理解能力突出,特别是具備更好的中文理解能力,更懂中國文化,同時時效性強、内容安全把握細微,這源于其知識增強、檢索增強和對話增強的技術創新。