今天小編分享的互聯網經驗:人民網打造Sora場景的全球最大中文語義語料庫?相關人員回應:這是我們新的業務方向,歡迎閲讀。
Sora 影片場景(來源:OpenAI)
钛媒體 App 獲悉,2 月 20 日下午,人民網旗下數據管理平台 " 人民數據 " 發布《人民數據打造全球最大中文語義語料庫助力 Sora 新場景》,聲稱已打造近 3 億條數據的新聞、問答等語義語料庫。
這則消息引發市場廣泛關注。随後,人民網(603000.SH)股價漲停,漲幅達 10%,最新報 25.64 元 / 股。
2 月 20 日下午,钛媒體 App 方面通過電話向有關負責人詢問更多信息。人民網一位與該事件有關的消息人士向钛媒體 App 獨家回應稱:" 對(文章屬實)。這應該是我們在新的一年(2024 年)業務主打的一些亮點與方向。"
官網顯示,人民數據管理有限公司系人民日報、人民網旗下的平台,公司致力于構建全方位的大數據運營生态系統,使大數據更加便捷、高效地服務于經濟社會發展,為各行各業廣泛應用。作為新時代大數據領網域中的 " 國家隊 ", 人民數據管理有限公司以承建國家大數據災備中心、國家應急數據中心、智慧黨建數據中心等國家大數據項目為契機,打造安全、高效、開放、共享的國家級大數據平台,并致力于做好各級黨政機關、央國企、民企等大數據的 " 存、管、用 " 工作。
2 月 16 日,美國 OpenAI 公司宣布推出全新的生成式人工智能模型 "Sora"。通過文本指令,Sora 可以直接輸出長達 60 秒的視頻,并且包含高度細致的背景、復雜的多角度鏡頭,以及富有情感的多個角色,引發全球關注。
OpenAI 表示,Sora 是能夠理解和模拟現實世界的模型的基礎,這一能力将是實現 AGI(通用人工智能)的重要裏程碑。
人民數據在文章中表示,這是全球最大、助力 Sora 場景的中文語義語料庫。
文章中透露,該語義語料庫面向人工智能大模型、通用人工智能、智能互聯網等應用場景。針對當前大模型普遍回答不了、回答不好卻又必須直面、不容回避的重大問題、敏感問題、疑難問題、復雜問題,梳理了 1 萬餘個重點問題。語料庫的進一步豐富充實或将使資料查找更加便捷,進一步降低了普通人的 AI 使用門檻,幫助普通人以更簡單的方式獲取更全面的信息。
但人民數據方面沒有透露該語義語料庫的更多中文名稱以及細節等。
人民數據方面也提醒,AI 技術和應用創新," 合規 " 始終是底線。未來還需加強對 AI 大模型安全、規範、可持續發展的探索,充分挖掘各類數據資源價值,以構建主流價值語料庫為抓手,推動中國 AI 產業安全發展。
(本文首發钛媒體 App,作者|林志佳)