今天小编分享的互联网经验:人民网打造Sora场景的全球最大中文语义语料库?相关人员回应:这是我们新的业务方向,欢迎阅读。
Sora 影片场景(来源:OpenAI)
钛媒体 App 获悉,2 月 20 日下午,人民网旗下数据管理平台 " 人民数据 " 发布《人民数据打造全球最大中文语义语料库助力 Sora 新场景》,声称已打造近 3 亿条数据的新闻、问答等语义语料库。
这则消息引发市场广泛关注。随后,人民网(603000.SH)股价涨停,涨幅达 10%,最新报 25.64 元 / 股。
2 月 20 日下午,钛媒体 App 方面通过电话向有关负责人询问更多信息。人民网一位与该事件有关的消息人士向钛媒体 App 独家回应称:" 对(文章属实)。这应该是我们在新的一年(2024 年)业务主打的一些亮点与方向。"
官网显示,人民数据管理有限公司系人民日报、人民网旗下的平台,公司致力于构建全方位的大数据运营生态系统,使大数据更加便捷、高效地服务于经济社会发展,为各行各业广泛应用。作为新时代大数据领網域中的 " 国家队 ", 人民数据管理有限公司以承建国家大数据灾备中心、国家应急数据中心、智慧党建数据中心等国家大数据项目为契机,打造安全、高效、开放、共享的国家级大数据平台,并致力于做好各级党政机关、央国企、民企等大数据的 " 存、管、用 " 工作。
2 月 16 日,美国 OpenAI 公司宣布推出全新的生成式人工智能模型 "Sora"。通过文本指令,Sora 可以直接输出长达 60 秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色,引发全球关注。
OpenAI 表示,Sora 是能够理解和模拟现实世界的模型的基础,这一能力将是实现 AGI(通用人工智能)的重要里程碑。
人民数据在文章中表示,这是全球最大、助力 Sora 场景的中文语义语料库。
文章中透露,该语义语料库面向人工智能大模型、通用人工智能、智能互联网等应用场景。针对当前大模型普遍回答不了、回答不好却又必须直面、不容回避的重大问题、敏感问题、疑难问题、复杂问题,梳理了 1 万余个重点问题。语料库的进一步丰富充实或将使资料查找更加便捷,进一步降低了普通人的 AI 使用门槛,帮助普通人以更简单的方式获取更全面的信息。
但人民数据方面没有透露该语义语料库的更多中文名称以及细节等。
人民数据方面也提醒,AI 技术和应用创新," 合规 " 始终是底线。未来还需加强对 AI 大模型安全、规范、可持续发展的探索,充分挖掘各类数据资源价值,以构建主流价值语料库为抓手,推动中国 AI 产业安全发展。
(本文首发钛媒体 App,作者|林志佳)