今天小编分享的科技经验:GPT-5开源?那只是奥特曼的“烟幕弹”,欢迎阅读。
在 2024 年即将到来的时刻,OpenAI CEO 山姆 · 奥特曼(Sam Altman)在 X 社交平台发表推文,汇总了用户对于 OpenAI 呼声最高的需求点。
图源:X 平台
包括:
AGI(请耐心等待)
GPT-5
更好的语音模式
更高的费率限制
更好的 GPT
更好的推理
对工作 / 行为程度的控制
视频
个性化
更好的浏览
" 使用 OpenAi 登录 "
开放源代码
作为被《时代》杂志评为 "2023 年度 CEO",山姆 · 奥特曼的一条推文瞬间成为了轰动整个 AI 行业的信号。尤其是万众期待的 "GPT-5" 与 " 开源 " 同时出现在这张表单时,更是被一些人错误解读成为了 "OpenAI 在 2024 年的发展目标,是将 GPT-5 开源 "。
然而大模型之家发现,山姆 · 奥特曼这则推文中的内容仅仅是汇总了 " 行业的呼声 ",这虽然可能会是 OpenAI 现阶段关注的方向,但如果将其解读为 " 企业发展目标 ",还是多少有失偏颇。
更何况,在大模型之家看来,即使 OpenAI 真的推出 GPT-5,可能性其实并不大。
为商业,GPT 开源可能性渺茫
虽然大模型开源可以促进 GPT 模型的创新和发展、开源可以增加大模型的透明度和可信度、让更多的人参与到人工智能的研究和实践中,扩大大模型的影响和普及。然而,在开源世界中,如何实现商业化始终是困扰行业的难题,而目前行业通常采取的做法是通过部分开源的方式,将核心竞争力的代码进行闭源,再通过闭源部分实现商业化。
大模型之家曾指出,行业内,常常把大模型的开源与闭源的争论,类比为移动互联网时代的 Android 与 iOS 之争。例如 OpenAI 的 GPT-4 和百度的文心一言至今则坚持闭源,Meta 则选择了开源的道路,相继面向 " 学术研究用途 " 开源了 LLaMA 和 LLaMA-2 模型,而百川智能在学术领網域选择了开源 7B、13B 两种尺寸的大模型,商业探索上将 53B 闭源,以保护商业利益和技术的竞争优势。
GPT 的闭源,为 OpenAI 带来了可观的收入。据 The Information 报道,OpenAI CEO 山姆 · 奥特曼对员工表示,公司正以每年 13 亿美元(约合人民币 94.93 亿元)的速度产生收入,平均每月收入超过 1 亿美元,比去年全年 2800 万美元增长超过 450 倍,达 4542%,也比三个月前预期的年收入高 30%。这也让 2023 年成为 OpenAI 公司成立 8 年来,收入增长最快的一年。
然而,在 OpenAI 快速增长的背后,其巨额的成本却往往被行业所忽略。公开信息显示,2022 年,OpenAI 开发 GPT-4,仅训练成本支出约 5.4 亿美元。2023 年 4 月,SemiAnalysis 的一项研究表示 OpenAI 每天为 ChatGPT 支付的运营成本约 694.4 万美元(主要是电费),年化运营成本约为 2.5 亿美元,综合年化成本可能超过 13 亿美元,这意味着 OpenAI 或仍处于亏损状态。
图源:网络
对于商业模式上,OpenAI 官网文章中明确指出:我们(OpenAI)打算继续免费提供 ChatGPT,并从选择付费的高级服务的用户和企业中获得收入。考虑到开发和提供大模型的高成本,我们(OpenAI)的组织目前并不盈利,也不指望在近期内盈利——我们(OpenAI)的目标仍然是广泛而安全地让人工智能的好处惠及全世界。
虽然 OpenAI 嘴上说着 " 不指望在近期内盈利 ",但生存问题仍然是其不得不面对的挑战。2022 年 OpenAI 非营利实体 2022 年收入仅 4.5 万美元,倘若没有商业化维持,OpenAI 恐怕很快会迎来破产。
2023 年 11 月,OpenAI 公司董事会突然宣布罢免首席执行官山姆 · 奥特曼引发的动荡引起广泛关注。虽然在一系列风波后,山姆 · 奥特曼重返 CEO 职位,但行业对于风波背后的诱因的猜测中,不乏对于董事会认为山姆 · 奥特曼追求激进的商业化运营策略,违背了 OpenAI 的核心价值观的指摘。
而通过 GPT-4 闭源获得大量收入的 OpenAI,显然没有充足的理由将 GPT-5 完全开源,这无异于自毁壁垒,在大模型赛道的竞逐中丧失领先优势。
为生态,部分开源仍存可能
在大模型之家看来,对于开源而言,虽然 GPT-5 开源的可能性极为渺茫,但是为了 GPT 相关生态建设,关于 GPT 相关的工具集开源的可能性却很高。结合 "OpenAI 计划下周推出 GPT 商店,用户可销售和共享聊天机器人 " 的消息,OpenAI 会通过部分开源的方式,为开发者的开发、调试、分享提供便利,并通过社区的方式,接受社区的反馈和建议,不断完善和更新其 GPT 模型和平台。
图源:网络
时至今日,坚持完全开源的企业凤毛麟角,多是采用部分开源的方式,对于 OpenAI 而言,部分开源是一种明智的选择,既能够让更多的人参与到 GPT 相关生态建设中,促进社区的发展和壮大,又能够保护公司的核心技术和商业利益。
除此之外,在山姆 · 奥特曼的关注点中,语音、视频等大模型的多模态输出能力,也成为行业呼声大,且 OpenAI 发力的重点,2023 年 10 月,GPT4 推送了 vision 相关的功能—— GPT-4V,展示了出色的影像与视频识别能力,让行业对其在影像、视频处理与自动驾驶领網域的应用充满期待。ChatGPT 的也在 9 月首次上线语音对话功能,并于 11 月面向全部用户开放。
OpenAI 对于大模型多模态能力的关注,恰恰与大模型之家近期发布的《2024 人工智能产业趋势预测》不谋而合。大模型之家指出:模态生成式 AI 是指能够处理多种媒体数据(如文本、影像、音频等)的 AI 技术。多模态生成式 AI 发展提速,音、视频大模型将成为发展新风口多,在 2024 年,多模态生成式 AI 的研发和应用将加速发展,推动音视频大模型的产业化应用。通过多模态生成式 AI 技术,人们将能够更加自然地与 AI 系统进行互動,实现更加高效、便捷的人机互動体验。同时,多模态生成式 AI 技术也将为创意产业带来新的发展机遇。
生态与商业化,这两者一直以来都是人工智能行业发展的核心要素,无法回避。在这个行业中,技术和应用的发展需要有一个健康的生态环境,以便为其商业化进程提供必要的支持和保障。同时,商业化的成功也离不开生态环境的建设,因为只有在一个良好的生态环境下,技术才能得到更好的应用和推广,进而推动整个行业的持续发展。
在人工智能行业中,生态与商业化是相互促进、相互依存的关系。只有在一个良好的生态环境下,商业化才能得到更好的发展;同时,商业化的成功也可以为生态的发展提供必要的支持和保障。因此,对于 OpenAI 而言,想要行稳致远,同样注重生态与商业化的平衡发展。