大酷樂
  • 汽车
  • 理财
  • 军事
  • 科技
  • 游戏
  • 互联网
  • 娱乐
  • 财经
  • 科学
  • 社会
  • 亲子
  • 电影
  • 健康
  • 教育
  1. 首頁
  2. 科学

大模型,教培机构要过窄门

2023-09-15 简体 HK SG TW

今天小编分享的科学经验:大模型,教培机构要过窄门,欢迎阅读。

一度 " 元气大伤 " 的教培机构,也开始加入大模型的热潮了。

教育 + 大模型,并不稀奇,自从 AI 大模型火爆之后,教育就被认为是大语言模型最容易落地的领網域。稀奇的是,和其他场内玩家相比,教培机构的优势确实称不上明显。

目前,市面上在做教育大模型的厂商,大概可以分为三类:一类是大模型厂商,如百度 " 文心一言 " 大模型被接入旗下品牌的学习手机,科大讯飞推出了星火大模型及学习机产品;第二类是教育科技公司,如网易有道打造了 " 子曰 " 大模型,作业帮自研了银河大模型,可汗学院、多邻国、Coursera、猿辅导等也都纷纷将产品与大模型结合,推出了 AI 助手型口语教练。

另一类,就是受 " 双减 " 影响的教培机构了,如新东方、好未来、学而思,也都披露了自家的大模型成果。

大模型在教培市场大有可为,与教培机构在大模型竞争中拔得头筹,这两个结论显然是不能划等号的。

毕竟三类玩家中,教培机构可能是离教育最近的一个,但也是离大模型最远的一个。技术、算力、资金、人才、互联网产品营销……教培机构都不可能比科技巨头、互联网企业玩的更溜。

那么,教培机构做大模型,是不是一场必输的游戏呢?我们认为不是。

正像《马太福音》中所说," 你们要进窄门。因为引到灭亡,那门是宽的,路是大的,进去的人也多;引到永生,那门是窄的,路是小的,找着的人也少 "。

教培机构做大模型,应该换一个思考方向——钻入 " 场景 " 的窄门,走巨头大厂不愿意投入的 " 小路 ",建立核心竞争力。

理解这件事,我们从教培机构究竟为什么要出发,开始说起。

原点,为什么出发

你可能会问,有钱、有技术、有实力的公司有壁垒,搞大模型顺理成章。开源大模型泛滥,普通公司搞大模型,简直就是往红海里跳,教培机构刚刚从 " 双减 " 阵痛中恢复了一点元气,怎么这么想不开?

说句公道话,教培机构做大模型,逻辑是能够自洽的。

第一个合理之处:大模型时代的教育,也需要教培。

有人说,大模型可以取代人类助教,智能导师比人类教师成本更低,这是确实存在的。但是,大模型仅仅是一个工具,并不能替代教师和教培机构的服务内容。

短期内,大模型还有很多技术难题没有解决,比如幻觉,大模型 " 一本正经地胡说八道 ",输出的都是错误的信息,很可能培养出 " 学渣 ";比如黑箱,大模型生成的内容可解释性不高,思考过程不清晰的话,答案的可信度不高,让 AI" 无人驾驶 " 来辅导孩子,学习效果不一定好。

长期来看,即使大模型进化到极高理解力、极高自动化程度、极低错误率,但教育产品和服务的本质还是学生,还是需要教培服务来更好地满足 " 千人千面 " 的具体需求。

正如同济大学校长、教授郑庆华所说,过去是老师和学生的二元结构。今天,机器在很多领網域比老师干得还好。因此,未来的教学模式,可能会拓展为老师、机器、学生三元结构。所以,教培机构与 AI 结合,还是有很多的可能性的。

第二个合理之处:教育领網域的大模型,精调少不了。

大模型自身的学习能力很强,GPT-4 在 SAT 等考试中都超过了 88% 以上的人类应试者。但就像高考状元不一定都是好老师,大模型学得好不代表一定能教得好。教育大模型,需要在通用大模型的基础上,加上自身数据进行精调,针对具体场景进行迭代优化,才可能(注意是可能)解决很多教育环节的具体问题。

举个例子,实际应用中,教育大模型非常重要的一点就是合规,用于教学、备课等场景的大模型,对语言组织能力、逻辑推理能力要求更高,且容错率低,一旦爆出不适当的内容就是教学事故,要提升大模型在此类任务中的安全可控,除了依靠高质量的标注数据,还需要专业教师的反馈、知识经验,而拥有大量教师人才和教学经验、数据的教培机构,显然是更具备行业优势。

第三个合理之处:短板不是真的短,长板却是真的长。

大家都学过田忌赛马的故事,在竞赛中获胜要用自己的长处去对付对手的短处。一眼看去,似乎教培机构在技术、人才、算力、资金等各方面,都比不上科技巨头或互联网公司,但有没有可能,这些短板在实际中,都不算是什么短板呢?

比如技术,教培机构确实在基础模型上的积累不多,但作为垂直行业,教培机构其实也没有必要全力投入自建底层模型,通过 API 云端调用、与头部厂商合作等方式,用相对较少的数据、算力资源和开发人员,就能建设出垂类的教育大模型。

多邻国的生成式 AI 应用,都是基于 OpenAI 的大模型来研发的,其报告中也强调,要做好功能而非做大模型,专注于应用场景。由此可见,教培机构如果不在基础模型赛道上跟科技巨头正面硬扛,那么所谓 " 短板 ",其实对于做垂类大模型,影响并没有想象的大。

反而教培机构所拥有的数据、场景、行业 know-how 等 " 长板 ",在大模型具体落地应用时,能发挥非常关键,甚至关乎生死的作用。

举个例子,教育和 AI 大模型,本质都是先苦后甜、漫长回报的慢生意,中间要经历很长的摸索、研发、客户积累的过程,习惯了 " 大水漫灌 "、烧钱式增长的科技创业公司,反而可能因为太过激进、导致亏损,反倒是习惯了做慢生意的教培机构,有更多的耐心和教育大模型一同长跑,更有可能等到盈利的那一天。

所以,往深了看,教培机构做大模型的底层逻辑,其实是有其合理性的,也是有希望在激烈竞争中获得一席之地的。

终点,彼岸的风景

第二个问题,更贴近教学场景的教培机构,能给教育大模型带来哪些不一样的选择呢?区别于其它教育大模型的差异化竞争力,究竟在哪里?

这就要来说说,目前教育领網域都在用大模型干什么。

軟體层面,大模型 + 教育的新应用可以说是 " 乱花渐欲迷人眼 ",不过可以统称为 "AI 助教 "。就是让大语言模型来完成大量人类教师的重复性工作,比如撰写讲课大纲、口语陪练、作业助手、互动式讲题、课堂对话助手、知识点查询、智能评卷等,减轻家长和教师的辅导压力。

硬體层面,将上述軟體能力集成到学习机、学生手表、学生手机、平板电腦等产品上,结合拍摄、OCR、姿态传感器等硬體能力,对终端算力、配置、互動等进行优化,比如要将大模型的规模压缩,以便在端侧部署。

目前来看,随着入局玩家的增多,无论是 "AI 老师 " 还是 AI 智能教育硬體,产品功能开始趋于同质化,逐渐呈现出白热化的竞争态势。这时候,教培机构做大模型,或许可以从既有优势中提取出一些差异化能力:

更专精。目前,"AI 老师 " 的同质化功能,主要集中在一些容错率较高的场景,比如口语对话,开放式聊天对大模型的理解能力、逻辑能力等要求,是没有那么高的,而一些容错率较低的场景,比如数学解题、结构分析等,就比较难了。这恰好是教培机构的强项,通过精调、人工标注等方法,可以与同类产品拉开差距。我们注意到,学而思就重点研发 MathGPT 数学大模型,聚焦在数学领網域的解题和讲题算法。单学科的精准辅导,可以成为教培机构做大模型的突破方向。

更个性。大模型好不好用,关键还是要看学生学的好不好。有一项 1984 年的研究发现,接受一对一辅导的学生表现,比接受传统课堂教学的学生高出两个标准差。我们毫不怀疑,未来接受人类优秀老师辅导的学生表现,也会比接受 AI 老师教学的学生高。因为,学生在人类老师的注意和评价下,更有学习动力。所以,对于教培机构来说,未来可以用大模型来赋能线上课堂,给老师找个 AI 助教,让人类教师有更多的时间和精力,去深入了解和指导每一个学生,洞悉学生的兴趣,制定个性化的学习规划,这或许是让人类教师更有职业成就感,让学生学习效果更好的方式。通过人机协作,也能减少教育者在适应新工具时的抗拒心理。

其实说白了,教培机构以前在整个教育体系中所提供的差异化价值,有了大模型之后,依然没变,只不过用更高生产力的工具去实现。

两点之间,过窄门

说了这么多,感觉教培机构做大模型,好像是有理有据,既有前途又有钱途,是不是开足马力、全力投入,就能成功呢?

别忘了,在原点和终点之间,还有许多岔路口,而每一道都可能将教培机构引向歧途。

比如说,教培机构选基座模型,开源还是闭源?

很多人可能会说,当然是开源了,大厂开源的大模型性能高、成本近乎免费,fine-tune 微调一下就能上线,简直不要太爽。可是问题来了,开源的 free 代表自由,也代表着开源人可以 " 不负责任 ",毕竟又没找你收钱,后续出现了代码问题或者漏洞,没人维护就成了大麻烦。遇到新的勒索軟體 / 病毒,开源人撒手不管,企业也没招。而且,开源的 open 并不是没有约束,是要有许可证的,如果开发者不愿意授权,或者滥用开源项目,很可能导致系统后续不可用。所以,用开源大模型来开发自己的垂类大模型,风险是客观存在的,一定要注意合规,防范失控的风险。

那有人可能会说,那我直接选闭源大模型作为基座,总没问题了吧?

值得注意的是,大厂的闭源的基座模型,能力上各有差异,很多排行榜所测试的能力,未必适配教育场景的需求。比如参数规模大的模型,性能表现比较好,但没办法部署到算力有限的端侧教育平板上,教培机构又不可能雇一个科学家团队来进行蒸馏、剪枝之类的压缩处理,是不可用的。所以,要找到最为理想的解决方案,需要教培机构有懂大模型的人才,开展专业的评测和选型。

此外,选择闭源大模型,给基础模型厂商付费,这也是一笔真金白银的开支,对于 " 元气大伤 " 的教培机构来说,也会带来一定的压力。

而且基础模型背靠大厂,在消费者和用户之间有较高的知名度,选择这类闭源模型确实可以很快说服消费者,快速做出购买决策,但也将自己与基础模型厂商捆绑在一起,一旦基础模型出现误差,就会影响消费者对品牌的观感。教育无小事,所以教培机构在选择闭源模型合作方时,也需要慎重考虑,最好是选择有 " 国家队 " 背书的大模型厂商,才是长久经营之道。

除了模型选型,在落地、迭代、营销等多个环节,教培机构要真正转型成为一个大模型能力的科技公司,需要补的课还比较多。

比如应用开发,教培机构要成为 " 产品经理 "。教培机构直接调用基础模型 API,可以短平快地打造出 AI 应用,但很容易陷入同质化竞争,无法发挥其优势,利润空间也会非常有限,而打造一款爆款 AI 原生应用,将大模型、AI 跟业务结合起来,甄别用户的真伪需求,解决刚需问题,做到工程化的可用程度,需要深入到产品级思考。

几年前,俞敏洪在《在线教育到底有没有未来?》的一次发言中,说了一句话:是否有持续的接近刚需的需求,是判断一个教育公司的商业模式是否可以持续的关键。

大模型 + 教育刚刚开始,老师、家长、学生、学校、机构……都还在一点点探寻需求。其中哪些是恐惧错过的 FOMO 情绪驱动下的无效产物,哪些是真正的持续的刚需,或许只能交给时间。而在这个視窗期内,传统教培机构能否生长出 AI 产品能力,还是未知数。

总结一下,做大模型的路上会有无数岔路,是否有过窄门、走小路的勇气,能否做对选择,或许比技术本身更加重要。

无论是为了教育,还是为了生意,教培机构都需要新的故事,大模型是必然之选。

教育,将是大模型所孕育的无数新产业里,更早出发、更晚抵达的一个。对于教培机构来说,未尝不是一件好事,教育大模型的风口吹得更久、更长,留给教培机构的转型視窗和成功概率,也就更大一点。

>
熱門排行
  • 王治郅:杨瀚森主要的问题是速度 他 王治郅:杨瀚森主要的问题是速度 他 郟君昊 | 2025-05-05
  • 贸易战烧进电影院:特朗普拟重税打击 贸易战烧进电影院:特朗普拟重税打击 習又夏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天 贷款追高炒黄金的人后悔了!有人一天 寸飛蘭 | 2025-05-05
  • 手机电池突破8000mAh?硅碳技术的回 手机电池突破8000mAh?硅碳技术的回 衛青柏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天 贷款追高炒黄金的人后悔了!有人一天 繁綺文 | 2025-05-05
  • 任天堂对Genki提起Switch 2商标侵 任天堂对Genki提起Switch 2商标侵 郜萌運 | 2025-05-05
  • 哪吒汽车APP和官网恢复正常 知情人 哪吒汽车APP和官网恢复正常 知情人 袁曼雁 | 2025-05-05
  • 极越汽车 CEO 夏一平名下青岛/义乌 极越汽车 CEO 夏一平名下青岛/义乌 集玲琳 | 2025-05-05
  • 全国经济第一大省明确,推动组建农商 全国经济第一大省明确,推动组建农商 佼昌翰 | 2025-05-05
  • 桑保利:亚马尔有配合意识&有点像梅 桑保利:亚马尔有配合意识&有点像梅 甄正浩 | 2025-05-05
  • 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 袁曼雁 | 2023-05-05
  • “懒癌”发病率上升,定期体检别忽视 “懒癌”发病率上升,定期体检别忽视 幸聽楓 | 2023-05-02
  • 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 賁芳蕤 | 2023-05-02
  • 曹操墓,里面都有啥? 曹操墓,里面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他们终于要HE! 十年了,他们终于要HE! 惠惠君 | 2023-05-07
  • 中央部署经济工作,释放5大信号 中央部署经济工作,释放5大信号 郜萌運 | 2023-05-02
  • 高德上线手机弯道会车预警功能 高德上线手机弯道会车预警功能 習又夏 | 2023-05-02
  • 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 賁芳蕤 | 2023-05-02
  • 等比例长大的童星,李兰迪算一个 等比例长大的童星,李兰迪算一个 郟君昊 | 2023-05-02
  • 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 集玲琳 | 2023-05-02
  • 《云襄传》终于抬上来啦,男O女A让人好上头! 《云襄传》终于抬上来啦,男O女A让人好上头! 集玲琳 | 2023-05-02
  • 高端国产车:军车血统,目前电动车越野的“天花板”? 高端国产车:军车血统,目前电动车越野的“天花板”? 謝飛揚 | 2023-05-02
  • 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 衛青柏 | 2023-05-04
  • 普京签署总统令,批准对俄刑法典相关法条的修正案 普京签署总统令,批准对俄刑法典相关法条的修正案 集玲琳 | 2023-05-02
  • 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 袁曼雁 | 2023-05-02
  • 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 寸飛蘭 | 2023-05-05
  • 解除资格!停止一切合作 解除资格!停止一切合作 佼昌翰 | 2023-05-02
  • 中银证券给予南京银行增持评级 中银证券给予南京银行增持评级 袁曼雁 | 2023-05-03
  • 3699起 联想小新mini主机上架 13代酷睿标压处理器 3699起 联想小新mini主机上架 13代酷睿标压处理器 習又夏 | 2023-05-05
  • 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 惠惠君 | 2023-05-02
  • 疯成这样,怎么还能被全网吹捧? 疯成这样,怎么还能被全网吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收购美国第一共和银行 摩根大通收购美国第一共和银行 謝飛揚 | 2023-05-02
  • 台剧赢麻了,又来一部8.9 台剧赢麻了,又来一部8.9 衛青柏 | 2023-05-02
  • 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 郟君昊 | 2023-05-02
  • 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好这件事是关键 "三高"已盯上青少年,做好这件事是关键 習又夏 | 2023-05-05
  • 五一档没一个能打的 五一档没一个能打的 集玲琳 | 2023-05-05
  • 恐怖韩剧下神坛,这次胆小可入 恐怖韩剧下神坛,这次胆小可入 袁曼雁 | 2023-05-05
  • 这剧是不是用ChatGPT写的呀? 这剧是不是用ChatGPT写的呀? 惠惠君 | 2023-05-02
  • 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 袁曼雁 | 2023-05-03
  • 性骚扰惯犯,滚出娱乐圈 性骚扰惯犯,滚出娱乐圈 謝飛揚 | 2023-05-05
  • 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 佼昌翰 | 2023-05-02
  • 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 惠惠君 | 2023-05-02
  • 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 嬴覓晴 | 2023-05-02
  • 当年轻人开始不随份子钱 当年轻人开始不随份子钱 袁曼雁 | 2023-05-02
  • 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 幸聽楓 | 2023-05-03
  • 宋慧乔获视后首次晒照,拿奖杯笑容温柔 宋慧乔获视后首次晒照,拿奖杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們