大模型，教培机构要过窄门

一度“元气大伤”的教培机构，也开始加入大模型的热潮了。

教育+大模型，并不稀奇，自从AI大模型火爆之后，教育就被认为是大语言模型最容易落地的领域。稀奇的是，和其他场内玩家相比，教培机构的优势确实称不上明显。

目前，市面上在做教育大模型的厂商，大概可以分为三类：一类是大模型厂商，如百度“文心一言”大模型被接入旗下品牌的学习手机，科大讯飞推出了星火大模型及学习机产品；第二类是教育科技公司，如网易有道打造了“子曰”大模型，作业帮自研了银河大模型，可汗学院、多邻国、Coursera、猿辅导等也都纷纷将产品与大模型结合，推出了AI助手型口语教练。

图片 1.png
另一类，就是受“双减”影响的教培机构了，如新东方、好未来、学而思，也都披露了自家的大模型成果。

大模型在教培市场大有可为，与教培机构在大模型竞争中拔得头筹，这两个结论显然是不能划等号的。

毕竟三类玩家中，教培机构可能是离教育最近的一个，但也是离大模型最远的一个。技术、算力、资金、人才、互联网产品营销……教培机构都不可能比科技巨头、互联网企业玩的更溜。

那么，教培机构做大模型，是不是一场必输的游戏呢？我们认为不是。

正像《马太福音》中所说，“你们要进窄门。因为引到灭亡，那门是宽的，路是大的，进去的人也多；引到永生，那门是窄的，路是小的，找着的人也少”。

教培机构做大模型，应该换一个思考方向——钻入“场景”的窄门，走巨头大厂不愿意投入的“小路”，建立核心竞争力。

理解这件事，我们从教培机构究竟为什么要出发，开始说起。

原点，为什么出发

你可能会问，有钱、有技术、有实力的公司有壁垒，搞大模型顺理成章。开源大模型泛滥，普通公司搞大模型，简直就是往红海里跳，教培机构刚刚从“双减”阵痛中恢复了一点元气，怎么这么想不开？

说句公道话，教培机构做大模型，逻辑是能够自洽的。

第一个合理之处：大模型时代的教育，也需要教培。

有人说，大模型可以取代人类助教，智能导师比人类教师成本更低，这是确实存在的。但是，大模型仅仅是一个工具，并不能替代教师和教培机构的服务内容。

短期内，大模型还有很多技术难题没有解决，比如幻觉，大模型“一本正经地胡说八道”，输出的都是错误的信息，很可能培养出“学渣”；比如黑箱，大模型生成的内容可解释性不高，思考过程不清晰的话，答案的可信度不高，让AI“无人驾驶”来辅导孩子，学习效果不一定好。

长期来看，即使大模型进化到极高理解力、极高自动化程度、极低错误率，但教育产品和服务的本质还是学生，还是需要教培服务来更好地满足“千人千面”的具体需求。
图片 2.png

正如同济大学校长、教授郑庆华所说，过去是老师和学生的二元结构。今天，机器在很多领域比老师干得还好。因此，未来的教学模式，可能会拓展为老师、机器、学生三元结构。所以，教培机构与AI结合，还是有很多的可能性的。

第二个合理之处：教育领域的大模型，精调少不了。

大模型自身的学习能力很强，GPT-4在SAT 等考试中都超过了88%以上的人类应试者。但就像高考状元不一定都是好老师，大模型学得好不代表一定能教得好。教育大模型，需要在通用大模型的基础上，加上自身数据进行精调，针对具体场景进行迭代优化，才可能（注意是可能）解决很多教育环节的具体问题。

举个例子，实际应用中，教育大模型非常重要的一点就是合规，用于教学、备课等场景的大模型，对语言组织能力、逻辑推理能力要求更高，且容错率低，一旦爆出不适当的内容就是教学事故，要提升大模型在此类任务中的安全可控，除了依靠高质量的标注数据，还需要专业教师的反馈、知识经验，而拥有大量教师人才和教学经验、数据的教培机构，显然是更具备行业优势。
图片 3.png

第三个合理之处：短板不是真的短，长板却是真的长。

大家都学过田忌赛马的故事，在竞赛中获胜要用自己的长处去对付对手的短处。一眼看去，似乎教培机构在技术、人才、算力、资金等各方面，都比不上科技巨头或互联网公司，但有没有可能，这些短板在实际中，都不算是什么短板呢？

比如技术，教培机构确实在基础模型上的积累不多，但作为垂直行业，教培机构其实也没有必要全力投入自建底层模型，通过API云端调用、与头部厂商合作等方式，用相对较少的数据、算力资源和开发人员，就能建设出垂类的教育大模型。

多邻国的生成式AI应用，都是基于OpenAI的大模型来研发的，其报告中也强调，要做好功能而非做大模型，专注于应用场景。由此可见，教培机构如果不在基础模型赛道上跟科技巨头正面硬扛，那么所谓“短板”，其实对于做垂类大模型，影响并没有想象的大。

反而教培机构所拥有的数据、场景、行业know-how等“长板”，在大模型具体落地应用时，能发挥非常关键，甚至关乎生死的作用。

举个例子，教育和AI大模型，本质都是先苦后甜、漫长回报的慢生意，中间要经历很长的摸索、研发、客户积累的过程，习惯了“大水漫灌”、烧钱式增长的科技创业公司，反而可能因为太过激进、导致亏损，反倒是习惯了做慢生意的教培机构，有更多的耐心和教育大模型一同长跑，更有可能等到盈利的那一天。

所以，往深了看，教培机构做大模型的底层逻辑，其实是有其合理性的，也是有希望在激烈竞争中获得一席之地的。

终点，彼岸的风景

第二个问题，更贴近教学场景的教培机构，能给教育大模型带来哪些不一样的选择呢？区别于其它教育大模型的差异化竞争力，究竟在哪里？

这就要来说说，目前教育领域都在用大模型干什么。

软件层面，大模型+教育的新应用可以说是“乱花渐欲迷人眼”，不过可以统称为“AI助教”。就是让大语言模型来完成大量人类教师的重复性工作，比如撰写讲课大纲、口语陪练、作业助手、互动式讲题、课堂对话助手、知识点查询、智能评卷等，减轻家长和教师的辅导压力。

硬件层面，将上述软件能力集成到学习机、学生手表、学生手机、平板电脑等产品上，结合拍摄、OCR、姿态传感器等硬件能力，对终端算力、配置、交互等进行优化，比如要将大模型的规模压缩，以便在端侧部署。

目前来看，随着入局玩家的增多，无论是“AI老师”还是AI智能教育硬件，产品功能开始趋于同质化，逐渐呈现出白热化的竞争态势。这时候，教培机构做大模型，或许可以从既有优势中提取出一些差异化能力：
图片 4.png

更专精。目前，“AI老师”的同质化功能，主要集中在一些容错率较高的场景，比如口语对话，开放式聊天对大模型的理解能力、逻辑能力等要求，是没有那么高的，而一些容错率较低的场景，比如数学解题、结构分析等，就比较难了。这恰好是教培机构的强项，通过精调、人工标注等方法，可以与同类产品拉开差距。我们注意到，学而思就重点研发MathGPT数学大模型，聚焦在数学领域的解题和讲题算法。单学科的精准辅导，可以成为教培机构做大模型的突破方向。

更个性。大模型好不好用，关键还是要看学生学的好不好。有一项1984年的研究发现，接受一对一辅导的学生表现，比接受传统课堂教学的学生高出两个标准差。我们毫不怀疑，未来接受人类优秀老师辅导的学生表现，也会比接受AI老师教学的学生高。因为，学生在人类老师的注意和评价下，更有学习动力。所以，对于教培机构来说，未来可以用大模型来赋能线上课堂，给老师找个AI助教，让人类教师有更多的时间和精力，去深入了解和指导每一个学生，洞悉学生的兴趣，制定个性化的学习规划，这或许是让人类教师更有职业成就感，让学生学习效果更好的方式。通过人机协作，也能减少教育者在适应新工具时的抗拒心理。

其实说白了，教培机构以前在整个教育体系中所提供的差异化价值，有了大模型之后，依然没变，只不过用更高生产力的工具去实现。

两点之间，过窄门

说了这么多，感觉教培机构做大模型，好像是有理有据，既有前途又有钱途，是不是开足马力、全力投入，就能成功呢？

别忘了，在原点和终点之间，还有许多岔路口，而每一道都可能将教培机构引向歧途。

比如说，教培机构选基座模型，开源还是闭源？

很多人可能会说，当然是开源了，大厂开源的大模型性能高、成本近乎免费，fine-tune微调一下就能上线，简直不要太爽。可是问题来了，开源的free代表自由，也代表着开源人可以“不负责任”，毕竟又没找你收钱，后续出现了代码问题或者漏洞，没人维护就成了大麻烦。遇到新的勒索软件/病毒，开源人撒手不管，企业也没招。而且，开源的open并不是没有约束，是要有许可证的，如果开发者不愿意授权，或者滥用开源项目，很可能导致系统后续不可用。所以，用开源大模型来开发自己的垂类大模型，风险是客观存在的，一定要注意合规，防范失控的风险。

那有人可能会说，那我直接选闭源大模型作为基座，总没问题了吧？

值得注意的是，大厂的闭源的基座模型，能力上各有差异，很多排行榜所测试的能力，未必适配教育场景的需求。比如参数规模大的模型，性能表现比较好，但没办法部署到算力有限的端侧教育平板上，教培机构又不可能雇一个科学家团队来进行蒸馏、剪枝之类的压缩处理，是不可用的。所以，要找到最为理想的解决方案，需要教培机构有懂大模型的人才，开展专业的评测和选型。

此外，选择闭源大模型，给基础模型厂商付费，这也是一笔真金白银的开支，对于“元气大伤”的教培机构来说，也会带来一定的压力。

而且基础模型背靠大厂，在消费者和用户之间有较高的知名度，选择这类闭源模型确实可以很快说服消费者，快速做出购买决策，但也将自己与基础模型厂商捆绑在一起，一旦基础模型出现误差，就会影响消费者对品牌的观感。教育无小事，所以教培机构在选择闭源模型合作方时，也需要慎重考虑，最好是选择有“国家队”背书的大模型厂商，才是长久经营之道。

图片 5.png
除了模型选型，在落地、迭代、营销等多个环节，教培机构要真正转型成为一个大模型能力的科技公司，需要补的课还比较多。

比如应用开发，教培机构要成为“产品经理”。教培机构直接调用基础模型API，可以短平快地打造出AI应用，但很容易陷入同质化竞争，无法发挥其优势，利润空间也会非常有限，而打造一款爆款AI原生应用，将大模型、AI跟业务结合起来，甄别用户的真伪需求，解决刚需问题，做到工程化的可用程度，需要深入到产品级思考。

几年前，俞敏洪在《在线教育到底有没有未来？》的一次发言中，说了一句话：是否有持续的接近刚需的需求，是判断一个教育公司的商业模式是否可以持续的关键。

大模型+教育刚刚开始，老师、家长、学生、学校、机构……都还在一点点探寻需求。其中哪些是恐惧错过的FOMO情绪驱动下的无效产物，哪些是真正的持续的刚需，或许只能交给时间。而在这个窗口期内，传统教培机构能否生长出AI产品能力，还是未知数。

总结一下，做大模型的路上会有无数岔路，是否有过窄门、走小路的勇气，能否做对选择，或许比技术本身更加重要。

无论是为了教育，还是为了生意，教培机构都需要新的故事，大模型是必然之选。

教育，将是大模型所孕育的无数新产业里，更早出发、更晚抵达的一个。对于教培机构来说，未尝不是一件好事，教育大模型的风口吹得更久、更长，留给教培机构的转型窗口和成功概率，也就更大一点。

推荐阅读

目录