半年积累用户超200万，教育行业正在被AI重写

Original 麦飞 AI新榜

2024-09-24

作者 | 麦飞

编辑 | 松露

教育大模型，再成焦点。

在刚刚结束的世界人工智能大会（WAIC）上，教育展区热度居高不下，网易有道、学而思、猿力科技等展位挤满了带娃逛展的家长。

复盘今年教育行业的AI进程，又增添了不少新看点，正在从去年的技术探索转向大模型落地上，尝试让可商用迈入新的阶段。

比如猿力科技亮相的教育全家桶，就涵盖了面向国内教育的飞象星球、猿编程、小猿学练机、海豚AI学，以及面向出海的CheckMath和LeapMath，释放的全是落地信息。

现在，猿辅导终于不用卖咖啡、羽绒服或者月子套餐了。

这也似乎验证了一件事，能让教育行业二次崛起的，恐怕还是它的传统艺能。

同时，教育领域的大模型落地也不仅在国内有动作，在海外呈现出的劲头也很强劲。比如在今年6月，一款名为Answer.AI的教育应用就曾霸榜北美教育TOP1，上线6个月就狂揽200万用户。

鉴于教育行业在推动大模型落地上遥遥领先——毕竟还有很多行业停留在通用大模型的旧思路上，不禁激起了“AI新榜”的探索兴趣。转眼2024过半，教育大模型落地进展几何了？不同企业之间在落地路径上有什么区别？以及AI到底能不能让教育变得更好？

教育大模型落地，走到哪了

2023年，被认为是教育大模型的元年。去年GPT-4o推出后，网易有道发布自研大模型“子曰”，学而思推出专注于数学的大模型MathGPT，作业帮上线自研银河大模型，科大讯飞对星火大模型连番升级，松鼠AI发布全球首款全学科智适应教育大模型等等。一时间，大模型成了教育企业的必争之地，引得各企业纷纷下注。

这波热潮过后，教育大模型似乎有了供过于求的迹象。因为市场最后只会选择一两个大模型作为技术基座，相比之下，应用层的市场空间则要比模型层大的多。

很多业界大佬都曾为上述观点站台，比如百度创始人李彦宏就多次强调AI原生应用。但这是否意味着大模型真的不重要了？答案显然不是，因为上层应用归根到底由底层技术决定。

“AI新榜”梳理发现，许多教企在发布新应用时，往往伴随自家大模型的更新换代。比如网易有道在发布“子曰”1.0版本时，就同步推出了6款AI应用。在发布“子曰”2.0版本时，又更新了3款AI应用。

讯飞星火也是如此。自去年5月星火大模型发布以来，它的每一次升级都与教育密切相关。远的不说，就说6月27日发布星火4.0时，讯飞也展示了其在教育、医疗、商业等多领域的应用更新。

说完模型侧，咱们再来说说应用侧。

得益于教育行业的积极探索，国内也的确出现了许多基于教育大模型的应用。

比如在软件方面，网易有道就结合自己在英语方面的赛道优势，推出了Hi Echo和小P老师等应用，并通过将其打包进AI订阅服务，一季度狂赚会员费5000万；学而思推出数学答疑原生工具九章随时问，能针对学生提供个性化讲解，既懂启发也懂知识点；另外还有开篇提到的猿力科技，最近更是推出了AI应用全家桶。

硬件方面的动作也不少，比如小度科技基于文心大模型落地学习机Z30；科大讯飞基于星火大模型推出学习机T20；除此之外，还有作业帮、步步高等一众教企竞相布局AI学习机。据艾瑞咨询，2023年我国智能学习机市场规模达807亿元，预计2025年将超千亿，学习机的市场潜力可谓巨大。

不难发现，目前国内在教育大模型落地上的主流做法，就是用AI把解题、口语、批改、讲题等场景重做一遍。这种做法虽然不出错，但也说明AI只是头部教企用于提升原有业务的工具。

当然这种现象也不难理解。正如A16Z的联合创始人Marc Andreessen近日在文章里提到的那样，当公司开拓新业务时，三个重要元素的排序分别是市场、产品和团队。但如果这个市场足够大，比如教育市场，那么新产品只要基本可接受就能获得成功。

这也很好解释了阿里云创始人王坚在今年WAIC的那句话，大企业把AI看做工具的革命，小企业把AI看做革命的工具。

除了上述提到的这些，教育大模型下一轮的落地方向是多模态。目前，教企也正尝试利用大模型生成文本、图像、视频、音频等不同形式的回复，模拟人类处理信息的方式。多模态能力将使大模型更了解学习者的需求，从而能提供更个性化的学习支持。

教育大模型落地，藏着哪些生意经？

可以说，教育行业正在被AI重写，一波新的创业潮已在路上。

据多知网，2023年，我国新注册教育科技相关企业4万家，同比增加22.3%。2024年前5个月，我国新注册教育科技相关企业1.7万家，同比增加5.4%。

在这个趋势之下，“AI新榜”也来盘了盘教育大模型落地还藏着哪些商业机会。

1. 差异化是良性发展的前提

上文提到，当前各家企业的落地方向主要是在卷场景。但由于教育场景总共就这么多，同质化的问题很快就显现了出来。

想要寻求差异化，还能有哪些打法？让我们一起来看看。

比如网易有道借鉴了多邻国的做法，推出了AI订阅服务。据多位网友反映，它大概率借鉴了多邻国"游戏化"的机制，纳入AI订阅的Hi Echo和小P老师也都解锁了很多趣味场景，能让学生一边娱乐一边学习。

同样选择寓教于乐的还有科大讯飞推出的"小鹰爱学"。和有道相比，它不仅有学习换能量、奖牌、排名等趣味化的玩法，还在界面上选择了二次元偏爱的UI设计，首页甚至飘着各种弹幕。

除开游戏化玩法外，精耕内容也是可以考虑的方向之一。比如在竞争激烈的英语赛道，高途依旧敢于晚下场布局高途AI英语。而它之所以有勇气，恰恰在于它选择了"分教材"、"同步课本"的差异化打法，并把客群瞄准在低龄学生。据高途称，这也是国内首个采取"分教材学习"的智能学习方案，从没有人尝试过。

在本轮创业潮中，小企业也充满了想象力。有了AI的加持，小企业也不再跟着大企业亦步亦趋，而是实打实地在尝试"把AI作为革命的工具"。

今年5月，VisionFlow创始人刘夜在法国发布了全新产品Talkit，称这款工具能让用户沉浸式学外语。

打开这个App，用户将进入一个3D虚拟世界。在这里，每个用户都能选择选择一个专属数字分身，并能定制对话发生的场景，如餐厅、打车途中、医院等。通过模拟真实世界，它能为用户提供最好的语言环境，从而实现快乐学习。

目前，Talkit还没有在国内发行，但试想一下，如果你能进入这个元宇宙，还用得进去别家的口语外教吗？

2. “不出海，就出局”

受双减政策影响，本轮落地潮中也有很多企业把目光转向国外，真正做到了“墙内开花墙外香”。

在美国市场，国内表现最突出的两款应用分别是字节跳动旗下的Gauth和作业帮旗下的Question AI。据Sensor Tower数据，今年5月，这两款应用已先后登顶美国教育类榜首，下载量均为170万左右。

同样问鼎过榜首的还有Answer.AI，这款由初创团队打造的应用，自去年年末上线以来，6个月内迅速积累用户超200万，增长速度同样令人瞩目。

全科辅导产品之外，数学应用在海外的表现也很出色，比如Solvely.AI，它作为今年的出海新兵，也顺利进入了榜单前十。

值得一提的是，国内教育应用的高性价比是其海外扩张的关键。据Tech Crunch报道，美国家教费用非常昂贵，比如休斯顿一小时的家教费要60美元，在富庶的湾区，价格可能还要再翻两倍。相比之下，来自中国的教育应用订阅费才几十美元一年，相当于真人家教1小时的费用，非常实惠。

3. 既To C，也To B

除开上述偏向于C端的策略外，To B同样是商业版图不可或缺的一块。

由于大模型落地的成本比较高昂，为摊薄前期研发和运营的大幅投入，各家公司都在寻求规模效应，开始和G端、B端开展广泛合作。

相对而言，科技巨头在这方面存在一定优势。比如网易，其业务横跨游戏、音乐、工业和教育四大领域，客户资源相对较多，加上雄厚的资本积累，即便教育板块遇到挑战，其余稳健的业务依然能保证教育有资金布局前沿科技。

而教企的抗风险能力就会稍微逊色一些，它们虽然具有贴近C端的传统优势，但毕竟距离G端、B端稍远。

目前很多教企也正在向B端和G端发力。如猿力科技的“看云大模型”自5月15日完成备案后，就迅速与全国183个地区的学校建立了合作，覆盖了作业设计、课后服务和课堂讲评等多个教育场景，体现了其在教育领域的深度整合能力。

好未来也是如此，通过与传统学校合作试点，从而构建了更加紧密的教育生态链，提升了教育科技的整体竞争力。

科大讯飞更是迈出了国际化的步伐，不仅在新加坡设立了区域总部，还与当地62所中小学展开了合作试点，共同推进学生学习平台项目的建设。

总而言之，随着AI技术在教育领域的渗透加深，教育科技企业的生存发展越来越依赖与学校的合作深度和广度。

AI真的能让教育更好吗？

说到底，AI是一种算法技术，本质仍是冰冷的代码，而教育是与人打交道的，不是一串串冰冷的指令。

这就带来了一个核心问题：AI真的能否扮演好个性化导师的角色、实现因材施教吗？

鉴于描绘愿景的文章已屡见不鲜，“AI新榜”在此就不再重复，而是想从技术的角度讨论一下它该如何实现。在这里，我们重点参考了谷歌此前发布的技术报告《面向教育生成式人工智能的负责任开发：一种评估驱动的方法》。

首先，由于大模型本身不懂教学行为，它需要研究者提前输入具体的教学规范，比如谷歌技术报告就为AI提出了如下原则：

不要过早给出解决方案，鼓励学习者提出解决方案
使解释易于理解
鼓励学习者，夸赞学习者的进步，把错误当做进步的机会
识别学习者什么时候遇到了困难，主动与他们沟通
通过提问来确定学习者的掌握程度
逐步解释，并传授思维过程‍

但这种笼统的原则无法建立一套通用的教学策略，因为许多学科的教学研究非常分散，即便是在同一学科内，很多时候也强调不同的教学标准，几乎没有重叠。

为此，研究者需要和多个群体展开合作，包括学生、教育工作者、科研工作者以及其他研究人员。

同时，大模型作为导师，还需要学会如何提问。

目前如果不向大模型输入让其提问的指令，它只会默认生成回复。

为了解决这个问题，谷歌的研发者实验了两种方法，分别是提示和微调。

提示是调整AI最流行的方法，它只需要开发者提前输入一套关于良好辅导行为的说明，比如“首先向学生介绍自己你是AI导师，你很擅长提问，每次只问一个问题......”，然后由AI来自行调整。

但提示存在很多局限性，因为有些具体的辅导行为很难用自然语言描述清楚，即便说得清楚，良好的辅导行为也不可能列举穷尽。

然后是微调。微调是指在大模型生成回复后，再由人类对它的表现进行反馈，从而强化学习。如果微调的操作由高级教师来执行，大模型就能捕捉到在有效教学中的一些直觉和推理，以至于能够推导出更广阔的教学空间。

成功的微调需要满足两个先决条件：足够多的高质量数据和衡量教学行为的客观标准。但不论满足与否，微调能带来的效果都和它的名字一样，即无法颠覆现有的教学模式，只能对其加以改进。

同时，AI对学生的了解也是一个循序渐进的过程，这一点很像现实中与人相处。大模型需要不断对学生的回答进行打分，然后通过这些分数得出平均分，从而了解学生的真实水平和知识盲区。

当然这个操作代入学生视角会有点难受，毕竟谁会愿意有个老师每天在背后给自己打分。

还有一点，教育大模型也存在伦理风险。

正如香港科技大学首席副校长郭毅在去年的WAIC教育论坛上说的那样，和人类先培养好奇心、再培养价值观、最后再系统学习各学科的教育顺序不同，机器学习是先输入数据，再被人类告知对错，最后才掌握价值观。

通过拟人化的交互系统，大模型已显著提升了用户信任与接受度。但在另一角度看来，这也可能导致用户对大模型产生情感依恋，比如使得未成年学生分享自己的敏感信息，或是对AI导师产生过度依赖。

所以研发团队更要对此进行安全微调，以保证AI说的每句话尽量都是合适的。

不过，正如猿力科技CTO杨元祖所说，大模型一定是教育未来发展的最大变量。虽然完美的AI导师还未出现，但它也许就在不远的未来。

「AI新榜交流群」进群方式：添加微信“banggebangmei”并备注姓名+职业/公司+进群，欢迎玩家们来群里交流，一起探索见证AI的进化。

欢迎分享、点赞、在看

一起研究AI

继续滑动看下一个

AI新榜

向上滑动看下一个

付鹏 —— 《2024年年终回顾和2025年展望——对冲风险VS软着陆》

炸裂大瓜！九比童“厉害”，女网红再嘲童锦程！哲家财团豪刷柚柚CC！

寒潮前最后一波捡漏！100%纯羊毛大衣只需179元！千元级质感，上身超显贵气~

清华女神，34岁的美女博士县长，辞职了

13人被撤销本届全国政协委员资格丨时政周报

半年积累用户超200万，教育行业正在被AI重写

您可能也对以下帖子感兴趣

付鹏 —— 《2024年年终回顾和2025年展望——对冲风险VS软着陆》

炸裂大瓜！九比童“厉害”，女网红再嘲童锦程！哲家财团豪刷柚柚CC！

寒潮前最后一波捡漏！100%纯羊毛大衣只需179元！千元级质感，上身超显贵气~

清华女神，34岁的美女博士县长，辞职了

13人被撤销本届全国政协委员资格丨时政周报

生成图片，分享到微信朋友圈

半年积累用户超200万，教育行业正在被AI重写

您可能也对以下帖子感兴趣