学吧课堂李行武:粗粒度的个性化是伪个性化 | 人物访谈
调研 | 凯文 东起
撰写 | 东起
学吧课堂创始人&CTO李行武毕业于清华大学计算机系,在校期间曾在Intel、微软亚洲研究院和搜狗实习,毕业后参与两家公司创业,后加入奇迹通讯担任CTO,2013年进入教育领域,创立了博学慎思教育科技有限公司。
公司旗下产品学吧课堂,是一款针对中学数学的练习产品;在积累了约200万用户和7亿条做题数据后,开始推出教学服务,其基于教学导航系统的1对1辅导产品已上线内测。
在做题库和教学产品时有哪些经验?面向K12的题库产品如何积累有效数据?现在的数据是否能支撑起人工智能在教育领域的应用?1对1教学有哪些问题,要如何解决?近日,李行武接受了爱分析专访,对这些问题交流了自己的看法。
题库产品篇
爱分析:14年的时候推出了虚拟老师,当时做这个产品有哪些技术难点?
李行武:两个难点吧,第一个是内容生产,一道题能有这么多变化,这些内容不可能是合成出来的,所以实际上是在事先录好了大量的有关联的十几秒到几十秒的短视频,组成一个巨大的内容树;第二个是如何带学生走出一条路径来,这条路径拼出来就是这道题,这个过程其实就是人脑思考的过程,需要去模拟这个过程。
爱分析:后来是如何解决第二个难点的?
李行武:一开始没有什么特别好的办法,更多的是像大家说的,你得去理解这个事情。今天AI的概念大行其道,大部分都是伪的。
它从中长期来看是靠数据驱动的,但它早期不是,尤其在这个场景中,因为你没有数据驱动算法,所以它极大程度上是基于策略的,就像教小朋友下跳棋,你说第一步走这个,如果他走了这步,你就走这步,这是最简单的策略,但实际会复杂很多。这相当于要把人思考的策略用机器实现,所以更多的是基于对上课这件事情的理解,这就是你去上了课才会知道的。
爱分析:所以目前AI在教育领域还是伪概念?
李行武:看你怎么定义了,这个讲起来比较细,要看不同的场景。
即使在练习场景,所有的做题产品讲的故事都是一样的,会根据同学们的做题情况推送适合的题,使做题更加高效,这个故事逻辑是成立的,但不谦虚的讲,可能在第一阶段只有我们做到了。
这其实也是我们转型做做题产品的一个非常重要的原因。
15年我们在转型的时候,去看市面上已经满街的做题产品了,但是你会发现没有一家起来了,做题产品没有人用。一个品类都没有做出来的时候,它只有两种情况:一个是这个事本身错了,一个是大家没找到路。我们的判断是这事没错,因为在线教育真能成立的话,学练测这重要的三大场景,一定都会在线化,所以一定是存在在线做题这样的事情的。那么问题出在哪?就去找问题,解决。
爱分析:那问题出在哪呢?
李行武:有一个很简单的结论,做题不是小朋友的需求。中国的K12教育整体上是反人性的,这也是K12领域最难的部分之一,就是它是一个反人性的行业;所有伟大的产品都是顺应人性的,你如何在一个反人性的领域做出一个有用户活跃度的产品。
那同学们为什么不爱学习?咱们最终要对学习有帮助其实就是两件事,传统行业早有定论,第一是学习动力问题,第二是学习方法问题。如果优先选一个解决,那肯定是学习动力问题。
回到大的逻辑,互联网对一个行业产生所谓巨大的影响,一定是解决行业一些根本性的问题,绝对不是细枝末节的;如果在线教育这个命题成立的话,它一定是要最终解决大问题,那行业的大问题也有定论,其中一个就是学习动力问题,影响学习动力的原因其实也有结论了,叫做累计的挫败感。
这是同学们不爱学习的核心原因,解决它的方案是让它进入正循环。所以我们当时就沿着这个思路去做了学吧课堂。
爱分析:解决学习动力问题,学吧课堂是怎么做的?
李行武:大家都喜欢做的是有成就感的事情,落地到做题上就是这题我刚好会做,所以你要出他会做的题。同时,我们把整个评价体系改了,我们营造了一个“学渣“的结界。
比如我举一个小的点,我们分很多区,一万人一个区,我们每个区的排行榜前十名可能只有两个是“学霸”,剩下八个是“学渣”,为什么呢?咱们一起做题,因为你是学霸,所以你的题是竞赛题,而我的是刚好会做的简单的题,咱俩都做对了,你得5分我也得5分,所以谁在前面真不好说。
爱分析:那在产品设计和技术层面,是怎么实现的?
李行武:对于练习产品,首先要解决的问题就是有人用,并且能活跃的用起来,核心就是刚才讲的动力问题。这靠两件事,第一是用很特殊的激励体系,第二是真正能够出适合学生的题目。
对于激励体系,外界有些声音说学吧是靠给学生补贴,那这个我们完全不避讳,就是同学们来我们这做题是有收入的,但问题是收入是多少呢,就是一个学生他几乎天天来做题,而且还要尽量把题做对的情况下一个月最多获得价值5块钱的东西。
所以我会问大家说,给你5块钱你愿意每天来做对几十道题吗?而且退一步讲,对家长来说,我去问家长,你给我5块钱,我让你孩子天天做题,你干不干?这件事本身是有价值的,所以不单纯是靠激励。
还有另外一件事在辅助它就是出题,你要让激励体系配合看不见的出题,才有可能使你的模型最终成立,获得持续的活跃用户,这是我们在2016年所谓寒冬能拿到钱的主要原因,我们在一个大家觉得几乎已经判死刑的赛道上做出一个完全不一样的产品,虽然看起来是一样的。
爱分析:出适合的题的基础是打标签,在这方面有哪些经验?
李行武:我们认为这件事的关键点在于颗粒度,粗粒度的个性化是伪个性化。比如把“集合的运算”这个考点作为标签,有教学经验的老师来看就会感觉到它有多粗;如果以这样的词作为标签,那中学数学大概也就是百这个量级的知识点,我们的知识点是在千这个量级。
当颗粒度粗的时候,机器是分辨不出来的。比如大家都知道AI最近的突破都是在视觉领域,最经典的例子就是识别猫,机器怎么认识一张图是猫?因为你给了它10000张图片去做训练,但是你想象一下,如果我给的这10000张图片全是打马赛克的猫,它能认出来吗?
那问题在哪呢,也有人反问我,如果我给它10000张高清的猫,它会不会认的更好,好像也没有,所以就是这个度到底在哪里?当你定性分析完,定量去分析,到底什么样算是正好到这个要求了,这就是应用决定的,应用到什么级别,你的数据就要到什么级别。这是很粗层的一个理解。
所以打标签这件事情,关键在于能打的多细多准,当你到某个量级以前,打多少都是废的,过不了那个阈值。
爱分析:那目前打标签有哪些方式呢?
李行武:现在行业通行的做法是找几百个大学生,按计件的方式进行,因为你不可能找名师来打标。问题就在于如何保证这些人的输出是稳定的,质量可靠的。
这件事是需要深刻理解知识,只依靠做工程的人是做不出来的,你要想办法去把这个标做好的分解。打标的过程其实就是要去区分,是在多个之中去做选择。那怎么才能尽量选择对呢?其实就是你的选项越正交,越容易选出来。
再比如说你在流程设计上,比如一个人打是不可信的,通常至少三个人打,其中两个人一样就过,这是个简单有效的策略。那你说我可不可以先让两个人打,当两个人不一样的时候,再让第三个人打,这个和刚才那个的区别就在于人效比差了1.5倍,因为大部分时候会有两个人打一样的。
所以最终的结果是,通过对工程以及领域本身的理解,使得你做这件事情的效率远远高于别人。
举个例子,我们的查错成本大概是别人的1/50以下,我们是这么干的:由于我的同学们已经相对认真的做题了,题目从老师那边经过初步的过滤之后,会小范围的推给认真做题的同学,这些人就会有反馈,如果到了一定的阈值,题目会自动打回。
如果比如100个人都没问题,就进入第二阶段,再过了,就可以推出去了,这会使整个查错的过程发生本质的变化。所以在内容这件事,核心是你怎么让效率远远高于别人。
爱分析:其它公司这么做似乎也不是很难?
李行武:所以问题在于这个过程是联动的。
当我们在讲数据的时候,除了内容数据,还有一个很重要的就是行为数据,也就是同学们做题的数据。
做题数据有一个重要的指标,叫做正确率,如果正确率很差,那不管是一亿条还是十亿条,让机器去训练,机器只可能有两个结论:一是从单题来看,这题很难;二是从任何一个个体来看,全是“学渣”。所以这个数据不仅没办法让你判断这道题是对还是错,更没有办法判断这道题的难度,更不要说去计算。
没有用户就没有数据,没有数据就不能很好的给用户出题,然后就更没有用户。我的结论是说,大家可以用钱先去解决用户的问题,在跑起来进入正循环之后,你的出题会比较好,用户感知就会比较好,然后用户的做题行为就会相对好,使得数据更好。
那怎么样进入正循环?第一是启动点,第二个是收敛速度。
爱分析:收敛速度怎么理解?
李行武:所有产品都会面临所谓冷启动问题,就是不了解用户。关键在于你能在多短时间内跨过那个阈值,做到还比较适合用户,使他开始用起来。如果你说要在用户做100道题之后,才有办法出适合的题,那大部分人可能还没到100题就已经走了,所以启动靠外部动力,在启动那件事情没有消失之前要收敛。
教学产品篇
爱分析:在练完成后还有个教的问题,只有教才能实现规模化收入,学吧课堂在这方面有哪些考虑?
李行武:练是不能完成最后的商业模式的,只是路径的一环,我们已经开始从练走向教了。
教书从形式上就是班课和1对1。我们认为在线教学这件事情,一定是1对1先起,它有个很重要的逻辑,就是从需求角度来看,大部分家长不相信学生可以在没有监督的情况下,在电脑前听一个老师讲大课听一个小时;但是1对1他又觉得有戏,因为1对1老师就带你一个,还有视频回放和双方录音,这是一个看似小但是决定性的点。
所以第一个结论是要从1对1切,而且1对1也正好跟我们的大逻辑一脉相承。
爱分析:1对1的问题也被讨论的很多了,你怎么看?
李行武:传统行业1对1的问题,其实也有非常明确的定论就是做不大,从财务角度看它的成本结构很痛苦。
成本问题的根源在于三点,获客,场地和教师。对于在线教学,场地的问题没有了,现在大家关注最多的就是获客,那么获客的问题在我们看来原因只有两个:上游流量的集中化和服务同质化。
流量集中化这个事情比较好理解,大趋势摆在这里,所以流量成本会越来越高,我们今天看到大家的做法都是在流量端做文章,做法有几种:
第一种是没有自有流量,就是传统的靠买,新媒体矩阵也好,线下开体验店也好,都是想尝试用一些方法去抓流量,但是这种方法最好的结果是短期有效。因为本质上没解决问题,一旦你找到了一个方法,大家就会立刻蜂拥而上,那你唯一的办法就是不停的有创新,去抓一开始短暂的红利。
第二种是2B2C,先明确一点这个客是家长而不是学生,家长是一个很神奇的群体,我们把他称作没有用户画像,因为所有人都是家长,所以不存在一个聚集家长量的地方,但有一个特例是好未来的家长帮,当然这是另外一个故事,我们不展开;除非是母婴那个特殊的品类,那无非就是,一种是2B通过抓老师影响家长,还有一种是2C通过抓学生再去抓家长。
但是各自面临问题:2B的问题是说,因为走公立校,所以在做商业化的时候遇到的最大的风险是政策风险,这是一个非常难拿捏的度,如果要转化成家长付费的话,怎么过这关?当然有一些做法,大逻辑的做法就是把这个流量导成另外一个流量,脱离出来。2C的问题是孩子的需求和家长的需求是对立的。
而服务同质化,因为1对1教学发展到今天,最大的坑就在于无法做到规模化的品控,品控的核心是控制下限,你要保证输出的下限比较高。
爱分析:学吧课堂打算怎么做?
李行武:我们去年做做题产品,本源的切入点是数据;但是我们在商业化思考的时候,发现了一个附带的好处:当做题产品解决了活跃度问题之后,它成为了一种新的流量池,这个转化是比较高的,这就是我们从流量端去解决获客的一个点。那这还是偏战术层面,因为当你有了用户量,开始考虑后端上课服务的时候,会发现获客问题的本源还是在服务端。
我们在服务端的方法还是靠系统,称之为教学导航系统。具体形态比如讲义,真的是根据学生情况来出,因为流量来自我们自己的做题用户,你对他是非常熟悉的;然后在教的时候这个讲义会告诉教师具体的安排。这个东西做出来就可以做过程管控了,你可以很好的去做一些定量的评价,老师这堂课上的好还是不好,有没有按你的计划走。
无论是做出自己新的流量池,还是做好品控,都会使成本降低。成本的本源其实是你的价值到底在哪里,1对1行业在传统中是营销驱动的,而机构没有在教学本身这件事上提供价值,所以收不来这个钱。所以如果它能真的往健康的方向发展的话,一定是对教学这件事情提供了价值,比如说你让老师借助系统把课上好。
爱分析:对于教学产品的未来有哪些期待?
李行武:未来教学我们认为是两个阶段走,第一个阶段是由于整个系统的介入,使得在不降低服务质量的前提下,对服务提供者的要求极大下降,从而使服务提供者极大增加,解决供应问题。
第二阶段是让人借助系统,使生产力数量级的放大。也就是今天一个老师,如果他真的个性化的去教,只能教十几个孩子;但是未来我们希望可以做到,教师可以个性化的教几百个孩子。今天老师可以通过大课教几百个孩子,但是所有的孩子未来一定是个性化的,所以反个性化的大课会一直存在,但不会是主流。
新龙榜
新金融
企业服务
其它