大模型进入公考行业

图片来源：图虫

大模型进入公考行业

界面新闻记者 | 查沁君

界面新闻编辑 | 文姝琪

大模型正在教育领域加速落地。

7月12日，职教巨头粉笔(02469.HK)推出公考行业内首个自研的垂直大模型，并宣布将于8月1日上线粉笔AI老师“粉笔头”。

在此之前，网易有道(NYSE:DAO)、好未来(NYSE:TAL)、作业帮、猿辅导等教企均已推出各自训练的教育大模型，并结合口语陪练、作文批改、个性化学习等场景，在学习机、词典笔等硬件中落地。

此前业内有观点认为，随着通用大模型能力的普遍增强，垂直领域的模型没有存在的必要。对此，粉笔CTO陈建华有不同的看法。

据其介绍，粉笔从2023年一季度开始探索大模型和教育的结合。他发现，某些场景里，通用大模型的表现不及预期，比如在回答行测这类客观题时，正确率非常低。在命题方面，通用大模型只能做到模仿题目的形态，在题目的难度、内容和考点设置上无法满足需求。

但通用大模型在面试点评环节这类受限的小场景下，效果非常好且可控。面试点评是学生备考的刚需，之前主要由老师人工完成，工作量大、效率低、单价高，如果借助于AI辅助老师进行面试点评，老师的点评时间可以从20分钟缩短到5分钟之内。AI面试点评的可用率也可在90%以上。

面对通用大模型和垂直大模型之间的“纷争”，好未来CTO田密也曾公开表示，现在通用大模型可以来解决很多寻常的通用问题，但在某个专项任务上只能解决到六七分的水平，如果想取得更好的结果，必须在垂直领域上做更专项的训练。

“大模型在B端（企业）内部提效方面会更容易落地。”陈建华称，例如上述提到的面试点评场景，通过大模型给出点评的内容，再由辅导老师把关，输出到学生端，可提高效率。

在他看来，对于准确性要求比较高的教育场景，C端（用户）应用的落地会面临着非常大的挑战，其中更大的挑战就是大模型的“幻觉”问题，例如在一些历史人物类的尝试问题中，可能会存在张冠李戴的效果，“这一点对教育行业来说是非常致命的”。

目前，粉笔的做法是借助于RAG(Retrieval-Augmented Generation)检索增强生成的辅助来克服幻觉，同时利用CoT（思维链）让大模型按照步骤一步步进行推理。

另一方面，采用分治法，尝试将复杂的问题拆分成足够简单的任务再让模型处理，陈建华称，效果会远远好过于直接将整个复杂的任务交给模型处理。

“每个产品都值得用大模型技术重做一遍。”陈建华认为，这里的重做不是要推倒过去已有的成果，而是要借助于大模型从效率、过程和结果上重塑整个流程，以提供更多可能性。

在应用场景上，粉笔AI老师已覆盖学员的入班测试、理论学习、强化练习、模拟套卷，直到最后的冲刺阶段。陈建华预计今年将上线申论AI老师。此外，面试AI老师、事业单位和教师项目的AI老师也在筹备中。

粉笔副总裁刘帅表示，粉笔AI老师将是未来粉笔主流的更高端的产品之一。

越来越多的AI老师上线，真人老师会失业吗？

当日发布会上，粉笔创始人、CEO张小龙对此予以否定，技术进步并不意味着就能取代行业人士，学习的过程不仅仅是知识学习，与此同时还伴随着老师提供的情绪价值。相反，技术解放了人之后，身体会变得越来越强，人也会变得越来越有智慧，更有趣、更有意识。

张小龙还表示，粉笔AI老师作为一款C端的AI产品，是“收费”且“收得起费”的。他同时呼吁：“中国科技领域的朋友们，不要都盯着通用大模型，可以多一些针对具体领域的具体服务，早日实现商业化。”