
教育 Agent 的第一场考试:让大模型学会 “主动教学”。
文丨陈然
2011年,乔布斯与比尔·盖茨的最后一次会面中,两人谈及教育领域的技术革新。乔布斯直言,无论是苹果还是微软,都未能通过技术真正提升教育质量。盖茨补充道,技术需要提供个性化课程和启发性反馈,才能从根本上重塑教育。这一观点揭示了教育改造的复杂性——它高度依赖人与人之间的互动反馈,涉及知识传递、情感交流与价值观引导。单纯将教学材料数字化,虽能优化资源分配,却无法本质提升教育水平。
语言学习尤其如此。语言学家史蒂芬·克拉申在1980年代提出的“语言习得假说”中,区分了“习得(Acquisition)”与“学习(Learning)”的概念。克拉申认为,语言学习应更接近“习得”过程——通过自然、直觉甚至潜意识的方式,如同婴儿学习母语。然而,现实中的语言学习多以“学习”为主,导致学习者虽掌握语法规则和词汇,却缺乏实际运用能力。
口语能力的提升尤为依赖“习得”方式。高频即时互动是关键,脱离语言环境与互动,口语水平难以提升。这也使得口语教育成为语言学习中最薄弱的环节,“哑巴英语”现象普遍存在。
2011年,乔布斯与盖茨均未看到技术改造口语学习的清晰路径。直到大模型技术的出现,才为语言教育方式带来根本变革的可能。
口语市场的供需矛盾与大模型的突破
在大模型出现前,外教是提升口语水平的主要方式。2020年教育部数据显示,中国教育机构共有外籍教师6.71万人。在卖方市场主导下,即使通过在线平台,单次外教费用也超100元/次。按一周两次课计算,月费用超800元,远超大部分中国家庭的承受能力。据博研咨询统计,全国仅12%的家庭能负担长期一对一外教费用。
若选择班级制授课,开口次数等关键指标会显著下滑,双向互动频率降低直接影响教学效果。斑马首席产品官修佳明指出,庞大的口语学习需求与无法规模化的教学方式之间的矛盾,是导致大部分人口语水平停滞的主要原因。既缺乏足够的一对一教师,又难以承担高昂费用,供需严重失衡。
大模型技术被视为解决这一痛点的关键。它提供个性化表达与及时反馈,同时易于规模化部署。口语教学首次得以脱离真人依赖,AI口语产品应运而生。大模型作为万能语伴,支持自由讨论,甚至能输出复杂句式,更接近语言“习得”的本质。
然而,理想与现实仍有差距。克拉申的“语言输入假说”强调,输入材料需略高于学习者水平,且具有适当挑战性。大模型虽具备广博知识与智能互动能力,却缺乏对难度的考量。它更像一个全能问答机器,而非基于AI原生驱动的教学产品。工具属性强,教学属性弱,难以形成完整的学习闭环。
可以说,传统AI口语产品多为被动响应用户问题,而非主动引导学习。
用户需要怎样的口语学习AI产品?
AI正成为教育产业的重要推动力。Grand View Research报告预测,2024至2030年,全球AI教育市场规模年复合增长率将超30%。然而,教育赛道尚未出现基于大模型Agent技术的原生AI教育产品。拍照搜题类工具虽因大模型提升答案准确性,但功能单一,难以形成学习闭环,仍属传统工具的AI化升级。
修佳明认为,仅在现有工具上添加AI功能远不够。教育产品需全栈式基于AI特点,从0构建新形态。斑马口语便是其理念的产物——首个落地教育场景的“教育Agent”,能自主完成教学闭环的智能体。

斑马口语技术架构图
“自主完成”与“教学闭环”是斑马口语的核心。其三分屏设计包含AI外教Jessica(虚拟2D老师)、用户实时画面与交互式动画课件。在大模型Agent技术支持下,6-12岁儿童可全程与AI外教一对一练习。
AI外教不仅回答用户问题,更主动引导开口表达。例如,当用户谈论生日时,课件会触发烟花动效;描述人物长相时,课件会动态展示特征。强互动设计确保用户25分钟内紧密围绕教学目标参与。内测数据显示,单课开口次数超100次。
斑马口语将难度分为六个梯度,每个梯度24个单元,每单元4节课,共96节课,需一年完成。随着教学推进,系统会记住用户学习情况与兴趣,后续课程中主动互动,模拟真人教师体验。
斑马口语遵循“AI原生”原则,实现大模型主动交互、教学目标体系化与产品界面机制的协同,国内尚属首次。
与模型“搏斗”:从技术到产品的跨越
斑马口语基于猿力大模型,针对儿童语言教育场景特训微调,数据来自斑马英语教学积累的近60万节、1500万分钟真实数据。然而,专有数据与大模型能力不足以形成差异化。为打造主导型Agent产品,斑马投入200人团队,涵盖内容、产品、研发、音视频中台及数据标注与质检调优团队。
自2023年8月立项以来,斑马口语多次推迟上线。修佳明表示,团队一直在“与模型搏斗”,分为模型层与工程化实践两层面。
模型层需融合口语教学法、心理学与语言学技巧,以应对突发场景(如用户捣乱),并将课件信息、学习目标等纳入模型,使其明确教学目标。例如,如何引导用户纠正复杂句子而不打击信心?如何根据用户理解程度调整难度?模型需围绕具体场景与能力水平响应。
工程化实践则需平衡控制与灵活。大模型需严格遵循教学流程,同时保留应答灵活性。数据筛选注重与儿童心理年龄匹配,策略层通过规则设定弹性边界,允许模型在边界内自由发挥。每堂课拆分为十几个环节,通过精确到2-3分钟的环节目标设定,引导大模型Agent能力沿教学体系前进。
这种精细颗粒度使开发内容与时间成本相当,但带来强主导能力与意外火花。例如,内测阶段AI学伴在用户提及收到礼物时,脱口而出“I’m jealous.”,令小朋友开心不已。这种针对性、情绪化反应,是大模型Agent出现前难以实现的。
作为完全自主的教育Agent,斑马口语中的AI外教Jessica对孩子意味着什么?修佳明认为,无需讳言其AI属性。Jessica是有人格的AI外教,知识广博、温暖热忱,教学能力超普通外教,且记忆力极强。斑马口语从设计之初便致力于建立稳定人格特质,通过高质量互动模拟真实教学中的多维交流。
主导型Agent与教育市场的重构
口语教学市场供需失衡,主导型Agent教育产品的出现有望根本解决这一问题。斑马口语定位为首款AI外教一对一产品,价格参考同级别真人口语课程。教育领域消费者决策理性,注重产品实用性。内测反响积极,斑马内部构建“口语力”指标,从准确度、流利度、丰富度三维度量化口语提升,用户可便捷衡量进步。
修佳明认为,教育与医疗领域的AI应用需更谨慎。让大模型领悟教育实践的微妙与精密,无法一蹴而就。两年开发中,斑马团队积累了一手经验,填补了大模型与商业化产品间的空白。例如,模型无法自由发挥时,需人工完成精密教学内容衔接与难度设计。
这是一份苦活。对教育Agent产品而言,97%的可靠性不可接受,意味着100个用户中有3个可能出错。提升至99.9%的边际成本巨大,斑马为该产品研发投入超两亿元。
斑马口语的形态是否具有泛用性?主导型Agent是否适合所有人群与场景?修佳明无确定答案。AI教育产品的未来仍有诸多问题待解。但AI推动教育增长已成事实,主导型Agent产品的出现,正重构教育市场规模、前景与商业模式。至少在口语教学领域,AI外教已达真人教师水平,甚至更出色。距离ChatGPT发布仅三年,技术已进入新阶段。
题图来源:《模仿游戏》