
教育Agent的第一场考试:让大模型学会“主动教学”
文丨陈然
2011年,乔布斯与比尔·盖茨的最后一次会面中,两人曾探讨过技术对教育的革新潜力。乔布斯直言,无论是苹果还是微软,都未能真正通过技术提升教育水平。盖茨则指出,技术需要提供个性化课程和启发性反馈,才能从根本上重塑教育格局。这种观点至今仍具现实意义:尽管技术已重塑法律和医学领域的学习方式,但教育领域却始终未能充分受益。
教育的复杂性在于其高度依赖人际互动反馈。教学过程不仅是知识传递,更涉及情感与价值观的多层次交流。单纯将教学材料数字化,或从传统纸笔转向平板电脑,虽能优化资源分配,却无法本质提升教育质量。这一困境在语言学习中尤为突出。
语言学家史蒂芬·克拉申在1980年代提出的语言习得理论中,明确区分了“习得”与“学习”两个概念。克拉申认为,语言学习应遵循“习得”路径——通过自然、直觉乃至潜意识的方式接近语言本质,正如婴儿学习母语的过程。然而现实是,多数人仍停留在“学习”层面,导致语法知识丰富却缺乏实际运用能力。
听、读、写能力可通过反复练习提升,但口语能力的突破必须依赖“习得”模式:唯有高频即时互动才能逐步提升口语水平。脱离语言环境与互动场景,口语教育便成为语言学习中最薄弱的环节,“哑巴英语”现象由此产生。
2011年,乔布斯与盖茨均未看到技术改造语言学习的清晰路径。直到人工智能浪潮席卷而来,大模型技术才为语言教育带来根本性变革的可能。
供需失衡的口语市场:大模型的破局契机
在大模型出现前,外教教学是提升口语水平的主要方式。2020年教育部数据显示,中国教育机构共有外籍教师6.71万人。在卖方市场主导下,即使通过在线平台,单次外教费用仍超100元/次。按每周两次课计算,月费用超800元——这远超多数中国家庭的承受能力。博研咨询统计显示,全国仅12%的家庭能负担长期一对一外教费用。
若选择班级制授课,开口次数等关键指标会显著下滑,双向互动频率降低直接影响教学效果。斑马首席产品官修佳明指出,庞大的口语学习需求与无法规模化的教学方式之间的矛盾,正是导致多数人口语水平停滞的主因。既缺乏足够教师提供一对一教学,又无足够家庭支付高昂费用,供需错配问题亟待解决。
大模型技术的出现为这一痛点提供了解决方案。其个性化表达与即时反馈能力,结合规模化部署优势,使口语教学首次摆脱对真人的依赖。市场对AI的乐观预期也源于此:口语教育终于迎来技术驱动的新可能。
各类AI口语产品应运而生。大模型被视为万能语伴,用户可自由讨论,甚至掌握复杂长难句式。从语言教育角度看,这更接近“习得”本质。然而,这些产品仍非理想解决方案。
克拉申的语言输入假说强调,输入(听、读)比输出(说、写)更重要。只有积累足够语料,输出才能有的放矢。输入材料需略高于学习者水平,同时保持适当挑战性。这种渐进式输入决定输出水平。然而,现有大模型虽具备广博知识与智能互动能力,却缺乏对难度的动态考量。其本质仍是全能问答机器,既无教学目标设定,也未构建教学闭环,更像传统教学工具的AI升级版,而非原生驱动的教学产品。
工具的被动响应模式与用户对主动学习的需求形成鲜明对比。用户究竟需要怎样的口语学习AI产品?
用户需求驱动:AI教育产品的进化方向
AI正成为教育产业发展的重要引擎。Grand View Research报告预测,2024至2030年,全球AI教育市场规模年复合增长率将超30%。然而,教育赛道尚未出现基于大模型Agent技术的原生AI教育产品。拍照搜题类工具虽因大模型提升答案准确性,但功能单一,难以形成学习闭环,仍属传统工具的AI优化版。
这揭示了大模型Agent技术落地的核心问题:用户已厌倦同质化AI工具,独特体验成为商业前景的关键。修佳明认为,仅在现有工具上添加AI功能远不够。斑马需构建全栈式AI原生产品,而非单点能力升级。
斑马口语的推出,正是这一理念的实践。修佳明称其为“首个落地教育场景的教育Agent”。与传统AI口语产品不同,教育Agent是“能自主完成教学闭环的智能体”。

斑马口语技术架构图
“自主完成”与“教学闭环”两大关键词,对应大模型的主动交互能力与“教学-练习-测试-反馈”全链条。斑马口语采用三分屏设计:左侧为AI外教Jessica(2D虚拟教师形象),右侧显示用户实时画面,中央为交互式动画课件。
在大模型Agent技术支持下,这款针对6-12岁儿童的口语学习产品,实现全程AI外教一对一教学(每节课25分钟)。AI外教不仅回答用户问题,更运用儿童心理学知识引导完整表达。交互式课件预埋彩蛋动效,如用户谈论生日时,屏幕会随机绽放烟花。当Jessica引导孩子描述人物长相时,课件会根据回答动态调整内容。
强互动设计贯穿课程始终。斑马内测数据显示,用户单节课开口次数超100次。产品按英语水平划分六个难度梯度,每个梯度24个单元,每单元4节课,完成全部96节课需一年。随着教学推进,斑马口语会记忆用户学习情况与兴趣爱好,并在后续课程中主动互动,模拟真人教师体验。
斑马口语遵循“AI原生”原则,实现大模型主动交互、教学目标体系化与产品界面机制的全面协同。修佳明称,这在国内尚属首次。
技术攻坚:与模型的“搏斗”历程
作为自主教学教育Agent,斑马口语基于猿力大模型,并针对儿童语言教育场景特训微调。其数据来自斑马英语教学积累的近60万节、1500万分钟真实课程。然而,专有数据与大模型能力仅是基础。为打造差异化产品,斑马投入200人团队,历时两年多开发,涵盖内容设计、产品研发、音视频中台及数据标注等多个部门。
自2023年8月立项以来,斑马口语多次推迟上线。修佳明坦言,团队一直在“与模型搏斗”。搏斗分两层:
首先是模型层。自研大模型需融合多种口语教学法、心理学与语言学技巧,以应对突发场景(如儿童捣乱)。同时,将课件信息、学习目标、评价标准纳入模型,使其明确教学目标。如何在纠正用户错误时不打击信心?如何根据理解程度调整训练难度?模型需围绕用户场景与能力水平动态响应。
其次是工程化实践。开发原生主导型教育Agent需平衡控制与灵活:既要确保模型遵循教学流程,又要保留应答灵活性。数据筛选注重与儿童心理年龄匹配,策略层通过规则设定弹性边界,允许模型在边界内自由发挥。斑马将每堂课拆分为十几个环节,通过精确到2-3分钟的环节目标设定,引导模型能力沿教学体系发展。
这种精细颗粒度使开发内容与时间成本几乎持平,但换来的是模型极强的主导能力。修佳明举例,内测阶段AI学伴在用户提及收到礼物时,脱口而出“I’m jealous.”,这种针对性、情绪化的意外反应,正是大模型Agent的独特价值。
这种独特性也引发新问题:AI外教Jessica对儿童意味着什么?修佳明认为,无需隐瞒Jessica的AI属性。她知识广博、温暖热忱,具备超越普通外教的教学能力与记忆力。斑马口语从设计之初就为Jessica建立稳定人格特质,通过高质量互动模拟真实教学中的多维交流,涵盖知识、情感与价值观。
市场重构:主导型Agent的教育革命
口语教学市场长期存在供需失衡,主导型Agent产品的出现有望根本解决这一问题。斑马口语定位为首个AI外教一对一产品,价格参考同级别真人口语课程。教育领域消费者决策逻辑朴素:产品是否有效?内测反馈显示,斑马口语通过“口语力”指标(准确度、流利度、丰富度)量化提升效果,用户可直观衡量进步。
教育和医疗领域的AI应用需谨慎。修佳明认为,教育涉及“人命关天”的微妙与精密,大模型需长期实践才能领悟。斑马产研团队两年多开发中积累的一手经验,填补了大模型与商业化产品间的空白。“尤其在儿童英语领域,模型无法自由发挥的部分,需依赖精密的教学内容衔接与难度设计。”
这是一份苦活。对教育Agent产品而言,97%的可靠性不可接受——这意味着100个用户中有3人会受影响。提升至99.9%的边际成本巨大,斑马为这款产品研发投入超两亿元。
斑马口语的形态是否具有泛用性?主导型Agent是否适合所有人群与场景?修佳明暂无确定答案。AI推动教育增长已成事实,但随着主导型Agent产品出现,教育市场规模、前景与商业模式面临重构。至少在口语教学领域,AI外教已达真人教师水平,甚至更出色。距离ChatGPT发布仅三年,技术已进入新阶段。
题图来源:《模仿游戏》