国内首个教育大模型落地，因材施教真能成吗？|界面新闻

界面新闻记者 | 查沁君

教育公司也“卷”入了大模型浪潮中。

7月26日，网易有道（NYSE: DAO）正式对外发布国内首个教育领域垂直大模型“子曰”，并推出基于“子曰”大模型研发的六大应用——“LLM翻译”、“虚拟人口语教练”、“AI作文指导”、“语法精讲”、“AI Box”以及“文档问答”。

目前，AI Box和文档问答已经在有道翻译中上线，口语教练、作文辅导和语法精讲下月初搭载在新学习硬件上线，大模型翻译将在今年三季度上线。

大语言模型诞生于2018年，谷歌的BERT是最早模型，自去年11月ChatGPT将大模型产品化后，它开始展示巨大的革命性力量，一时间，大模型成为全新风口，国内外巨头相继涌入。

“每个月、每个星期都刷新行业对AI技术未来可能性的想象。”网易有道CEO周枫在发布会现场表示。过去半年，其团队也在持续进行产品研发和迭代，并推出一系列小规模用户实验。

在他看来，大模型给教育领域带来的最大机会，就是助力因材施教，包括以下三大关键机会：

第一，个性化分析和指导。大模型具有强大的生产能力，且能进行定制化的反馈，比如面对一道作文题，大模型在理解题目含义后，可给出写作指导，也可以对学生的写作进行个性化的反馈。

第二，引导式学习。通过不断提问，让学生培养自我学习的能力，提高批判化思维。

第三，全学科教学。通过掌握海量知识，从而实现跨学科的搜索和语言生成能力。

相比通用大模型，“子曰”大模型的定位是以“场景为先”的教育垂类大模型。作为基座模型支持诸多下游任务，向所有下游场景提供语义理解、知识表达等基础能力。

发布会现场，有道词典业务负责人与虚拟人口语教练Echo进行了对话，Echo能根据对话者的发言和对上下文的理解，及时反馈。对话结束后，Echo还会给出发音、语法等建议。

周枫在群访中坦言，对这位口语教练“寄予厚望”，毕竟其背后指向的是口语陪练这个百亿市场。该项目采取会员付费制，较真人口语教练花费更低。

AI口语陪练并非新事物，大模型出现以前，就已有大量相关产品，基于大模型的虚拟人口语陪练有何不同？

“以前AI口语陪练产品所给出的对话，是基于提前设定的模板，AI基于模板进行微调，给出对话内容。”网易有道首席科学家段亦涛在群访中解释，大模型的生成能力更强，并具有了一定的推理能力。

不仅如此，周枫还透露：“内部调研中，‘子曰’大模型的翻译能力已经优于ChatGPT、超过了市面上所有主流翻译引擎。”

但“子曰”大模型翻译目前仅支持中英文互译，尚未开发其他语种。“很重要的原因是大模型引擎的计算量大，比原有引擎贵20倍。”周枫称。

这指向了大模型背后的一个关键问题，即投入产出比和商业化。

相比接入通用大模型，自研模型在数据采集和处理、训练资源和时间、算法和模型架构、模型评估和调优上，所耗费的成本和资源是一笔不小的账单。如果不能有效完成商业化，则很难收回成本，后续的迭代、更新、升级更是难题。

恰逢近日Meta宣布将推出开源大型语言模型Llama2，免费用于研究和商业用途。这意味着，企业和个人可以在Llama2的基础上以较低的成本开发自己的专属大模型。

“这也是我们内部非常关心的问题，我们非常拥抱开源。”周枫在群访中称，“但我们做AI的重点，永远是盯着最后的应用落地。”之所以选择自研，也是因为现有模型暂时不能满足需求，尤其是像语法、答疑等深度需求。不排除“哪一天开源项目很成熟，我们也会用”。

周枫还认为，世界上大部分的大模型都将会免费，因为其边际成本非常低，复制模型其实不需要成本。商业公司会从多个角度推动大模型免费、开源，比如为了增强公司影响力、构建生态，或者纯粹为了惠及公众。

在这趟由大模型驱动的新一轮“AI技术快车”上，网易有道并非唯一的教育企业。

在国外，可汗学院、多邻国（NASDAQ:DUOL）、Chegg（NYSE:CHGG）等教育机构相继宣布推出接入GPT-4的学习辅助工具，且有一定的商业化考量。

以多邻国推出的新产品“Duolingo Max”为例，Max订阅服务收费30美元/月、168美元/年，目前仅限于iPhone平台，主要面向学习西班牙语和法语的英语用户。

在国内，和网易有道一样，好未来（NYSE： TAL）瞄准的也是垂类大模型，并利用自身基因和资源强项，研发数学大模型MathGPT，预计于年内推出基于该自研大模型的产品级应用。

周枫也提到研发数学大模型的难点所在，“数学光喂内容没用，因为它是原理问题，现有技术没法做到套一下就能使用（的地步）。”相反，如果是文字语言型的应用，不需要特别强的推理。

近日，美国研究人员评估了ChatGPT模型在不同时期版本的表现能力，发现GPT-3.5和GPT-4的某些性能正在变差，尤其是GPT-4求解数学问题的能力，GPT-4在3月表现出的97.6%准确率到6月降至2.4%。

科大讯飞（002230.SZ）也于近期对外展示其自研的“星火认知大模型”，明确将通用AI大模型的能力推向学习机、录音转写工具“讯飞听见”等产品，上线了中英文作文类人批改、数学类人互动辅学、英语类人口语陪练等功能。

6月初，作业帮也传出消息，称其研发的教育大模型在内测阶段，正在进行相关评估及备案等工作。

无论是教育垂类大模型的研发，还是通用大模型在教育领域的落地，都并非易事，不仅需要强大的技术实力，还需要雄厚的资金投入。对于尚处早期的大模型来说，跑通商业模型尚需时日，这也意味着，教育企业在相当长的一段时间内还难获得回报。