有了大模型,因材施教不是梦。
作者|刘杨楠
编辑|栗子
4月12日,蚂蚁云科技集团发布了首款垂直行业大模型产品——以正教育大模型。
以正大模型通过深度定制的海量教育数据,精准理解并高效应用教学内容,为学生、教师及家长提供高度智能化、个性化的教育资源与服务。
会上,蚂蚁云科技集团也与南威软件集团拟定战略投资意向协议。并且,集团在一季度基本完成Pre-A轮融资,即将开启A轮融资。
蚂蚁云科技集团成立于2019年,是一家专注AI大模型研发、上下游应用开发及产业生态拓展的人工智能公司。目前,公司团队已有170余人,研发人员占比超70%。
2023年9月,蚂蚁云科技迎来了一位新的CEO——蒋俊。蒋俊已经在AI行业深耕10年有余,亲历了上一波AI浪潮在安防领域的爆发与消亡。
站在大模型时代的起点,这位年轻的“AI老兵”重新All in AI。在蒋俊的带领下,蚂蚁云科技集团成立了上海大模型研究院和杭州数字人实验室,并于11月正式投入大模型研发。
仅半年过后,蚂蚁云科技便交出了首份成绩单。本文,「甲子光年」深度对话蚂蚁云科技集团CEO蒋俊、CTO谢恽,试图回答两个问题:
蚂蚁云科技为何将“教育”作为大模型首个落地场景?
“以正教育大模型”如何实现真正的“因材施教”?
1.有了大模型,因材施教不是梦
自2012年起,智慧教育概念就开始在教育市场崭露头角,并迅速发展成为教育信息化的重要组成部分。
然而,智慧教育发展了多年,却始终没有解决教育界的“老大难”问题——因材施教。多年来,有关因材施教的问题不断被讨论,但从未被解决。
最理想的“因材施教”,就是学校为每一位学生配一位老师,老师针对学生的学习水平和日常学习习惯定制一套专有的学习计划。放学时间,老师还要与家长协同,督促学生按计划认真学习——很显然,这会让教育成为一个“劳动密集型”产业,人力成本将直线上升。
大模型的出现,则让智慧教育有了全新的可能。
大模型最强大的能力,是能够将海量世界知识压缩至模型中,并在模型消化吸收后,再次根据用户需要提取出来。而教育是最直接的“知识聚集地”。
“教育就是一个创造、解释、获取知识的行业,因此我们认为大模型时代,最有可能被首先变革的行业就是教育。”蚂蚁云科技集团CEO蒋俊在会上分享道。
蚂蚁云科技集团CEO蒋俊
近期,国家层面也针对大模型时代的智慧教育指出了方向。3月28日,教育部发布了4项行动,旨在通过人工智能赋能教育,包括上线“AI学习”专栏、推动国家智慧教育公共服务平台智能升级等措施,以支持全民个性化终身学习。
此时回看蚂蚁云科技的大模型布局,颇有趋势预见性。
2023年11月,蚂蚁云科技上海AI大模型研究院落地徐汇。蚂蚁云科技上海AI大模型研究院主要基于市面上的开源大模型开发,以业务需求为向导,通过创新和研发,为各行各业提供专业的行业大模型,而对基础大模型的开发只是使用开源或对接已有大模型。
在蒋俊规划下,蚂蚁云科技集团形成“一个平台和两个中心”——平台是指承接建设和运营的AI算力平台项目,而两个中心包括数据标注中心和模型开发中心。
2023年12月,蒋俊曾在接受「甲子光年」采访时表示:“教育、民政等行业是最有可能诞生颠覆性应用的,因此蚂蚁云科技会对上述领域进行独立的AI大模型、应用等开发。对其他行业会的业务铺展将与业内头部玩家共同完成。”
今天,不到半年时间,蚂蚁云科技便在教育行业交出了第一份答卷。
蚂蚁云科技探索了一条双轮驱动的路径——以大模型能力为核心驱动,结合本地教育大数据作为支撑,打造出能真正实现因材施教的以正教育大模型。
那么,以正大模型究竟如何实现“因材施教”呢?
2.从场景中来,到场景中去
以正教育大模型的技术架构可大致分为三层——
模型底座接入了国内外多个基础模型构成,Stable Diffusion、GPT系列、LLaMA系列、PaLM-E、RT-2、通义千问、文心一言等模型均在其中;模型底座之上,构建了千万级数字人平台及系列垂直行业大模型;大模型之上,又增加了规划、记忆、工具调用等能力,以Agent的形态,落地各行各业。
搭建完善的技术架构只是万里长征的第一步,都要围绕着一个核心要义,即如何让这套技术真正解决各个场景的实际问题。
蚂蚁云科技集团CTO谢恽
蚂蚁云科技集团CTO谢恽介绍道:“现实场景中,每一位教师、学生、家长都有各自独特的能力,如果在一个Agent上实现所有能力,Agent的架构将会极其复杂。”
为保证工作效率,蚂蚁云针对真实的学校场景进行分工,推出多种Agent角色。
其中,助教Agent能够实现一对一讲评,成为教师的得力助手;教案Agent能够生成高质量精品教案;学伴Agent则是学生的学习伴侣,随时提供学习辅导,并为学生制定个性化教学方案。
在实际场景中,以正大模型Agent大多采用“群体作战”模式。在Agent社区中,不同角色的Agent可以主动与彼此交互、协同,帮人类用户完成任务。
例如,教师将某个学习任务输入助教Agent后,助教Agent能够主动将任务分发至各位同学的学伴Agent,学伴Agent会主动根据学生的学习习惯制定个性化学习计划,并主动跟踪学生的学习进度和质量,还能将情况即使反馈至助教Agent。
Agent社区形成后,接下来,便是解决Agent落地“最后一米”的问题——如何设计人与Agent的交互形式。
大模型最惊艳之处,就是能和人类用自然语言进行多轮对话。也正因这个特性,让一众大模型公司自然而然地选择对话机器人作为产品形态。甚至一度有观点认为,未来对话会完全取代图形界面。
以正教育大模型研发初期,蚂蚁云团队内部曾对最终的交互形态有过一段“拉扯”——一派认为大模型驱动Agent,对话将会成为主要交互形式;另一派认为,日常工作中,并非所有人机交互都要通过对话进行,传统软件的UI界面反而更便于操作。
到底谁对谁错?
事实上,现实世界并不是非黑即白。蚂蚁云科技在很多教育场景中,自然语言交互并非最佳方式。例如老师制定教育计划或学生提交作业经常会涉及到四五千字的长文本,这么长的内容放在一个对话流中阅读,非常影响使用体验。“现实工作场景中,用户很多时候都需要一个能高效操作的工具,并不是每次人机交互都需要输入一段文字或说一段话。”谢恽解释道。
因此,团队最终摸索出集两种交互方式优点于一体的产品形态——用“白板”代替简单的对话流,支持自然语言驱动的交互方式,并提供内容展示、阅览、回顾等功能,比传统软件交互更简单,但比对话交互更丰富,可深入学校各个业务场景。
以正大模型教师端产品演示
以正大模型学生端产品演示
同时,大模型的“幻觉”问题很可能导致Agent“教错”学生,蚂蚁云也采用了一系列方法来解决该问题。例如通过模型融合提高模型自身准确性;引入“反思”“自评估”等思维工程方法,或者直接外挂RAG知识库、知识图谱等工具对模型加以“约束”。
目前,以正教育大模型已经开始在多地政府及学校落地,以私有化部署为主。“并不是我们不能做公有云,根本原因是每个地区、每个学校的教学特色各有不同,很难用一个云平台大范围解决所有问题。”谢恽表示。
在交付方式上,区域级与校级也略有不同。
区域级项目体量较大,多模型基座与Agent整体交付,并根据区域内各个学校的需求部署Agents,Agent单价约数千元,项目整体客单价约在千万级;校级项目体量较小,优先部署参数规模较小的模型,结合学校的教育数据部署Agent,客单价约在百万级,部署周期约2个月左右。
同时,蚂蚁云科技也在不断夯实产品力。谢恽给「甲子光年」举了一个很生动的例子,在以正大模型Agent内测时,推出了一项“Agent辅助批改作文”的功能,直接把家长从“给孩子改作文”的繁重任务中解放出来,当场就有家长表示愿意买单。
3.让每个孩子都有自己的老师
教育行业是一项长坡厚雪的事业。中研普华数据预测2024年中国AI教育市场规模将突破7993亿元,有巨大的商业想象力。
教育行业和民生强烈交织的特殊性,也注定身处这一赛道的玩家必须要肩负起一家企业之外的使命。
古语有云:“蒙以养正,圣功也。”这是以正大模型名字的由来,也是蚂蚁云科技集团布局教育赛道的初心。“科技真正的力量,是让每个人都平等。只有做到这一步,才能真正地成就伟大。”蒋俊表示。
蚂蚁云科技也正在用实际行动践行这句话。除商业合作外,蚂蚁云科技会将以正教育大模型带到教育资源匮乏的地区,只需配备一台电脑,就能让当地的孩子们享受到和教育发达地区同等水平的教育。
此外,蒋俊向「甲子光年」透露,公司正在规划推出新一代学习机。“Agent出现后,硬件载体的形象可能会突破传统的设计思维。下一代学习机形态会更加强调‘陪伴’,不只是催促学生学习或辅导功课,更会成为孩子们的朋友,激发学生学习兴趣。最理想的状态是,每个孩子都能有自己的老师。”
以正教育大模型的发布无疑是蚂蚁云科技在大模型市场的一大里程碑,公司将进入全新的快速发展期。
事实上,自2019年成立以来,蚂蚁云科技便一直保持紧凑的发展节奏,在上海、西安、杭州、东莞等地成立了AI大模型研究院、AI应用研究院、AI数字人研究院、算力中心等。
本次活动,蚂蚁云科技集团也与南威软件集团拟定战略投资意向协议。并且,集团在一季度基本完成Pre-A轮融资,即将开启A轮融资。
“大模型竞争愈演愈烈,未来需要持续投入大量算力、人才,资金消耗会越来越大,这笔融资会为公司发展带来强大助力;更重要的是,蚂蚁云与南威软件集团能在业务上形成互补。”蒋俊表示。
未来,蚂蚁云科技的Agent系统也将在民政、新零售、养老、医疗等领域陆续落地相关应用。
(封面图来源:蚂蚁云科技集团)