您的位置: 学院首页 >> 信息资讯 >> 正文
吴飞:从人工智能教育迈向人工智能通识教育——行动与思考
发布时间:2025-05-28   点击数:

本文根据浙江大学计算机学院吴飞教授在2025年教科版高中信息技术教材全国培训会上的发言整理、补充而成。


   2025年4月10日,由中国教育科学研究院培训中心主办、教育科学出版社承办、苏州市教育科学研究院协办的教科版高中信息技术教材全国培训会于苏州召开。会上,浙江大学求是特聘教授、博士生导师、本科生院院长、人工智能研究所所长吴飞教授,以“人工智能通识教育的思考与实践”为题做了精彩的报告。该报告围绕“人工智能通识教育的思考与实践”展开,从人工智能与教育的起源切入,探讨生成式人工智能带来的挑战,详细介绍浙江大学在人工智能通识教育方面的经验与做法,旨在为人工智能教育的发展提供参考与借鉴。



一、人工智能与教育的原点

图片





(一)人工智能的起点:达特茅斯夏季研讨会


1955年8月31日,麦卡锡、明斯基、香农和罗切斯特四位学者向美国洛克菲勒基金会递交了关于举办达特茅斯人工智能夏季研讨会的建议书,人工智能(Artificial Intelligence)这一术语在这份项目建议书中首次被提出,标志着人工智能开始登上人类历史舞台。

四位学者不愿使用当时流行的术语“控制论”(cybernetics),而是创造了一个新词:artificial(人工的)+intelligence(智能)——人工智能。他们在建议书的首页写道:“我们有一个基本的猜想,学习的所有特点以及大多数智能,原则上都可以被精确描述,从而用一台机器来模拟。”换句话说,人工智能就是人造智能。如果希望用机器来模拟人类的智能活动,那首先要能够清晰描述这些活动的过程与机制,否则,我们自己都说不清楚,又如何让机器学会?这就像诺贝尔物理学奖获得者费曼所说的:“What I cannot create, I cannot understand.”(不可造也,未能知也。)

最终,洛克菲勒基金会批准了7500美元。借助这7500美元,1956年6月18日至8月17日,40位科学家齐聚达特茅斯学院,围绕“自动计算机”“使用语言对计算机进行编程”“神经网络”“计算复杂度”“算法自我改进能力”“算法抽象能力”“算法随机性和创造力”七个议题开展了为期8周的研讨。因此我们说,人工智能的原点,就是达特茅斯夏季研讨会所吹响的号角,从此人类历史中有了人工智能这一研究方向。

我后来在写一本书时,想搞清楚究竟有哪些人在1956年那个夏天来到了达特茅斯学院。因为那是一个开放式会议,有的人只来了半天,有的人甚至根本没来。通过查阅资料,最终找到了40多位参与者,并整理了他们的姓名与研究方向,列成一张表。当我完成这张表的时候,我特别感动,我联想起隐蔽战线有一句话:你们的名字从未被人知晓,你们的功绩将永世长存。但是,把参加达特茅斯人工智能暑期夏季研讨会人员名单写出来,就可以欣慰而言:你们的名字已被世人知晓,你们的功绩将永世长存!

今年2月18日,我去宁波市镇海中学做报告。镇海中学吴国平校长带我参观了校史馆中的“朱枫烈士纪念馆”。吴校长说,朱枫烈士是镇海中学优秀校友,也是全国为数不多被党中央和国务院公开披露的隐蔽战线英雄之一。她在一九四九年后深入台湾,后被叛徒出卖,在舟山被捕并英勇就义,年仅45岁。那一刻我特别感慨,我说,今天我要给镇海中学的学生讲人工智能,我的PPT中正好有一页写着“你们的名字已被知晓,你们的功绩将永世长存”。在讲人工智能的历史时,要铭记漫漫历史中这些光辉人物,找到学科的原点,不忘初心,砥砺前行。




(二)人工智能发展历程:两落三起


人工智能从1956年正式登上人类历史舞台,到现在不到70年。在这段时间里,它经历了“两落三起”的过程。每当人工智能试图去解决真实问题时,就会迅速坠入低谷;而当它带来技术突破,展现希望的时候,它又会重新崛起。我们很幸运,正处于人工智能第三次崛起的绝佳时刻,我国政府将其命名为“新一代人工智能”。

浙江大学潘云鹤院士在2005年为中国工程院主办的期刊Engineering创刊号撰写了一篇中英文文章,标题是《人工智能走向2.0》。该文明确指出:信息环境已经发生了巨大变化,人类进入了万物互联的时代,人工智能的需求层出不穷,从人工智能迈向人工智能+。更为重要的是,人工智能目标和理念也发生了变化。过去对人工智能研究结果的希望是有头有脑、有手有脚、有眼有耳的实体,才算是人工智能。但是今天生活中完成语音识别、图像理解、导航推荐、商品推送等的算法、系统和工具等,只要能够帮助人类完成原本需要人类完成的任务,它就是人工智能。这也标志着人工智能的理念发生了变化,即从“造人”转向“赋能”,只要技术能够代替人类完成原本需要人类才能完成的任务,那就是人工智能。

潘云鹤院士在文章中指出:随着互联网的普及、传感器的泛在、大数据的涌现、电子商务的发展、信息社区的兴起,数据和知识在人类社会、物理世界和信息空间之间的交叉融合与相互作用,人工智能发展所处信息环境和数据基础已经发生了巨大而深刻的变化,这些变化形成了驱动人工智能走向新阶段的外在动力。




(三)《新一代人工智能发展规划》的出台

为了构筑我国人工智能的先发优势,中国工程院于2015年12月批准启动了由潘云鹤院士负责的“中国人工智能2.0发展战略研究”重大咨询研究项目,旨在研究人工智能作用于我国创新发展的意义,并探索相关发展途径。该项目先后聘请第十届全国政协副主席、中国工程院原院长徐匡迪院士,中国工程院原院长周济院士,以及时任科技部党组书记、副部长王志刚和中国工程院副院长陈左宁院士担任项目顾问。

2016年5月,项目组给党中央上报《建议我国启动“中国人工智能2.0”重大科技计划》报告。报告受到了习近平总书记等中央领导同志高度重视。科技部和中国工程院贯彻落实党中央、国务院的系列指示,组织项目组开展研究,完成了《新一代人工智能规划建议研究报告》的编制工作。

2017年7月,国务院印发《新一代人工智能发展规划》,这是我国发布的首个国家人工智能发展战略规划,提出了面向2030年我国新一代人工智能发展的指导思想、战略目标、重点任务和保障措施,同时指出大数据智能、跨媒体智能、群体智能、人机混合增强智能以及智能自主系统将作为人工智能的五种新技术形态。



(四)教育的原点

那教育又是什么时候出来的呢?说完人工智能的发展,再回过头来谈谈“教育”的原点。

有一次某出版社找我约稿:“吴老师,你能不能写一篇关于‘人工智能赋能教育’的文章?”我当时有些迟疑,因为我是研究计算机出身的,对于人工智能和计算机的起点能说清楚,但是在没有弄清楚教育原点之前,还真不敢越界撰写有关教育的文章。后来我查阅了大量资料,读到了培根于1605年出版的《学术的进展》这本书,给我很大启发。培根在这本书中雄心勃勃地绘制了“人类知识全貌”(The General Distribution of Human Knowledge)树状图,尝试对其所处时代人类知识进行分类和规范化,其根据记忆、想象、理性三种人类能力将人类总体知识划分为历史、诗歌和哲学三个不同领域,其中历史学被归属于记忆范畴、诗和艺术被归属为想象范畴、哲学则被归属为理性范畴。

培根对人类知识的分类成为近代科学分类的先导。在其给出的这一人类知识体系图中,哲学包括了自然神学、自然哲学和人类哲学三个大类。其中,在人类哲学这一类别中,第一次出现了阅读校勘(The Art of Criticism)和学校学习(School of Learning)两个领域,用来表示教育中传播和学习人类文明成果的两种不同手段。从此,教育从哲学知识体系中分解出来,成为一门专门的科学。更为重要的是,与当时诡辩哲学所采用的从理论到理论的演绎推理研究方法不同,培根开创性地提出了归纳推理的研究方法,即从观察和实验的事实出发,通过排斥法来发现各种现象之间的关系。这一“经验的实验化”研究方法被马克思所认同,认为它是“英国唯物主义和整个现代实验科学的真正始祖。

很多学者认为,“学校学习”和“阅读校勘”这两个分支标志着“教育”第一次作为一个独立的研究领域出现在人类历史的舞台上。

实际上,仔细思考,教育教学工作不正是主要通过这两种手段么?学生在学校中通过“学校学习”继承人类已有的知识,掌握后再通过“阅读校勘”对知识进行质疑、重组和创造,从而推动人类知识总量的增长。

在培根将教育从哲学中独立出来且提出了以“理性和实验”为核心的现代科学思想后,人们就开始思考是否可以从实验观察中发现提升教育效果的普遍化规律,进而用计算手段来模拟这些规律,从而使任何地方、任何民族和任何国家所取得的任何新的知识和智能,都可以很快被大多数人所认知,以便更加有效地传承人类创造的积累知识与精神财富。

遗憾的是,这个时期的教育虽然成为科学的一个分类,但人们还是仅仅将其视为知识传递的方式,缺乏发现教育中普遍规律的研究方法,遑论寻求合适的计算手段来模拟这些规律。19世纪末,人们开始意识到教育中存在普遍规律,进而对普遍规律研究加以重视。1891年,哈佛大学哲学家Royce在《教育评论》(Educational Review)创刊号上发表了名为《教育是一门科学吗?》(Is there a science of education)的文章,指出教育作为一门科学,应该研究普遍有效(universally valid)的规律,因为科学本身所探讨的是普遍规律。简言之,教育远非最终和完全地告诉教师人性是什么、必须是什么以及如何处理它,其更应该研究井然有序的秩序和性格形成的一般规则。显然,教育要成为一门科学,就需要研究教育过程中(如学习、评测等)存在的普遍客观规律。但是,由于缺乏刻画这些客观规律的数据,因此即使人们已经认识到教育是一门科学,仍然很难通过计算手段对其开展相应研究。

总之,教育本身是自然科学和社会科学相互融合的一门科学,不能把它看作单纯的社会科学或自然科学,它一定具有很强的自然属性,又有很强的社会属性。



(五)人工智能相关专业与学科发展

人工智能在这几年的发展非常迅猛。2018年,全国35所高校开设了首批人工智能本科专业。截至2024年4月,已经有535所高校设立了该专业。2019年,浙江大学设置了全国第一个人工智能交叉学科,如今已有21所高校将人工智能列为独立学科。

2022年,教育部发布新的学科目录,在原有13个学科门类的基础上,新增了第14个门类“交叉学科门类”,包括集成电路科学与工程、国家安全学、设计学、遥感科学与技术、智能科学与技术、 区域国别学等交叉学科。以前我们的学科都是一个一个独立的学科,学科之间老死不相往来,大家都画地为牢。现在第14个学科出来,学科名称就叫作交叉学科,但它不是一个学科,而是若干学科的汇聚。著名物理学家、量子力学创始人普朗克曾说:“科学是内在的整体,被分解为单独的单元,不是取决于事物的本身,而是取决于人类认识能力的局限性。实际上存在着由物理学到化学、通过生物学和人类学到社会科学的链条,这是一个任何一处都不能被打断的链条。”

类似于电力等通用目的技术,人工智能具备“至小有内,至大无外”的与各种学科交叉的潜力,无论是从人工智能角度解决科学挑战和工程难题(AI for Science,如利用人工智能预测蛋白质序列的三维空间结构),还是从科学的角度优化人工智能(Science for AI,如从统计物理规律角度优化神经网络模型),未来的重大突破将越来越多地源自这种交叉领域的工作。

当前人工智能正在改变以数据观测为核心的实验科学和以发现物理世界基本原理为核心的理论科学,人工智能参与到基础学科和工程技术的生成假设、设计实验、计算结果、解释机理过程中,重新定义对科学和工程等领域中规律的探索手段,以计算方式合理应用科学定律来系统化地解决现实中的复杂问题,犹如“水与电”一样让万千普通人用它创造出善意涟漪,迸发新意迭出和价值分享的知识力量。



(六)计算机“101计划”与《人工智能引论》教材建设

2021年末,教育部在北京大学启动实施了计算机领域本科教育教学改革试点工作计划,这项由图灵奖得主约翰·霍普克罗夫特(John Hopcroft)教授提议、教育部部长统筹部署、高教司牵头的重要教改工作,称为“101计划”。“101计划”分为两个阶段:第一阶段是以33所计算机类基础学科拔尖学生培养基地建设高校为主进行试点,其目标是用两年时间推出一批计算机领域的名课、名师、名教材;第二阶段希望在全国高校中分类分步进行推广,并期望对其他学科专业起到标杆作用。这个计划为什么叫101?它有三层含义,第一是计算机领域所有的信息编码都是以 0和1 编码组成;第二是在计算机本科专业中,所有必修课程编码是以 1 打头,101 是必修课程里面第一门课程,显示了它的重中之重;第三,101是由0和1可以组成的最小的素数(即素数5)。素数是广袤无垠数学宇宙中的瑰宝,是数学的心跳。“道生一、一生二、二生三、三生万物”,“101”计划就如数学中的素数一样,是计算机本科专业最基础的工作,因此“101计划”被定义为中国学科建设和教育改革的一项品牌工程。

教育部全国高校计算机类专业教学指导委员会(简称计算机教指委)从学科特性出发,精选了12门核心课程,作为“101计划”建设的核心课程。我本人很荣幸,负责了“人工智能引论”这门课程,与其他建设核心课程的老师一样,我们的想法是打造一门具有中国特色、世界一流、101风格的计算机类基础课程。

那么如何推进“101计划”核心课程建设呢?2022年春节一过,北京大学计算机学院郭耀教授(计算机“101计划”工作组秘书长)召集12门核心课程负责人开会,希望每门核心课程按照约翰·霍普克罗夫特先生的要求,首先要构建完成课程知识点。大家对这一要求十分困惑,不知道为什么要制定课程知识点以及如何定义知识点。

后来我读到加泰罗尼亚(现西班牙境内)诗人、哲学家、逻辑学家雷蒙·卢尔(Ramon Llull)的一篇文章,对这一问题开始有了深刻理解。卢尔认为认知是人类智能的重要表现,其基石和燃料是规范化的知识(如概念、属性和关系等),基于规范化知识就可形成对学习对象的理解和分类。为此,卢尔提出了对知识进行规范化描述的“知识树(tree of knowledge)或科学树(tree of science)”的概念,这是目前最早的一种知识规范化努力。卢尔所提出的知识树由十六部分或十六棵树组成。前十四棵树分别表示现实世界中某一类别所包含的不同层次知识概念,如原子类、植物类、动物类、感性类、人类、道德类、神类等。另外两棵树分别是示例树(examples)和问题树(questions)。卢尔认为可以从前十四棵树中获取概念,然后找到概念对应的示例(即概念的具体描述),接着形成问题以进一步推知现实世界中未知的性质。于是,人类的知识总量慢慢被延伸、扩展和扩充。

看完这篇文章之后,我豁然开朗:“人工智能引论”核心课程不就是形成一棵知识树么?为了更好地理解人工智能所蕴含的磅礴知识体系,按照人工智能具有“至小有内”内涵和“至大无外”外延的双重特点,依据“厚算法基础、养伦理意识、匠工具平台、促赋能应用”的培养目标,《人工智能引论》教材以知识点为主线来介绍人工智能,让学习者掌握知识表达与推理、搜索探寻与问题求解、统计机器学习、神经网络与深度学习、强化学习、人工智能博弈等基本算法,树立人工智能伦理与安全意识,理解保障人工智能安全、可信和公平的技术方法,会应用人工智能工具、芯片和平台等手段,搭建具体场景所需人工智能架构与系统,完成自然语言中机器翻译、视觉理解中图像分类、机器人中行为控制、大语言模型、跨媒体智能以及科学计算等应用案例,以在人工智能知识学习中形成如莱布尼茨所言的“人类思想字母表(alphabet of human thought)” 。

于是,《人工智能引论》设计了包含63个知识点的人工智能知识图谱,在知识点之间建立循序渐进的关系,比如在讲解算法内容时,应该让同学们知道从逻辑推理到问题求解、从策略搜索到数据建模、从浅层学习到深度学习、从单次式标注到序贯式奖励、从最优解到均衡解等序贯关系······让同学们知道学习完这个算法还要学习另外一个,它们之间有天然的逻辑迭代和递进关系。

这本教材中每一章由三部分构成,第一部分用一句话把这一章的内容进行整体凝练。比如第一章“绪论”用了德国数学家希尔伯特的墓志铭 “我们必须知道,我们必将知道”,是想让学生们在了解人工智能源头及其历史发展的同时,面对人工智能现在带给我们的诸如不可解释性等诸多困惑时,一定要坚信我们必将知道。第二部分是每一章的主体内容。第三部分是每一章的“延伸阅读”内容,该部分内容从历史、当下和未来等不同角度对本章内容进行解读,包括当前是从过去拔萃出来的投影、推理即计算、突破组合爆炸之难与陷入地平线问题之困、“二战”中德军每个月生产多少坦克、爬上树梢与攀登月球、最优化之策与试错术之间的姻缘结合、规避随机性与命运——骰子占卜到算法博弈、人有人的用处、咸与维新——计算机体系架构的黄金时代、人工智能效应之奇怪悖论等。

浙江大学在试点教学这本教材的过程中录制了2000多分钟的视频,将这些视频截成了以知识点为单元的微视频,以二维码形式嵌入教材中。因此,同学们和老师们在使用这本教材时,扫描一下二维码就可以知道我在浙江大学是如何讲解该知识点的。近千页的PPT也全部分享,所以老师们只要下载了这些PPT,略加修改,就能把它们变成自己熟悉的授课内容和授课方式。

后来,课题组又研发了“智海-三乐”垂直领域学科大模型。由此,同学们和老师们可以通过生成式人工智能对课本内容进行问答,为学生更加主动地学、教师更有创造性地教积累了丰富的数字燃料。

“101计划”对本人而言是一种责任、一份荣誉和一个动力。我在《人工智能引论》教材序言中写下如下一段话,或许是我投入“101计划”的驱动力写照:笔者勤勤恳恳,在教材写作中不敢有丝毫懈怠。深夜航班舷窗外皎洁的月光、假日宁静校园办公室中键盘敲击的旋律、风驰电掣高铁外掠过的暮色壮美山河、互联网中探索知识海洋的喜悦、七尺讲台上经历的春夏秋冬之时光,以及日常忙碌中家人的体谅照顾,这些点滴岁月都是本人曾经和正在经历的感动、热爱和坚强的时刻。

二、

生成式人工智能对教育的挑战

图片


先前的技术发明从机械化增强角度提升了人类与环境的互动能力,然而,人工智能的出现挑战了人类的根本,它深刻改变了人类与环境互动的能力和角色。近来生成式人工智能的出现使得智能机器成为知识生产的辅助者,对个体学习者的自主思考、判断、学习能力乃至伦理道德观提出了挑战。



(一)人工智能的“iPhone时刻”

2022年下半年,当生成式人工智能出现时,许多专家说人工智能已经进入“iPhone时刻”。怎么去理解这句话呢?2007年乔布斯发布第一台智能手机,经过20多年移动互联网的发展,手机已经成为我们所有信息流量的入口。如今每个人手机上面可能都有二三十个APP,每天的学习、工作、娱乐、出行、消费等,所有的信息流量都集中到手机上面去了。从互联网时代进入人工智能时代,所有信息流量的入口在哪里?在以CHAT为形式的人工智能系统上面。

如果一个人工智能系统能够让你像人与人交流那样,只需要自然语言的交流,你就能把这个人工智能系统使用起来,没有任何的鼠标键盘、Python语言、令人生畏的人工智能的庞大体系,你只要像和人沟通一样,直接问它问题,输入自然语言,它就能够完成你的任务,那是不是所有的信息流量入口都到以CHAT为形式的人工智能产品上去了?所以说,我们已经进入了人工智能的“iPhone时刻”。



(二)GPT是什么?

那GPT到底是什么东西?GPT的全称是Generative Pre-trained Transformer。所谓生成式(Generative),是指它所有产生的内容,都是一个词一个词生成出来的。它不是从互联网上搜索现成的内容,而是自己“创造”出来的内容。预训练(Pre-trained)是什么意思?就是说它要合成一个句子时,先产生第一个词,然后预测下一个词,接着再预测下一个单词。能够预测下一个单词的神经网络,被称为预训练模型。于是,在能够预测下一个单词的神经网络驱动下,就可以连词成句、连句成段、连段成篇,“创造”出人类看到的合成内容。

什么叫Transformer?2017年谷歌公司发表了一篇文章,提出了一种新的神经网络架构,将其命名为Transformer。美国有部电影叫《变形金刚》,它的英文名字也叫作TRANSFORMERS。可以姑且认为Transformer就是一个魔镜,一个万花筒,无论你问什么问题,它都能如法炮制地给出这个问题所对应的答案。

那Transformer为什么这么厉害?谷歌公司说其原因在于引入了自注意力(self-attention)机制。什么是自注意力机制?就是每个词都要自己肩负起自己的责任,要记住在某些上下文语境下,它的“左邻右舍”是什么。比如将“项庄舞剑,意在沛公”输入给Transformer,它可能没什么感觉。但如果输入的语料里反复出现“项庄舞剑,意在沛公”,那么自注意力机制就会被启动,让 “项庄”“舞剑”“意在”“沛公”等单词履行自己的责任,记住在这样的上下文语境中自己的左邻右舍是什么。

一旦每个单词都从大数据学习中记住了自己在某些上下文语境中的“左邻右舍”,那么预测下一个单词就变成了概率预测问题:先产生第一个词,然后根据所处上下文语境去寻找在“昨日数据”中与之经常出现的单词,按照概率最大原则将“昨日与之经常出现的单词”作为下一个单词预测出来,再如此预测第三个词、第四个词等,就像 “挤牙膏”一样把单词一个一个地挤出来。

其实人类不也天天在预测下一个吗?在工作岗位、在休闲时刻、在家庭聚会等场景中,人类每时每刻都在构建起自己的上下文语境,然后迅速判断在这样的上下文语境里可以采取的下一步行动。



(三)GPT的训练三板斧

Transformer刚被提出时,其包含的参数有10亿个左右,且参数异常复杂,很难训练。为此,科学家采取了三步走的策略。

第一步叫“文字接龙游戏”。 比如给定句子“一辆列车缓慢行驶在崎岖的路上”,先从这个句子中移除“缓慢”这一单词,然后让Transformer根据剩下单词的上下文语义来预测出现在“空白处”概率最大的单词。如果Transformer能预测2万个单词,那么其会计算每个单词出现在这个位置的概率,当然只有概率最大的那个单词才会被填入这个空白处。

很显然,“缓慢”不会一蹴而就地出现,那如果“缓慢”没有填充在这里怎么办?可以计算 “缓慢”没有出现在这里的误差,然后利用神经网络里面一个很著名的“误差后向传播”算法,把这个误差传给每一个参数,让每个参数按照 “缓慢”出现概率最大方向进行自我调整。经过若干次调整后,“缓慢”就以概率最大方式如约而至,被填充在了“空白处”。

但是,一个神经网络只能让你玩文字接龙游戏,那么这个神经网络没有任何意义,你应该让这个神经网络“说人话、做人事”。怎么实现呢?OpenAI采取了第二步,称为“有监督微调”方法。比如可以让Transformer回答如下问题:“本法院查明,被告人酒后······请分析案情。”由于Transformer肯定不会回答这个问题,因此人类就告诉这个问题的如下答案:“根据上述内容,可以认定本案的核心要素包括······”

于是科学家们惊奇地发现,只要教它若干个例子,Transformer就能在问题和答案之间建立起关联,然后再问它类似的问题时,它就能“种瓜得瓜,种豆得豆”,回答类似的问题。

这一过程之所以叫 “有监督微调”,是因为人类在教它,所以是“有监督”。为什么叫“微调”呢?是因为要完成这个任务,不需要把Transformer中10亿个参数全部调整一遍,只需要稍微调整一下与这个任务相关的参数。

就好像人类的大脑是分区的,在识别一个图像时,只有视觉分区的神经在工作,而不是整个大脑800亿个神经元都要参与。所以,和文字接龙不一样,文字接龙是10亿个参数都要调整,有监督微调是指仅需要微微调整和这个问题有关的参数就可以了,因为只有这些参数参与完成这个问题,与其他参数没有关系。

为了进一步提高模型合成语言的性能,ChatGPT还引入了人类反馈中强化学习(Reinforcement Learning from Human Feedback,RLHF)的这个第三步技术,将在交流中人类对模型所合成内容的反馈作为一种监督信息输入给模型,对模型参数微调,提高语言模型回答的真实性和流畅性。ChatGPT上线2个月后,日活跃用户达到了1亿。在每个人使用ChatGPT的时候,好比让它“吃百家饭、穿百家衣”,迅速与人类价值进行对齐。下次再问它人类已经问过的类似的问题时,ChatGPT就能从容不迫,对答如流。



(四)AI三宝

ChatGPT就是“数据是燃料、模型是引擎、算力是加速器”三架马车的使然结果。首先是“无数据,不AI”。如果没有数据,ChatGPT就无法让每个单词记住其左邻右舍。为了记住数据的左邻右舍,就需要庞大的参数。为了让庞大参数适配海量数据,就需要巨大的算力。因此,GPT-3.5在训练中使用了1万张英伟达V100芯片。在大数据、大模型、大算力下以“共生则关联”原则实现了统计关联关系的挖掘。

图片


(五)Sora:从自然语言描述去合成视觉内容

Sora能够在接收人类输入的文本提示词后,生成一段长达60秒的视频,实现了内容合成从文本到图像、再到视频的领域跨越。所有这些一次次带给人们震撼的技术背后,都遵循着同一个原理:对合成内容中的最小单元进行有意义的关联组合。比如,在保持连贯的上下文语境中,对若干个单词进行有意义组合,从而连缀成一个会意句子;在保持合理的空间布局下,对众多图像小块进行有意义组合,拼合为一幅精彩图像;在保持一致的连续时空内,对一系列时空子块进行有意义组合,从而拼接成一段动感视频。现实生活中,我们每个人都在通过有价值的内容组合来进行交流、设计和创作。唐代诗人卢延让对于“吟安一个字,捻断数茎须”的感叹,讲的就是诗人从百千个候选字词中反复对比、精心挑选出一个合适的单词,从而写就一篇传世之作。南宋诗人陆游所说的“文章本天成,妙手偶得之”,惊叹的就是让词汇恰如其分地出现在其应该出现的位置,形成语意连贯、文气贯通的天然佳作。

目前,合成视频需要先提供文本提示词,然后通过文本单词和时空子块之间的关联来合成新的视频。但因文本单词与视觉信息分属于不同类型,故而存在异构鸿沟困难,这是首先需要要解决的难题。其次,还要克服由视频图像分辨率过大而带来的维度灾难,以及其所引发的操作上的挑战。

为应对这些挑战,Sora先将文本单词和视觉子块映射到同构低维隐性空间,在这一低维隐性空间中引入扩散模型,对视觉信息反复迭代添加噪声并消除噪声,千锤百炼地挖掘文本单词、空间子块和时空子块之间的关联关系。

这种方式好比先通过“车同轨、书同文”,将文本、视觉等异构信息投影到同构空间,然后再通过“先破坏(添加噪声)”“再重建(去除噪声)”的迭代手段,来洞悉视频中各种不同单元在时间和空间中的关联关系,从而甄别学习纹理、运动、光照、遮挡、交互等复杂视觉物理规律。

这就好比鲁班学艺,不断将大桥拆散再拼装,从这个反复过程中知晓它们的跨结构、支座系统、桥墩、桥台和墩台之间的组合关系,从而练就重建大桥的能力。因此,Sora合成视频的过程并非是简单随机的“鹦鹉学舌”,而是对物理世界的重建。



(六)DeepSeek的崛起

近期,杭州深度求索人工智能基础技术研究有限公司(DeepSeek)先后上线大语言基座模型DeepSeek V3和基于V3训练、专为复杂推理任务设计的DeepSeek R1模型并同步开源,以卓越的性能超越或媲美全球顶级的开源及闭源模型。

DeepSeek研究人员在模型算法和工程优化方面进行了系统级创新,为在受限资源下探索通用人工智能开辟了新的道路,打破了以“大模型、大数据和大算力”为核心的生成式人工智能扩展定律天花板,引起了广泛关注和热议。

美国外交学者(The Diplomat)网站2025年1月28日发表了题为“中国的DeepSeek是美国人工智能的‘斯普特尼克时刻’”的文章,指出苏联于1957年发射人类首颗人造卫星“斯普特尼克1号”,触发了美苏两霸科技与军事竞赛,但是这一次DeepSeek开源之举延续了OpenAI的初心使命:为了人类利益推动人工智能发展。精益求精、富有创造力的工程——而非纯粹的金融实力和出口管制——才是赢得比赛的关键。

DeepSeek开源之举将使得人工智能像水和电一样触手可及,为时时、处处、人人可用的普遍智能实现带来曙光。DeepSeek模型基于Transformer架构,并非颠覆性基础理论创新,但是DeepSeek的确是人工智能漫漫征途中的精彩一跃。  

2025年1月25日,《经济学人》杂志发表了一篇题为《中国人工智能产业几乎已追上美国》的文章,用了“穿着高跟鞋倒退跳舞的金杰·罗杰斯”这句话来暗喻在人工智能发展过程中,美国OpenAI等人工智能巨头付出了更多的努力或承担了更多的责任,而目前DeepSeek却得到了更多的赞誉或关注。该文中给出了一幅一条龙出现在一辆车的后视镜中的图片,暗指中美人工智能发展之间距离已经相当接近。

在为DeepSeek成功喝彩的同时,也要为推动人工智能发展的所有努力而喝彩,每个人的努力均不可忽视,“夫水之积也不厚,则其负大舟也无力”。

长久以来,我们均认为从0到1的理论创新是推动人工智能发展的引擎。为了实现在资源受限情况下完成对标一流大语言模型性能的任务,DeepSeek在架构设计和工程优化上进行了系统性创新,用创新来改变大语言模型依赖算力的固有路径。

中国工程物理研究院李幼平院士在2022年8月参加“中国人工智能学院院长与名师论坛”时,曾经讲过一个故事,说他向朱光亚先生请教为什么九院称工程物理研究院,朱光亚先生回答说:“物理是深度,工程是规模。没有规模,做不成大事。”在算力成本呈指数级增长的人工智能领域,通过算法优化、架构突破和工程创新降低大语言模型成本,这本身就是技术实力的体现,是难能可贵的大事。

更难能可贵的是,DeepSeek将工程创新成果开源,加速技术落地和迭代升级。任何人均可从DeepSeek网站自行下载与部署模型,网站提供了详细说明训练步骤与窍门的文档。可以预见的是,DeepSeek将被部署为不同场景中的人工智能基座,通过行业自有数据、知识和经验进行专业训练和微调,创造无限可能,推动“由专到通”的人工智能发展路径形成,牵引人工智能技术生态形成,迈向全社会分享的普遍智能之路,而非现在“由通到专”的人工智能发展思路。



(七)浙江大学的学科大模型

近年来,OpenAI、Meta、百度和阿里等通过汇聚互联网近乎全量数据训练得到千亿级参数生成式大语言模型,表现出较强通用型内容合成能力,推动了语言生成和对话式人工智能等领域的突破性进展,其以自然语言交互手段来完成传统人工智能难以比及的众多任务,为探索通用人工智能的实现提供了一种方式。

与“上知天文、下知地理”的通用生成式大模型不同,高等学校学科大模型利用高质量教科书级语料,将学科领域知识和经验融入深度学习架构,强调多模态、长程推理和人机协同等能力提升,往往通过百亿级参数模型来解决专业性场景问题,然后不同学科大模型之间相互融会贯通,进而形成由专到通的大学大模型,这一研究思路与当前直接构建通用大模型不同,开辟了由专到通的人工智能研究新范式,有望促进科学发现突破、教育模式创新和产业赋能提升。浙江大学在过去几年围绕科学场景和领域任务进行了学科大模型的探索。

如浙江大学联合高等教育出版社、阿里云、华院计算共同研发的人工智能学科教育大模型“智海-三乐”就是一个典型的学科大模型,其将人工智能技术与教育理论紧密结合,提供知识问答、学习计划定制、习题生成、错题解析、教学大纲生成等功能,辅助学生更个性化地学、赋能教师更创造性地教。“智海-三乐”取名于孟子所言“天下英才而教育之,三乐也”的寓意,彰显培育英才的教育理想。

作为“101计划”核心课程“人工智能引论”的重要支撑平台,“智海-三乐”与“学在浙大”、智慧教室、“智云课堂”、浙大先生、浙大钉等深度融合,构成了浙江大学教育教学人工智能进阶计划(AI STEP)的体系化支撑基座。“智海-三乐”与《人工智能引论》教材的教育教学形成深度高度耦合,打造了“创造性教、个性化学”的数字化智能教学基座。基于该模型研发的苏格拉底教学智能体,采用启发式教学方法有效提升学生的自主学习能力与批判性思维,推动教学模式实现从知识本位向能力本位的范式转型,教学效果显著优于传统知识问答模式。

目前,“智海-三乐”已通过高教社云平台对外开放,支撑人工智能专业、通识教育和交叉学科以及AI+X微专业等教育教学,推动了人工智能技术在高等教育中的落地应用,其创新实践成果入选教育部首批18个“人工智能+高等教育”应用场景典型案例。图片

      对于不同的学科大模型,是否可以将其组合起来形成更强能力,这被称为大小模型协同。浙江大学现有60多个学科大模型,如果每个学科对应的大模型能够协同起来,就可以走向由专到通的人工智能发展道路。

三、

浙江大学通识教育的经验和做法

图片

1987年诺贝尔经济学奖获得者美国经济学家索洛研究表明,国民经济最终会达到这样一种稳态发展阶段:在那个阶段以后,经济增长将只取决于技术的进步。虽然技术进步是经济增长的源泉,但是长期的经济增长是由少数几种“通用目的技术” (general purpose technologies,简称GPTs)驱动的。在人类发展历史上,蒸汽机、电力、计算机、半导体和互联网等与人工智能一样,都是通用目的技术,具有普遍适用性、动态演进性和创新互补性特点。

通用目的技术是最核心的创新要素,但不是完整的最终解决方案。比如瓦特在1795年改良了蒸汽机,但是直至这之后近百年,当蒸汽机与纺织、交通和冶金等工业紧密结合,使得机械动力迅速取代了人力、风力、水力和畜力,蒸汽机对劳动生产率的贡献才达到顶峰,推动人类迈入工业革命时代,突破了“马尔萨斯陷阱”。

人工智能也是如此。只有当人工智能与经济、工业、教育、医疗、农业等广泛融合时,人工智能时代才真正到来。

浙江大学一直非常重视人工智能教育和科研。早在1978年计算机系成立之初,创系主任何志均先生就将“研究人工智能理论、设计新型计算机”作为建系之本。同年,学校就开始招收人工智能方向的硕士研究生。2018年7月,成为首批开设人工智能本科专业的高校。2018年,教育部批准设置省部共建人工智能协同创新中心(浙江大学)。2019年5月,设立全国首个人工智能交叉学科。2024年,相继获批国家人工智能产教融合创新平台(浙江大学)和国家教材建设重点研究基地(高等学校人工智能教材研究)。

依托我国首批人工智能本科专业和首个人工智能交叉学科,构建形成从本科生到研究生的“人工智能”及“智能+”人才培养完整体系。



(一)通识课程设置

2024年,学校成立了浙江大学人工智能教育教学研究中心,统筹全校教育、科技、人才优势,系统推进人工智能教育教学改革。2024年6月16日,在教育部“101计划”核心课程“人工智能引论”的建设基础上,按照不同类别设置了面向全校所有学生的人工智能通识必修课程群,其中面向理工农医类开设“人工智能基础A”,注重构建基础;面向社会科学类开设“人工智能基础B”,注重应用实践;面向人文艺术类开设“人工智能基础C”,突出通识理解。2024—2025学年春夏学期已面向2024级学生共计开出58个教学班,近3000名学生学习。图片

简言之,浙江大学“人工智能基础”系列通识课程分为A、B、C三类,分别面向理工农医类、社会科学类、人文艺术类专业的学生开设。分层分类是人工智能基础系列通识课程的最大特色,这考虑到不同专业学生的先修基础和学科背景,也为了更好满足同学们个性化的学习需求。“人工智能基础A”“人工智能基础B”“人工智能基础C”分别对应创新人工智能、使用人工智能和了解人工智能的素养培养目标开展。

“人工智能基础A”是实践能力培养的“硬核课堂”。课程从人工智能基础入门导入,再逐一讲授机器学习、深度学习、大语言模型等人工智能三大核心进阶技术,构建平台部署、数据建模和应用开发等实用技能,培养同学们“从代码到落地”的全流程应用创新能力。

“人工智能基础B”聚焦于社会科学领域适用的模型算法与工具应用,具有浓厚的交叉属性。课程嵌入了数据生态、社会仿真、计算社会科学等人工智能+社会科学的前沿内容,探索数字人文、智能社会治理等交叉创新方向,培养同学们跨领域研究中的伦理意识与技术批判思维。

“人工智能基础C”是零基础入门的“AI启蒙课”,以“低门槛、广覆盖”为特色,“人工智能基础C”系统讲解人工智能的发展历史、核心算法演变及人文社科场景应用案例。



(二)素养能力培养

在教育领域,人工智能正彻底改变着以知识积累和传递为中心的教学模式,新一代人工智能技术可以胜任原本属于人类脑力劳动范畴的部分工作。如何通过多样化的人机协同模式不断提升学习者的主体性、能动性和实践性,最终让大规模的个性化学习普遍发生,成为“智能时代、教育何为”需要直面的重大命题。

生成式人工智能将人类绝大多数知识装进数字化知识容器中,重构了人类知识版图,成为与人类并驾齐驱的“知识提供者”。然而,生成式人工智能的局限性也是显而易见的,它对个体的自主思考、判断、学习能力乃至伦理道德观提出了前所未有的挑战。在人类教育史上,每一次伟大的技术创新(如文字、印刷术和互联网技术)都引发了教育领域质和量的飞跃。以ChatGPT为代表的生成式人工智能技术将实现对传统教育体系的再次迭代升级,促使人类教育目标从知识本位和能力本位走向素养本位。

为了让同学们理解在人工智能时代具备相应素养的重要性,浙江大学还发布了《大学生人工智能素养红皮书》,希望我们的学生了解人工智能,使用人工智能,创新人工智能,恪守人与人造物的关系。《大学生人工智能素养红皮书》提出了大学生人工智能素养的构成内涵、培养的目标与愿景以及培养的载体、行动与策略,认为大学生人工智能素养是由体系化知识、构建式能力、创造性价值和人本型伦理构成的有机整体,其中知识为基、能力为重、价值为先、伦理为本。

高校教师是智能技术能否以及如何进入高校的关键守门人和把关者,高校教师人工智能素养水平将直接决定着智能时代高校教育教学变革的方向、速度和质量。浙江大学发布的《高校教师人工智能素养红皮书》,提出了高校教师人工智能素养的概念、内涵以及提升的目标、路径与保障,认为高校教师人工智能素养是指在高校从事教学与科研工作的教师为了在智能时代胜任教书育人、科研创新、社会服务及文化传承等工作而应具有的一种与人工智能应用相关的专门素养,它包含赓续育人理念(何为师)、学习智能知识(以何为师)、变革教研模式(何以成师)和担当社会责任(师者为何)等能力,具体包括智能时代育人理念、智能教育基本知识、人机协同教学能力、数智赋能科研创新以及科技向善人本价值等五个纬度的内容,其中,理念引领、知识为基、能力为核、创新为重、价值为本。高校可以通过更新高校教师培训的内容及形式、创新高校教研室的活动内容与形式以及项目驱动高校教师AI+X的实践能力提升等路径促进教师人工智能素养的提升,并为其提供组织、制度、资源和环境保障。图片



(三)AI生态打造

为了帮助学生更好地学习人工智能,浙江大学发布了新一代人工智能科教开放平台“智海”。智海新一代人工智能科教实训平台入选教育部首批“人工智能+高等教育”应用场景典型案例和教育部学位与研究生教育发展中心“2022年主题案例”,包含2000余个数据集、200门标准课程、80万+模型训练,服务全国高校师生近15万人次;“智海-三乐”学科大模型上线国家高等教育智慧教育平台。

同时,浙江大学于今年2月14日发布了“浙大先生”。“浙大先生”是一个智能体平台,向千余所高校开放共享。其底座是DeepSeek的满血版本,可助力老师和学生们根据自己的任务与场景来自主研发不同的智能体,把DeepSeek 变成一个真正的超级助力工具。



(四)多元化人工智能人才培养

针对不同层次、不同领域对人工智能知识的学习需求,设计并实施了AI+X微专业、“灰犀牛”特训班、国家开放大学人工智能第二学士学位以及中小学人工智能通识线上系列课等人才培养模式,覆盖高等教育、基础教育、职业教育和终身教育等不同层次教育群体,探索跨校、跨学科、跨行业多元化人才培养长效机制。

围绕“人人、时时、处处可学人工智能”理念,拓展人工智能教育的社会服务与科普推广,DeepSeek专题公开课、智行中国系列讲座、新一代人工智能系列教材主编谈、人工智能通识系列讲座等线上活动总观看人次超3000万。



(五)专业教材和通识教育教材编写图片

为促进人工智能人才培养,国家新一代人工智能战略咨询委员会和高等教育出版社于2018年3月成立了“新一代人工智能系列教材”编委会。“新一代人工智能系列教材” 已出版了包含人工智能基础理论、算法模型、技术系统、硬件芯片和伦理安全以及“智能+”学科交叉与实践等内容的26本理论技术教材和11本实践教材,形成了衔接前沿、涵盖完整、交叉融合的,而且具有中国特色的人工智能一流教材体系。

目前浙江大学牵头完成了教育部战略性新兴领域“十四五”新一代信息技术(人工智能)教材体系建设,出版了包括计算机“101计划”《人工智能引论》等教材45本,AI领域10门课程入选国家级一流课程,完成教育部“人工智能关键领域工程硕博士核心课程”(上线课程12门)。出版《走进人工智能》和《人工智能初步》等图书,教材被百余所学校近10万师生使用,线上课程和科普读物触及千万人群。

2024年11月,高等教育出版社和国家教材建设重点研究基地(高等学校人工智能教材研究)对新一代人工智能系列教材编委会扩容,聘请潘云鹤院士担任编委会主任,吴澄院士、郑南宁院士、高文院士、陈纯院士、戴琼海院士、郑庆华院士和阳化冰副总编辑担任编委会副主任,并联合浙江大学出版社共同面向全国高校教师组织编写“有专业高度、显学理深度、含人文温度”的“新一代人工智能通识系列教材”,开启有组织的人工智能通识教育和“人工智能+”专业人才培养教材建设的新篇章。

2024年10月,浙江大学获批国家人工智能教材基地。在新的时代背景下,浙江大学将与相关高校和机构合作,出版覆盖“专业—通识—科普”“高等教育—基础教育”“理论—实践”“纸质—数字”高水平体系化教材,注重融入“中国案例”,普及新一代人工智能理念与方法。在教材基础上,建设了配套线上线下课程体系,开发了涵盖微视频、实训案例、知识图谱、能力图谱等的结构化、关联化数字资源,有力推动了教材体系向教学体系的转变。



(六)“AI STEP”计划

面对“智能时代、教育何为”的挑战,学校正式推出“浙江大学教育教学人工智能进阶计划(AI STEP)”,以“Start, Train, Explore, Progress”为进阶路径,以“Science, Technology, Engineering & Enterprise, Philosophical & Social Science”为学科交叉融合之道,推动AI与教育教学深度融合,构建智能时代拔尖创新人才自主培养新范式。

“AI STEP”计划包括构建通识—核心—交叉—产教融合课程教材体系、提升师生人工智能素养能力、提升实践与创新能力、建设学科大模型和赋能教学科研应用等内容,打造时时、处处、人人可学习的育人环境。



(七)助力中小学人工智能教育

2024年10月,教育部办公厅发布通知,提出2030年实现人工智能进入中小学课堂,于是杭州很多中小学希望浙江大学能够助力基础教育阶段的人工智能教育。

目前,我们对高中、初中和小学分别按照“形成一批适用于基础教育的生动活泼人工智能教学案例与课程”“通过人工智能与学科课程内容的结合,激发适性成长”“通过人工智能案例体验,激发小学生对人工智能的兴趣”探索“人工智能+基础教育”的融合路径,但目前只能说还在初步探索阶段。

我个人也一直在做人工智能科普。2021年,某出版社希望我能用150分钟给中学生讲清楚人工智能,他们要求将内容制作成数字有声科普通识读物。在他们的支持下,150分钟原创人工智能前沿科普数字栏目《走进人工智能》在2022年1月上线喜马拉雅。同时,我也将其扩展成一本23万字的科普书——《走进人工智能》。《走进人工智能》以青少年为主要读者群体,引经据典,用古今中外的历史事实来理顺人工智能纵向发展脉络与横向科学轮廓,将硬核知识、技术方法与人文历史、人物故事有机融合。该书重点关注人工智能与其他学科的交叉融合,旨在引导读者充分了解人工智能兼具技术属性和社会属性。该书入选2022年科普中国创作出版扶持计划出版类项目,荣获第八届“中国科普作家协会优秀科普作品奖”科普图书银奖、《人民日报》首期10本大地书单,阿拉伯文版版权已输出海外。

图片


图片

结语

当然,我们也必须清醒地认识到,人工智能也有其不足,甚至可能带来危害。面对这样的挑战,我们唯有用人工智能发展人工智能,用魔法打败魔法,而不能对人工智能按下“暂停键”。

就像诺贝尔物理学奖获得者费曼说的,每个人都掌握着一把开启天堂之门的钥匙,这把钥匙也同样能打开地狱之门,如果我们没有办法分辨一扇门是通向天堂还是地狱,那么手中的钥匙可是个危险的玩意儿。可是这钥匙又确实有它的价值,没有它,我们无法开启天堂之门;没有它,我们即使明辨了天堂与地狱,也还是束手无策。所以我们必须勇敢地拿起这把钥匙,用人工智能的钥匙,开启通往“人工智能天堂”的那扇门。

潘云鹤院士2018年为我们的工作进行了题词:“人工智能,教育先行。”今天再回过头来看,这句话是多么具有前瞻性,教育一定要走在人工智能发展的前列。人工智能是一个产学研结合特别紧密的学科,所以叫“产学协作,引领创新”。图片

      人工智能是引领这一轮科技革命、产业变革、社会发展的战略性技术。 1955年,在达特茅斯夏季研讨会上,人工智能首次登上人类历史的舞台,其初衷非常简单,而人工智能完成的那一刹那,必将辉煌无比。








 

版权所有:咸阳师范学院计算机学院

地址:陕西省咸阳市渭城区文林路 邮编:712000