【摘要】 针对“人工智能”课程实验中存在的各种问题,提出在实验教学中引入企业云服务平台,支持实验实训等实践教学环节的方法。在云平台的支持下,可以实现大数据量、高运算能力要求的AI算法实验。云端实验平台的引入丰富了教学手段,解决了实验算力不足、实验数据存储量不足、实验过程难以监控,以及实验教学效果难以评价的问题。实验平台的引入有助于激发学生的主观能动性和创新实践能力。
刘丽珏; 阳春华; 陈白帆; 王雅琳; 高琰, 工业和信息化教育 发表时间:2021-10-22
【关键词】人工智能;云实验;ModelArts;AI平台;交叉学科
0 引言
人工智能主要研究如何利用计算机和自动机去模拟、延伸、创造和扩展生物的智能,设计和建造具有拟人智能水平的智能系统[1],并把这类系统应用到科学技术、国民经济、社会和人民生活的各领域。“人工智能”课程涉及认知科学、计算机科学、控制论、生物信息学、数学、人工生命、脑科学、心理学、生理学和哲学等学科,是一门综合性强、实践性强、创新性强、应用领域广、多学科高度交叉的前沿课程[2]。
中南大学自动化学院设有智能科学与技术专业,拥有国家级教学团队——智能科学基础系列课程教学团队。“人工智能”课程已开设30余年,是国家级精品课程、国家级资源共享课、新世纪网络课程、国家级双语教学示范课程、国家级精品视频公开课、中南金课、中南大学开放式精品示范课堂。“人工智能”课程以人工智能和智能系统理论为指导,以智能机器人、智能识别和智能信息处理系统为应用背景,依托精品课程群,发挥了示范作用[3]。
1 “人工智能”课程教学中存在的问题
随着新一代深度感知、高速传输、海量存储和智能处理等技术的不断发展与成熟[4],人工智能技术不再是纸上谈兵的理论,这对课程的实践环节提出了更高的要求。受学校实验室环境和设备的限制,综合性、前沿性实验难以开展,主要表现在如下3个方面。
(1)实验内容过于简单,缺乏综合性实验。课程实验往往只注重对知识点的强化,而忽略了其实际应用场景。多数实验均为演示型、体验型实验,无法真正让学生领会到实际应用中的问题并培养解决问题的能力。如神经网络实验中,只能通过演示型实验让学生了解网络迭代优化的过程,而对较重要的应用场景——图像识别的实验却难以支撑。
(2)实验设备老旧,无法满足新技术要求。学校的实验室设备仍然停留在单台计算机的水平,且实验室的设备只能在学生实验期间使用,学生一旦离开则不能继续运行。与此相对应的,是以机器学习、深度学习为代表的主要靠数据、算力和算法支撑的新一代人工智能技术实验需求,其中很多实验需要学生长时间自行训练和学习。老旧设备无法承载大数据存储和高速运算的需求,实验室管理办法也没有跟上新的需求。即便是进行简单的手写数字识别实验,1台实验室的计算机完成1次实验训练也需要15~30分钟。
(3)实验考核困难,难以定量分析。由于条件限制,以往的实验只能是验证性实验,且由于单机的形式,实验数据、实验环境难以统一,使得评价指标的计算基础不一致,教师对学生实验环节的表现多半只能通过实验报告来评价。这里面掺杂了很多主观因素。例如,对于回归分析的实验,每名学生1份数据,每人的机器都有区别,导致最后只能从拟合程度来判断实验效果,而无法对时间性能、空间性能进行更全面的评价。且数据量受到单机存储量限制,只能进行小样本实验,无法再现实际工作中可能出现的问题。
2 云实验的引入与设计
在高校实验环境建设相对落后的同时,很多科技企业开始布局人工智能领域[5],并且推出相应的云端计算服务平台。ModelArts是华为公司面向开发者提供的云端AI开发平台,为机器学习与深度学习提供海量数据预处理及半自动化标注、大规模分布式训练、自动化模型生成,及端— 边—云模型按需部署能力,帮助快速创建和部署模型,管理全周期AI工作流。中南大学于2018年底申请教育部产学合作协同育人项目,与华为公司达成协同育人协议,将ModelArts引入“人工智能”等相关课程的实验教学中,为课程实验提供云端算力支持。
2.1 ModelArts应用背景
ModelArts是华为公司针对AI开发者面临的一系列困难设计开发的一站式开发平台,所谓 “一站式”是指AI开发的各环节,包括数据处理、算法开发、模型训练、模型部署都可以在 ModelArts上完成。从技术上看,ModelArts底层支持各种异构计算资源,开发者可以根据需要灵活选择使用,而不需要考虑底层的技术。同时, ModelArts支持Tensorflow、PyTorch等主流开源的AI开发框架,也支持开发者使用自研的算法框架。面向不同经验的AI开发者,提供便捷易用的使用流程。例如,面向业务开发者,不需关注模型或编码,可使用自动学习流程快速构建AI 应用;面向AI初学者,不需关注模型开发,使用预置算法构建AI应用;面向AI工程师,提供多种开发环境,多种操作流程和模式,方便开发者编码扩展,快速构建模型及应用。对不同层次使用者的支持,正好符合课程实验中不同需求何难度的实验要求,非常适合作为实践教学平台。 ModelArts中典型的AI算法训练和发布流程,如图1所示。
ModelArts预置了大量已标注数据集,可以支持目标检测、目标识别等多种任务,还支持用户上传自建的数据集,并提供了标注工具;在算法开发过程中,Tensorflow、PyTorch等主流框架均已集成进去,并有大量预置算法模型供使用者选择使用,有利于快速实现课堂上介绍的各种框架和算法,便于学生对之建立起感性认识;至于训练模型,平台提供分布式集群进行训练,远超老旧实验设备所能提供的计算资源,大大缩短了训练时间,另外零编程的自动学习方式方便课堂演示实验效果,激发学生的学习兴趣;训练后的模型可以很容易地进行部署,提供预测推理功能,支持各类应用。
2.2 课程实验安排
“人工智能”课程作为智能科学与技术专业的专业基础课,在涉及机器学习部分的教学中主要关注学生的基本理论学习和应用体会。学生在这部分学习中主要需要了解学习系统的构建过程及可能遇到的各种问题,让学生在实验过程中对技术的应用先有整体认识,以便在后续的“模式识别”“机器学习”等课程中更加关注具体的技术和方法。结合ModelArts功能和课程实际情况,课程实验内容设计如下。
(1)回归分析。①分析胚胎发育B超测量数据,利用ModelArts开发环境中的Notebook自编代码,建立合适的回归模型,进行胚胎发育情况的趋势模型编写,并对指定测试集的数据进行预测;②前列腺癌预测,利用ModelArts开发环境中的Notebook自编代码,对前列腺癌数据进行回归分析,统一测试集进行测试。
(2)手写数字识别。①利用ModelArts上的 Minist手写数字集,训练和测试手写数字识别; ②将回归模型稍加修改,迁移到美国邮政编码手写数字集的数字识别上,检测识别率并进行改进。
(3)找校徽。请学生搜集校园中各处出现的中南大学校徽图片,统一形成数据集上传ModelArts,利用平台标注工具为数据进行标注,仿照云平台中的“找云宝”实验,完成找校徽实验。实验的设计从易到难,先完成线上编程,再完成从数据到应用的完整实验流程,让学生在实践过程中不断提高解决问题的能力。实验以分组形式完成,每名学生均需完成所有实验内容,但可取最好的实验结果作为本组的最后成绩。实验完成后组织集体汇报,学生以组为单位汇报实验内容与结果,同时统计每组最终成绩,公布排行榜。每名学生在每个实验部分的得分按照其个人在组内排名和整组排名综合计算。
3 云实验教学特色
(1)课堂教学手段更加丰富。以往受制于计算资源,课堂上的案例都只能给出过程描述和结果截图,引入云端资源后,即便是在教室的机器上,也可以通过实操来向学生展示教学案例的实现过程,使其对其中的问题和解决办法有更直观的认识。
(2)实验安排更加灵活。专业课的授课学生普遍较少,其中的实验学时就更少了。以往2学时实验的安排及集中在实验室进行的方式都使得大规模综合性实验难以开展。云实验的出现,使学生可以不受空间和时间的限制,同时扩大了实验内容的范围。
(3)学生学习更加主动。随着实验内容综合性、实用性的提高,学生完成实验的热情也逐渐提高。演示型、体验型实验学生只能被动参与,云实验由于只限定了输入、输出及基本办法,具体的处理过程和方法细节都可以由学生设计,台可为培养大数据应用型人才提供重要保障,满足师生多元化与多终端的需求。