人工智能教育应用的新发展

daoge6302 2019-01-28

展开全文

摘要：人工智能在教育领域的应用已有四十多年的历史，随着近年来人工智能在各领域不断取得重大突破，教育人工智能也将迎来新一轮发展。文章首先梳理了人工智能发展的脉络；进而分析了教育人工智能的典型应用领域以及未来趋势，提炼总结教育人工智能应用模型以及核心服务能力，分析深度学习技术对于实现若干核心服务能力的作用；最后指出教育人工智能所面临的机遇和挑战。文章从多个维度阐述了当前教育人工智能的发展情况，以期为设计人工智能教育应用提供借鉴。

关键词：深度学习；人工智能教育应用模型；人工智能教育应用核心服务；人工智能民主化；教育数据隐私保护

引言

人工智能（Artificial Intelligence，AI）被广泛认为是继信息技术革命之后的新一轮生产力革命，它将对诸多行业和领域产生了巨大和深远的影响，而教育领域就是其中一个需要被高度重视的领域。在这种背景下，《“互联网+”人工智能三年行动实施方案》提出要鼓励开展人工智能基础知识和应用培训；《新一代人工智能发展规划》提出要利用智能技术加快推动人才培养模式、教学方法改革；《高等学校人工智能创新行动计划》与《教育信息化2.0行动计划》强调要发展智能教育。由此可见，将AI应用于教育领域已成为未来一段时间需要重点关注的问题。

通常，AI在教育领域的应用被称为Artificial Intelligence in Education（AIEd）^[1]。国外一些政府和研究机构高度关注AIEd的发展，美国国家人工智能研究和发展战略计划^[2]、英国机器人和人工智能报告^[3]、斯坦福报告^[4]中都有相关的阐述。培生的报告从教学模型和应用领域阐述了人工智能教育应用的发展路径，强调需要从政府层面进行规划设计，围绕人工智能教育应用进行一个生态系统建设，而不能局限于单一应用^[1]。

国内外的这些规划及报告将推动AIEd的发展。然而，历史上人工智能的发展经历了数次“寒冬”，因为在当时，存在着人工智能技术无法满足日益膨胀的幻想需求之间的矛盾。以史为鉴，面对当前人工智能的快速发展之势，在具体实施过程中，我们需要对其在教育领域的应用进行分析，回答能做什么、要做什么、有哪些关键技术以及要注意什么。为此，本研究梳理了当前人工智能和教育应用的发展现状、应用领域、核心服务能力、关键技术模型以及机遇与挑战。

一人工智能发展概况

1 知识库和推理阶段

在1956年达特茅斯会议上，人工智能这一术语首次被提出。在1956~1969年间，一些研究成果使得人们对于人工智能研究产生了巨大的期望，如Herbert^[5]开发了几何定理证明器，James^[6]的SAINT程序能够求解大学一年级课程中典型的闭合式微积分问题，Tom^[7]的ANALOGY程序能够求解出现在智商测试中的几何类推问题。

然而，AI早期的问题求解主要是一种通用的搜索机制，试图串联基本的推理步骤来寻找完全解，但这种方法难以应对现实世界复杂的领域问题。因此，20世纪70年代，基于知识的专家系统开始发展起来。这种系统聚焦于特定领域，用领域大量的相关知识作为基础，允许更大量的推理步骤，因此可以更好地处理特定领域中的问题，在业界得以广泛应用。

2 机器学习及深度学习阶段

然而，人们逐渐认识到，专家系统面临着“知识工程瓶颈”问题，即依靠人把知识总结出来再教给计算机是相当困难的。于是，机器学习这一技术分支出现了，其目的就是让机器自己学习知识。

从2000年前后开始，大数据集在机器学习中发挥了重要作用^[8]。如Halvey^[9]认为很多应用中的“知识瓶颈”可以通过足够的数据来解决；Hays等^[10]讨论了马赛克模糊处理照片补全的问题，他们发现使用1万张照片，算法性能会很差，而如果增加到200万张照片，算法会表现出极好的性能。

人工神经网络是机器学习中一种重要的计算模型。由于早期人工神经网络感知机只有两层网络，难以表达复杂的问题，而多层的复杂神经网络架构，又面临计算难度骤增等问题，因此早期遭到包括Minsky等人工智能先驱的批评，其发展起起落落。2006年，Hinton^[11]开启了深度学习研究和应用的新时代。发展至今，人工智能在语音识别处理、视频和图像处理、物体检测以及其它领域表现出了比传统方法更好的效果^[12]。

二人工智能教育应用领域分析

1 分析和决策类

随着“互联网+教育”的发展，在线学习平台上的用户越来越多，数据量急速膨胀，依托传统的分析方法难以有效识别学情。采用人工智能技术，可以有效分析、高效利用这些数据。Marius等^[13]基于MOOC的学习数据，采用机器学习算法预测学生退课情况，该项研究中有3,475,485条点击记录。研究者将这些记录条目属性分为22类，依据这22类属性基于主成分析算法、支持向量机算法综合判定学生退课率，在基准方法上提高了15%的预测准确率。

2 智能教学类

一对一教学是理想的教学模式，因为其天然具备个性化服务的内涵。研究表明，在一定层面，AI能够模拟出有效的一对一教学模式^[14][15]，其中典型的就是智能导师系统（Intelligent Tutoring System，ITS）。ITS能够整合认知模型、学习者模型、资源推荐、学习路径推荐等众多的技术来实现针对学习者的个性化辅导。经历几十年的发展，ITS已经获得了广泛应用，VanLEHN^[16]认为在某些情况下，ITS已经接近人类一对一教学的效果。Carnegie Learning’s Cognitive Tutor Mathematics Courese[^14]已被2000所中学师生使用。随着AI技术的进步，ITS中开始检测学生情绪的变化并提供针对性的学习策略调整^[17]。

3 常规业务自动化

人工智能的自然语言处理分支已被广泛应用于学术写作训练领域。Simon[^18]设计了一个针对民法学习的写作课程分析工具。Ming^[19]针对用机器学习的方法对汉字进行相似性对比，利用这些相似性数据自动生成汉字填空和多选试题。可以预见，未来大量的、重复性的工作将被人工智能取代。

4 未来发展的典型应用

吴永和等^[20]提出了“人工智能+教育”应用的四种形态，包括智能校园、立体化综合教学场、基于数据智能的在线学习教育平台、智能教育助理。余明华等^[21]深入了分析机器学习在智慧教育中的应用问题。本研究从实践的角度探讨如下几个具体的应用。

（1）大规模自动化的课堂观察和分析

①教学角度。在传统课堂上，教师难以快速识别不同学生的需求。如教师无法实时判断哪些学生掌握得好，哪些学生掌握得不好。有经验的教师可以根据学生的面部表达进行部分判断，但这中情况高度依赖教师本身的素养，因此这种教育近乎“艺术”，难以普及。

②教学评价的角度。典型的方式是通过对任课老师的听课、评课进行评价，这一方式存在两个问题：一方面，听课这件事本身对该堂课会产生影响；另一方面，这种听课行为无法做到大规模、持续地按需进行，难以积累大规模的有效数据。

以上两个方面都对课堂观察技术提出了高要求。随着深度学习技术的应用，人工智能技术在人脸识别、情感识别、动作识别、语音识别等领域取得了突破性进展，这为智能课堂中大规模、自动化的课堂观察和分析提供了基础。

（2）用于家庭早教的人工智能教育机器人、智能音箱等

随着人工智能在语言识别、语音合成、图像识别等领域不断取得突破，一批新型的早教机器人逐渐进入市场。这些机器人同互联网进行紧密结合，不断在用户之间发生数据交互。可以预期，这样的机器人最终将越来越了解小孩，其教育属性将越来越明显。

（3）万物识知与科研科普

万物识知与科研科普是一种新的在线学习和科研教学形态，该形态能够将日常生活经历和学习很好地结合起来。深度学习技术为这种教育模式提供了技术基础，如Carranza等^[22]采用深度学习的图像识别方法对标本进行识别，准确率接近80%。这项研究重要而深刻的意义在于：①在生物、地理等自然领域，机器自动识别物种和地理现象的能力不断提高，可能会极大地丰富这些领域的科研数据，这将解决野外工作者力量有限、不可遍及全球任何地方的问题；②用户通过手机APP拍摄所见之物，当遇到不认识拍摄物的时候，系统可直接通过机器识别，开展以用户兴趣和主动服务为核心的科普和自学服务，此方式正好切中自主学习、探索学习的精神。

三人工智能教育应用的核心服务能力

1 人工智能教育应用的模型

Self^[23]认为教育方面、心理方面和社会方面的知识通常是含蓄的、不外显的，ITS作为人工智能教育应用的典型代表，其科学目标就是使这些知识能以精确和外显的形式计算化。从广义角度来讲，人工智能教育应用的科学目标也是类似的情况，即数据驱动的分析、预测和行动。

在人工智能的驱动下，教学测评评价、教学管理、教学场景、教育形式等方面呈现出新的教育产品和教育形态^{[24][25][26][27]}。应用场景包括智慧教室、MOOC、ITS系统中的学习和其它各类数字化学习环境。然而无论哪种学习场景，人工智能教育应用的核心共性关键要素可以概括为四种：①关于学习者的模型，即获取学生的学习经历数据，据此数据进行实时或者离线分析，从而提供实时或者离线的学习反馈和提示。在学习者模型中，关键的识别内容包括认知水平、情感和情绪、学习状态等。②关于领域的模型，即对学生所学知识主题的感知处理，自动构建符合学生需求、知识水平、情感状态的学习内容并做出相应的干预。③关于教学法的模型，即从人类教学过程或者机器对抗学习过程中提炼的、关于教学方法方面的知识。教学法模型是教师（包括智能导师系统）、学习者和学习资源这三个要素之间的粘合剂。④关于自动化的模型。自动化可能贯穿于前述①-③的各环节中。如在学习者模型中，依赖于机器学习的自动化方法将持续地为学习者进行建模，这个过程不是静态的，而是在线动态的；在领域模型方面，机器学习算法可以持续地对学习资源进行知识建模、分类；在教学法模型中，系统可以自动批改学生主观题的内容^[18]，还可以自动出题[19]等。

2 人工智能教育应用的核心服务能力

人工智能的教育应用千差万别，但是也总离不开前述四个要素。而其底层更是存在若干共性关键服务，这些服务应该是可以被复用的。一些学者从智能代理的角度阐述了这种复用，如吴永和^[20]提出了面向学生学习智能代理、面向教师教学智能代理、面向资源服务智能代理、面向教育管理者智能代理、面向家庭智能代理、面向整个教育的智能代理等。本研究提炼了工智能教育应用的核心共性服务，如表1所示。

表1 人工智能教育应用的核心共性服务

四深度学习是一种共性关键技术

如今，教育正朝着因材施教和个性化教学方向发展。因此，在本质上，研究者首要关注的任务是教学过程中的分类和聚类，包括对教师、学生以及学习资源的分类和聚类，而教师、学生以及学习资源这三类又都包含多种维度（如教师—教学风格、教学手段，学生—认知水平、学习风格、潜在学习需求，学习资源—认知水平、类型等），再根据分类结果进行相关的教学预测和行动。因此，分类是教育领域中人工智能的一个主要关注点。

深度学习在分类问题中发挥了重要的作用。深度学习是机器学习的一种方法，深度学习模型是含有多个隐含层的人工神经网络，该网络的输入是特征向量，输出可以是二元分类或者多元分类。深度学习算法优化求解人工神经网络多个层级间的链接权重，从而对海量大数据中错综复杂的特征建模。在网络的内部，每一层在前一层特征的基础上进行新的表征提取，从而建立事物的抽象特征模型。本研究提炼深度学习对表1中若干核心共性服务的作用，如表2所示。

表2 深度学习在教育领域的作用

目前，深度学习架构和算法已经有很多在特定领域和基准测试中表现优异。将这些成果移植到教育领域中需要做如下关键工作：①确定教育领域的问题域；②确定该问题对应的输入值特征向量；③确定是二元分类还是多元分类；④调优，由于深度学习中具有若干超参数，而目前超参数的选择尚未形成完备的理论化方法作为指导，故需在特定问题域中结合经验调整优化。

五机遇和挑战

1 机遇：AI应用门槛大幅降低，有利于领域研究者快速开始研究

AI新突破和AI民主化^[28]为快速推进AI在教育领域的深度融合应用提供了机会。近年来，深度学习在诸如计算机视觉、语音识别和自然语言处理等领域都取得了突破性进展，以深度学习为代表的AI技术快速进入大众视野。在这样的快速发展过程中，人们开始思考如何降低人工智能应用的门槛，并付诸于行动，这一行动被称为AI民主化。目前，微软认知服务、亚马逊的机器学习服务、Google人工智能服务、OpenAI以及Github上出现了越来越多的开源深度学习包，为软件工程师和研究人员提供了便捷，解决了传统人工智应用开发门槛高的问题。

2 挑战：隐私保护缺乏科学化

教育大数据的隐私保护缺乏科学化手段，导致围绕数据的研究不能快速健康发展。我们通常靠行政流程来确保数据保密性，但行政审批手段是从管理的角度来确保数据保密，而不能从科学的角度来确保数据保密。在利用科学的方法进行隐私保密方面，国外已经有了比较成熟的技术和策略。如HarvardX-MITx Person-Course De-Identified dataset^[29]应用K-anonymity^[30]方法作为一种数据隐私保护技术，其目的是在保护用户信息隐私的同时最大限度地提供有利于研究的信息。目前，我国教育领域还缺少这方面的应用经验，这将在很大程度上影响教育大数据的开发、开放和研究。

3 挑战：机器学习训练集缺乏大量的标记数据

虽然目前深度学习领域在不断尝试半监督甚至无监督等方法，来降低对大量标记训练数据的依赖，但使用标记数据作为训练集进行深度学习训练依然是主要的方法。比如图像识别领域的训练，有很多是基于数据集ImageNet^[31]来进行的。业界也认识到，领域对学习具有重要的作用，因此在教育领域开发相当数量的标记数据集，将成为未来人工智能教育应用研究的一项重要工作。

六结束语

“人工智能+教育”将是教育信息化发展的高级阶段。未来人工智能赋能的教育，将推动精细管理、精准测评、个性教学、因材施教走上新高度，在此过程中，关注和研究“人工智能+教育”的领域问题（包括应用领域、问题领域和技术领域的问题），以迎接由此而来的一系列挑战等，是不可缺少的。本研究分析了人工智能的发展概况，探究了教育人工智能的典型应用领域，提炼了人工智能教育应用的核心服务，指出教育人工智能面临的重大机遇是AI民主化，但关键的挑战在于数据的隐私与开放以及可供训练的语料数据集。

参考文献

[1]Luckin R, Holmes W, Griffiths M, et al. Intelligence unleashed: An argument for AI in education[R]. London: Person, 2016:18-19、51.

[2]U.S.National Science and Technology Council. The national artificial intelligence research and development strategic plan[R]. Washinton, US:National Science and Technology Council, 2016:10.

[3]House of Commons. Robotics and artificial intelligence[R]. London: Parliament 2016:12-16.

[4]Stone P, Brooks R, Brynjolfsson E, et al. Artificial intelligence and life in 2030[R]. Stanford, CA: Stanford University, 2016:3.

[5]Gelernter H. Realization of a geometry theorem proving machine[A]. Proceedings of the Computers & Thought[C]. Cambridge, MA, USA: MIT Press, 1959:137-152.

[6]Slagle J R. A heuristic program that solves symbolic integration problems in freshman calculus[J]. Journal of the Acm, 1963,(4):507-520.

[7]Evans T G. A heuristic program to solve geometric-analogy problems[A]. Koller H R. Proceedings of the Spring Joint Computer Conference[C]. London: Cleaver-hume Press, 1964:327-338.

[8](美)斯图尔特·罗素著,(美)彼得·诺维格著.殷建平译.人工智能:一种现代方法(第3版)[M].北京:清华大学出版社,2013:6-16.

[9]Halevy A, Norvig P, Pereira F. The unreasonable effectiveness of data[J]. Intelligent Systems IEEE, 2009,(2):8-12.

[10]Hays J, Efros A A. Scene completion using millions of photographs[J]. Communications of the ACM, 2008,(10):87-94.

[11]Hinton G E, Osindero S, Teh Y W. A fast learning algorithm for deep belief nets[J]. Neural Computation, 2006,(7):1527.

[12]Lecun Y, Bengio Y, Hinton G. Deep learning[J]. Nature, 2015,521:436-444.

[13]Kloft M, Stiehler F, Zheng Z, et al. Predicting MOOC dropout over weeks using machine learning methods[A]. Proceedings of the Empirical Methods in Natural Language Processing (EMNLP)[C]. Doha, Qatar: Association for Computational Linguistics, 2014:60-65.

[14]Chaudhri V K, Gunning D, Lane H C, et al. Intelligent learning technologies part 2: applications of artificial intelligence to contemporary and emerging educational challenges [J]. AI Magazine, 2013,(4):10-12.

[15]Bloom B S. The 2 sigma problem: The search for methods of group instruction as effective as one-to-one tutoring [J]. Educational Researcher, 1984,(6):4-16.

[16]VanLehn K. The relative effectiveness of human tutoring, intelligent tutoring systems, and other tutoring systems [J]. Educational Psychologist, 2011,(4):197-221.

[17]Janning R, Schatten C, Schmidt-Thieme L. Improving automatic affect recognition on low-level speech features in intelligent tutoring systems[A]. Proceedings of the Design for Teaching and Learning in a Networked World[C]. Switzerland:Springer,2015:169-182.

[18]Knight S, Buckingham S S, Ryan P, et al. Designing academic writing analytics for civil law student self-assessment [J]. International Journal of Artificial Intelligence in Education, 2016,28(1):1-28.

[19]Liu M, Rus V, Liu L. Automatic Chinese multiple choice question generation using mixed similarity strategy[J]. IEEE Transactions on Learning Technologies, 2017,(99):1-11.

[20]吴永和,刘博文,马晓玲.构筑“人工智能+教育”的生态系统[J].远程教育杂志,2017,(5):27-39.

[21]余明华,冯翔,祝智庭.人工智能视域下机器学习的教育应用与创新探索[J].远程教育杂志, 2017,(3):11-21.

[22]Carranza-Rojas J, Goeau H, Bonnet P, et al. Going deeper in the automated identification of herbarium specimens [J]. BMC Evolutionary Biology, 2017,(1):181.

[23]Self J. The defining characteristics of intelligent tutoring systems research: ITSs care, precisely[J]. International Journal of Artificial Intelligence in Education, 1998,10:350-364.

[24]Winebarger J，Stüker S, Waibel A. Adapting automatic speech recognition for foreign language learners in a serious game[A]. Proceedings of the 3rd Workshop on Games and NLP [C].Palo Alto, California, USA:AAAI Press, 2014:39-40

[25]Witt S M, Young S J. Phone-level pronunciation scoring and assessment for interactive language learning[J]. Speech Communication, 2000,(2):95-108

[26]Liu O L, Rios J A, Heilman M, et al. Validation of automated scoring of science assessments[J]. Journal of Research in Science Teaching, 2016,(2):215-233.

[27]科大讯飞.国家普通话智能测试系统[OL]. <http://www./content/details_27_726.html>

[28]Microsoft. Democratizing AI: For every person and every organization[OL]. <https://news.microsoft.com/features/democratizing-ai/#sm.00001ilndv6tq1dnqvln99h0adbfs#Tf5lXMWHLV2LIXe3.97>

[29]Mitx, HarvardX. HarvardX-MITx person-course academic year 2013 de-identified dataset, version 2.0[OL].

<http://dx./10.7910/DVN/26147>

[30]SWEENEY L. K-anonymity: A model for protecting privacy[J]. International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems, 2002,(5):557-570.

[31]Deng J, Dong W, Socher R, et al. Imagenet: A large-scale hierarchical image database[A]. Proceedings of the 2009 IEEE Conference on Computer Vision and Pattern Recognition[C]. Miami, FL, USA :IEEE,2009:248-255.