配色: 字号:
人工智能与数据的学术研究分析报告
2017-08-12 | 阅:  转:  |  分享 
  
人工智能与数据的学术研究分析报告ArtificialIntelligenceandDataResearchReport方建勇1(余姚浙江315400)[摘要]无论在产业界,还是在大众媒体报道中,人工智能大热。对于学界来说,我们还是要保持一个平常心,毕竟这不是一个学界可以炒作的概念,尽管大家对人工智能的未来充满期待。人工智能有两个重要的基础因数来支撑,一是大到足够充分的数据,尽管数据是需要不断积累的,包括自然数据,也包括经验数据;二是算法,在不同应用领域,加上数据样本空间的量级差异,不同算法表现出来的各种效能也是有差异的。本文主要针对人工智能与数据相结合的领域,分析了

学术界历年来的总体研究状况,以期在广度与深度上对该领域的研究分布作一个概要性的陈述。[关键词]人工智能数据算法学术研究分析报告[Abstract]Whetherintheindustry,orinthemassmediareports,artificialintelligencehot.Fortheacademiccommunity,westillhavetomaintainasenseofbalance,afterall,thisisnotasocietycanspeculationconcept,althougheveryoneonthefutureofartificialintelligencefullofexpectations.Artificialintelligencehastwoimportantbasicfactorstosupport,oneislargeenoughtofulldata,althoughthedataistheneedtocontinuetoaccumulate,includingnaturaldata,includingempiricaldata;thesecondisthealgorithm,indifferentapplications,plusdataThemagnitudeofthesamplespaceisdifferent,andtheperformanceofthe

differentalgorithmsisdifferent.Thispapermainlyfocusesonthefieldofartificialintelligenceanddata,andanalyzestheoverallresearchstatusofacademiccirclesovertheyears,withaviewtomakingasummarystatementonthedistributionofresearchinthisfieldinbreadthanddepth.[Keywords]Artificialintelligence;Data;Algorithm;Academicresearch;Analysisreport1引言

1方建勇男,1978年生,1998年考入浙江大学数学系,中国工业与应用数学学会会员,中国物流学会会员,资深IT项目经理,资深IT工程师,资深DBA(大型数据库管理员),浙江大学历史系硕士研究生学历,浙江大学数学与应用数学专业本科毕业,理学学士学位。

无论在产业界,还是在大众媒体报道中,人工智能大热。对于学界来说,我们还是要保持一个平常心,毕竟这不是一个学界可以炒作的概念,尽管大家对人工智能的未来充满期待。人工智能有两个重要的基础因数来支撑,一是大到足够充分的数据,尽管数据是需要不断积累的,包括自然数据,也包括经验数据;二是算法,在不同应用领域,加上数据样本空间的量级差异,不同算法表现出来的各种效能也是有差异的。本文主要针对人工智能与数据相结合的领域,分析了学术界历年来的总体研究状况,以期在广度与深度上对该领域的研究分布作一个概要性的陈述。2概述人工智能(ArtificialIntelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个

分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,可以设想,未来人工智能带来的科技产品,将会是人类智慧的“容器”。人工智能可以对人的意识、思维的信息过程的模拟。人工智能不是人的智能,但能像人那样思考、也可能超过人的智能。人工智能是一门极富挑战性的科学,从事这项工作的人必须懂得计算机知识,心理学和哲学。人工智能是包括十分广泛的科学,它由不同的领域组成,如机器学习,计算机视觉等等,总的说来,人工智能研究的一个主要目标是使机器能够胜任一些通常需要人类智能才能完成的复杂工作。但不同的时代、不同的人对这种“复杂工作”的理解是不同的。

2人工智能是科学技术发展的最新成果,其发展依靠相关的云技术和大数据技术的日渐成熟。33各类型学术发展趋势分析超星发现系统收录的人工智能与数据历年发表的中文学术成果,总量为18,641篇,其中包括图书198册、期刊7235篇、报纸262篇、学位论文7098篇、会议论文983篇、标准2个、专利576项、音视频31个、科技成果1389项、年鉴37篇、法律法规7篇、案例3篇、信息资讯797篇、特色库23篇。按发表的时间段来看,2017年1761篇

4、2016年2074篇、2015年1198篇、2014年1011篇、2013年1020篇、2012年919篇、2011年1036篇、2010年913篇、2000-2009年6556篇、1990-1999年939篇、1989年以前1214篇。2参见百度百科人工智能词条。3马臻,车雨霏(武汉大学信息管理学院):《大数据技术在人工智能中的应用研究》[J],消费导刊2016第5期。

4为方便起见,这里单位统一为篇。

自1979年第一篇期刊论文收录以来,1984年收录了第一篇会议论文,表明学界开始在会议上对人工智能与数据这个研究课题进行讨论,1985年收录了第一篇学位论文,表明这个课题已经进入到高校研究群体当中,1989年诞生了人工智能与数据研究领域的第一个科技成果和2项专利。1999年是个分水岭,在这一年里,有两项人工智能与数据领域的标准诞生,期刊论文数量首次年度突破100篇,达到了106篇。2002年,人工智能与数据领域的学位论文首次年度突破100篇,达到了117篇,随后出现爆发性增长,2006年至2015年学位论文每年都超过500篇,其中在2011年达到年度峰值的626篇,2016年有所下降,达到361篇,2017年截至发稿时为270篇,表明学界对人工智能与数据领域的研究热度自2016年以来下降很多。学术研究热度晴雨表的一个领先指标,是会议论文的数量,2007年、2008年和2009年发表的会议论文数量分别为91篇、97篇和92篇,从整体上来看,这是会议论文最为高产的三年,随后年发表数量陆续锐减,2010年

35篇、2011年78篇、2012年48篇、2013年55篇、2014年28篇、2015年15篇、2016年18篇,2017年截至发稿时为23篇。与会议论文和学位论文发表数量发展趋势形成鲜明对照的是,期刊论文、专利和报纸在2016年、2017年出现井喷态势,这些短、频、快的学术成果应为政府和媒体的推动有重要关联,2016年期刊论文数量翻番,突破1000篇,达到1172篇,2017年截至发稿时为1523篇;2016年专利数量同样翻番,突破100项,达到181项,2017年截至发稿时为235项;2016年报纸发表量翻两番,达到107篇,2017年截至发稿时为121篇。表1人工智能与数据各类型学术发展趋势

"人工智能""数据"-各类型学术发展趋势曲线序号年份图书(数量)期刊(数量)学位论文(数量)会议论文(数量)专利(数量)标准(数量)报纸(数量)科技成果(数量)11979010000002198002000000319810500000041982000000005198304000000619840110300007198501611000081986030080000

91987028040000

4关键词分析表2人工智能与数据关键词频次分析表频次区间关键词(频次)3000以上人工智能(3163)

10198803016000011198902817200112199003101000001319910494170000141992144390000151993035213200416199406421810001719951607111003181996180241600031919970571312000720199819128246005211999110635842015

222000511130143002423200141676215100572420023156117262005825200341731805312003426200442102522580042272005321935950701502820069224544501101432920071226057391900483020081031052997200053312009113195989217002932201023280501351600413320111424962678170042

342012925354448330016352013932455855450083620141533150228550910372015144945061578023538201617117236118181010703920172215232702323501210

1000-2999数据挖掘(1652)500-999专家系统(727)、神经网络(722)200-499故障诊断(462)、支持向量机(397)、遗传算法(374)、机器学习(363)、粗糙集(352)、关联规则(314)、数据库(295)、人工神经网络(280)、模式识别(257)、数据仓库(254)、聚类(241)、Bp神经网络(229)、人工智能技术(206)100-199物联网(198)、数据挖掘技术(177)、知识发现(176)、特征提取(172)、决策支持系统(172)、决策树(161)、知识库(150)、属性约简(150)、人脸识别(148)、继电保护(144)、系统设计(138)、信息技术(132)、聚类分析(129)、贝叶斯网络(129)、分类(128)、信息系统(125)、电力系统(124)、本体(120)、图像处理(119)、预测(116)、虚拟现实(116)、特征选择(116)、数据

处理(114)、决策支持(107)、系统研究(106)、智能化(105)、云计算(104)、计算机应用(101)87-99数据采集(92)、互联网(90)、入侵检测(87)87以下未统计

图1人工智能与数据关键词频次泡型图

5作者机构分析表3作者机构频次分析表频次区间作者机构(频次)400以上浙江大学(423)300-399华中科技大学(372)200-299吉林大学(295)、中国科学院(257)、电子科技大学(228)、重庆大学(227)、哈尔滨工业大学(220)、北京航空航天大学(214)、武汉大学(203)150-199上海交通大学(194)、华南理工大学(190)、西安交通大学(190)、东北大学(173)、西安电子科技大学(166)、合肥工业大学(153)

100-149华北电力大学(145)、大连理工大学(143)、西南交通大学(138)、东南大学(135)、山东大学(135)、天津大学(132)、中国科学技术大学(130)、中山大学(130)、北京科技大学(128)、北京工业大学(125)、中南大学(122)、南京理工大学(114)、清华大学(113)、北京交通大学(113)、武汉理工大学(109)、南京大学(103)、安徽大学(100)70-99北京理工大学(97)、哈尔滨工程大学(97)、南京航空航天大学(97)、厦门大学(96)、北京邮电大学(92)、湖南大学(90)、复旦大学(88)、广东工业大学(87)、同济大学(85)、四川大学(82)、江南大学(79)、北京大学(76)、上海大学(76)、西北工业大学(74)、华中理工大学(73)、中国地质大学(武汉)(71)、燕山大学(70)70以下未统计

6作者分析表4作者发表篇数分析表篇数区间发表作者(篇数)50以上张天序(56)30-49董金祥(38)、李德华(37)、田金文(37)、潘云鹤(33)20-29柳健(29)、郑南宁(28)、王磊(25)、孔繁胜(25)、彭嘉雄(23)、吴飞(21)、胡汉平(21)、何志均(21)、田雨农(21)、刘伟(20)、陈奇(20)

13-19张燕平(19)、庄越挺(19)、桑农(19)、丁明跃(19)、王伟(18)、张伟(18)、汪国有(18)、史忠植(17)、俞瑞钊(17)、王刚(16)、杨静(16)、张铃(16)、王军(15)、张勇(15)、张莉(15)、刘静(15)、刘波(15)、李强(14)、王鹏(14)、吴涛(14)、黄厚宽(14)、熊范纶(14)、李伟(13)、王勇(13)、李军(13)、张敏(13)、李斌(13)、刘勇(13)、张涛(13)、刘洋(13)、张超(13)、郭涛(13)、王士同(13)13以下未统计7学科分类统计人工智能与数据-中文学科分类统计序号名称数量1工业技术9506

2经济13143文化、科学、教育、体育5684交通运输4495医药、卫生4146天文学、地球科学3857数理科学和化学3028农业科学1889航空、航天11310环境科学、安全科学8611社会科学总论7712政治、法律7613生物科学7614语言、文字61

15军事5616哲学、宗教5117自然科学总论4318艺术2319文学620历史、地理521综合性文献18刊种统计人工智能与数据-刊种统计序号名称数量

1模式识别与人工智能6822计算机科学1123计算机工程与应用784计算机研究与发展645吉林大学学报(工学版)596华中科技大学学报(自然科学版)567数据采集与处理558计算机工程499计算机应用4710中国计算机报4411计算机应用研究4312计算机学报3913智能系统学报35

14电脑知识与技术3515计算机工程与设计3516计算机与数字工程3517金融电子化3518计算机技术与发展3419小型微型计算机系统3320通信产业报3021IT经理世界2822电脑知识与技术(学术交流)2823软件学报2624中国图象图形学报2625中国金融电脑2626现代电子技术26

27计算机辅助设计与图形学学报2628通信世界2629黑龙江科技信息2530中国信息化2531中国传媒科技2532红外与激光工程2533微电子学与计算机2334计算机光盘软件与应用2235青年记者2136电子世界2137福建电脑2138中国经济信息2139科学导报20

40计算机应用与软件2041计算机测量与控制20

42微计算机信息2043信息化建设1944科技资讯1945信息与电脑(理论版)199发表机构地区统计人工智能与数据-地区统计序号名称数量1江苏省9622湖北省6893上海市9004陕西省684

5四川省6346浙江省6217辽宁省5868广东省5809安徽省46110吉林省45111黑龙江省44012山东省41913重庆市35514湖南省32315天津市29616河北省23517福建省213

18山西省18819河南省17720江西省16721云南省13422广西壮族自治区12123甘肃省10724贵州省5325内蒙古自治区4826新疆维吾尔自治区3727宁夏回族自治区1228青海省629海南省430西藏自治区110核心期刊统计

人工智能与数据-核心期刊统计序号名称数量1中文核心期刊(北大)24722CSCD中国科学引文库(中科院)22433统计源期刊(中信所)22144EI工程索引(美)7665CSSCI中文社科引文索引(南大)1506SCI科学引文索引(美)611扶持基金统计人工智能与数据-扶持基金

序号名称数量1国家自然科学基金项目10472省市基金项目5753科技部国家科技计划项目2444国家教育部基金1725国防部国防科技基金项目326国家社会科学基金项目287其他基金项目138中国科学院基金项目112结论统计发现,关键词前5名依次人工智能(3163)、数据挖掘(1652)、专家系统(727)、神经网络

(722)、故障诊断(462);作者机构前5名依次是浙江大学(423)、华中科技大学(372)、吉林大学(295)、中国科学院(257)、电子科技大学(228);作者前5名依次是张天序(56)、董金祥(38)、李德华(37)、田金文(37)、潘云鹤(33);学科前5名依次是工业技术(9506)、经济(1314)、文化科学教育体育(568)、交通运输(449)、医药卫生(414);刊种前5名依次是模式识别与人工智能(682)、计算机科学(112)、计算机工程与应用(78)、计算机研究与发展(64)、吉林大学学报(工学版)(59);发表机构所在地区前5名依次是江苏省(962)、湖北省(689)、上海市(900)、陕西省(684)、四川省(634);核心期刊类前5名依次是中文核心期刊(北大)(2472)、CSCD中国科学引文库(中科院)(2243)、统计源期刊(中信所)(2214)、EI工程索引(美)(766)、CSSCI中文社科引文索引(南大)(150);扶持基金前5名依次是国家自然科学基金项目(1047)、省市基金项目(575)、科技部国家科技计划项目(244)、国家教育部基金

(172)、国防部国防科技基金项目(32)。

这份人工智能与数据学术研究的分析报告,包含了目前工智能与数据中文类学术研究几乎可查到的所有元数据的大集合,代表了工智能与数据中文类学术研究情报的最前沿,希望能对产业界或者相关学者有一定借鉴意义。参考文献:1超星发现系统[EB/OL].http://www.chaoxing.com/2百科百科[EB/OL]..https://baike.baidu.com/item/人工智能/9180?fr=aladdin

献花(0)
+1
(本文系方建勇首藏)