摘 要:软计算是当前人工智能领域的主要研究对象,是人工智能发展的基本技术支持,《应用软计算》是专门针对软计算技术的研究和应用而创立的一个国际性期刊。本文依托对《应用软计算》创刊以来发表论文的统计数据,介绍和分析了软计算的发展和趋势。
梁春华; 贺天平, 系统科学学报 发表时间:2021-10-15
关键词:《应用软计算》;模糊逻辑;进化;优化;人工神经网络
软计算是在人工智能的发展过程中诞生的一个新概念,由美国加州大学伯克利分校教授 ZADEHLA[1]提出。为了更清楚说明软计算表征的内涵,1996年 ZADEHLA教授[2]136-137将传统的计算称之为硬计算。与硬计算追求的严格、确定和精确相比,软计算求的是近似而非精确的解。
“软计算”这个概念不是特指具体的某一种算法,它是指求解复杂问题的一类算法,这类算法的共同特点都是通过模拟生物的感知、脑神经网络、进化或免疫过程,来处理日常生活中不确定、不精确、不完备的问题[3]i-ii。
正如 ZADEHLA教授多次提到的,“人类有一种非凡的能力,能够在不经过任何精确测量和计算的前提下,完成各种各样体力和脑力劳动”。比如,人类可以驾车在人流拥挤的城市中穿行;可以对一本书一个故事作一个精辟的总结。这些都是硬计算无法完成的,软计算却可以让机器具有这种能力。在大数据背景下软计算已经在人类生活中无处不在,智能家电、美颜相机、即时翻译、无人驾驶等都是软计算应用的实例。从某种意义上说,软计算是让机器在使用硬计算计算时,具有了与人类相似的思考、推理和决策的能力。
《应用软计算》(AppliedSoftComputing)是软计算研究与应用领域的重要国际期刊之一,是国际软计算学会的会刊,创刊于 2001年,由 Elsevier出版。该刊物主要发表软计算技术研究和应用的文章,所发表的论文涉及软计算研究的各个方面,研究的广度和深度都是同类期刊中首屈一指的,涉及的应用领域也是最广泛的[4],无论是投稿来源还是文章质量,都具有国际视野,能够代表近三十年来国际软计算发展历程和趋势。本文通过对该期刊创刊以来发表的论文进行深入的统计分析,揭示软计算的发展历程,探究软计算未来发展趋势。
1 软计算的兴起
20世纪 80年代随着人工智能的兴起,人们逐渐认识到世界的本质除了普遍性、确定性、线性之外,还具有偶然性、不确定性和非线性等特征[5],要实现真正的人工智能就必须让科学具有解决这些特征的能力。于是仿真模拟人类智能的各种计算应运而生,这些计算方法都不同于硬计算,没有既定的数学公式,没有准确的度量,也不追求精确的计算,这些计算方法将硬计算精确的数值表达用不精确、不确定的自然语言表达替代,从而解决传统数值计算难以处理的现实世界中的复杂问题。
这些智能计算都各自拥有独特的优势,比如:模糊计算主要是通过模拟人类思维的特点,在不精确、不确定的环境下让机器具有推理能力;人工神经网络是模拟了人类脑神经的功能,在计算过程中可以实现自我组织、自我学习,具有高度的容错和泛化能力;遗传算法模拟的是达尔文生物进化论中优胜劣汰的规律,能够在处理结构复杂、参数众多的问题中寻得全局最优解。
但是,在实际的研究过程中人们发现要实现让机器具有人类的智能,单一的某种计算方法都不足以完成,而是需要汇集各种与人类智能相关的算法资源。于是,ZADEH LA教授构思了软计算的概念,将模糊计算、人工神经网络、遗传算法组合成一个计算方法的集合体,并称之为软计算。
软计算是通过模拟人类大脑对事物进行识别、认知、推理和决策的过程,来对现实世界中普遍存在的不确定、不精确和局部真实的数据进行建模和计算。与硬计算追求的准确和精确不同,软计算对不准确、不精确的数据具有较高的容错能力。硬计算中对数据准确和精确的要求是以较高的运算成本为代价的,而软计算可以通过这种容错性成功地降低运算成本,达到更好的鲁棒性和可跟踪性。通过软计算方法建立的模型更接近客观事物本身,获得的结果也更容易让人类所接受。
软计算的提出为科学研究开辟了新的疆域,但也因挑战了传统硬科学的思维,在最初的发展中受到了很多阻力。1991年,在 ZADEHLA教授的主持下,加州大学伯克利分校启动了软计算伯克利计划(BerkeleyInitiativeinSoftComputingBISC),软计算成为了机器智能领域的重要计算方法。
2 分析对象的确定以及数据来源
国际期刊《应用软计算》提倡以软计算的综合观点来解决现实生活中的问题,主要发表各种软计算方法研究和应用的文章。据《期刊引用报告》数据显示,2018年该刊物的被引用率为 6.27,影响因子为 4.873,5年影响因子为 4.858,平均每篇论文资源标准化影响率(SNIP)为 2.369,SCImago期刊排名(SJR)为 1.308。如表 1所示,与其他同类或近似期刊相比,该刊物是最新的,但评价的各项指标均排名靠前,仅次于 KnowledgeBasedSystems和 InformationSciences这些顶级期刊。本文选择对《应用软计算》创刊以来 19年(2001—2019)所发表的5745篇研究论文进行统计分析,使用的数据主要来源有WebofScience、ScienceDirect和计算机科学文献库DBLP(DataBasesystemsandLogicProgramming)。
软计算是一类计算方法的集合体,这个集合体是一个开放的概念,随着智能计算的不断发展,组成这个集合体的成员也在不断地增加。而且,软计算的应用也很广泛,几乎涉及了现代生产和生活的各个方面,很多时候这些应用并不是单一的某种软计算研究的结果,而是软计算中多种计算方法共同研究的结果,这些因素都给统计带来了很大的难度。
本文通过对期刊 2001—2019年期间所发表的5745篇论文的 26445个关键词进行统计,发现关键词种类可达 1万多种,由此,也可证实《应用软计算》期刊研究领域的广泛性。
在统计中,认为某一关键词出现的频次越高,与之相关的论文数也越多,表明该领域的研究越热门,也越能代表软计算发展的状况。表 2列出的是在期刊所发论文总数中占比为 2%以上的关键词种类,本文就选取这些领域的论文进行分析统计。
除表 2所列关键词之外,还有一些关键词出现频次相对也比较多,但占比没有达到 2%,所以没有罗列 出 来,如:immune(免 疫)、decomposition(分解)、roughset(粗糙集)、reinforcementlearning(强化学 习)、principalcomponentanalysis(主 成 分 分析)、faultdiagnosis/detection(故障诊断/检测)、patternrecognition(模式识别)、case-basedreasoning(案例推理)、self-organizingmap(自组织映射)、wavelettransform (小波变换)、wirelessSensorNetworks(无线传感器网络)、bigdata(大数据)等。
这些因素会给统计带来一定的误差,但由于这些关键词大多属于软计算的应用领域,占比不高,所以不影响整体统计分析的结果。另外,在统计过程中发现,这些关键词相关论文的发表时间都在最近几年,也说明了软计算研究和应用的领域在不断扩展,这些方向将来也可能成为软计算研究的重要领域之一。
3 期刊论文发表和研究方向的统计
《应用软计算》期刊创刊于 2001年,2004年该期刊被科学引文索引(SCI)收录,从 2007年开始该期刊发表论文数突破 100篇。在 2011年期刊发表的论文数得到了一个井喷式的上升,如图 1所示,2012年回归正常,每年发表的论文数都在不断增长。这表明软计算发展一直是一个平稳上升的趋势。
从研究方向上看,模糊计算的研究,从创刊以来发表的论文数一直都是最多的,优化算法的论文数增速是最快的,神经计算的论文数在 2008—2011年增长幅度较大,此后增幅平稳。
从表 3中可以看出,在 2016—2019年期间优化算法发表的论文数远高于其它研究方向。说明优化算法是近几年软计算研究的热门方向。从广义上讲,进化算法也是一种优化算法,它是通过模拟生物生存进化的原则,对算法策略的一种优化。而遗传算法、元启发式算法也是优化算法的一种。这样,如果把这些算法整合在一起,优化算法无疑是发表论文数最多的,是软计算研究中的主要方向。
所以,模糊计算、优化算法、神经计算作为软计算的三个主要成员,仍是软计算研究的重点,而近几年尤以优化算法的研究较多。本文也对这三个研究方向展开进一步统计分析。
除了这三个研究方向之外,模拟退火作为较早出现的一种算法,并没有受到研究者的追捧。而分类、搜索、决策、调度是软计算的应用,这些方向的论文数增长速度比较快,说明软计算已经从单一的理论研究转向了理论和应用的双重研究模式。理论研究为应用研究提供了理论依据,应用研究反过来为理论研究提供了实证,并且开拓了新的研究方向。向量机、机器学习、混沌理论和人工免疫,这些新研究方向正逐渐成为软计算下一个研究热点。
3.1 模糊计算
在现实生活中我们遇到的问题一般都会以一种模糊的语言方式来表达,例如,这辆汽车开得很快,一下子冲到了花池里;这个人是个高个子,但是他很胖;这位女士长得很漂亮;等等。类似于这样的表达,人们很难用精确的数值去衡量。这里的“很快” 是多快?多高是“高个子”?多重是“胖”?什么数值是“漂亮”?在生活中高与矮、胖与瘦、美与丑之间并不能明确地划分,当判断某人是否是“高的” “胖的”“美的”的时候,会因为判断者判断的标准不同而得到不同的答案,这就是一种模糊的、不精确的、不确定的输入。模糊计算就是用来解决这些问题的新方法,它是由 ZADEHLA教授[6]提出的。
一个完整模糊计算系统其功能包括模糊逻辑的确定、模糊数的生成、模糊集合的建立以及模糊规则库的制定。一个模糊计算通常需要经过三个阶段:模糊化、处理和去模糊化[7]。模糊化就是根据输入的模糊信息属性构建合适的隶属函数,通过隶属函数生成相应的隶属值,组成模糊集的过程;处理过程就是根据规则库中的规则将模糊信息转化为模糊结论的过程;去模糊化就是要从模糊结论中得到一个精确的结果。
从表4中可以看到,模糊系统在模糊计算的理论研究中占有的比例,远远高于其他研究,是理论研究的重点;模糊逻辑、模糊集和模糊规则的文章占比相差不大,作为模糊系统的重要功能模块,三者以微弱的优势平分秋色,为模糊系统的进一步发展,打下了基础。
在应用研究中,模糊建模、模糊决策、模糊聚类和模糊控制是模糊计算应用最多的领域,而且事实也已证明,它们已经成功地应用到了各个行业当中,如:工业自动控制系统、医疗行业的诊断系统、系统分析、信息处理、模式识别、地质勘探、气象预报和管理决策等都有相关的论文发表。
3.2 优化算法
优化算法是一个算法簇,它包含很多种算法,每种算法都是受大自然生物进化的启发,采用“优胜劣汰”的原则寻找全局最优解。
经过统计得到,在《应用软计算》各种优化算法发表的总论文数有 1881篇,占期刊总发表数 5745的 32.74%。其中,关于遗传算法的论文有 390篇,粒子群优化的论文有 336篇,两种算法发表的论文数遥遥领先其他算法。遗传算法是 1975年由美国密歇根大学的 HOLLANDJ教授提出的。它是基于自然选择和遗传的搜索和优化算法,是一种比较早的优化算法,也是最常用的一种算法。
与遗传算法一样,粒子群算法也是过程优化中最常用的算法之一。粒子群算法和其他算法相比,运算过程中参数的调整要少些,产生局部最优问题的几率更小些,更容易得到全局最优解,而且对硬件资源的消耗也小。
除以上两种优化算法外,还有一些其他算法发表的论文数也相对较多,比如,多目标优化、人工蜂群优化、蚁群优化、元启发式算法、萤火虫算法发表的论文分别有 150篇、102篇、84篇、62篇和 30篇。
由于优化算法提出的是一种计算的思路和框架,所以在求解复杂系统的优化问题时,不会因为问题所属领域而受到限制,因此,能够被广泛应用于各个行业中,发表的论文涉及机器检测诊断优化、石油勘探、工程建筑、图像处理、车间调度、风电系统、矿业开采、网络协议的改进、软件测试等。
3.3 人工神经网络
人工神经网络是模拟人类脑神经系统结构和功能的一种计算模型。早在 1943年,麦卡洛克和皮茨就提出了第一个模拟人类大脑的神经元模型,这种模型把单个神经元等价于一个计算单元,每个计算单元通过一些带有权重的线连起来组成一个层次化的网状结构。其中,权重的值代表了相互连接的两个神经元之间作用的强度,强度不同神经元的活跃度就不同,权重值越大,神经元越活跃。但是,麦卡洛克和皮茨的这个模型中间层的权重值都是提前定义好的,不能通过训练改变也没有自我学习的能力,只能做一些简单的运算。
1949年,心理学家 HEBB提出了 Hebb学习规则,认为生物神经系统中连接神经元的强度是可以随学习而改变的。此后,如何让人工神经网络实现动态调整权重值,从而让机器具有学习的能力,成为了人工神经网络研究的重点,由此而产生了各种类型的人工神经网络。
统计发现,期刊发表人工神经网络的文章有426篇,涉及的类型有卷积神经网络、递归神经网络、深层神经网络、概率神经网络、RBF(径向基)神经网络、多层感知器神经网络、脉冲耦合神经网络、粒神经网络等十几种。研究神经网络学习算法的论文有 360篇,其中机器学习 64篇、深度学习 22篇、强化学习 30篇。神经网络与模糊计算、进化计算、免疫计算等结合应用的论文有 131篇。三类论文加起来有 917篇,占期刊总发表数5745篇的 15.96%。
由此可以看出,人工神经网络也是软计算研究的重要领域。另外,通过人工神经网络模拟人脑认知结构的各种学习算法成为了由人工神经网络衍生出的一个重要研究方向。
其次,通过增加网络层数构造的深层神经网络,让机器具有了更好的学习、认知和获得抽象概念的能力,这也使得神经网络研究迎来了又一个高潮时期。
再次,人工神经网络计算模型的应用更多的是与软计算中其它智能计算方法的融合,而且这种应用效果已经在很多领域取得了实证,如信号处理、模式识别、计算机视觉、自然语言处理、优化计算等领域。
4 论文发表国家及科研机构统计
4.1 国家和地区
美国是科研大国也是软计算的发源地,从表 5可以看出,在 2001—2003年美国对软计算的研究还处于绝对的领先地位,但在 2004—2007年期间,印度发表的论文数已经赶超美国,成为软计算研究的主要国家,这期间中国发表的论文数也仅次于英国,排名第四。在 2008—2011年间,印度、中国、伊朗发表的论文数已经远远超过了美国,软计算的研究在发展中国家得到了突飞猛进的增长。
正如 ZADEHLA在 1984年接受的一次采访时谈到的:“当美国还在怀疑和质疑软计算概念的时候,在 东 方 国 家,人 们 更 愿 意 接 受 这 种 新 的 理念。”[8]这使得软计算在这些国家能够得到快速发展。从 2012—2015年开始,中国、印度、伊朗、中国台湾已经稳居软计算研究的前四,截止到 2019年本文统计数据时,中国以 1273篇论文遥遥领先稳居第一,中国已成为软计算研究最多的国家。
4.2 研究机构和多产作者
目前软计算研究的主力仍然是各大院校和研究所。统计选择《应用软计算》创刊以来发表论文数最多的前 20个研究机构,其中,中国、伊朗、印度入围的研究机构数位列前三,各机构发表的论文数和占比如表 6所示。
从统计结果可以看出,发表论文最多的这些研究机构几乎都是亚洲国家,亚洲成为了软计算研究的重要阵地。
在多产作者的统计中,如表 7所示,发表论文最多的是加拿大阿尔伯塔大学的 PEDRYCZW 教授,1980年博士毕业于波兰 SilesianTechnical大学,长期从事软计算的研究,尤其对混和智能系统的学习、知识挖掘与表达领域的研究做出了重要贡献。PEDRYCZW教授多次来中国做学术报告,与很多中国学者有研究合作,对中国软计算的发展有很大的帮助。
在发表论文数最多的前十名作者中,中国作者有四位。依据高引指数(h-index),徐泽水教授的高引指数是 89,排名第一;焦李成教授排名第三;公茂果教授排名第六;高亮教授排名第七。中国的这几位教授分别在决策分析、模糊数学、优化算法、模式识别、图像智能感知、数据挖掘等领域表现突出,具有很高的国际影响力。
这说明软计算研究的热度在发展中国家,中国做为软计算研究人员较多的国家,对软计算的发展起到了很大的促进作用。
结论
本文以国际期刊《应用软计算》为载体,对软计算的发展和研究做了深入的分析统计,从总体上看,统计的结果和我们对软计算已有的了解是一致的。经过近 30年的发展,软计算方法已经成功地应用到了许多领域,为这些应用领域带来明显的效益,也极大地影响了人类工作和生活的方式。
纵观软计算的发展历程,软计算可以看作是一种新的计算思维,是解决复杂系统问题的一种指导原则,也是多种学科共同发展的产物,随着人类对自然界生物系统的深入了解,软计算的成员会越来越多,软计算也将会取代硬计算成为最主要的计算。而且,软计算的发展也会成为发展中国家科技强国的试金石。