这篇软件工程师论文发表了数据挖掘技术对软件工程的应用,如今面对大量的数据信息,数据挖掘功能就显得尤为重要,这项技术应运而生,在当前的社会发展背景下,规模不断壮大,论文探讨了数据挖掘技术所采用的方法,以及数据挖掘技术在具体的使用中面临的问题。
摘要:我们如今的生活会遇到大量的信息,一方面人们随时随地可以查阅相关信息但是另一方面不利于人们来进行分门别类和快速的获得主要信息,数据挖掘技术的使用使人们能够段时间内完成信息的处理。本文首先介绍了数据挖掘技术的含义和包括的方法,然后阐释了数据挖掘技术的应用情况并对它面临的问题进行了分析。
【关键词】软件工程师论文,数据挖掘技术,软件工程,应用
社会的发展使得技术也得到了快速发展,信息技术营运而生,并且被人们广泛的应用于机械、医疗、化工和教育等领域,发挥着越来越重要的作用。在当前社会的发展背景下,信息技术中的软件工程虽然发展规模不断扩大,但是在技术上已经不能满足对资源管理的要求,而数据挖掘技术的到来弥补了软件软件工程的不足,促进了软件工程的进一步发展
1数据挖掘技术的简介
1.1数据挖掘技术的含义
所谓数据挖掘,主要指的是在大量的数据信息中利用科学、有效的算法第一时间获取到有用信息的筛选过程。大量的信息存在于生产和生活领域,使得人们在处理事情是无从下手,这样大大降低了人们的工作效率,也浪费了工作人员宝贵的时间。而这一问题通过数据挖掘技术的使用得到了很好的解决
1.2数据挖掘技术所采用的方法
在具体的操作中,数据挖掘技术会通过很多方法来使任务得以完成。具体的方法有如下几种:1.2.1遗传算法的使用所谓遗传算法,主要是指基于生物自然选择与遗传激励的随机搜索算法,也是数据挖掘技术常用的一种操作方法。遗传算法的有点就在于表面上看似无联系的事物,却能在事物模型间建立相关的练习,实现事物之间共同发展,现在生物界越来越重视的遗传基因等的研究,所以这种方法很受人们的欢迎。1.2.2采用决策树方法这种方法主要用于对信息的分类和整合,在遇到大量的信息的时候,能够在短时间内找出关键的信息,能够使信息分类的快速化和简单化,并且保证了信息分类的准确度,但是此方法的不足之处就在于具有较差的抗噪性能,不能全面的来表述较为复杂的概念。1.2.3采用统计分析法往往会利用回归分析和主成分分析等方法来分析数据库字段之间的关系。在字段之间的关系包括相关关系,函数关系也是其中的一种,不同的是函数关系可以用公式来表示,而相关关系则不能通过公示来表示关系,系统分析法的使用为这种关系的分析提供了便利。1.2.4采用可视化技术可视化技术是采用一些图表来对数据进行表现,便于对数据的理解,比如,使用简单图形来展示存在于数据库中的多个数据,使研究者看起来一目了然,使单调的数据形象化,更容易掌握数据的相关信息。1.2.5采用神经网络方法它模拟人脑神经元结构,以MP模型和Hebb学习规则为基础,用神经网络连接的权值表示知识,其学习体现在神经网络权值的逐步计算上。前馈式网络、反馈式网络和自组织网络是常用的三种神经网络模型,分别用于预测、联想记忆和聚类等。
2软件工程中数据挖掘技术的应用表现
2.1用于软件项目管理方面
软件项目的管理呈现出复杂化和系统化的特点,数据挖掘技术应用于软件项目管理一方面表现在对组织关系的挖掘,比如公司举办年会等大型活动,在人员的分配上如果处理不好,就会出现混乱的局面,为了实现人力资源的合理配制,往往采用数据挖掘技术来区分每个职员的职责,实现项目管理的有序化,提高了办事效率;软件项目管理中使用数据挖掘技术的另一个方面就是挖掘版本控制信息,在此系统面临外系统入侵时提出警告是数据挖掘技术所具备的功能之一,除此之外数据挖掘技术可以检测该系统的修复情况,版本控制信息的作用就是方便了人们对版本信息的查看,而数据挖掘技术的使用为系统的安全运行提供了更有利的保障,使得软件项目的管理水平逐步提高。
2.2漏洞的检测时数据挖掘技术的使用
当数据挖掘技术用于检测软件的漏洞时,第一步要弄清楚要检测什么样的软件,第二步就是要制定合理的计划,计划的目的是为了更好的对软件进行检测,不同软件的构成和性质决定了检测要采用不同的方式,紧接着就是对漏洞库中的数据进行整理,对于不需要的数据进行清除,除此之外对于丢失的项目要采取措施补救回来,用数值表示来代替数据属性。另外,要对合适的数据模型进行验证,不同的项目会采取不同的方法,重要的是选择合适的发掘方式来使其形成测试集,进而可以对全部的结果进行比较,通过比较找出最满意的方式,数据挖掘技术的应用不见可以检测漏洞还可以对未知的漏洞进行防护,并且把漏洞的种类进行分析,整合出修复的方法,能使的在第一时间找出漏洞并进行修复,使得软件能够保持良好的性能,使其运行速度不至于减慢。
2.3挖掘程序代码和结构中数据挖掘技术的使用
在挖掘程序代码和结构方面比较常用的一种数据挖掘方法就是克隆代码检测法,该方法分为度量、文本对比、程序结构和标识符对比这四种方法,四种方法各有各自的特点,具体的运用中需要考虑实际情况来确定到底使用那种方法。克隆代码检测通常会复制粘贴某一个代码,在特殊的要求下,会根据需求来改正某些代码,检测这些代码主要是为了防止大面积出现故障,维护系统的安全,为软件运行提供一个可靠的环境。另一个常见的就是Aspect的挖掘,Aspect的挖掘就是常见说的横切关注点挖掘。软件工程中面向方面软件的改造需要解决好Aspect的挖掘,虽然可以采用大量的方式来解决这个问题,但是最重要的方法之一就是度量分析法。
3数据挖掘技术在具体的使用中面临的问题
3.1数据复杂化
目前的软件工程数据主要包括结构化和非结构化两类数据。非结构化数据包括软件代码,结构化数据则跟软件的版本信息有关,非结构化数据和结构化数据之间联系密切,因此在使用数据挖掘技术的时候,要对着两种数据的关系进行考虑,这就增加了挖掘技术使用的难度。
3.2评价标准不一致
生产生活中很多领域都在使用数据挖掘技术,在使用后对它的结果也采取了一定的评价方法,但是往往这些方法不能一致,在软件工程中也很难统一评价标准,因为在软件工程中出现的信息一般比较复杂,而且往往通过不同的方法来表达,所以获取者在进行信息比较时候,面临很大的苦难,所以导致不能准确的对数据挖掘结果进行分析。
4结论
总而言之,时代的发展越来越离不开数据挖掘技术的使用,这项技术很大程度上满足了人们的需求,受到越来越多的重视,经过本文的论述之后,可以得知数据挖掘技术不仅使软件工程更加完善,而且使人们学会用新的方式来获得信息,虽然书籍挖掘技术在实际的应用中会因为软件项目的数据复杂等原因会面临一些挑战,但是科技也在不断进步,相信未来,数据挖掘技术会得到更广泛的应用。
参考文献
[1]陈建桦.数据挖掘技术在软件工程中的应用研究[J].硅谷,2014(01):11-12.
[2]姚文涛.试论软件工程中数据挖掘技术的应用[J].河南科技,2014(23):45-46.
[3]雷蕾.关于数据挖掘技术在软件工程中的应用综述[J].电子测试,2014(02):19-20.
作者:王希军
推荐期刊:《计算机工程与设计》(月刊)创刊于1980年,由中国航天科工集团第二研究院706所主办,是中国计算机学会会刊、北京计算机学会会刊和中国宇航学会会刊,是全国中文核心期刊、中国科技核心期刊。