异常检测方法在网络入侵检测过程中可以检测出那些未知的攻击,它大多数采用的建模方式都是基于机器学习之上的。在机器学习阶段,理论上为了达到比较理想的检测效果,需要对大量和合适的训练样本集进行训练。但是,在实际的网络中,大量和合适的训练样本集的截获是相当困难的。这样就要求能够实现在少量样本的情况下获得比较理想的检测效果。
《现代计算机》杂志(专业版)致力于营造一个融洽的学术交流平台,助您在学业、事业上更上一层楼。本刊已被以下数据库全文收录:中国学术期刊综合评价数据库、中国期刊全文数据库、方数据库、中文科技期刊数据库、中国核心期刊(遴选)数据库。
1基于向量机(SVM)主动学习算法的网络入侵检测过程
下面本论题将研究一种基于SVM主动学习算法的网络入侵检测的具体过程。通关过分析可知基于SVM主动学习算法的网络入侵检测系统的功能模块应该包含数据采集模块、特征提取模块、向量化处理模块、支持向量库模块、SVM训练模块、SVM检测模块和系统响应模块等。具体的过程为数据采集模块从网络中采集网络数据流,然后将这些数据流传送给特征提取模块,特征提取模块进行特征提取处理,发送给向量化处理,向量化后的样本可以作为分类样本和预分类样本分别传给支持向量库和SVM检测模块,接下来分类样本中的正确样本就可以进行SVM训练,不正确的样本收到SVM检测,做出系统响应等响应。
网络论文:《网络科技时代》本刊坚持为社会主义服务的方向,坚持以马克思列宁主义、毛泽东思想和邓小平理论为指导,贯彻“百花齐放、百家争鸣”和“古为今用、洋为中用”的方针,坚持实事求是、理论与实际相结合的严谨学风,传播先进的科学文化知识,弘扬民族优秀科学文化,促进国际科学文化交流,探索防灾科技教育、教学及管理诸方面的规律,活跃教学与科研的学术风气,为教学与科研服务。
2支持向量机(SVM)主动学习的入侵检测算法优化设计
2.1核函数的选择虽然多种因素都能影响到SVM的分类性能,但是有已存在的研究表明:在SVM分类中,所选取的SVM核函数的类型对SVM的分类性能影响不大,但是,SVM核函数选取的参数却与分类性能相关,在本论题的优化设计中选取的SVM核函数为,影响SVM的分类性能即分类正确率的主要因素是参数以及相对应的错误判决因子C。错误判决因子C是在已知的特征空间中用来调整学习机的经验风险与置信范围的比例,这样就可以优化学习机器的推广能力,对于不同的数据子空间C的最优值也不尽相同,C值的不稳定会使系统的泛化性能降低;核函数中的参数的变化可以间接的改变最优超平面与实践超平面之间的映射函数,这样就增加了在较高维特征空间中样本数据集的分布复杂度,参数也在一定程度上影响着系统的泛化性能。但是目前这两个参数的选择方法却只是靠试凑法来计算,这样就造成了很多人为的不恰当、随机和盲目选择性。
2.2支持向量机主动学习的入侵检测算法的优化设计下面本文将提出一种优化算法来对上面提到的参数以及相对应的惩罚系数C进行优化计算。这种算法得到在较高维空间中最优解的方法是通过利用个体相互之间的合作与竞争关系来实现的。算法的第一步实现了在可解空间中对一群粒子进行初始化,同时得到粒子的初始状态(位置和速度等),假设每个粒子都是对参数以及相对应的惩罚系数C进行优化计算的可行解,粒子的特征可以由它的位置和速度以及适应度的值来表现,适应度的值决定了对应解的优化程度,是由目标函数确定的。这样就形成了迭代关系,进行的每一次迭代,每个粒子的位置更新都是根据本身的位置极值和所有粒子的速度极值来实现的,这样每一次更新都可以得到一组位置和速度以及适应度,即一组最优解。在上述的算法中,假若有一颗粒子已经搜索到了当前的一个最优解,其他粒子就会因为这个最优解的吸引而快速的聚集到其附近,这种收敛方法虽然速度很快,但是有很大的概率是这个最优解不是一个全局最优解,而仅仅是一个局部最优解,这样就会造成粒子群无法再在解空间内对其他方向搜索最优解,很容易陷入早早收敛的局部最优状态。为此本文将再对上述算法进行优化。
算法的具体实现如下:
(1)给定算法的最初参数,对粒子种群进行初始化,产生粒子的初始状态(位置和速度等)。
(2)通过对目标函数的确定,计算出每个体粒子的适应度的值,并且得出位置极值以计算出位置极值情况下的适应度的值,把两个适应度的值相比较,若通过对目标函数的确定计算得出的粒子适应度的值更好,则要在解空间中更新粒子的位置极值。
(3)把每个粒子的位置极值与全局速度极值适应度的值进行比较,若得到更好的结果,则要在解空间中更新粒子的速度极值。