首页 > 范文大全 > 正文

基于动态网格密度聚类的雷达信号分选算法

开篇:润墨网以专业的文秘视角,为您筛选了一篇基于动态网格密度聚类的雷达信号分选算法范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘 要: 针对固定网格密度聚类算法在雷达信号分选中对数据输入的依赖性和聚类精度低的问题,提出了一种基于动态网格密度聚类雷达信号分选算法。该算法采用动态网格生成技术大幅度地减少无效网格生成数目,移动网格技术消除对数据输入的依赖性,用改进的双密度阈值提高聚类精度。该算法不需要输入任何参数就能快速对任意形状大小的数据集进行聚类。实验表明,该算法能有效去除噪声,快速准确的对未知雷达信号进行聚类。

关键词: 雷达信号分选; 聚类; 动态网格; 移动网格; 双密度阈值

中图分类号: TN957.51?34; TP311 文献标识码: A 文章编号: 1004?373X(2013)21?0001?04

0 引 言

雷达信号分选是现代雷达侦察设备的重要功能之一,在当今战场上起着不可或缺的作用。然而随着现代战争中各种雷达和精确制导武器的大量应用,使得雷达侦察系统面临的信号环境日趋复杂多变,而且信号数量变的十分庞大[1]。因此,现代雷达信号的分选工作变的越来越复杂和困难。现在常用的信号分选方法是基于同一信号源发出的脉冲信号参数之间的相关性对雷达全脉冲序列进行去交错[2]。但是这种分选方式的分选结果和上述过程中每一级分选的准确率都有很大关系,因此最终结果可能会出现很大的偏差。

聚类分析是重要的数据挖掘技术之一,近几年被越来越多地用于雷达信号分选,且取得了很好的效果,聚类算法一般分为基于划分的、基于层次的、基于模型的、基于网格的和基于密度的等几种方法[3]。其中基于网格的聚类方法是将数据空间量化在有限的网格单元当中,将要分析的数据的统计信息汇总到其所在的单元格中,将网格中的点作为一个整体处理,处理速度快,但聚类精度低[4?5];基于密度的聚类方法[6]是将数据分成高密度和低密度的区域,该方法具有能识别任意形状、大小的聚类等优点,但输入参数太多,影响聚类结果。

传统的网格聚类主要是基于固定网格划分的,分选结果对输入顺序有很大依赖性,并且会产生很多无效网格,分选速度慢,聚类精度不高。

为了解决上述的问题,本文提出一种基于动态网格密度聚类的雷达信号分选算法,融合了网格聚类和密度聚类的优点。该算法使用动态网格划分技术生成网格,通过移动网格技术消除对数据输入的依赖性;并对密度阈值进行改进,采用双密度阈值,最后通过广度优先搜索方法完成聚类。

1 相关概念

1.1 密度网格

式中:[k]为每一维上划分的区间个数;[xi]是点[x]的第[i]个分量;[maxx∈D{xi}]表示数据集在第[i]维上的最大值,[minx∈D{xi}]表示数据集在第[i]维上的最小值。

定义2 网格单元重心:假定网格单元[U]中包含了[m]个数据点[p1,p2,…,pm,]则[U]的重心[pu]就是一个[n]维向量[pu1,pu2,…,pun,]网格重心为:

定义3 网格单元密度:网格单元中所包含的数据点的个数,用[den(C)]表示网格单元[C]的密度,图1中网格单元密度为6。

定义4 网格单元关系:设[C1]和[C2]是两个非空网格单元, 若[C1?C2≠?,]则称[C1]和[C2]是相交关系, 否则为相离关系。

1.2 网格密度阈值

网格密度阈值的确定对聚类结果有着很大的影响,如果选择的不合理很可能造成信号的多选和漏选[8]。传统的网格密度聚类算法主要是采用单密度阈值判断高低密度网格,容易将真实信号和噪声信号相混淆。如图1所示是某一维度空间中雷达信号的网格单元密度变化情况,区域[a、b、c、d]都是网格单元密度大于密度阈值,往往被认为是真实雷达信号进行聚类,然而[b]和[d]却是噪声区域网格,所以必须提高密度阈值,这样又会造成[a]和[e]之间及[c]和[f]之间的网格漏选现象。为了获取[a]和[c]的完整雷达信号,而同时去除[b]和[d]内的噪声信号,所以在这里主要是借鉴平均密度的思想,对密度阈值进行改进,在原有密度阈值的基础上再增加一个核心密度阈值,采用双密度阈值的方法更加有效的聚类。

设[G]为生成的网格单元数目,[den(Ci)]为网格密度,[max(den(Ci))]为生成相交网格最高密度网格,[min(den(Ci))]为生成相交网格最低密度网格。

定义5 核心网格:网格单元密度大于核心密度阈值的网格单元;

高密度网格:网格单元密度大于密度阈值的网格单元,所以核心网格也属于高密度网格单元;

低密度网格:网格单元密度小于密度阈值的网格单元。

在网格聚类过程中,只有含有核心网格单元的高密度网格区域才是真实的雷达信号,低密度网格区域和不含有核心网格单元的高密度网格区域都是噪声网格,聚类只对真实雷达信号单元网格进行聚类。

2 改进的网格聚类算法

本文用脉冲描述字PDW描述雷达的信号参数。包括脉冲到达时间(TOA)、脉冲宽度(PW)、脉冲幅度(PA)、信号载频(RF)、到达方向(DOA)和脉冲重复间隔(PRI)等参数。其中TOA不能反映雷达本身特性, 不适合作分选依据;PA受多径效应影响,是一个不确定参数;而PRI的工作方式多,变化快,同样不适合作为分选依据。所以本文使用DOA、RF 和PW三个参数进行聚类[9]。

2.1 数据的预处理

在实际的雷达信号侦察中,收到的信号往往都比较复杂,参数大小不一,并有着不同的量纲。因此为了消除原始数据对分选结果的影响,需要对数据进行预处理,使其分布在[0,1]之间[10]。由于雷达信号有未知的噪声信号存在,所以采用Z?Score标准化算法。

其次再由此得到原始数据的标准化值:

最后因为此时得到的标准数据不一定在[0,1]闭区间内,再采用极值标准化公式:

2.2 移动网格技术

移动网格技术的原理就是将整个网格单元向高密度网格区域移动,使聚类的网格更加集中。由于生成网格单元的位置完全由生成网格的数据点决定,所以每个网格单元的中心点与重心点很可能并不在同一位置,导致相邻的网格无法相交,聚类就可能丢失边界[11]。因此在生成网格的过程中,如果网格的密度大于密度阈值[ε,]就根据公式(2)计算此网格单元的重心,再以重心为中心建立新的网格单元。移动网格后对移入网格的点做好标志, 并记录新的网格单元与其周围网格的共享信息;同时将移除网格的点做好记录并排到数据集尾部,直到所有数据点都处理完毕。为了提高算法的效率,对每个网格只移动一次。移动网格技术消除了网格生成过程中对数据输入顺序的依赖性,大幅减少网格生成数目,提高了算法效率和聚类精度。

2.3 动态生成网格

初始网格集合为空,从数据集中读入一个数据点,如果该点不在已生成的网格当中,则重新建立一个网格,网格单元密度为1;如果新输入的数据在已生成的网格单元当中,则相应的网格单元密度加1,同时利用移动网格技术消除聚类的结果对数据输入的依赖性。如果一个点属于多个网格,说明这些网格是相交关系,则记录这些网格的网格单元号、聚类标志和共享点信息等。重复上述步骤直到所有的点被处理。图2为二维动态生成网格示意图。

2.4 整个算法过程的描述

Step1:根据[N]个待分选对象的3个特征参数DOA、RF和PW形成一个三维待分选数据集,[N]为雷达脉冲数。对数据集按照2.1进行归一化处理,得到预处理后的数据集。

Step2:网格边长的确定,根据定义1给出的网格单元边长的公式计算每一维网格边长,[k]的值一般选为 [N3,][N]为待分选的样本点数。

Step3:根据2.3节方法动态地生成网格,并用移动网格技术处理网格单元,记录每一个网格所包含的数据点信息。

Step4:为了防止边界点的丢失,对于移动网格过程中被移除网格的某些点,则将网格边长扩大10%,看看该点是否处于网格内,如果是则仍将该点标记看作是该网格中的点。

Step5:计算每一网格单元的密度,并根据公式(3)和(4)算出核心密度阈值和密度阈值。

Step6:完成上述步骤后,数据点已经全部映射到网格单元当中。开始聚类,从任意一个含有核心网格的网格区间开始,按照广度优先原则将所有相交的高密度网格聚为一类,而不含有核心网格的噪声网格区域被屏蔽;接着再选取另一个含有核心网格的网格区间,重复这个过程直到所有网格单元被处理。不属于任何类的网格单元的数据点作为噪声点处理;最后输出聚类结果。

3 仿真实验分析

实际在处理雷达信号数据的时候,都可以通过雷达使用的频率分段和方位进行初步的分选,所以最后待分选的雷达信号较之最初的信号数量会大大降低[12]。

为了验证基于移动网格技术和双密度阈值的动态网格密度聚类分选算法在雷达信号分选方面的可行性和有效性,仿真实验模拟了4部雷达全脉冲仿真数据对该分选方法进行了仿真实验。同时加入了不少于雷达脉冲总数10%的干扰脉冲,具体参数见表1。

图3为构造雷达数据的载频和到达角的二维归一化分布图,从图中可以看出,这4部雷达信号的到达角和载频严重交叠在一起,所以基本是满足了本文对复杂信号环境的要求。

固定网格密度聚类算法用于雷达信号分选效果如图4所示。由于固定网格密度聚类算法是将数据空间每一维划分为长度相等、互不相交的[k]个区间形成[k3]个固定网格单元,然后将数据集的每个对象映射到相应的网格当中[13],所以生成了很多无用的空网格,导致降低了算法执行速度和由于处理不好网格边界而造成漏选和增选现象,损失了很多真实信号数据。

用动态网格密度聚类算法用于雷达信号分选效果如图5所示。通过对比图4和图5可以看出动态网格密度聚类分选算法取得了更好的分选效果,两种算法分选结果比较见表2。

从表2可以看出,动态网格密度聚类算法的平均分选准确率比固定密度网格聚类有了大幅的提高,漏选和增选现象都有了很大的改善,所以动态网格密度聚类算法用于雷达信号分选可以取得更好的效果。

4 结 语

本文提出一种基于动态网格密度聚类的雷达信号分选算法,该算法采用改进的网格生成技术和移动网格技术将数据映射到网格当中,并改进了密度阈值,采用双密度阈值有效解决聚类结果精度低的问题。该算法能识别任意大小形状的雷达信号,聚类精度高,速度快,不需要任何输入参数。仿真结果证实了该算法的有效性和先进性。

参考文献

[1] 李合生,韩宇,蔡英武,等.雷达信号分选关键技术研究综述[J].系统工程与电子技术,2005,27(12):2035?2040.

[2] MILOJEVIC D J, POPVIC B M. Improved algorithm for deinterleaving of radar pulses [J]. Radar and Signal Processing, 1992, 139(1): 98?104.

[3] 屠莉,陈崚,邹凌君.数据流的网格密度聚类算法[J].小型微型计算机系统,2009,30(7):1376?1382.

[4] 邱保志,沈均毅.基于扩展和网格的多密度算法[J].控制与决策,2006(9):1011?1014.

[5] WANG W, YANG J, MUNTZ R R. STING: a statistical information grid approach to spatial data mining [C]// Proceedings of the 23rd International Conference on Very Large Data Bases. San Francisco, CA, USA: VLDB, 1997: 186?195.

[6] JANUZAJ E, KRIECEL H P, PFEIFLE M. DBDC: density based distributed clustering [J]. Lecture Notes in Computer Science, 2004, 2992: 88?105.

[7] QIU B Z, LI X L, SHEN J Y. Grid?based clustering Algorithm based on intersecting partition and density estimation [J]. Lecture Notes in Computer Science, 2007, 4819: 368?377.

[8] 米源,杨燕,李天瑞.基于密度网格的数据流聚类算法[J].计算机科学,2011,38(12):178?181.

[9] 赵贵喜,骆鲁秦,陈彬.基于蚁群算法的K?Means聚类雷达信号分选算法[J].雷达科学与技术,2009,7(2):142?146.

[10] 贺宏洲,景占荣,徐振华.雷达信号的模糊聚类分选方法[J].航空计算技术,2008,38(5):21?24.

[11] 郑盈盈,倪志伟,吴姗,等.基于移动网格和密度的数据流聚类算法[J].计算机工程与应用,2009,45(8):129?131.

[12] 王晓峰,张国毅,戴杰.一种新的未知雷达信号聚类分选方法[J].电子信息对抗技术,2012,27(1):19?22.

[13] 向娴,汤建龙.一种基于网格密度聚类的雷达信号分选[J].火控雷达技术,2010,39(4):67?72.