首页 > 范文大全 > 正文

基于案例推理与模拟退火的认知自学习引擎

开篇:润墨网以专业的文秘视角,为您筛选了一篇基于案例推理与模拟退火的认知自学习引擎范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘要 认知无线电与传统无线电的最大区别在于其能够感知环境,主动去学习、适应环境。近年来,对于认知无线电的研究主要集中于多目标优化的配置决策问题。但实际的通信系统可观测到的环境参数有限,且输入输出关系复杂,需要认知无线电通过学习来理解并适应环境,本文针对上述问题,提出了一种基于案例推理模拟退火思想的认知决策引擎算法,仿真结果表明,该算法具有增量自学习、多目标适用性,快速收敛等优点。

关键词 认知无线电 认知引擎 人工智能 案例推理 模拟退火算法

1 引言

基于案例的推理(Case-based reasoning,简称CBR)借鉴人类处理问题的方式,运用以前积累的知识和经验直接解决问题。由于CBR具备自主学习功能,不要求决策主体掌握丰富领域知识或精确的数学模型,仅仅通过简单的案例记忆就能实现出色的增量学习和自我提升,因而引起相关专家和学者的关注,逐渐成为人工智能领域的一个研究热点。

认知无线电技术作为无线通信领域与人工智能领域相结合的产物[1],近年来受到极大关注。认知决策引擎是认知无线电(CR:Cognitive Radio)实现其智能的核心功能模块,决策引擎以CR观察到的外界无线环境、CR自身状态和用户需求信息为输入,对目标和情境进行分析,根据已有知识进行推理,决策输出达到用户需求的优化配置,同时能够学习不同配置在新环境下的效用,从而丰富系统知识,以适应环境和需求的变化[2]。

现阶段对认知引擎的研究主要集中于,当认知无线电可以通过观察获得需要的所有环境知识(表示为c),且用户需求u与环境c和配置d之间的定量关系:u=f(c,d)已知时,将认知决策的过程建模为一个优化问题[3]:即在给定的环境c下,寻找最优配置决策d,使性能u最大(或寻找某个配置决策d,使性能u得到满足)的情况。如文献[4]使用遗传算法对CR中多目标优化问题进行了研究,文献[5]将粒子群优化算法应用在认知引擎的决策问题中,文献[6]考虑遗传算法中参数敏感度对不同目标的影响,进一步提升了优化效率。然而,在实际应用中,CR可直接观测得到的环境参数有限(比如信道统计特性等无法直接观测得到),且系统可能面临各种不同的传播环境、动态接入不同频段的信道,输入c和u与输出d的关系很复杂,函数f无法事先确知。此时,认知无线电需要通过不断的学习来理解并适应环境。目前,针对环境部分可观测、精确函数f未知下的认知决策系统研究才刚起步,文献[3]简单举例说明了学习在解决这类问题当中的关键作用,但尚未有相关系统的研究成果出现。

本文针对这类问题,研究基于案例的推理决策问题,提出基于案例库的认知决策引擎。文中所提决策框架具有自学习、多状态多目标通用性强、快速收敛等特点。

2 CBR简介

基于案例的推理模仿人类的思维方式,直接援引以前积累的经验和知识解决现在的问题,同时将当前问题及解决结果补充为新知识,从而实现自主学习和增量学习。

通常,CBR系统的运作过程可以概况为“4Rs”(如图1所示):

1)、检索(Retrieve):分析当前面临的新问题,定义新问题的特征或属性,在案例库中寻找对当前问题的解决有最大潜在启发价值的旧案例;

2)、重用(Reuse):以相似案例为基础,通过自适应的调整,构造新问题的解决策略;

3)、修订(Revise):执行并验证当前策略;

4)、存储(Retain):将有参考价值的经验案例存储到案例库中。

其中,检索和重用属于推理阶段,修订和存储属于学习阶段,学习的过程将以往的决策经验以案例的形式进行积累,使系统知识不断丰富,以提高未来推理的效能,从而在面对新问题时能够做出更好的决策。

3 基于CBR与模拟退火的自学习认知决策算法

认知引擎的输入变量包括用户的目标需求、观测到的无线环境变量、以及CR自身状态,三者共同影响认知引擎的配置决策。为了使CR通信案例库具有广泛的可借鉴性,为不同目标、不同状态的CR决策提供参考,构建如下所示案例库:

其中条件属性包括观测的无线环境特征和自身状态(如当前信道是否空闲、最大发射功率、可选的调制编码方式等),用于描述问题发生的场景或情境。决策属性为CR所作的一些反应,包括信道、发射功率、调制方式、编码方式、数据包长等配置参数。结果为在不同条件属性下,相应配置所带来的不同目标的实际性能,如误比特率、吞吐量、频谱效率、存活时间等。

配置检索的目的在于从案例库中找到能够帮助解决当前所描述问题的经验配置。因而检索过程应当注重两个方面,一是案例场景的相似性;二是原有决策方案对当前目标的收益值。鉴于此,案例检索需要计算场景相似度和目标函数适值。

2、基于模拟退火思想的案例调整

通过CBR机制检索案例获取的解决方案,并不一定能满足当前业务需求(即便满足需求也很有可能是次优解)。本小节将介绍一种结合检索机制与模拟退火思想的案例学习调整算法。这种基于启发式智能的案例自适应方法无需领域知识,具有很好的全局搜索能力。为了实现该算法,对案例库中对每个案例增加一项温度属性,且案例生成时t=1。对搜索出的最优案例n,进行如下自适应算法:

通过调整产生的最终方案将输出给终端指导重配置,并记下实际的性能结果,形成新案例存储入案例库。在案例调整过程中,对每个被检索出来的最优案例的温度系数进行等比退火处理,可以达到以下目的:一方面,多次被检索到的最优案例的温度等比下降,从而对其配置的调整幅度将逐渐减小;另一方面,调整过程中一旦出现比当前解性能更优的新配置方案,新案例将取代原有案例被检索出来,重新进入等比退火过程。最终,学习过程使得配置方案逼近于最优。

4 应用实例与结果分析

本小节采用仿真实验手段,验证并分析所提算法的学习与决策性能。仿真场景如下。

下面对形成上述性能结果的各项配置参数进行分析。图4为功率参数调整曲线。如图,当通信目标为最大化用户吞吐量时,尽管系统不知道功率越大则吞吐量越大的这种先验知识,但是通过不断的学习,系统不断调整其发射功率,使其逼近于最大发射功率23dBm。另一方面,对于最大化频谱能效的用户而言,功率将被调整到一个适合的大小。

5 结束语

本文针对认知无线电中环境部分可观测,信道统计信息先验未知,且系统的目标、环境与配置间的关系不明确,需要通过学习进行配置决策的问题,提出了一种基于案例推理和模拟退火思想的认知决策引擎算法,理论分析和仿真结果表明,该算法具有增量自学习、多目标适用性、快速收敛等优点。案例库有广泛借鉴性,可实现在不同节点间相互学习的功能,因此下一步,可研究关于多节点合作的学习引擎的实现方法,以及如何应用数据挖掘的方法从案例库中提取出有用知识的问题也有待进一步研究。

参考文献

[1] Mitola J. Cognitive radio-making software radios more personal. IEEE Personal Communications,1999. 6(4):13-18.

[2] B. Fette, Ed., Cognitive Radio Technology. New York: Elsevier, 2006.

[3] C. Clancy, J. Hecker, et al. Application of machine learning to cognitive radio networks[J].IEEE Wireless Communications, 2007, 14(4):47-52

[4] Rieser C J. Biologically inspired cognitive radio engine model utilizing distributed genetic algorithms for secure and robust wireless communications and networking [D]. Blacksburg, VA, USA: Virginia Polytechnic Institute and State University, 2004.

[5] 赵之劲,徐世宇,郑仕链等. 基于二进制粒子群算法的认知无线电决策引擎.物理学报,2009,58:5118-5125

[6] Timothy R. Newman and Joseph B. Evans. Parameter Sensitivity in Cognitive Radio Adaptation Engines