首页 > 范文大全 > 正文

基于OnTrac平台逆向分析系统的设计

开篇:润墨网以专业的文秘视角,为您筛选了一篇基于OnTrac平台逆向分析系统的设计范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘要:探讨了软件逆向工程的基本原理,基于ontrac平台设计了一个针对 Python源代码的逆向分析系统,并简要介绍ReverseUML系统以及核心模块。

关键词:逆向工程;Python;UML;类图;序列图

中图分类号:TP391文献标识码:A文章编号:1009-3044(2008)23-969-02

Design of Reverse Analysis System Based on OnTrac Platform

WANG Qi

(Software Department , Southeast University, Nanjing 210096, China)

Abstract: This essay has introduced the basic principle of software reverse engineering, and designed a Reverse UML system based on OnTrac system. Then we describe the system, and key modules.

Key words: reverse engineering; Python; UML; class diagram; sequence diagram

逆向工程本质上是一个知识恢复、知识发现的过程。对于软件这种复杂系统来说,逆向工程首先是发现原有系统所表达的一些信息,其次是挖掘原有系统表面下隐藏的、存在于设计人员脑中的设计知识。而源代码逆向工程分析的对象是代码。代码是软件设计最后一个阶段的产物,是唯一的逆向工程工作的输入,也是所有逆向工程的基础,因此源代码逆向工程显得格外重要[1]。因此如何对现有的源代码进行分析,以及如何以清晰、标准的方式展现原有的设计知识,是本课题研究的主要问题。

为了达到方便分析 Python 源代码的目的,本课题在 SIEMENS 公司的 OnTrac 平台上设计了一套管理分析Python源代码的系统ReverseUML。通过 ReverseUML 系统,用户可以方便的获得服务器上 Python 源代码的类图以及序列图。

1 Reverse UML系统结构

为了实现上述功能,ReverseUML系统主要分为OnTrac服务器、ReverseUML 插件、代码跟踪服务器,程序跟踪执行模块。系统结构框图如图1所示:

ReverseUML 系统物理结构图

用户可以通过兼容 IE6.0 的浏览器登录 OnTrac 服务器,然后通过 OnTrac 中的 ReverseUML 插件对源代码进行管理分析。

ReverseUML系统的物理结构如图2所示,用户分析代码的服务器,OnTrac服务器和Trace服务器是通过网络连接起来,用户可以在任何可以访问OnTrac服务器的地方分析Python源代码,这种结构也符合了目前软件网络服务化的趋势。

2 ReverseUML插件分析设计

通过对 ReverseUML 系统的介绍,系统需要提供基于Web页面的分析管理模块,分析模块还需要和跟踪模块交互通讯,来达到在网络上分析源代码的目的,而跟踪模块需要可以在受控制的情况下执行源代码[2]。因此本插件设计的模块图以及和模块的通信,如图3所示。

ReverseUML 插件依赖于 OnTrac 系统对用户的请求进行预处理。OnTrac系统会把对ReverseUML的请求分配给ReverseUML插件,然后插件对请求进行相应的处理,并将处理的结果以页面的形式返回给客户端。

当插件在处理用户动态跟踪脚本的时候,插件首先会通过OnTrac的ResquestDispatch 得到脚本的文本,然后通过工程配置里的用户名与密码和服务器进行连接。随后将命令脚本逐条发给TraceServer,并返回由TraceServer的SSH Server执行后的结果。

当插件被初始化的时候会在OnTrac服务器上开启一个新的监听服务,随时监听并添加从Trace Daemon发来的动态跟踪数据记录。

ReverseUML插件主要分为页面显示模块、分析模块、对Trace Server进行shell命令控制的PySSH模块以及从Trace Server获得消息的 PyListener模块。

用户获得类图的过程需要有两个步骤,一个得到当前系统中存在什么类,二是选择需要由哪些类组成类图,因此插件需要处理用户的两次查询,一次是点击 ClassGraph 链接的页面请求,查询当前系统中的所有类名,第二次是选择相应的类与类图深度之后,点击ViewClassGraph 的请求,获得类图图形。处理的流程如图4所示。

首先ReverseUML插件在初始化的时候会在OnTrac系统的Dispatch消息转发器中注册相应的页面请求消息。当用户进入ReverseUML工程页面后所有的页面上的链接被定向为由ReverseUML插件来处理。

当用户点击ClassGraph链接时,OnTrac的Dispatch将ClassGraph消息转给已经注册关联上的处理函数。处理函数从数据库里获得当前存在的所有类,逐一填充到页面模板上,最后由OnTrac的页面Render解释页面模板生成标准的 HTML页面,并发送回客户的浏览器。处理用户的 ViewClassGraph点击事件的总体流程与ClassGraph类似,细节上有所不同,浏览器发送来的消息有用户选择类的列表、类图的深度需要通过 OnTrac提供的标准API获得,类图生成模块根据输入进行计算生成类图,类图以 JPEG 的方式存在服务器临时目录中,最后将图片的链接地址填充在类图模板相应的位置里。

3 跟踪执行模块分析设计

跟踪执行模块的作用为了获得实际跟踪时的数据并将数据发送到OnTrac服务器。实际跟踪时会有多个Python执行的进程同时向一台OnTrac 服务器发送数据,如果采用简单的连接发送的方式会因为网络拥塞造成被跟踪的程序等待网络传输而执行非常缓慢,因此本课题采用了一个统一的数据收集转发服务来对跟踪数据进行有效的发送。

由于需要通过在程序执行时动态地获取数据,因此需要对Python的解释器进行扩展,让Python解释器在执行程序时将数据传给Trace Daemon 模块。下面将分别叙述这两个模块的设计。

3.1 Trace Daemon模块设计

Trace Daemon 是在程序执行的时候运行在后台的监控进程,用来将跟踪数据发给OnTrac Server。Trace Daemon 的工作流程设计如图5所示。

如图5所示,Trace Daemon由Trace Server的shell启动,并且传入OnTrac Server的地址、和临时存放数据所在目录,程序启动后每隔1秒从数据所在的目录中读取数据文件,判断数据是否已经被填充完毕,或者记录数据文件的线程已经结束,如果已经记录完毕则发送给OnTrac Server,最后删除已经发送完的数据文件。发送数据部分则由Twisted实现了一个简单的传输协议。

用户可以通过 ReverseUML 系统方便地察看源代码以及它们的类图和序列图、建立分析工程来管理逆向工程的配置,添加被分析的代码,设定目标代码执行的环境。

3.2 代码跟踪脚本设置

本文提出的生成类图与序列图算法的核心是对动静态分析数据的

综合,为了获得其中的动态数据,必须要通过一种方式让程序运行起来。本课题的设计的方法是,通过在跟踪服务器上运行事先编写好的脚本,使被跟踪的代码运行起来,然后系统将服务器中跟踪记录下的数据发回。因此ReverseUML系统提供了编写,管理这些脚本的功能模块。

如果当用户需要通过ReverseUML插件获得类图时,登录OnTrac系统,进入ReverseUML插件,打开相关工程后单击ClassGraph链接,系统会显示当前系统中含有的类名列表。然后选择若干需要显示的类图的类名称、类图的关系深度,最后点击 View Class Graph按钮,系统会返回所选择的几个类的类图。

用户可以通过ReverseUML系统获得所需的序列图。用户进入相关工程后单击SequenceGraph链接,系统会显示当前系统中含有的函数入口列表。然后用户选择序列图的一个入口,制定序列图的嵌套层次以及涉及类的模块数,系统会返回此入口在数据库里的若干次调用。随后用户选择其中某一次调用所在的时间戳,点击View Sequence Graph链接,系统将返回相应的序列图。

4 结束语

本课题首先介绍了逆向工程的一些基本原理,而逆向工程则是对遗留软件工程进行知识恢复的一个很重要,也很可行的方法。而本课题在SIEMENS公司OnTrac系统的基础上,设计开发了ReverseUML系统,通过该系统可以对Python语言设计的软件进行逆向分析,可以通过UML类图与序列图清晰地展现面向对象软件底层的设计思想。

参考文献:

[1] Rumbaugh J. 面向对象建模与设[M].影印版.北京:中国电力出版社,2003.

[2] Hondt k.Aproach to Architectural Recovery in Evolving Object-Oriented Systems[D]. Brussel:Ph Dthesis of Vrije Universiteit Brussel,1998.