开篇:润墨网以专业的文秘视角,为您筛选了一篇专利知识产权管理系统研究及应用范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!
摘要:专利知识产权管理系统融入了《中华人民共和国专利法》等法律法规,以知识产权“创造、运用、保护、利用”为核心,结合工作流、信息流技术,对知识产权管理全过程进行管理,全面、及时、准确把握知识产权现状,推动了用户单位技术创新发展。本文就专利知识产权管理系统研究及应用进行了分析,以供参考。
关键词:专利;知识产权;管理系统;应用
中图分类号:C18文献标识码: A
1、引言
近年来,企业知识产权申请量大幅提升,随之而来的就是相关的知识产权档案管理、维持知识产权有效性的费用及日益琐碎与繁重的期限管理,而传统的手工方式或利用EXCEL表格管理已经无法满足需求。同时,知识产权作为一种无形资产,国家审批及保护的时间跨度较长,国家知识产权管理部门对不同知识产权如专利、商标在审批不同阶段的费用,如申请费、审查费、年费等的交纳有着严格的期限规定,一旦错过,都会导致权利的丧失,对权利人造成无法弥补的损失。
2、专利知识产权管理系统信息提取方法
2.1光学字符识别
光学字符识别 ( optical character recogni2tion ,OCR) 技术能对图像数据通过运算分类进行版面分析 ,识别出文字区域和图片区域 ,并将文字区域中的图像文字转换为计算机文本。在专利文献的信息提取过程中 ,主要通过对已有 OCR软件包的二次开发 ,从每个图像专利中识别出文本信息和分离出附图。由于每个专利都由几个或十几个. tif 文件组成 ,而非单个图像文件 ,因此在进行 OCR 识别时 ,需要对这些文件依次进行处理 ,再组合为该专利的识别结果。对每个. tif 文件的处理过程如下 :
(1) 若识别区域为文本区域 ,则建立一个文本节点 ,并记录该区域的版面位置信息 ,同时调用OCR 函数对该文本区域进行识别 ,将识别结果保存为该文本节点的值 ;
(2) 若识别区域为图形区域 ,则建立一个图形节点 ,截取该图形,并生成一个唯一的文件名加以保存 ,将文件名作为该图形节点的值。由于 OCR 存在相近字符误识别问题 ,特别对非中文字符更容易混淆 ,如会把“0”识别成“O”“、2”识别成“Z”、“1”识别成“I”等 ,因此在识别得到的文本中会存在一定的错误。
2.2正则表达式信息提取
正则表达式由美国数学家 Step hen Kleene研究“神经网事件的表示法”时引入 ,用于描述正则集的代数表达式。它是一串特殊的字符 ,可根据一定的算法来匹配文本。现在正则表达式主要用于基于文本的编辑和搜索工具 ,实现数据有效性验证、文本替换以及根据模式匹配从字符串中提取子字符串等。一个正则表达式通常由若干普通字符 (字符a 到 z) 以及特殊字符(元字符) 组成。如正则表达式“\ [21\ ] 申请号 (\ d{8} \ . [ \ dx ]) ”将匹配以“[ 21 ]申请号”开头 + 8 位数字 +“. ”+ 1 位任意字符的字符串。
由于 OCR 存在误识别问题 ,因此 ,为了能正确定位并捕获专利信息 ,必须将标准正则表达式扩展为具有容错功能的表达式。以专利申请号为例 ,根据对部分专利样本的 OCR 识别错误统计,可以将原有正则表达式进行容错扩展为“[ 1l\ [ E【】[ - ] ? 2[ - ] ? [1Il ][ - ] ? [\ ] ]1l3 ][\ w\ s\W]{0 ,5} ( ?:专利| 申请) ? 号([loO0 - 9. \ . Xx ]{8 ,15}) ”。利用该扩展的容错表达式可以实现 95 %以上中国专利文献申请 (或专利) 号的匹配。
2、3纠错处理
经过正则表达式提取得到的各个专利信息包含了 OCR 识别中的错误 ,因此 ,需要经过纠错处理将正确信息还原。纠错主要是根据错误出现的规律 ,将误识别的字符用相应的正确文字加以替换。如将专利申请号的“O”替换成“0”、“Z”替换成“2”、“S”替换成“5”等。
3、系统实现和应用
根据上述专利信息提取过程 ,专利信息提取与管理系统可采用 B/ S构架方式,将 OCR 识别、信息提取等过程放置于服务器端 ,以易于部署到企业内部网 ,并节省部署成本。企业设计人员通过 Web 浏览器访问系统 ,将需要提取的图像专利文件上传到服务器端 ,实现专利信息提取。也可将一批待处理专利文献存放于指定目录 ,由系统实现批量地自动提取。
结束语
知识产权信息管理系统是现代化知识产权行政管理的重要组成部分,它需要借助于信息技术的强劲支持,同时,作为一种应用软件系统,它也更有效地促进了知识产权管理与服务的网络化建设。
参考文献
[1]石兴广,陆平.利用专利信息推进技术创新[J].现代情报,2003,23(11).
[2]马会钧,柴新建.专用专利数据库系统的研究[J].计算机应用.2000,20(11).
[3]邱清盈,郑国民,冯培恩,武建伟.基于正则表达式的专利信息提取方法研究[J].中国机械工程第.2007,19(10).