首页 > 范文大全 > 正文

数字出版与术语规范

开篇:润墨网以专业的文秘视角,为您筛选了一篇数字出版与术语规范范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘 要:数字出版给传统出版带来了生机和创新,并促进了术语的发展。数字出版的发展使大量术语进入出版业,原有术语内涵和外延有所变化、发展,规范出版术语更为重要。

关键词:数字出版,术语,规范

中图分类号:G230;N04 文献标识码:A 文章编号:1673-8578(2012)03-0038-05

作者简介:王渝丽(1944—),女,四川重庆人,中国大百科全书出版社术语中心原主任,从事术语及术语标准化工作多年。通信方式:wangyuli@ecphcomcn。引 言 从20世纪90年代起,数字媒体作为一种新的出版介质和阅读介质,在传递知识和文化上,有着传统纸质媒体所无法比拟的诸多优势。近年来,我国数字出版产业取得了高速的发展。根据中国新闻出版研究院的《2010~2011年中国数字出版年度报告》,2010年国内数字出版产业总体收入规模达到105179亿元,比2009年增长了3197%,并且持续高速增长。通过在产业中大量应用新型的科学技术,数字出版在不断冲击传统的生产方式,创新出版的业态,改变已有的观念,创造新的产业模式,必将对文化传播方式和新闻出版事业产生深远影响。

数字时代的到来使传统的传媒形态发生了巨大变化,出版物的载体从传统的纸介质一统天下,到现在的音像、电子、多媒体、网络出版群雄并起,传统出版机构也逐渐转变成全方位、立体化的出版机构。数字出版使出版物内容形式、编辑模式、生产流程、传播介质和管理模式等方面都有了创新,并有大量的术语涌现。笔者根据从事的工作,在下文中介绍了数字出版领域的术语和术语标准、术语规范的重要性。

一 数字出版 数字出版可以理解为利用数字化技术,将各种图、文、声、像信息以数字形式存入信息库中,出版者根据市场需要对这些信息进行筛选、编辑、加工、整合,然后以纸介质出版物、光碟或网络出版物等形式投放市场的出版活动。它包括以CD、VCD、DVD、EVD光碟为载体的数字音像出版,以CDROM、FD、DVDROM光碟等为主要载体的电子出版,以互联网为平台的网络出版,同时传输相同内容到不同媒体上以满足受众的不同需求的跨媒体出版(如手机出版)等。它易于传播和复制,同时集成了音频、视频、文字、图形、图像等传统媒体的功能。人们可以方便地通过互联网、手机、电视等媒介,随时随地地获取数字内容。

数字出版就其本质而言是传统出版的内容和计算机技术的结合;是传统出版业在发展过程中,快速发展的高新技术对其自身产生的冲击。它既传承了传统出版的优点,又结合了计算机技术,用计算机技术去深度表现传统出版的内容。简单地说,数字出版就是利用计算机技术或网络技术来代替一些传统的出版活动。

日益发展的数字信息技术使内容的形态发生了根本性的变化,使文字、图像、影像、语音等原来以不同表现形式和载体表达的内容要素得到高度融合,以不同行业和传播方式区分的数字格式也趋于统一,数字内容的组织方式也实现了从顺序方式到非顺序方式的跨越。

二 数字出版对出版术语发展的促进 在信息时代,新名词、新术语、新概念层出不穷,老词新用情况也很常见。数字出版的发展改变了编辑出版流程和出版物的形式,出版的内涵和外延也已发生了很大的变动和前所未有的扩展,出版从以往涉及编辑、出版、印制、发行等方面,增加了出版内容资源利用、载体多样化、在线服务等新领域。大量术语随着数字出版这一新技术、新媒介进入了出版领域。其中,在中文信息处理、网络信息抽取、术语数据库的建设和跨媒体制作等领域尤为显著。举例如下(以下术语引自《中国标准书号》和《信息与文献国际标准书号(ISBN)》):

1版本(edition)

传统出版中的定义为:一种书籍经过多次传抄、刻印或以其他方式而形成的各种不同本子。数字出版中是指由同一出版者出版、同一载体、同一格式、内容相同的复制品。后者的内涵已经拓展到影视、软件等事物上。

2责任者(responsible)

传统出版中的定义为:形成文件内容并对其负有责任的团体(单位组织)或个人。原指“作者”负有对客观存在的人或事物形态进行如实文字性描述责任的一方(或者是某人或者是某个单位组织)。数字出版中指对内容做出贡献并负有责任的实体(包括对数字内容资源投送责任)、网络资源的创建者等。其内涵已经扩展,“责任者”在数字出版中涵盖的范围增大。

3检索(retrieve)

传统出版中的定义为:检查索取所需要的文字或资料。数字出版中的定义:以计算机技术为手段,通过媒介和联机等方式进行信息检索的方法。后者的内涵已有变化。

4关键词(keywords)

传统出版中的定义为:用于表达出版物主题内容的词。数字出版中的定义:用来标识文件中各个记录的特定数据项目的值。其内涵已经延伸,不再是特指单个媒体在制作使用索引时所用到的词汇,而扩展到搜索引擎行业。

5出版内容资源(publishing content resources)

传统出版中的定义为:指编辑加工完成的可进行排版、印制纸质出版物的内容集合。数字出版中的定义指与出版产品内容形成直接相关的各种要素的集合。后者不仅包括了可以生产的纸质产品,还包括可以实现对出版内容的深度开发和多维应用的内容集合。元数据、粒度、语境、标识、标识体系、最小应用单元、结构文档、代码等系列术语进入了出版内容资源领域,这是出版术语发展的一个体现。

6在线服务( online services)

这是一个崭新的出版服务方式,定义为:利用互联网技术,向用户提供线上出版物服务的方式。就术语而言有在线、语义分析、知识单元、知识标引、问答技术、个性化服务等需要出版者掌握。

三 出版术语国家标准与规范工作 我国对于出版术语是比较重视的,20世纪80年代国家标准局、国家技术监督局(现名为国家质量监督检验检疫总局)颁布了一系列有关国家标准。以辞书为例,全国术语标准化技术委员会(现名为全国术语与语言资源标准化技术委员会)辞书编纂分委员会(秘书处设在上海辞书出版社)自1986年成立以来,在辞书编纂领域内开展了一系列的标准化工作,研究辞书编纂中有关标准化的原则和方法,为促进我国辞书编纂术语的统一做了许多工作。1989年8月31日颁布了GB11617—1989《辞书编纂符号》。它适用于字典、单语和双(多)语词(辞)典、词汇、百科词(辞)典、百科全书等的编纂,是我国辞书编纂的第一个国家标准。20余年来,该技术委员会制定了多项辞书编纂的标准,不断修订并增加了新内容。例如:《辞书编纂符号》(GB/T 11617—2000)、《术语工作 辞书编纂基本术语》(GB/T 15238—2000)、《辞书编纂常用的汉语缩略语》(GB/T 15933—2005)、《辞书编纂的一般原则与方法》(GB/T 19103—2008)等。

2011年全国科学技术名词审定委员会成立编辑出版学名词审定委员会,开展我国编辑出版学名词审定工作。这项工作中包含了数字出版领域的名词审定工作,将对我国数字出版术语的科学界定、对数字出版技术的交流与发展发挥基础性的奠基作用。

四 数字出版术语亟须规范 数字出版的发展使出版形式发生了改变。从内容出版方式角度看,出版社迫切需要实现“一次制作,多元;深度标引,多重应用”的新型的出版方式。从出版流程角度看,出版社要实现全新的数字出版流程,彻底改造传统出版流程中众多复杂的出版环节,需要为创作、编辑、排版、审核、等各环节的人员提供一个统一的数字化平台。在这个平台上,内容创作者和编辑能够完成稿件的传递,在出版社内部实现编辑三审流程,完成编辑加工的书稿能够和排版环节无缝衔接,通过自动排版及交互编排生成多种形态数字产品,并迅速将这些数字产品推送到用户的阅读终端,提高内容产品的效率。

但由于受时代和历史的局限,一些原有的术语内涵显然已不适用,而新术语还未完全融入出版业。现在数字出版术语使用不统一的现象极为普遍,传统出版的术语已不能满足数字出版发展的需求。我们应该清醒地认识到,数字出版并不是纸质图书出版的升级版,它的内容创新与形式创新同样重要。由于现阶段数字出版标准术语的制定、推广都滞后,所以数字出版术语存在使用不恰当和混乱现象。

出版物形式的多样化和内容资源的开发丰富了出版术语,也对出版人提出了不断学习的任务:对数字出版概念和范围本身加以深入探讨,并在此基础上形成一个相对统一、公认的定义,以促进数字出版产业的发展。

规范数字出版术语对于出版业发展具有重要的推动作用,笔者结合工作实践,举例如下:

1出版元数据(publishing metadata )

这是出版业的一个核心要素,为数字出版业务工程管理和内容资源开发、共享提供基础。元数据是描述一个具体的资源对象并能对这个对象进行定位管理且有助于它的发现与获取的数据,其定义的准确性对产业发展很重要。出版元数据是与一本图书及用于创作、出版、发行、营销、推广和销售这本书的所有与出版物相关的信息的集合。它通常由一种包含在某个数据库中的文档的形式呈现,这一文档中涵盖了所有与出版商的图书产品相关的信息。出版元数据大致分为4类:数字媒体管理元数据、图像内容元数据、视频内容元数据和音频内容元数据。其中管理元数据包括标题、主题、制作时间、来源、版权等管理信息方面的元数据;而图像、视频和音频内容元数据则是对数字媒体的内容进行描述的元数据。经过有关专家讨论,初步统计出版元数据的基本数据为300余个,而进入出版领域新的元素据约为30%,其元素的概念部分没有确切的定义或存在争议。但是至今还没有出版元数据的国家标准、行业标准出台,一些出版者对此还不了解。这一状况妨碍了数字出版元数据的正确应用。

2可扩展置标语言(eXtensible Markup Language,XML)

XML(eXtensible Markup Language,可扩展置标语言)是用于标记电子文件使其具有结构性的标记语言,可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言。标记指计算机所能理解的信息符号,通过此种标记,计算机之间可以处理包含各种信息的内容,例如:文章、条目、词目、关键词、图像等。XML对数字出版是非常重要的,现在教育、科技、辞书等出版单位都在研制符合本专业的XML,以达到出版内容资源的充分开发。

以百科全书为例,百科全书的编纂是一个大型的系统工程,参与的人员众多,人员的类型众多,需要建立一系列标准规范来约束指导参与人员的工作。网络百科全书与传统百科全书的结构不规范、标准不一致、形式不确定,这给编纂百科全书和利用百科全书构建百科知识库带来了极大的不便。为了把百科知识转化为计算机可以利用的百科知识库,需要对百科全书的编写内容和结构进行规范,要规范百科知识元的分类及其属性描述,因此要制定相关标准,而术语的标准化是编纂工程的基础。正在研制的百科全书XML( Encyclopedia XML)标准将是指导百科编纂平台开发及编辑加工的基础标准。本标准将制定百科全书知识描述的XML格式,可使百科知识结构化,充分开发利用内容的同时也会对规范百科条目的编纂、指导百科全书的编写、提高百科条目的质量起到重要作用。该标准中的术语,例如:格式、元素、标识、属性、声明、文件类型定义(DTD)等,都是百科编辑和技术人员必须掌握的术语。

3几个新术语

国外数字出版产业发展相对较早,并且产业比较成熟。目前我国数字出版的术语大量翻译、引用国外的术语。但因为权威管理部门没有及时公布相应的标准术语(包括新术语、同义词、近义词等), 因此就常常会产生歧义。例如:

①ebook,ebook有人就分别译为电子图书和电子书,牛津英语辞典中介绍An electronic book (also ebook, ebook, electronic book, digital book): as “an electronic version of a printed book”。 由于对电子书定义内涵不清楚,同一事物就有了不同的名称。

②general publishing data element of matedata, 有人译为出版元数据通用元素,有人译为通用出版元数据元素。因为出版元数据包括核心元素和通用元素,因此译为出版元数据通用元素是准确的。

③content structure 内容结构,对于传统出版者对该术语的理解只限于语法结构。但是有了数字出版技术后,该术语是指出版业专业领域描述资源相关特性的数据元素。它由描述性元素、技术性元素、管理性元素、结构性元素(例如与编码语言、命名空间、数据单元等)组成。

五 结 语 新闻出版企业拥有并掌握先进技术装备和内容数字化技术,以先进的技术手段生产出可共享的个性化内容产品,从而满足国家对文化安全的需求,满足读者对内容多样化的需求,满足版权持有人对保护其权益的需求。国际上流行的Docbook(一些标准和工具的集合)、DITA(一个基于XML 的体系结构,用于技术信息)等数字内容描述规范,是数字出版发展的基础,其中的术语对我国的数字出版是非常重要的。针对这种现状,需要尽快通过介绍国际规范,加强对数字出版术语的规范工作,以推进数字出版的发展和出版资源的充分利用。

我国是出版大国,现在出版业已经进入了由传统出版向数字出版跨越的关键时期。数字出版是一个科学体系,也是个全球产业体系,没有统一的技术标准、产业标准和产品标准,数字出版就不能快速发展。而系列标准中的术语标准是基础,没有基础就不可能健康发展。希望有关管理部门更多地借鉴国外的先进经验,尽快规范数字出版的术语,制定相关术语标准、术语规范,并积极宣传、推广。