您当前所在位置:

对古代史料数字化诸问题初步研究

2013-04-02

【摘要】:历史,一是指过去事实的记载;二是指已过去的事实;三是指经历,底细;四是指自然界和社会的发展进程,沿革,来历;五是指以过去的经历和事迹的痕迹;六是指历史学科。精品学习网论文网为您提供历史论文范文参考,以及历史论文写作指导和格式排版要求,解决您在论文写作中的难题。

史料包括历史文献与史迹遗存,是史学研究的基础。中国历史悠久,历代文献遗物浩如烟海,近现代又有大批新史料发现与累积。史学界对史料的整理和研究历来非常重视。王国维使用两重证据法,“取地下之实物与纸上之遗书辨证,取异族之故书与吾国之故籍互相补证,取外来之观念与固有之材料互相参证”,进行古史新证,解决了许多重大史学问题。顾颉刚等“古史辨”派以疑古辨伪为宗旨,进行了系统的古史辨伪,“古史辨”作为对“古书”与“古事”的—种史料考订工作,颇有意义。[1]以傅斯年为代表的史料学派提出了“史学即是史料学”的观点,傅氏认为:“只要把材料整理好,则事实自然显明了。一分材料出一分货,十分材料出十分货,没有材料便不出货”,他们彻底从故纸堆中脱身而出,宣称不读书只找材料,“上穷碧落下黄泉,动手动脚找东西”,[2]在考古等领域很快取得举世瞩目的成绩,一举超越前人的成就。陈寅恪和陈垣等诸先生也都十分重视史料,把考实作为治史方法的前提。郭沫若、吕振羽、翦伯赞、侯外庐、范文澜等先生高举马克思主义史学观之利器,“将历来为封建学者所湮没、改造、曲解的古代史料,加以重新辨别、整理和阐发”,开辟了中国历史研究的新途径。

人类已经进入信息时代,我们现在不仅面临着用新技术来整理旧史料的问题,而且随着考古新发现的不断涌现和科技的发展,史料的容量和形式急剧膨胀。以何种方法处理、存储史料,并且能够让学者从中方便迅速地检索和得到所需的信息,是当前史料学的一个大问题。

数字化是史料处理的必由之路。第一,把各种史料统一为计算机数据,方便存储和检索;第二,使史料的物理体积大大缩小,方便携带;第三,可以低成本无差错拷贝,方便传播和普及。目前,不论是印刷文档、手写稿,还是电子文档、音像文件、甚至于遗址与文物,越来越多的史料逐渐被数字化,出现了数据仓库(Data warehousing)、数据集市(Data mart)、数据采集(Data mining)等新概念和信息数字化处理方法,逐步形成了大数据量存储和管理模式。全球范围内,建立史料数据库逐步成为潮流。联合国推动Memory of the World计划以挽救某些濒临灭绝的人类文明,西方各国也无不积极推动数字图书馆、数字博物馆或数字典藏建设,如:美国有国会图书馆的American Memory计划和六所大学所主导的数字图书馆计划等;加拿大有国家数字典藏计划(Canada’s National Digital Collections);日本和IBM合作的数字博物馆计划;大英图书馆的敦煌数据数字化计划等,不胜枚举。自上世纪90年代中期以来,因特网技术对整个社会的影响程度全面加深,信息科技已然启开了社会全面急速变迁的序幕。借助网络之一利器,分散在世界各地的史料数据资源得以有效整合,因特网已经成为一个超大型的史料数据库。但是,从总体来看,史料数字化的研究和实践才刚刚起步,还处于探索阶段,因此,对史料数字化进行整体的研究是很有必要的。

下面,本文把史料按照其性质分为两类进行讨论,其一为人类精神产品类史料——文献;其二为物质产品类史料——文物。

历史文献的数字化

历史文献作为人类精神产品,具有可复制性和可移植性,并且必须依托载体而存在。国家标准局批准公布的GB4894—85《情报与文献工作词汇——基本术语》定义道:“文献是记录有知识的一切载体”。根据这一标准定义,历史文献就是以文本、图形、符号、音像、软件等各种形式固化在一定物质载体上的历史资料,其物质载体为:纸、胶片、磁带、光盘等。历史文献数字化的目标是将原来在各种物理载体上存储的信息,统一转变为最基本的比特,用0和1来表示,成为计算机可以识别的数据。

历史文献数字化的终极形式为数字图书馆的出现。所谓数字图书馆,就是利用现代信息技术对有价值的图像、文本、语音、音响、影像、影视、软件和科学数据库等多媒体信息进行收集,组织规范性的加工和压缩处理,使其转化为数字信息,然后通过计算机技术进行高质量保存和管理,实施知识增值,并通过网络通讯技术进行高效、经济地传播、接收,使用户可以在任何时间、任何地点,都能从网上得到各种服务,为公民的终身学习机会做出贡献,成为国家的知识基础设施。[3]

建立数字图书馆的关键在于以统一的标准和规范为基础,表现为同一类型文件格式的统一。当前,数字图片格式主要有BMP、GIF、JPG、PCX、TGA、TIF等;数字音频格式有WAV、MP3、MIDI等;数字视频格式有mpg、mov、avi、rm等;网页格式有html, vrml,xml,sgml等;数据库有Oracle, SQL Server, Sybase, DB2, Informix, Access等。文献数字化的过程中一般采取最通用的文件格式,这样既便于为最多的人服务,又便于数据的升级。数字图书实现形式主要有两种:一是采用扫描录入方式将书籍资料按原貌逐页存储为图象文件;二是以文本方式存储文献内容,辅之以全文检索系统构成全文检索数据库。前一种方式适合古籍善本和以往出版图书的数字化,后一种适合新出版图书的数字化。

建立数字图书馆的设想首先由美国人提出,1994年6月,美国召开了“第一届数字图书馆理论与实践年会”。同年9月,美国国家科学基金会(NSF)、国家宇航局(NASA)和国防部高级研究署(AKPA)联合公布了一项为期4年、投入2440万美元的《数字图书馆启动计划》(DLI ,Digital Library Initiative),在斯坦福大学、密西根大学、伊利诺斯大学、卡耐基-梅隆大学、加州大学伯克利分校和圣·巴巴拉分校等6所高校进行数字图书馆的分项研究。同年10月,美国国会图书馆推出数字化项目,领导与协调全国的公共图书馆、研究图书馆,将其收藏的图书、绘画、手稿、照片等转换成高清晰度的数字化图像并存储起来,通过互联网供公众利用。继美国之后,英国、法国、日本、德国等西方发达国家以及亚洲的新加坡、韩国也先后提出各自的数字图书馆计划,投入巨额实施资金。

我国数字图书馆建设开始于1997年,北京图书馆作为国家图书馆,经国家计委批准建立了“中国试验型数字图书馆”项目,并开展了与此有关的专题科研。同年12月,我国民营计算机高科技企业北京世纪超星信息技术有限公司将其远程图书浏览器安装到瑞得在线网站上,创建了国内首家以图像存储为主的数字图书馆——超星数字图书馆,此后,国家连续实施了“中国数字图书馆工程”和“中国数字图书馆示范工程”,国内各大图书馆和高校纷纷跟进,掀起了一股数字化潮流。据不完全统计,目前国内的中文数字图书馆已达数百家之多,以学术专业书籍为主要内容的超星数字图书馆的数字图书已超过到40万种,中国数字图书馆也已达20万种以上。此外,书生之家“中国图书网”和方正apabi数字图书馆也都非常有实力。

目前,我国科技期刊的全文数据库主要有“中国期刊网”、“万方数字化期刊网”和“维普中文科技期刊全文数据库”等,以中国期刊网为例,收有几年来5300种期刊的全部文章,重要期刊几乎被网罗殆尽。

更多精彩内容请点击:精品学习网 > 论文 > 人文社科 > 历史