内容提要:主要对专志内容数字化的涵义作了简要阐释;从信息网络时代的必然要求、续志体例体裁的要求、控制专志篇幅体量的需要与满足读者阅读习惯的需要4个角度,阐述了数字化的作用和意义;论述了表格的资料性、附属性、时限性、准确性和规范性5个本质特征,与互补性、便览性、统一性、可比性和合理性5个非本质特征;按文字与数字的比例,将表格划分出数字表(统计表)、文字表和数文复合表,按框线结构形式划分出的有线表、无线表,分析了表格的分类和形式。最后,提出了专志数字化(表格)的三项规范原则和要求:(一)比例适当,体量相宜的原则;(二)注重规范,保障质量的原则,包括表题规范、序号统一,表目整齐、跨页续表,单位确切、价格清楚,数值准确、见歧加注4项具体要求;(三)注明出处,有稽可考的原则。
主题词:专志 表述 数字化 初探
地方志一般有述、记、志、传、图、表、录7种体裁,述、记、志、传、录多为文本信息,图、表为非文字信息。旧方志主要的信息语言就是文、图、表三种,表主要有职官表、人物表两种文字表格,是文字编排的不同方式,不是真正意义上的表格。因此,可以说旧方志的信息语言就只有“文、图”两种。而首轮修志中存在数字化内容文字化表述、以文代表的现象,忽视了专志内容的数字化,本轮续志有必要对专志中要素、项目、指标和参数等较为齐全的内容如何进行数字化,设计为表格来反映,展开专题研究。本文对在二轮修志中的市县志专志内容表述的数字化进行初步探讨,以期促进专志内容表述的质量进一步提高和优化。本文所称的数字化并非指出版志书光盘版、上网或建立地方志门户网、地情信息网所指的数字化,而是专指志书内容表述的数字化,即应该用表格、图表表现的内容的系统化、条理化和规整化。
一、专志内容表述数字化的含义
专志内容表述的数字化是指以表格的形式来反映入志史料和信息的记述体裁和形式。数字能集中、准确反映事物的绝对量和所处状态的度,通过对比反映事物发展变化的速度、幅度、趋势和规律,表现事物间的比例关系。专志内容数字化的实质是地情信息和历史信息(史料)的系统化,是专志内容的规整化、信息化和系统化。二轮修志时限近而时间短,数据比较齐全,表格在续志专志部分的使用十分普遍。我们把专志中明显采用板块化排列、不按自然段排列的形式统称为表格,或称表线化,所反映内容结构更加严谨,层次更加分明。一部300万字左右的市级续志如果表格化资料占总篇幅的30%~40%,表格的篇幅将达到90万~120万字。如果表格体裁使用偏少、不到位,或以文代表,或者表格制作不规范,都是全志体例、规范方面的重大缺陷。
二、专志内容表述数字化的作用和意义
专志内容的数字化具有用表格(表线化形式)来表现历史资料信息的功能。俗话说“一图胜千言”,如果表格运用得当,也能收到“一表胜千言”的奇效。
(一)专志数字化是信息网络时代的必然要求。现代社会许多事物都是量化的,涉及的经济、技术、社会和发展的指标、数据繁多,每人每天都要接触大量的数字数据。志书要对历史上发生的重大事件事物进行较详实的记载,就离不开用表格来反映事物和事件。因此,表格是志书保存史料、承载信息、传承历史的一种重要形式,也是地方志数据库、地情信息库建设必须的一种载体形式
(二)专志数字化是续志体例体裁的要求。表格和图表本身就是志书的一种重要体裁,用数字表述一个地方各行各业、诸事多年的状况,具有化繁为简、聚零为整、纵横比较、文省事明的作用,能起到朱彝尊所称的“揽万里于尺寸之内,罗百世于方册之间”效果。从首轮修志中出版的许多市县志书的专志总体量来看,文字所占比例偏高,用表格、表线化反映的数字化内容所占比例偏少,存在较浓的“表线化内容文字化表述”色彩,从以下例证可以看出,部分应用宜用表格、表线化形式表现的内容采用大段冗长的文字表示,造成叙述沉闷、难以卒读的现象。
如《某某市志·物价》之《物价水平篇》之《物价指数章》第一节《零售物价指数》有段文字“生活费指数:以1939年为100.00,1940—1943年分别为130.50、164.10、185.80和196.90,4年物价上升近1倍。其中饮食费指数以1939年为100.00,1940—1943年分别为143.10、193.50、217.40和229.80,4年上升1.3倍。黑市价格,以1941年为100.00,1942—1945年分别为163.80、354.10、703.00和2136.00,4年中上升20多倍。”原文共5行215字。可改为先用文字叙述“1939~1943年,物价飞涨,生活费指数上涨96.9%,其中饮食费指数4年上升涨129.8%;1941~1945年,黑市价格上涨20.36倍。”仅72字,下接一张表,就更加清晰明白,见附表一。
附表一 《1939~1945年零售物价指数表》
年份
|
生活费
指数
|
饮食费
指数
|
黑市
价格
|
年份
|
生活费
指数
|
饮食费
指数
|
黑市
价格
|
1939
|
100.00
|
100.00
|
-
|
1943
|
196.90
|
229.80
|
354.10
|
1940
|
130.50
|
143.10
|
-
|
1944
|
-
|
-
|
703.00
|
1941
|
164.10
|
193.50
|
100.00
|
1945
|
-
|
-
|
2136.00
|
1942
|
185.80
|
217.40
|
163.80
|
|
|
|
|
(三)专志数字化是控制专志篇幅和体量的需要。从二轮修志实践来看,不管是已经出版的续志,还是评审定稿的续志,体量都膨胀得相当惊人。许多专家提出削肿减肥,把一部县(市、区、旗)续志字数控制在30万~50万字,把一部市(地、州、盟)续志控制在100万~150万字,可能将成为天方夜谈,因为根本不具现实可操作性。究其主要原因有二,一是改革开放后,新生事物层出不穷,经济社会文化发展日新月异,一日千里,续志需要记载的事物事件、史料信息包罗万象,过去讲志书是一地之百科全书,实际上,若按当今一地所具备的产业、行业、专业和学科详细划分,称为“千科全书”亦不为过。这样志书自然就需要更多的文字量,压缩体量的任务实难完成,副省级城市续志近千万字数、地级市续志三五百万字者,比比皆是;二是续志初稿中有大量篇幅的数字性化内容用文字表述,势必造成体量膨胀。而数字化(表格)具有压缩篇幅、控制体量的特殊功能,一表胜千言,势必用数字化来控制体量。
(四)专志数字化是满足读者阅读习惯的需要。信息时代多姿多彩的各类信息爆炸,呈几何级数增长。阅读者不论是在虚拟的网络世界还是在实存的现实社会,都需要掌握必要的信息抓取技术。而志书又是一个地方的百科全书,横陈百科,纵述脉络,更应重视采用便捷的信息获取技术,而表格、表线等数字化形式具有形象直观、准确整齐的特点,便于读者获取信息,适合读者阅读习惯,表格设计制作法就是一种简便的志内信息获取技术。因此,对于涉及门类、项目、要素和指标纷繁复杂且数据较为齐全的内容,表格就成为最合适的表述体裁和方式。
三、专志内容数字化的特征
数字化、表线化内容是续志专志内容的重要组成部分,具体表现形式主要是表格。高邮市地方志办公室的孙铎在《浅析地方志书和综合年鉴表格的基本特点》中提出了志书表格的10个特点,称为“十性”。笔者把“十性”归纳为5个本质属性和5个非本质属性,这只是一种基本的、粗浅的划分,先提出来探讨,以待方志专家提出更好的研究成果。
(一)本质属性。表格的本质属性有资料性、附属性、时限性、准确性和规范性。
1.资料性。表格是志书资料、史料的重要载体,资料性是志书的重要属性。因此,资料性为志书表格的首要特征,表格与志书文字内容和年鉴文字条目一样,都具有资料性。
2.附属性。表格固然重要,在志书中占有重要的地位,但其始终是作为文字内容的补充,居于附属、从属地位,不能本末倒置,舍本逐末。
3.时限性。志书具有非常确切的年代断限。因此,表格所记录的内容和信息也必须符合志书的上下限,不得突破。
4.准确性。真实性的志书的生命。因此,专志表格所记录的内容信息都要准确无误,并且要与相关文字内容记载保持一致、口径统一。
5.规范性。志书的体例、记载内容和形式都有严格的规范要求。因此,专志表格也要符合志书编纂规范和质量评审验收标准的规定和要求。
(二)非本质属性。专志表格具有互补性、便览性、统一性、可比性和合理性等非本质属性。
1.互补性。表格与专志的文字叙述内容应相互补充,相互映衬。
2.便览性。志书表格内容应明晰、直观,要方便读者阅读、查检。
3.统一性。表格的标题、序号、表栏、文字和数字排列与间距、转行字体、字号等格式都应当统一。
4.可比性。志书表格要保持连续性、衔接性,表格宽度允许的话,要进行纵向比较,要增加反映速度、幅度的表项,以确保可比可考。
5.合理性。志书表格的表头、表栏和表项的内容要合理,既要符合常理,又要符合历史事件、事物,还要为读者着想,设计得较为实用。
四、专志数字化(表格)的分类和形式
(一)按文字与数字的比例划分,即按表格数据划分为数字表、文字表,以及数字与文字兼有、各占比例相当的数文复合表三种。还有一种特殊的表格即图表,就是根据结构较简单的表格制成的统计图、示意图。
1.数字表。又称统计表、数据表,指表文全部或大部分为数字的表格,是为反映统计资料用纵横交叉的线条绘制的。按形式,又可分为简单表、分组表和复合表,简单表一般是不嵌套子表的数字表,复合表是指如综合指标叠加分组指标、主表中嵌套有子表的数字表。统计表又可分为调查表、整理表和分析表。如《某某市志(1840-1987)》之《城乡建设》卷的《房地产》章《其他房地产》节《社团房地产》目正文为“据1950年房地产登记,全市社团571个,共有房屋453栋,建筑面积259191平方米,其中祠堂29328平方米、庙宇16201平方米、会馆10712平方米、行会29386平方米、寺林17244平方米、慈善公益22816平方米、宗教团体60115平方米、其他73389平方米;共有地产915279平方米,其中祠堂75579平方米、庙宇41172平方米、会馆90993平方米、行会38597平方米、寺林31234平方米、慈善公益70500平方米、宗教团体519240平方米、其他47664平方米。”可整理设计为下表《某某市社团房地产登记情况表》。
某某市1950年社团房地产登记情况
单位:平方米
类 别
|
房 屋
|
地 产
|
类 别
|
房 屋
|
地 产
|
全市总计
|
259191
|
915279
|
寺 林
|
17244
|
31234
|
祠 堂
|
29328
|
75579
|
慈善公益
|
22816
|
70500
|
庙 宇
|
16201
|
41172
|
宗教团体
|
60115
|
519240
|
会 馆
|
10712
|
90993
|
其 他
|
73389
|
47664
|
行 会
|
29386
|
38597
|
|
|
|
2.文字表。表体全部或大部分为文字的表格称为文字表。如《金坛市志(1988~2007)》的《1980~1991年金坛县优质工业产品情况表》《2001~2007年金坛市获国家、省、市名牌产品情况表》和《1984~2007年金坛市(县)获省名优、名牌农产品情况表》等表格,都是文字表。又如某某市志《民俗方言志》的《会馆篇》有载“湖广会馆奉祀大禹或真武祖师,又称其会馆为‘禹王宫’,有的又称‘真武宫’、‘三楚宫’;湖南会馆称‘南岳宫’,奉祀南岳神;江西会馆名‘万寿宫’,奉祀许逊,或供奉吕遵及九皇神位;新都县的江西会馆又为裴姓的族庙。福建会馆奉祀林妃,又称‘妈祖’,名‘天后宫’;广东会馆信仰佛教,奉祀禅宗六祖慧能,名‘南华宫’;浙江会馆祀吴大夫伍员、吴越王钱缪,名‘列圣宫’;江南会馆祀准提,名‘准提庵’;山西会馆祀关羽,名‘关帝庙’;陕西会馆称‘三元宫’,奉祀关羽、三官大帝(即……引者省略);云贵公所祀唐南霁云,俗称‘黑神’,故又称‘黑神庙’。贵州会馆,称‘荣禄宫’、‘乾阳宫’、‘黑爷庙’。四川会馆称‘川主宫’、‘土主庙’、‘惠民宫’、‘华光寺’,奉祀李冰、二郎或五显神。云南会馆又称‘景庄庙’,奉祀南诏国王异牟寻”。原文共400字,可改为文字表《某市市区会馆情况表》,见下表。
某市市区会馆情况
馆 名
|
别 称
|
奉祀主神
|
馆 名
|
别 称
|
奉祀主神
|
湖广会馆
|
禹王宫、真武宫、三楚宫
|
大禹、真武祖师
|
浙江会馆
|
列圣宫
|
吴大夫伍员、吴越王钱缪
|
湖南会馆
|
南岳宫
|
南岳神
|
陕西会馆
|
三元宫
|
关羽、三官
大帝
|
江南会馆
|
准提
|
准提庵
|
广东会馆
|
南华宫
|
禅宗六祖慧能
|
福建会馆
|
天后宫
|
林妃(妈祖)
|
山西会馆
|
关帝庙
|
关羽
|
云贵公所
|
黑神庙
|
唐南霁云,俗称“黑神”
|
贵州会馆
|
荣禄宫、乾阳宫、黑爷庙
|
|
四川会馆
|
川主宫、土主庙、惠民宫、华光寺
|
李冰、二郎、五显神
|
云南会馆
|
景庄庙
|
南诏国王异牟寻
|
江西会馆
|
万寿宫
|
许逊、吕遵、九皇神位
|
|
|
|
为保留对该市会馆文化、奉祀文化记述的完整,表下可对新都县的江西会馆和陕西会馆奉祀的三官大帝加注,这样既省略了许多引号,更一目了然,也便于对各会馆情况进行比较。
3.数字文字复合表。简称数文复合表,有的表栏是纯文字,有的表栏是纯数字,文字、数字交叉复合于一表,如反映重点工程、科技科研项目情况的表格,既可以有工程项目概况的文字介绍性表栏,又可以有反映经济指标、技术指标的数字性表栏,文字、数字基本平分秋色。
如《常州市武进区志(1986~2007)》的表1-10《2006年武进区土壤情况表》就是一个典型的数文复合表(因篇幅所限仅选取该表一部分以说明数文复合表的样式,表内面积单位为公顷)。
土类
|
亚 类
|
土 属
|
土 种
|
面 积
|
占比(%)
|
分 布
|
水
稻
土
|
渗育型
水稻土
|
沙 土
|
狗头沙土
|
299.05
|
0.61
|
奔牛、嘉泽西部
|
粘底沙土
|
18.67
|
0.04
|
嘉泽西部
|
小粉沙土
|
83.88
|
0.17
|
郑陆东南部
|
潴育型
水稻土
|
老黄泥土
|
老黄泥土
|
755.82
|
1.55
|
嘉泽
|
黄泥土
|
黄泥土
|
19432.20
|
39.96
|
平田地区与白土交错分布,圩田地区边缘与乌栅土、灰芦土相接
|
乌底黄泥土
|
595.75
|
1.23
|
与黄泥土分布同
|
软质黄泥土
|
1489.02
|
3.06
|
邹区、西部边缘
|
4.图表。即统计图、示意图,包括曲线(折线)图、条形图、柱状图、圆饼图等,用点线面的结合来表现数值之间的关系,直观地反映数字比较产生的幅度变化与比例结构。王曜卿在其《关于志书图表应用的探索》一文认为,利用现代技术手段来创建图表,操作非常简单方便,专志的大部分表格是行列数不多、较为简单的数据表,均可直接转换为图表,直观反映,一目了然。必要时,编辑可以在图表上添加原始数字,标注数据,增加一个参照标本。《中牟县志》原有一个全县土壤类型构成表,用计算机转换为圆饼比例图、标注数据后,各类土壤面积占土地总面积的比例立刻鲜活地显示出来。
(二)按框线结构形式划分,为有线表、无线表。有线表又可分为规整表、不规整表,又分为开放式表格、封闭式表格。志书按科学文献、公开出版物的要求,采用开放式表格,即去掉左右墙线,左右两端不封闭。无线表可分为有表头无线表、无表头无线表。有表头无线表指表序、表题和表目齐全的无线表,无表头无线表指不用列表序、表题和表目的无线表,如关于机构和领导的专志中的领导人任职表,只要直接排列职务名称、人名和任职时间,排列整齐,一目了然。
五、专志数字化(表格)的规范原则和要求
专志内容的数字化不是为数字化而数字化,而是根据专志内容的内在要求来设置表格,作为志书一种重要体裁,必须遵守严格的规范和要求。续志“专记”若有表格,其规范应与“专志”的表格规范相同。
(一)比例适当,体量相宜的原则。编纂人员设计志书数据表格一定要把握科学、适度的态度,处理好与文叙述的体量比例关系,不能毫无节制地堆砌表格,更不能资料不够表格来凑,应该做到当文则文、当表则表,宜文则文、宜表则表,文表互配、相得益彰。定性叙述较多时,应当有一定的定量叙述,用适量的表格资料来充实史料,让叙述具体化,内容更加充实。既要尽可能保证表格的信息量,又要控制表格体量,压缩篇幅,结合篇目对表目、表项进行合理剪裁,合并与主题关系不大或无关的行和列,一般不用未加工的原始表,不能有太多的折表和横向表。
(二)注重规范,保障质量的原则。专志内容记述中,文字自有其表述规范,表格当然也有设计规范,有严格的质量标准和要求。在制作表格、实践现数字化的过程中,要严格按照规范设计制作表格,征集、填写表内文字、数字等数据。首轮志书存在表格内容选取不当(应作表而未作)、设计不够规范、随意性较大、表体尚较粗糙等诸多问题。
下面举例说明表格设计制作质量的规范要求。如某市首轮市志《涉外房地产目》原文“至1949年解放前夕,全市的涉外房地产共有土地572461平方米,房屋275.5栋,建筑面积87656平方米。其中:美国占有土地346511平方米、房屋147栋,建筑面积44892平方米;英国占有土地110301平方米、房屋28栋,建筑面积8538平方米;意大利占有土地85726平方米、房屋65.5栋,建筑面积21595平方米;日本占有房屋4栋,建筑面积2225平方米;瑞典占有土地2377平方米、房屋3栋,建筑面积798平方米;挪威占有土地6416平方米、房屋6栋,建筑面积2025平方米。此外,尚有英、美等国家共同占有土地21129平方米、房屋22栋,建筑面积7605平方米。”共292字,涉及6个单独的国家和一个复合区域(英美等国),加上“全市合计”共涉及8项和土地、房屋及其建筑面积3个指标,项目、指标相当整齐,可改列为《某市1949年(解放前夕)涉外房地产调查情况表》,见下表。
某市1949年(解放前夕)涉外房地产调查情况表
国 别
|
土 地
(平方米)
|
房屋(栋)
|
房屋建
筑面积(平方米)
|
国 别
|
土地
(平方米)
|
房屋(栋)
|
房屋建
筑面积
(平方米)
|
合 计
|
572461
|
275.5
|
87656
|
瑞 典
|
2377
|
3
|
798
|
美 国
|
346511
|
147
|
44892
|
挪 威
|
6416
|
6
|
2025
|
英 国
|
110301
|
28
|
8538
|
日 本
|
-
|
4
|
2225
|
意大利
|
85726
|
65.5
|
21595
|
英、美等国
|
21129
|
22
|
7605
|
1.表题规范,序号统一。专志中在正文节、目标题下无叙述文字的情况下不能直接列表格,不允许以表代文。表题名称要规范,与表内记录内容相符,应包含地方单位、时间、事项和性质四要素,政区的名称在不引起疑义的情况下可省略,如《绍兴市志》的《酿酒工业重要企业基本情况》等表格的标题都不标“绍兴市”,政区名称也可以加上。时间要素可放在前面,亦可放在表题下一行加括号。表序已有“表”字,表题最后不用“表”字。表题一般不加标点符号,不允许出现无表题的情况,不能在正文末尾用“具体情况见下表”代替表题。表序一般以编(卷、篇)为单位依次排列,如第一篇第三个表写为“表1-3”,依此类推;也可以章为基本单元排序,如“表1-1-3”。全志表序排法要统一,表序可与表名同行排表名前,空一格排表名;也可排在表题下一行左上角。
2.表目整齐,跨页续表。表目即表格内的栏目或项目,分为横表目、纵表目。横表目也称横行标题,主栏目、主词列在表的左侧,一般为年份;纵表目也称纵行标题,宾栏目、宾词列在表的上端,一般为数据名称。表头左上首栏不宜用斜线格。表目要注意排序,或按时间顺序、数量大小,或按行政区划,不能凌乱。跨页的续表不再列表题,必须标“续表”与序号,不能标“续上(前)表”和“接上(前)表”。
3.单位确切,价格清楚。整表通用的计量单位排在表题下一行的右上角,可右缩进两格,亦可不缩格,如何把握要与表序相对应。计量单位如表中只有1~2个可写在右上方,有3个或3个以上的可在指标标题的下方或右侧括注计量单位。表题或栏题已包含单位的不再加注单位,如《某某市中小学校历年毕业人数》。法定计量、常用非法定计量单位要用汉字,要避免汉字和字母兼用的不规范现象。在续志时限内,以经济指标为主的表格涉及到统计上的1980、1990、2000、2010不变价4种和现行价,共5种价格关系,必须明确,否则不具有可比性,出版后不能为读者、研究者使用,将会徒劳无功。
4.数值准确,见歧加注。表栏外延要清楚,内涵要确切,数据要反复核实,准确无误。数字子母项、分合数要相符,分项数与合计(总计、累计、小计)数要相符,各分项的百分比相加要等于100,合计、总计栏应排在前或在首位,不要放在后面或末位。数字以小数点为准纵行上下对齐,表内数据一般保留小数点后两位,不使用千分号。纵横栏口径要一致,表中数字与正文的相应数字要统一。分项数空格不能太多,否则失去列表的意义,缺少或不存在或免填的数据应进行技术处理。
(三)注明出处,有稽可考的原则。一般来说,表格是由正文引出,必须与正文相有机衔接,必须是正文提及的内容,正文都有交代,表题要与正文一致。表格尤其是大体量、整版整块的表格必须在表下注明资料来源,一为证明资料内容的真实性、科学性,二为方便读者、研究者查证,有稽可考,对表格所依凭的资料进行深入的考证研究。
(作者为常州市地方志办公室编纂二处处长、常州市地方志年鉴学会秘书长、江苏省地方志学会理事)
|