探訪文溯閣《四庫全書》數(shù)字化影印出版工程(人民眼·讓文物活起來③)
引 子
登臨蘭州北山九州臺,甘肅省圖書館文溯閣《四庫全書》藏書館躍入眼簾——館樓飛檐翹角,踞北山而瞰黃河。
自正門入樓,穿鞋套,做登記,進書庫。書庫恒溫恒濕,1128個香樟木書箱層層疊疊,收錄典籍6141函、3474種、36315冊的文溯閣《四庫全書》就安放于箱中。
2023年6月,習(xí)近平總書記在中國國家版本館中央總館考察調(diào)研時,詳細聽取《四庫全書》版本源流、紙張印刷、保護收藏等介紹,叮囑工作人員:“我最關(guān)心的就是中華文明歷經(jīng)滄桑留下的最寶貴的東西。中華民族的一些典籍在歲月侵蝕中已經(jīng)失去了不少,留下來的這些瑰寶一定要千方百計呵護好、珍惜好,把我們這個世界上唯一沒有中斷的文明繼續(xù)傳承下去。”
《四庫全書》編纂于清代乾隆年間,是我國歷史上規(guī)模最大的叢書,修成后謄抄7部,分藏于紫禁城文淵閣、圓明園文源閣、盛京(今沈陽)文溯閣、承德避暑山莊文津閣、杭州文瀾閣等地。目前存世三部半,分別為文淵閣本、文溯閣本、文津閣本,以及被稱為“半部”的文瀾閣殘本。其中,文溯閣本輾轉(zhuǎn)多地,于2006年入藏現(xiàn)在的藏書館,也是“三部半”中唯一尚未完整影印出版的一部。
為了讓書寫在古籍里的文字活起來,經(jīng)過長期縝密的籌劃論證,2021年8月,甘肅省正式啟動文溯閣《四庫全書》數(shù)字化影印出版工程。
目前,文溯閣《四庫全書》數(shù)字采集工作已全部完成,數(shù)據(jù)處理工作完成70%。從現(xiàn)在起至2028年,文溯閣《四庫全書》將按經(jīng)、史、子、集四部,分期分批推出全套影印版本。
數(shù)字采集
采集方案、流程規(guī)范和相關(guān)作業(yè)標準周密完善
約8億字的文溯閣《四庫全書》共有多少頁?數(shù)字化之前鮮有人知。
“換算為現(xiàn)代書籍頁碼,共488萬多頁。”文溯閣《四庫全書》數(shù)字化影印出版專職工作組組長宋學(xué)娟說。
作為讀者出版集團有限公司所屬的讀者古籍數(shù)字科技中心總經(jīng)理,宋學(xué)娟過去兩年多時間帶領(lǐng)團隊把文溯閣《四庫全書》從紙上“搬進”了電腦——逐頁掃描、存入,數(shù)據(jù)資源總量逾700TB(太字節(jié))。“如果用常見的容量32GB的U盤存儲,需要2.2萬多個才能裝下。”宋學(xué)娟說。
文溯閣《四庫全書》既是歷史典籍,又是珍貴文物。若藏于高閣,難以活化利用;若活化利用,又有損壞之虞。如何破解“藏”“用”兩難?2021年8月,甘肅省委宣傳部制定《文溯閣〈四庫全書〉數(shù)字化影印出版工作重啟方案》,力求在保護的同時“喚醒”古籍。
古籍真本由甘肅省圖書館提供,數(shù)據(jù)采集處理、影印出版等工作由讀者出版集團有限公司具體實施。數(shù)字化影印出版工程分為“數(shù)字采集—數(shù)據(jù)處理—影印出版及數(shù)據(jù)庫建設(shè)”3個階段。所需經(jīng)費,部分由中央文化產(chǎn)業(yè)發(fā)展專項資金、甘肅省財政資助,部分由讀者出版集團有限公司自籌。
數(shù)字采集,免不了要接觸古籍真本,如何確保其安全無損?甘肅省圖書館和讀者出版集團有限公司制定了周密完善的采集方案、流程規(guī)范和相關(guān)作業(yè)標準,“54條數(shù)字化工作流程規(guī)定,涵蓋前期準備、文獻出庫、數(shù)據(jù)處理等全部流程。”宋學(xué)娟介紹。
為保古籍安全萬無一失,文溯閣《四庫全書》藏書館二樓會議室被改造成了數(shù)字采集室,做到原書“出庫不出館”。而從書庫到采集室,平常不到一分鐘的路程,藏書館90后館員魏喬波卻要走好幾分鐘:戴上白色手套,細查一遍即將出庫的古籍,再輕輕捧起,就像捧著一碗不能灑出的水,慢慢往樓上“移”,“就怕腳下不穩(wěn)”。
“古籍出庫,要填報11類表格,層層審批。歸還時,所有細節(jié)都要對得上。”魏喬波說,以其中的《提書登記表》為例,提取古籍需詳細填報當日采集計劃、提取數(shù)量,然后與書庫管理員共同清點每一函、每一冊書,包括函盒、夾板、束帶、銅扣的存缺程度,每一冊古籍的題名、卷數(shù)、頁數(shù),以及有無破損、污跡或霉斑等情況,“這些都要一一記錄在案。一送一回路上、數(shù)據(jù)采集期間,古籍若有半點閃失,都會被及時發(fā)現(xiàn)。”
數(shù)字采集作業(yè)班班長楊旭勇告訴記者,采集時必須使用古籍專用非接觸式掃描儀高清掃描,且光源必須是冷光源。對采集人員,甘肅省圖書館的古籍專家也開展了多輪培訓(xùn)演練,“既要保證掃描精度與進度,還要避免傷害古籍,翻書的力道不能輕也不能重,要穩(wěn)而有力。”楊旭勇說。
準備周密,工作前期進展順利,意料不到的問題還是出現(xiàn)了。“古籍開本大小相同,厚薄卻不一樣。”宋學(xué)娟翻開一本書,拿到一臺掃描儀前比劃道,“超3厘米厚的古籍,用這種平板掃描儀掃描,靠近訂口的部分內(nèi)容很難被有效采集。”
為啥?不按壓,無法掃描;按壓,古籍易損,且采集到的內(nèi)容會變形。怎么辦?“為保證采集質(zhì)量,我們追加預(yù)算,在已采購10臺古籍專用平板掃描儀的基礎(chǔ)上,又購置了兩臺V型古籍掃描儀。”宋學(xué)娟說,使用這種掃描儀,只需將書翻開到90度,即可完成掃描采集,問題迎刃而解。
2021年12月23日,開機掃描;2022年5月23日,采集告竣。“整整5個月,經(jīng)過人員倒班,實現(xiàn)每天工作16個小時、一天未休。古籍沒有絲毫受損,函盒沒有增加一道劃痕。”陽光透過窗口,灑在黃底黑字的《文溯閣〈四庫全書〉數(shù)字化工作手冊》上,宋學(xué)娟長舒一口氣。
數(shù)據(jù)處理
數(shù)字文件與古籍真本如同孿生,最大程度呈現(xiàn)古籍原貌
偌大的房間里,數(shù)十名工作人員神情專注、緊盯屏幕,只聽見鍵盤敲擊聲此起彼伏。在讀者古籍數(shù)字科技中心的數(shù)據(jù)處理室,采集來的文溯閣《四庫全書》數(shù)據(jù),將被加工成標準的數(shù)字文件,供后續(xù)影印出版和數(shù)據(jù)庫建設(shè)之用。
“數(shù)據(jù)處理有4道流程,圖版處理、一校、二校和質(zhì)檢存儲。”宋學(xué)娟介紹,其中圖版處理是關(guān)鍵,主要工作是拼接完整“葉”。
葉,古籍特有的量詞。不同于現(xiàn)代書籍,古代紙張多為單面印刷,一張紙即為一葉,書冊由一葉一葉對折后裝訂而成。一葉,相當于現(xiàn)代書籍的兩頁。所以,數(shù)字采集到的掃描件實則都是半葉,圖版處理就是讓它們合二為一。
“最初,我們先在電腦上制作一個標準葉模板,再利用智能軟件,從掃描件上提取文字,貼在模板上。”宋學(xué)娟告訴記者,但實際操作中發(fā)現(xiàn),智能軟件可能會漏字、識錯字,且原本每一葉的版式不盡相同,模板統(tǒng)一后,有“失真”之嫌。
數(shù)字文件與古籍真本,如何保持孿生一般的相同面貌?“我們摒棄了標準模板,選擇了逐葉拼接,最大程度呈現(xiàn)古籍原貌。”宋學(xué)娟說。
圖版處理不易,校對任務(wù)也很繁重。文溯閣《四庫全書》數(shù)據(jù)校對人員張靜從事古籍校對工作已有10年,但從未校對過如此海量內(nèi)容。利用數(shù)字技術(shù)能夠提速,但一些訛誤很難被發(fā)現(xiàn)。
不久前,張靜在校對時發(fā)現(xiàn),一個“丸”字疑為“九”字。經(jīng)仔細核校后確認,果然是因為古籍宣紙里的植物纖維發(fā)生霉變,掃描時多出了這一“點”。
起初,一天校對300葉是張靜的上限。“剛開始時平均用力,耗時較多。”她說,而今這個數(shù)字翻了近3倍,“慢慢地,哪里容易出錯、哪里容易變色,心里都有了數(shù),效率提高不少。”
效率高了,膽子卻小了。“總擔心有錯誤沒能及時發(fā)現(xiàn)。”張靜回憶,有次下樓吃午餐,飯剛端上來,她又起身趕忙回到辦公室,“以為忘了標注一處訛誤,打開電腦一看,其實已經(jīng)做了記錄。”
為明確權(quán)責,避免誤操作,從圖版處理到一校、二校,再到最后的質(zhì)檢存儲,文溯閣《四庫全書》數(shù)據(jù)處理是條“單行道”。電腦之間不能互相訪問,數(shù)據(jù)傳給下一流程后,前一流程的人員將無權(quán)再改。
“在數(shù)據(jù)處理程序軟件和制度流程上,我們有一套完整設(shè)計,確保數(shù)據(jù)資源安全。”宋學(xué)娟輸入賬號、密碼,登錄數(shù)字化成果管理系統(tǒng),所有成品文件呈現(xiàn)在眼前,函盒編碼、書名、作者、朝代,以及長、寬、高和冊數(shù)等基本信息,都有詳細記錄。“我們爭取今年內(nèi)基本完成圖版處理工作。”她說。
影印出版
不少圖書館、藏書機構(gòu)等正虛位以待,靜待“四閣四庫合璧”
文溯閣《四庫全書》影印出版,匯聚了社會各界的期待。
西北師范大學(xué)教授趙逵夫全程參與了文溯閣《四庫全書》影印出版工程專家論證會。他說,《四庫全書》現(xiàn)存不同版本在內(nèi)容、冊數(shù)、卷數(shù)上皆有不同,通過數(shù)字化影印出版,方便學(xué)者比對研究,意義重大。
蘭州大學(xué)教授汪受寬也持相同觀點。他曾用兩年時間,帶著學(xué)生對甘肅省圖書館編印的《影印文溯閣四庫全書四種》進行整理、標點和精細校勘,并將收錄其中的《易圖說》《長安志圖》《墨法集要》《璇璣圖詩讀法》這4種(每種各1冊)書,跟文淵閣本進行對比,發(fā)現(xiàn)兩個版本的文字、圖片等存在901處差異。
“4冊書就有這么多差異,3.6萬多冊會是什么樣?”汪受寬說,“文溯閣《四庫全書》影印出版,將對文化史、史學(xué)史、文獻學(xué)研究等都產(chǎn)生重要影響。”
期望值高,現(xiàn)實問題也不少。一方面,古籍實現(xiàn)數(shù)字化后,盜印現(xiàn)象難以杜絕。另一方面,超大規(guī)模古籍的影印出版投入巨大,盈利是個難題。“變古籍為現(xiàn)代書籍,背后是大量的人力、物力、財力成本。”讀者出版集團有限公司所屬甘肅人民出版社社長、總編輯原彥平坦言。
防止數(shù)據(jù)泄露,采集區(qū)域設(shè)置嚴密安保措施。宋學(xué)娟介紹,任何人出入采集區(qū),都須經(jīng)過嚴格安檢,以防手機等電子設(shè)備進入工作區(qū)域。同時,每個工作臺均安裝了監(jiān)控設(shè)備,每臺電腦都作了加密設(shè)置。
應(yīng)對盈利難題,找準盈利點是關(guān)鍵。原彥平給記者詳細分析:古籍影印本主要有仿真本和縮印本。前者好比是“克隆體”,從紙張到字號,從排版到裝幀,與原書幾乎“一模一樣”;后者則是“迷你版”,內(nèi)容不變,但字號變小、頁數(shù)變少,冊數(shù)大幅縮減。“文溯閣《四庫全書》若是出全套仿真影印本,成本過高,市場較小。”
原彥平說,文溯閣《四庫全書》多達3.6萬余冊,數(shù)據(jù)采集、處理、編輯、出版等投入大,且多為手工完成,成本高,發(fā)行對象則主要為圖書館、文化館、高校、研究院所等專業(yè)機構(gòu)和為數(shù)不多的研究者。
2024年1月3日,文溯閣《四庫全書》經(jīng)部影印出版專題工作會議召開,確定了出版方案——縮印、16開本、236冊。“我們將按經(jīng)、史、子、集四部,分期分批推出縮印本。如果全套出齊,預(yù)計共1500冊。”原彥平說。
走進甘肅省圖書館的古籍閱覽室,其他三閣《四庫全書》的影印本旁,工作人員已為文溯閣《四庫全書》的影印本騰好了書架。
“古籍影印本看似小眾、銷路窄,實際上,版本好、印刷精美、定價合適的古籍,自有其發(fā)行空間。”從事出版行業(yè)20多年,宋學(xué)娟對文溯閣《四庫全書》影印本的市場前景頗有信心——版本獨一份,價值突出,公眾期待較高;自帶流量和話題,營銷成本較低,做到客戶明確、精準供給,就能減輕銷售壓力。
今年初,宋學(xué)娟帶領(lǐng)團隊參加2024北京圖書訂貨會。文溯閣《四庫全書》全套影印出版工作頗受關(guān)注,不僅有高校、圖書館、文博機構(gòu)的負責人,還有銷售商和個人前來咨詢。“據(jù)市場調(diào)研,不少圖書館、藏書機構(gòu)等正虛位以待,靜待‘四閣四庫合璧’。”宋學(xué)娟說。
“在做好保護工作基礎(chǔ)上,我們將深入挖掘文溯閣《四庫全書》價值,努力在信息服務(wù)、文化創(chuàng)意、文旅融合上求突破,讓這座資源寶庫在新時代活起來、用起來。”讀者出版集團有限公司黨委書記、董事長梁朝陽表示。
活化利用
首推精選本,開發(fā)文創(chuàng)產(chǎn)品,讓更多人領(lǐng)略古籍魅力
“宣傳推廣古籍的文創(chuàng)產(chǎn)品,既要開發(fā)周邊,更要聚焦古籍本身。”甘肅省圖書館館長肖學(xué)智說,不妨跳出杯子、本子、袋子等樣式,回歸古籍做文創(chuàng),出版精選本圖書。
汪受寬介紹,《四庫全書》歷來有“典籍總匯,文化淵藪”之譽,不僅囊括了從先秦至清代乾隆中期之前中國歷史上的主要典籍,而且涵蓋了中國傳統(tǒng)學(xué)術(shù)文化的各個學(xué)科門類和各個專門領(lǐng)域。
“卷帙浩繁通常也意味著無從讀起,從這個意義上講,讓‘高冷’的古籍變暢銷的書籍,就是好文創(chuàng)。”肖學(xué)智說。
啟函盒、取夾板、解束帶,《文溯閣四庫全書影印精選》露出真容。翻開書頁,映入眼簾的楷書溫潤大方、賞心悅目。每頁8行、每行21字,雖是手抄,可字的大小、間距幾無差異,工整如打印一般。
“共計40卷,分為3函、5種、18冊。”肖學(xué)智介紹,為突出甘肅文化特色,這套影印精選本甄選了文溯閣《四庫全書》子部所收古代隴人著作兩種——《潛夫論》和《拾遺記》,另外還有《文房四譜》《法書要錄》《畫史會要》等書畫藝術(shù)史經(jīng)典作品3種。
這樣一套精裝古籍,俘獲了不少讀者的心。“自去年5月出版發(fā)行,迄今已銷售680多套,平均每天銷售約2套,這在古籍中銷量不低。”甘肅省圖書館文創(chuàng)中心負責人介紹,甘肅省圖書館10多年前就曾出版《影印文溯閣四庫全書四種》,暢銷至今,共售出5600多套。
“優(yōu)質(zhì)的古籍,就是優(yōu)質(zhì)的文創(chuàng)。”肖學(xué)智說,近年來,甘肅省圖書館以文溯閣《四庫全書》為素材,從其包裝方式、撰寫格式、用色寓意、人文理念等角度汲取靈感,推出了一系列文創(chuàng)產(chǎn)品,“目前,我們正挖掘文溯閣《四庫全書》中的龍元素,即將推出特色伴手禮。”
“古籍活化,不能止于開發(fā)文創(chuàng)產(chǎn)品。”肖學(xué)智說,為了讓更多人樂于走近文溯閣《四庫全書》,領(lǐng)略古籍魅力,甘肅省圖書館打造了多個文創(chuàng)場景——線上,推出“文溯·隴跡”等專欄,在“云”上賦予古籍新話題;線下,建成甘肅省圖書館文溯閣《四庫全書》藏書館展廳,讓參觀者沉浸式體驗纂修、流傳、保護、發(fā)展等歷史場景,與“書”同行……
“我們舉辦的‘千古巨制——《四庫全書》展’是國內(nèi)較早推出的《四庫全書》專題展覽,至今已在全省50多個圖書館流動展出。”肖學(xué)智介紹,今年3月,省圖書館還啟動了專題展覽進校園活動,未來還將推動展覽進社區(qū)。
年輕讀者馬瑛正是通過這個展覽認識了文溯閣《四庫全書》,并買了一套《影印文溯閣四庫全書四種》。“帶回去,讓更多人了解我們的典籍瑰寶。”馬瑛說。
今年,甘肅省出臺《關(guān)于以“八個一”文化品牌為抓手全力推動文化傳承發(fā)展的實施方案》,其中一個“一”即為“一部《四庫全書》,讓中國古典文化活起來”。實施方案提出,加強文溯閣《四庫全書》保護傳承、整理研究、數(shù)字轉(zhuǎn)化、版權(quán)開發(fā)、活化利用等,激發(fā)古籍保護利用活力。
“影印出版,是活化利用的第一步。”肖學(xué)智說,未來還將建設(shè)完整、好用的數(shù)據(jù)庫,研發(fā)音視頻等產(chǎn)品,讓文溯閣《四庫全書》的“數(shù)字分身”走進千家萬戶。
《 人民日報 》( 2024年05月31日 第 13 版)
分享讓更多人看到