當前位置

首頁 > 國學之蒙學 > 國學常識 > 讓中華經典“活起來”

讓中華經典“活起來”

推薦人: 來源: 閱讀: 1.84W 次

讓中華經典“活起來”


“中華經典古籍庫”首頁(資料照片)

讓中華經典“活起來”

日前,中華書局研發完成“中華經典古籍庫”第一期數字化成果,完成自有版權的300種共2億字古籍的數字化,包括了中國傳世典籍的最核心部分。這一數據庫將依託全國十幾家圖書館的平臺向公衆開放,讓中華經典躍然屏幕,讓文化真正“活起來”。

  完成這2億字,中華書局用了十年。

  古爲今用:傳承中華文化的時代擔當

打開中華書局“中華古籍數據庫”,黃褐色的界面充滿古典感和文化氣息,左側的目錄欄裏,各本古籍按照“經”“史”“子”“集”分類排列,綱舉目張,條理清晰。

這一數據庫保留了標點、校勘、專名、註釋等全部整理成果,提供原書掃描圖像頁與數字文本一一對照,公衆將擁有可靠、可直接引用的數字化古籍,實現了中國高質量古籍整理圖書的數字化。

浩瀚的文字背後,是煩瑣的古籍整理和精細的後期數據加工工作。

早在2003年,中華書局便成立古籍資源部,開展“中華古籍語料庫”項目的研製開發,當時還完全沒有“數字出版”的概念,古籍資源部主要從事古籍的數字化編輯加工,用6年時間將3億字的整理本古籍做數字化處理,完成了初步的平臺建設和語料積累。

這些語料積累,源自中華優秀傳統文化和典籍作品。我國浩繁的文化典籍,是中華民族政治、經濟、歷史、文化和民族精神的重要載體。據專家估計,中國存世古籍總計在20萬種以上,如果計入碑刻、家譜等,數量更多。

“這些存世古籍負載着厚重的'中華文明,凝聚着民族智慧,是祖先留給我們的精神遺產。”中華書局總經理徐俊說,弘揚中華民族的優秀文化,爲學術研究和廣大讀者提供高質量的基本古籍,是中華書局長期致力的目標。

[NextPage][/NextPage]

  內容爲王:秉持精益求精的文化品格

20世紀90年代,古籍數字化開始在我國起步,隨着網絡的普及,古籍數字化迅速興起。

在古籍數字化欣欣向榮的同時,我們也看到,目前我國古籍數字化在數據質量、數據內容等方面存在諸多問題。個別數字化資源隨意節選,以訛傳訛,對讀者產生了誤導;很多古籍數字出版物沒有獲得合法著作權、網絡盜版猖獗,成爲知識發展的重大障礙。

“在目前的數字出版界,始終存在一種爭議,那就是數字出版應堅持技術爲王還是內容爲王?”中華書局副總編輯顧青介紹說,“我們在做古籍數字化之前,首先明確了這個問題,確定了‘內容爲王、質量至上’的原則。”

對此,徐俊也明確指出:“保證數字產品的合法性和基本質量,是古籍專業社應該做的事,但也正是版權和質量這兩點使得專業社古籍庫產品研發步履維艱。”

顧青介紹說,由此,我們確定了古籍數字化的幾個基本理念:一是古籍數字化一定要以古籍整理爲基礎,做到內容準確;二是古籍數字化產品必須要擁有合法著作權,確保法律上無瑕疵;三是古籍數字化一定要方便讀者使用,讓古籍從書頁中走到屏幕上來。

  攻克難關:打造數字出版的百年老店

“我們點開右側的‘人名信息關聯’功能,輸入‘曹操’這個人名,便會出現這個古籍庫中所有曹操的人名、別名信息,這對於學者的研究很有幫助。”中華書局市場部主任翁向紅說。

然而,外人卻很難了解,在這背後,數據編輯工作人員付出了怎樣的艱辛。

“這就意味着,編輯人員需要在數據底層把人名、地名、年代等信息都歸納標引出來,再編成可供讀者檢索的程序,這個工作需要有深厚的專業功底,做到專業領先,同時要攻克技術難關。”徐俊介紹。

爲了破解古籍數字化中遇到的難題,中華書局投入了大量精力參與計算機用字規範項目的建設,如“中華字庫”“國家數字圖書館漢字規範處理項目”“新聞出版用大字符集”等項目。“通過這些項目的建設,我們規範了計算機古籍用字,積累了大量的漢字屬性數據,爲古籍數字化的工作提供了基礎。也正是有了這些基礎,“中華經典古籍庫”的造字工作才能順利展開。”顧青說。

爲做到數據持續更新,“中華經典古籍庫”計劃每年推出一輯數據包,持續收錄新出版的優秀整理本古籍,在保證質量的基礎上有序擴充數據量,同時不斷進行數據的修訂與完善。

徐俊認爲,未來,古籍數字化需要政府、企業、社會三方面努力,爲數字出版營造良好的政策和法律環境,讓優秀中華文化走出書本,得到更好地使用和傳承。