国产成人茄子视频免费_欧美激情(一区二区三区)_日韩精品亚洲专区_日本高清Av不卡一区二区_国产最火爆美女爽到高潮嗷嗷嗷叫免费网站网站

您現(xiàn)在的位置:首頁 > 文化 > 正文

講述·弘揚科學家精神丨用科技手段激活古籍瑰寶

時間:2023-06-27 08:51:06    來源:人民日報    

講述·弘揚科學家精神

原標題:浙江大學徐永明團隊打造古籍智慧數(shù)據(jù)共享平臺——(引題)


(資料圖)

用科技手段激活古籍瑰寶(主題)

人民日報記者 江南 竇瀚洋

打開瀏覽器,登錄“智慧古籍平臺”,可在線查閱4.4萬篇古籍,除了著述、篇目詳情等基本內(nèi)容外,還有著者小傳、人物行跡、世系圖及社會網(wǎng)絡關系圖等延伸信息,全面立體地展現(xiàn)古籍內(nèi)容,滿足讀者一站式查詢、閱讀與研究需求。

這是由浙江大學徐永明教授及其團隊打造的人機交互式智慧數(shù)據(jù)共享平臺,將中國古典文獻和研究成果圖譜化、智能化,打造了集瀏覽、查詢、研究、欣賞于一體的古籍大數(shù)據(jù)平臺,通過科技賦能,讓古籍知識變得“觸手可及”。

科技賦能,推動古籍資源“上線”

在浙江大學文學院,記者見到技術團隊負責人徐永明時,他正專心致志地坐在電腦前,忙著審核已完成校對的古籍篇目并準備上線發(fā)布……

“目前平臺已上線著述總字數(shù)約700萬字?!闭f罷,徐永明招呼記者上手體驗。在“智慧古籍平臺”,古籍內(nèi)容按“著述導覽”“篇目導覽”“著者導覽”等板塊分類呈現(xiàn),界面設計古典雅致、功能齊全,令人眼前一亮……

“平臺引入知識圖譜理念,綜合運用大數(shù)據(jù)進行計量統(tǒng)計、定位查詢、聚類查詢等,讓讀者輕松便利地獲取古籍知識?!毙煊烂鬟呇菔具吔榻B,點擊“篇目導覽”按鈕,即可進入文本閱讀界面,“文本閱讀是本平臺的特色功能,為提高文本的真實性和準確性,平臺提供了古籍圖片與古籍數(shù)字化文本一一對應的功能。”

不僅如此,“智慧古籍平臺”還有許多其他亮點:為降低閱讀時查閱相關資料的頻率,平臺提供了關鍵字詞釋義功能,文本中重要信息及疑難詞按照人名、地名、職官、時間、典故等不同類型以不同顏色顯示,點擊即可查看釋義;借助地理信息系統(tǒng)軟件,結合在線地理信息系統(tǒng),古籍中留存的地理信息實現(xiàn)了可視化,點擊著者詳情,即可查看所鏈接的人物行跡圖……

而提及地理信息可視化,不得不提徐永明團隊的另一個平臺——“學術地圖發(fā)布平臺”,其中匯集了李白、蘇軾等500多位中華歷史名人的行跡圖、《全元詩》作者分布圖等各類學術地圖……“其實這個平臺比‘智慧古籍平臺’還要早一些,是中國首個綜合性學術地圖平臺。”他介紹,平臺迄今已發(fā)布1600余幅地圖,共有70余個國家100萬讀者的訪問量。

綜合利用這兩個平臺,徐永明團隊將文史數(shù)據(jù)與數(shù)字地圖相結合,極大地增強閱讀體驗,旨在豐富讀者對古籍知識的綜合認知。

為解決技術難題,文科背景出身的徐永明自學編程

在徐永明看來,完善豐富的前端體驗少不了強大的后臺技術支持,“比如,要將古籍圖像中的文字轉(zhuǎn)換成文本格式,就需要OCR識別,即‘光學字符識別’技術,平臺現(xiàn)用的OCR技術能較為精確地識別版刻古籍,準確率達到90%以上?!彼蛴浾呖破掌饋?,再如,借助計算機學習技術,平臺采用的“機器古籍標點技術”,可根據(jù)特定算法為古籍文本自動標注現(xiàn)代中文標點符號,準確率也穩(wěn)定在90%以上。

“但正所謂‘隔行如隔山’,僅靠我一人無法建起這個平臺,需要許多相關專業(yè)人員的支持。”他介紹,作為項目負責人,從2020年項目立項以來,他找來浙江大學計算機科學與技術學院、地球科學學院和校圖書館等相關學院和部門老師,組建起一支20余人的技術團隊。

這期間,曾遇到不少難點,“比如,前期需要不斷跟第三方公司磨合,解決前、后臺頁面設計、框架布局、功能模塊等問題;到了后期,我們更換了合作方,又得重新磨合,主要解決地域?qū)в[、編輯器、職官圖譜、智能OCR服務引入等相關問題?!毙煊烂髡f。

緣何要研發(fā)這樣的古籍知識大數(shù)據(jù)平臺?徐永明坦言,這跟自己早年的經(jīng)歷有關。上世紀90年代末期,他曾在浙江圖書館古籍部工作過一段時間,目睹了讀者來看古籍善本有多不方便,比如只能抄錄,復制的話也要經(jīng)過許可,且費用很貴。

在他讀博期間,國內(nèi)還沒有出全文檢索的《四庫全書》電子產(chǎn)品。那時,他寫作博士論文材料,都是靠自己翻閱原書,一條一條抄錄。這些經(jīng)歷讓徐永明深深地感到,紙質(zhì)文獻難以保存?zhèn)鞑ィ偶畔⒋嬖凇肮聧u化”“碎片化”現(xiàn)象,“如今,數(shù)字技術發(fā)展日新月異,我們便琢磨著能否將大數(shù)據(jù)技術與古籍進行深度融合,為傳承中華優(yōu)秀傳統(tǒng)文化探索新的可能?!?/p>

在“學術地圖發(fā)布平臺”開發(fā)階段,面對界面不美觀,操作不方便,功能有限,經(jīng)常出現(xiàn)程序故障等問題,文科背景出身的徐永明開始了他的自學Python(計算機編程語言)開發(fā)之路。在他的朋友圈,他時常發(fā)布學習編程的動態(tài)、用Python完成的各種小成果、自己編寫的代碼,等等。

面對海量數(shù)據(jù),徐永明善于利用團隊的力量,“過去整理古籍,主要是個體作業(yè),以書為單位,不能修改、不可關聯(lián),效率不高?!彼f,“現(xiàn)在,我們將古籍整理任務通過勤工儉學、暑期社會實踐等形式,遴選相關專業(yè)學生、專家,在線上線下一同參與,努力發(fā)揮集體的智慧?!?/p>

幫助讀者掃除古代文獻閱讀障礙,推動古籍閱讀普及化,激活學者的研究成果

浙江大學中國古代文學專業(yè)的博士生郝亞潔認領了新任務:對《徐文長文集》《吟香室詩草》等古籍的OCR校對結果進行二次審核。

“根據(jù)平臺不同時期的需求,我的工作內(nèi)容側(cè)重點都有不同。”郝亞潔介紹,比如,在平臺建設初期,同學們主要負責數(shù)據(jù)上傳整理,“數(shù)據(jù)一般以一部文集為單位,需要制作目錄文件把文集的文字內(nèi)容按照篇目和影像一一對應?!焙笃冢聛啙崉t負責OCR識別和機器標點校對后的人工審核等工作。

全程參與“智慧古籍平臺”建設,讓郝亞潔受益匪淺……在她眼中,徐永明是治學嚴謹?shù)膶?,自己從平臺維護中收獲良多。“比如,之前學過的Python計算機編程語言,就苦于沒機會實踐;現(xiàn)在的校對環(huán)節(jié)中,用Python代碼檢查不僅幫了我大忙,更體會到了什么叫‘活學活用’?!?/p>

平臺運行至今獲得各方好評,但徐永明坦言,“智慧古籍平臺”建設任重道遠,想要把浩如煙海的中華古籍資源利用起來,還有很長的路要走?!拔覀兊某踔院芎唵?,就是想為讀者掃除古代文獻閱讀障礙,推動古籍閱讀普及化,激活學者的研究成果,突破學術壁壘,將前沿的學術研究成果轉(zhuǎn)化為社會大眾共享的文化資源,同時改變‘數(shù)據(jù)在中國,數(shù)據(jù)庫在國外’的現(xiàn)象?!?/p>

面向未來,徐永明團隊定下了新目標:利用“智慧古籍平臺”進一步推進古籍數(shù)據(jù)資源的整合和開放共享,用智慧化手段為中國古代典籍資源爭取“主動權”,讓古籍資源從“活下來”真正轉(zhuǎn)變?yōu)椤盎钇饋怼保?/p>

標簽:

相關新聞

凡本網(wǎng)注明“XXX(非現(xiàn)代青年網(wǎng))提供”的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和其真實性負責。

特別關注

熱文推薦

焦點資訊