一、研究進(jìn)展情況
(一)研究計(jì)劃總體執(zhí)行情況及各子課題進(jìn)展情況
自2016年11月立項(xiàng)后,本項(xiàng)目按照投標(biāo)書中的以“藏文典籍歷史發(fā)展” 為縱向、以“藏文典籍?dāng)?shù)字化”為橫向的研究思路,以開題為界分兩階段完成了如下工作:
1、2016年11月-2017年5月,項(xiàng)目開題階段。根據(jù)立項(xiàng)評(píng)審意見,對(duì)項(xiàng)目總體框架相關(guān)內(nèi)容進(jìn)行了深入調(diào)研并優(yōu)化:面對(duì)浩如煙海的藏文古籍,精煉了藏文典籍整理的范圍,且輔以對(duì)傳統(tǒng)的、現(xiàn)代的寫本、刻本文獻(xiàn)的整理、出版等成果、相關(guān)理論和方法做出分析和評(píng)價(jià);藏文典籍?dāng)?shù)字化確定為以建設(shè)藏文典籍文獻(xiàn)之全文數(shù)據(jù)庫(kù)和數(shù)字化平臺(tái)為目標(biāo)。 依據(jù)深入的調(diào)研和具體的實(shí)施方案,本項(xiàng)目于2017年5月29日順利開題,精簡(jiǎn)典籍整理范圍和爭(zhēng)取項(xiàng)目外經(jīng)費(fèi)支持獲得與會(huì)專家的充分認(rèn)可。
2、2017年6月-2018年7月,項(xiàng)目實(shí)施初期。項(xiàng)目組織協(xié)調(diào)了子課題之一、二、三、四的典籍文獻(xiàn)整理和專題選編,組織協(xié)調(diào)子課題五的基礎(chǔ)平臺(tái)搭建、相關(guān)規(guī)范和底層技術(shù)的研究。目前,項(xiàng)目研究進(jìn)度符合計(jì)劃。各子課題進(jìn)展具體情況如下:
(1)子課題之一“苯教系屬文獻(xiàn)整理與全文數(shù)字化研究”
該子課題具體路徑分為四步,第一步是選擇苯教文獻(xiàn)搜集的區(qū)域,按照區(qū)域?qū)嵭形墨I(xiàn)搜集;第二步在全面搜集文獻(xiàn)的基礎(chǔ)上,對(duì)不同苯教經(jīng)書進(jìn)行詳細(xì)?,然后對(duì)內(nèi)容進(jìn)行文字錄入;第三步是對(duì)搜集的文本中,選擇最優(yōu)的苯教經(jīng)文版本進(jìn)行翻譯,完整呈現(xiàn)出一部系統(tǒng)的苯教文獻(xiàn);第四步是對(duì)苯教文獻(xiàn)內(nèi)容進(jìn)行相關(guān)研究。
目前,該課題已整理了藏區(qū)民間苯教文獻(xiàn)共2000種,對(duì)藏區(qū)各地散落的古藏文苯教文獻(xiàn)進(jìn)行系統(tǒng)的內(nèi)容提要的寫作和文獻(xiàn)整理工作,完成藏文目錄編制和內(nèi)容提要寫作。且對(duì)目前苯教文獻(xiàn)中關(guān)于甄選,排版、分類不確切甚至是錯(cuò)誤的部分,提出了訂正意見;編寫了《苯教典籍文獻(xiàn)概說(shuō)》(約2萬(wàn)字)一書部分初稿,主要介紹了苯教大藏經(jīng)的發(fā)展過(guò)程,以及目錄、版本、校勘、刻板、傳承等問(wèn)題。
(2)子課題之二“敦煌吐蕃古藏文文獻(xiàn)整理與數(shù)字化研究”
該子課題考慮到國(guó)內(nèi)學(xué)術(shù)界對(duì)法國(guó)收藏的敦煌吐蕃文獻(xiàn)研究已經(jīng)走在前面的現(xiàn)實(shí),故提出以整理、研究英國(guó)收藏的敦煌、西域吐蕃文獻(xiàn)為主線,借鑒國(guó)內(nèi)外研究敦煌吐蕃文獻(xiàn)的成果和經(jīng)驗(yàn),推進(jìn)實(shí)施,成功完成整理、研究英國(guó)收藏的敦煌、西域吐蕃文獻(xiàn)的目標(biāo)。
目前,該子課題已編撰出《新疆、青海出土藏文簡(jiǎn)牘整理與數(shù)字化研究》(約10萬(wàn)字)一書部分初稿,對(duì)出自新疆和青海而今藏于英國(guó)國(guó)家圖書館、新疆自治區(qū)博物館、青海省博物館的500余枚吐蕃簡(jiǎn)牘,按地域分類,逐一進(jìn)行說(shuō)明介紹,包括序號(hào)、題名、編號(hào)、形制、尺寸、內(nèi)容提要、著錄狀況等,同時(shí)收錄了日本學(xué)者武內(nèi)紹人等人有關(guān)吐蕃簡(jiǎn)牘的論文等。
(3)子課題之三“佛教系屬藏文刻本文獻(xiàn)整理與全文數(shù)字化研究”
該子課題以佛教藏文古代刻本文獻(xiàn)、現(xiàn)代活字打印出版文獻(xiàn)、刻本全文數(shù)字化文獻(xiàn)等三種文獻(xiàn)整理為研究對(duì)象,以刻本文獻(xiàn)產(chǎn)生發(fā)展的歷史、刻本文獻(xiàn)分類、刻本文獻(xiàn)整理的特點(diǎn)、活字文獻(xiàn)整理出版的原則、刻本文獻(xiàn)整理中的爭(zhēng)議問(wèn)題、刻本文獻(xiàn)全文數(shù)字化狀況等為視角,就佛教刻本文獻(xiàn)整理與數(shù)字化問(wèn)題進(jìn)行分析研究。
目前,該子課題已赴俄羅斯圣彼得堡東方手稿研究所尋訪黑水城發(fā)現(xiàn)的藏文刻本文獻(xiàn);已搜集了佛教藏文刻本文獻(xiàn),包括藏文《大藏經(jīng)》8種刻本,對(duì)佛教藏文刻本文獻(xiàn)起始、范圍、分布(刻本印經(jīng)院)等進(jìn)行研究;根據(jù)藏文刻本文獻(xiàn)特點(diǎn),提出了整理規(guī)范,并結(jié)合文本TEI國(guó)際通用語(yǔ)言,提出了《信息處理用藏文文獻(xiàn)文本信息標(biāo)記規(guī)范》,已于2017年5月在蘭州召開最后審定會(huì),提交國(guó)家信標(biāo)委,并于2018年6月批準(zhǔn)發(fā)布;研究了藏文刻本文獻(xiàn)全文數(shù)字化的架構(gòu)體系。
(4)子課題之四“佛教系屬藏文寫本文獻(xiàn)整理與全文數(shù)字化研究”
該子課題以苯教、佛教、其他內(nèi)容寫本文獻(xiàn)在以藏區(qū)為中心的各地傳播、影響和藏族典籍文化最初形成、寫本文獻(xiàn)的貢獻(xiàn)與不同時(shí)期發(fā)展為主線,在比較全面掌握材料的基礎(chǔ)上,按照歷史發(fā)展脈絡(luò),分象雄、吐蕃、中世紀(jì)、近代、現(xiàn)代等五個(gè)階段,分別研究藏文寫本文獻(xiàn)與刻本文獻(xiàn)、活字版、數(shù)字化族等文獻(xiàn)關(guān)系的歷史發(fā)展,考辨史實(shí),闡釋重要藏族文化事件和主要代表人物的思想,突出其意義和貢獻(xiàn)。
目前,該子課題已整理編輯了西藏民族大學(xué)館藏藏文古籍中的大藏經(jīng)、叢書、文集、史志類、明處類、顯乘撰述類、密乘撰述類及其它類等大類目,并對(duì)這些大類目?jī)?nèi)容進(jìn)行具體分類整理編目;收集了177幅藏傳木刻版畫資料,內(nèi)容包括《羅漢圖》、《釋迦牟尼神變圖》、《佛陀十二宏化圖》、《蓮花生八相圖》、《藏傳佛教之八大傳承》、《薩迦俄爾派壇城圖》、《十六羅漢圖》、《掘藏師傳承圖》、《六長(zhǎng)壽圖》等。
(5)子課題之五“藏文文獻(xiàn)全文數(shù)字化研究”
該子課題通過(guò)設(shè)計(jì)或選擇統(tǒng)一的元數(shù)據(jù)格式和系統(tǒng)架構(gòu),在自建新增的基礎(chǔ)上,吸納已有數(shù)據(jù)庫(kù)資源,建設(shè)具有一定規(guī)模的藏文典籍文獻(xiàn)全文數(shù)據(jù)庫(kù);然后,遵循現(xiàn)有文檔圖像檢索領(lǐng)域新興的詞定位技術(shù)基本框架,研究藏文典籍文獻(xiàn)字符圖像特征,并在此基礎(chǔ)上深入和擴(kuò)展,引入并融合文獻(xiàn)學(xué)信息,探索藏文典籍文獻(xiàn)的全信息檢索技術(shù),在藏文典籍文獻(xiàn)全文數(shù)據(jù)庫(kù)的基礎(chǔ)上試建全信息檢索功能。
目前,該子課題在總項(xiàng)目的組織協(xié)調(diào)下借助項(xiàng)目外經(jīng)費(fèi)支持已初步完成藏文文獻(xiàn)全文數(shù)字化硬件平臺(tái)的搭建;已整理完成約50萬(wàn)頁(yè)的藏文典籍?dāng)?shù)字圖像,完成元數(shù)據(jù)格式和軟件系統(tǒng)架構(gòu)設(shè)計(jì),初步搭建了藏文文獻(xiàn)全文數(shù)據(jù)庫(kù);選取了以德格木刻版的《宗喀巴文集》為代表的約2萬(wàn)頁(yè)的測(cè)試圖像,搭建了符合藏文文獻(xiàn)全文數(shù)字化平臺(tái)底層技術(shù)驗(yàn)證所需的藏文古籍圖像測(cè)試庫(kù);在底層技術(shù)研究上,已取得了系列進(jìn)展,解決了復(fù)雜條件下的藏文木刻版文檔圖像幾何校正問(wèn)題,尋找到并驗(yàn)證清楚了適合藏文古籍全文檢索技術(shù)的藏文古籍文字圖像特征的提取方法和匹配算法,研發(fā)了藏文古籍全文檢索仿真驗(yàn)證系統(tǒng)。
(二)調(diào)查研究及學(xué)術(shù)交流情況
項(xiàng)目開展調(diào)查研究及學(xué)術(shù)交流情況如下:
1.2016年11月,項(xiàng)目組召開2次小型會(huì)議,以根據(jù)立項(xiàng)評(píng)審意見優(yōu)化項(xiàng)目總體框架為主要目標(biāo),統(tǒng)一思路,落實(shí)開題前調(diào)研工作任務(wù)。其中,項(xiàng)目責(zé)任單位西藏民族大學(xué)、西南民族大學(xué)、西北民族大學(xué)在西藏民族大學(xué),商議和落實(shí)立項(xiàng)評(píng)審意見中的文獻(xiàn)整理范圍和全文數(shù)字化方式;項(xiàng)目責(zé)任單位西北民族中國(guó)民族信息技術(shù)處理研究院、西南民族大學(xué)藏文文獻(xiàn)館在西南民族大學(xué)就藏文古籍文獻(xiàn)整理和全文數(shù)字化做了深入的交流。
2.2016年12月至2017年5月,項(xiàng)目組在已有調(diào)研基礎(chǔ)上分3批次赴北京和深入藏區(qū),對(duì)藏文古籍文獻(xiàn)整理范圍和文獻(xiàn)數(shù)字化新技術(shù)進(jìn)行了確認(rèn),完成了開題準(zhǔn)備工作。
3.2017年6月至今,項(xiàng)目進(jìn)入具體實(shí)施階段,各子課題在總結(jié)前期工作的基礎(chǔ)上,進(jìn)一步深入文獻(xiàn)和田野調(diào)查,確認(rèn)和落實(shí)未完成的調(diào)研工作,進(jìn)行補(bǔ)充調(diào)查或繼續(xù)深入調(diào)查,并全面開展學(xué)術(shù)交流活動(dòng):
(1)項(xiàng)目組成員參加了2017年9月在烏魯木齊召開的“歷史上的新疆與西藏關(guān)系學(xué)術(shù)研討會(huì)”、2017年7月在四川南充舉辦的“中國(guó)敦煌吐魯番學(xué)會(huì)年會(huì)暨學(xué)術(shù)研討會(huì)”、2018年6月在蘭州舉辦的“中國(guó)民族史年會(huì)暨會(huì)員學(xué)術(shù)研討會(huì)”等學(xué)術(shù)會(huì)議。
(2)2017年9月,項(xiàng)目組成員赴俄羅斯圣彼得堡東方手稿研究所尋訪黑水城發(fā)現(xiàn)的藏文刻本文獻(xiàn)。
(3)2017年7月,項(xiàng)目組成員參加了在杭州召開的“Intelligent Human-Machine Systems and Cybernetics”國(guó)際學(xué)術(shù)會(huì)議,對(duì)文獻(xiàn)數(shù)字化前沿問(wèn)題進(jìn)行了交流。
(4)項(xiàng)目組成員與國(guó)際著名學(xué)者、日本大谷大學(xué)康嘎次赤木教授建立了師徒關(guān)系,這為項(xiàng)目開展國(guó)際合作交流提供了幫助。
(5)邀請(qǐng)多名國(guó)內(nèi)專家學(xué)者,對(duì)與藏文典籍文獻(xiàn)、大藏經(jīng)版本、文獻(xiàn)數(shù)字化等方面進(jìn)行了深入交流,如:2017年6月,邀請(qǐng)西藏圖書館副研究員朗錯(cuò)作了“藏文大藏經(jīng)版本”方面的專題報(bào)告;2017年6月邀請(qǐng)四川大學(xué)教授、博士生導(dǎo)師張澤洪教授作了“西南少數(shù)民族宗教”的專題報(bào)告;日本大谷大學(xué)康嘎次赤木教授繼2016年6月應(yīng)邀到西南民大講學(xué)一個(gè)月后,又于2017年5月、2018年6月到西南民大講學(xué)《藏文古籍文獻(xiàn)研究方法》、《傳統(tǒng)與現(xiàn)代藏文文獻(xiàn)研究方法》、《國(guó)外藏學(xué)文獻(xiàn)研究現(xiàn)狀》等專門知識(shí)。
(三)成果宣傳推介情況
1、2017年5月29日,本項(xiàng)目舉行了開題論證會(huì)。來(lái)自中國(guó)藏學(xué)研究中心、西南民族大學(xué)、蘭州大學(xué)、西北民族大學(xué)、陜西師范大學(xué)、西藏大學(xué)、西藏民族大學(xué)等高校與科研機(jī)構(gòu)的專家、課題組成員20余人參加了會(huì)議。西藏民族大學(xué)黨委副書記、副校長(zhǎng)劉凱參加會(huì)議并發(fā)表了熱情洋溢的致辭,對(duì)課題的重大意義給予了充分肯定,并對(duì)課題的開展提出了真知灼見。項(xiàng)目首席專家劉勇教授介紹了項(xiàng)目的基本情況。本次開題論證會(huì)取得了良好效果,為課題盡快展開研究提供了思路和框架。《西藏民族大學(xué)學(xué)報(bào)》等媒體進(jìn)行了專門報(bào)道,西藏民族大學(xué)網(wǎng)及各大網(wǎng)站等對(duì)活動(dòng)綜述也進(jìn)行了轉(zhuǎn)載。
2、2017年5月在蘭州召開藏文信息最后審定會(huì)上,子課題項(xiàng)目負(fù)責(zé)人多拉結(jié)合文本TEI國(guó)際通用語(yǔ)言,提出《信息處理用藏文文獻(xiàn)文本信息標(biāo)記規(guī)范》,且此規(guī)范提交國(guó)家信標(biāo)委,并于2018年6月批準(zhǔn)發(fā)布。
(四)研究中存在的主要問(wèn)題、改進(jìn)措施,研究心得、意見建議
下面從藏文典籍文獻(xiàn)的整理和全文數(shù)字化兩方面來(lái)談:
1、藏文典籍文獻(xiàn)的整理方面的困難
應(yīng)評(píng)審專家意見中的“藏文文獻(xiàn)量大,覆蓋面也非常大”、“工作量大”、“應(yīng)適當(dāng)改變或縮小”,本項(xiàng)目就藏文典籍整理范圍做了深入調(diào)研并取得了專家們認(rèn)可的成果,但隨著研究的深入,文獻(xiàn)收集整理仍然面臨如下困難:
(1)文獻(xiàn)收集難度較大,例如:民間苯教文獻(xiàn)中對(duì)苯教經(jīng)書的識(shí)別和分類有難度;文獻(xiàn)分布范圍較廣,這些苯教文獻(xiàn)分布在藏區(qū)各地,做田野調(diào)查有一定的難度;基于苯教宗教信仰的原因,絕大多數(shù)苯教藏文寫本文獻(xiàn)秘不示眾,平日供奉高閣,節(jié)慶祭祀時(shí)才能取出,難得一見,因此,收集文獻(xiàn)時(shí)受宗教信仰因素制約較大,需對(duì)群眾做認(rèn)真細(xì)致的工作。
(2)經(jīng)書名目繁多,從而造成了分類和校勘的困難,例如:經(jīng)文中不僅出現(xiàn)了苯教特有的符號(hào),而且夾雜一些方言,甚至通篇使用縮寫字,加之文本流傳年代久遠(yuǎn),其中所記錄的部分儀軌業(yè)已失傳,這些經(jīng)文幾乎成為“天書”;翻譯是一種再創(chuàng)作,無(wú)論是對(duì)原文的理解還是譯文的表達(dá),翻譯古代苯教經(jīng)文難度都比較大,要達(dá)到忠實(shí)于原文,翻譯用語(yǔ)即是關(guān)鍵點(diǎn),也是難點(diǎn)。
2、藏文典籍全文數(shù)字化方面的心得
應(yīng)評(píng)審專家意見中的“藏文所有典籍文獻(xiàn)浩如煙海,要實(shí)現(xiàn)其全部的全文數(shù)字化,按國(guó)家社科重大課題批復(fù)的八十萬(wàn)元經(jīng)費(fèi)難以完成”,本項(xiàng)目采取了如下兩方面措施:
(1)采取了爭(zhēng)取項(xiàng)目外經(jīng)費(fèi)支持的措施。目前已獲取西南民族大學(xué)逾一百萬(wàn)資金專用于藏文典籍全文數(shù)字化硬件平臺(tái)的建設(shè)和優(yōu)化,這證明了“以重大項(xiàng)目為牽引,帶動(dòng)相關(guān)建設(shè)”已取得成效。
(2)堅(jiān)持長(zhǎng)期發(fā)展策略,采取以系統(tǒng)研發(fā)為先,以文獻(xiàn)掃描、信息著錄等耗費(fèi)人力的事項(xiàng)為后的措施。目前已聚焦完成元數(shù)據(jù)格式和軟件系統(tǒng)架構(gòu)設(shè)計(jì),并驗(yàn)證了一些關(guān)鍵前沿技術(shù),且已搭建了約50萬(wàn)頁(yè)藏文典籍?dāng)?shù)字圖像的數(shù)據(jù)庫(kù),該措施不僅可以規(guī)避經(jīng)費(fèi)風(fēng)險(xiǎn),而且有利于浩瀚藏文典籍全文數(shù)字化的長(zhǎng)遠(yuǎn)健康發(fā)展。
二、研究成果情況
(一)代表性成果簡(jiǎn)介
1、《敦煌吐蕃文<寺院施入疏>考釋》論文:本文漢譯和考釋了收藏于英國(guó)國(guó)家圖書館的兩件吐蕃文書(編號(hào)IOL Tib J 575、IOL Tib J 1357),初步判定這兩件寫本可以綴合成一件寺院施入疏,反映的是吐蕃統(tǒng)治敦煌時(shí)期,阿骨薩千戶下左三將的百姓需要向寺院繳納供養(yǎng),或者是部落入籍戶向官府舉辦的“千人齋”、“萬(wàn)人齋”交納貢物的名單。
2、《<后藏乃寧寺志>及其價(jià)值研究》論文:乃寧寺是西藏近代史上一座較有影響的寺院,關(guān)于對(duì)乃寧寺的歷史考證,目前除了《后藏志》中有少量記載之外,《后藏乃寧寺志》是現(xiàn)今唯一的一部對(duì)其進(jìn)行全面系統(tǒng)介紹的歷史著作,也是研究乃寧寺不可多得的一部重要的藏文文獻(xiàn)!逗蟛啬藢幩轮尽穬(nèi)容涵蓋印度佛教和藏族歷史、圣地乃寧寺的形成及其歷任堪布、乃寧寺的重要?dú)v史、有關(guān)《噶陀司徒衛(wèi)藏志》中的《后藏乃寧寺志》等,全書采用自由式的敘事風(fēng)格和記敘方式,以人物為中心對(duì)佛教相關(guān)史事進(jìn)行詳細(xì)記載,使后人能夠?qū)谭▊鞒屑捌渲匾臍v史地位有較為清晰的認(rèn)識(shí)。此外,《后藏乃寧寺志》還對(duì)歷史上與乃寧寺相關(guān)的重大歷史事件有諸多記載,反映了整個(gè)后藏的歷史、文化和社會(huì)經(jīng)濟(jì)等?傊,《后藏乃寧寺》不僅是一部研究佛教歷史人物及其相關(guān)宗教活動(dòng)的重要?dú)v史文獻(xiàn),而且對(duì)藏族文化的傳承與發(fā)展具有一定的意義。
3、《苯教典籍文獻(xiàn)概說(shuō)》報(bào)告:苯教在長(zhǎng)期的發(fā)展過(guò)程中積累了卷帙浩繁的經(jīng)籍書文,其內(nèi)容包羅萬(wàn)象,不僅記錄了苯教的教理教義、教規(guī)教戒,還保留了藏族古代哲學(xué)、文學(xué)、醫(yī)藥學(xué)、音樂(lè)、地理等多種學(xué)科的珍貴資料,是藏族傳統(tǒng)文化的一個(gè)寶庫(kù)。苯教文獻(xiàn)的主要由苯教甘珠爾、甘丹、民間苯教文獻(xiàn)(藏外苯教文獻(xiàn))三個(gè)部分組成。文章主要介紹了苯教大藏經(jīng)的發(fā)展過(guò)程,以及目錄、版本、?薄⒖贪、傳承等問(wèn)題。目前藏學(xué)界重視寺院所藏經(jīng)典的研究,對(duì)民間的苯教經(jīng)典關(guān)注很少。作者重點(diǎn)對(duì)白龍江流域的民間苯教經(jīng)典進(jìn)行實(shí)地調(diào)查,把大量的民間苯教經(jīng)典根據(jù)苯教傳統(tǒng)的分類法為基礎(chǔ), 重新分類編目,進(jìn)行了初步的探討和研究。并總結(jié)經(jīng)典中折射的文化信息,對(duì)研究民間苯教和藏族文化意義重大。
4、《Effect on convergence from different particle swarms with a unified and simplified formula for position updating》論文:在實(shí)現(xiàn)藏文古籍全文檢索時(shí)為了滿足時(shí)效和準(zhǔn)確性需求,采用了對(duì)藏文古籍文字圖像進(jìn)行二級(jí)匹配的策略,即先進(jìn)行特征級(jí)粗匹配,后進(jìn)行像素級(jí)精匹配。在采用原PSO算法的實(shí)踐中,本項(xiàng)目發(fā)現(xiàn)原算法對(duì)于藏文古籍文字圖像的匹配具有計(jì)算量仍然過(guò)大、收斂性難于控制的缺陷,于是對(duì)PSO算法的核心——位置更新方程進(jìn)行了分析和簡(jiǎn)化,把多階隨機(jī)差分方程簡(jiǎn)化為一階隨機(jī)差分方程,把多個(gè)參數(shù)減少到一個(gè)參數(shù),在理論上使得算法收斂性分析和控制更為容易。實(shí)踐證明,這種改進(jìn)的、簡(jiǎn)化的PSO算法不僅減少了藏文古籍文字圖像匹配的計(jì)算量,而且提高了匹配的準(zhǔn)確性。該論文研究分析了位置更新方程中的歷史最優(yōu)位置對(duì)收斂性的影響。
5、《The convergence of particle swarm with unified and simplified formula for position updating》論文:在上一論文的基礎(chǔ)上,進(jìn)一步研究了對(duì)收斂性影響的參數(shù)設(shè)置問(wèn)題。該論文和上一論文所呈現(xiàn)的算法不僅是本項(xiàng)目成功進(jìn)行藏文古籍文字圖像像素級(jí)精匹配以實(shí)現(xiàn)藏文古籍全文檢索的重點(diǎn),也能為后續(xù)的藏文古籍全信息檢索奠定算法基礎(chǔ)。
6、電腦軟件成果(藏文古籍全文檢索仿真驗(yàn)證系統(tǒng)):該系統(tǒng)是以研究為目的而搭建的,具有算法驗(yàn)證、效果演示功能的軟件系統(tǒng)。該系統(tǒng)基于Matlab環(huán)境而研發(fā),由如下兩大類模塊組成:一是圖像處理通過(guò)模塊類,包括圖像數(shù)據(jù)讀取、圖像縮放、灰度圖像轉(zhuǎn)換、二值化等模塊。該類模塊主要基于本項(xiàng)目應(yīng)用需求而選用matlab自帶函數(shù)或現(xiàn)有開源庫(kù)而完成。二是藏文典籍圖像處理及全文檢索專用模塊類,包括粗畸形校正、細(xì)畸形校正、去邊框、行分割、圖像特征提取、特征級(jí)圖像匹配、像素級(jí)圖像匹配、檢索結(jié)果顯示等模塊。這些模塊所組成的軟件系統(tǒng),集成式地展示了藏文古籍全文檢索技術(shù)中眾算法之間的流程關(guān)系,而且其中部分算法具有創(chuàng)造性的改進(jìn)。該系統(tǒng)不僅為項(xiàng)目的后續(xù)開展提供了深入驗(yàn)證的平臺(tái),而且,無(wú)論從單獨(dú)算法改進(jìn)上,還是從系統(tǒng)集成經(jīng)驗(yàn)上,也為研究者們提供非常有益的參考。
(二)階段性成果清單
序號(hào) 成果名稱 作者 成果形式(著作、論文等) 出版社或刊物名 出版或刊發(fā)時(shí)間 字?jǐn)?shù)(萬(wàn)字) 轉(zhuǎn)載、引用獲獎(jiǎng)等情況
1 敦煌吐蕃文<寺院施入疏>考釋 楊銘 論文 《西北民族論叢》 2018.2 2
2 “后藏乃寧寺志” 羊毛措 論文 西藏大學(xué)學(xué)報(bào)(人文社科版) 2018.2 0.6 CSSCI
3 苯教典籍文獻(xiàn)概說(shuō) 阿旺嘉措 報(bào)告 2018.3 2
4 Effect on convergence from different particle swarms with a unified and simplified formula for position updating 胡建 論文 2017 9th International Conference on Intelligent Human-Machine Systems and Cybernetics 2017.7 0.3
(單詞) EI、CPCI-S收錄
5 The convergence of particle swarm with unified and simplified formula for position updating 胡建 論文 2017 9th International Conference on Intelligent Human-Machine Systems and Cybernetics 2017.7 0.4
(單詞) EI、CPCI-S收錄
6 藏文古籍全文檢索仿真驗(yàn)證系統(tǒng) 項(xiàng)目組 軟件 2018.6 50萬(wàn)頁(yè)藏文圖像
三、下一步研究計(jì)劃
各課題根據(jù)總課題研究方案,現(xiàn)將下一步研究計(jì)劃如下:
1、子課題“藏族民間苯教經(jīng)書“萊塢四典四部廣經(jīng)”的分類整理及研究”計(jì)劃于2017年7月-2019年10月期間課題組整理提供所有相關(guān)研究資料,包括調(diào)查所得文獻(xiàn)資料、田野調(diào)查訪談問(wèn)卷、各類錄音錄像資料。課題組分類整理,編輯成冊(cè)。同時(shí),課題組調(diào)查成果情況,總結(jié)經(jīng)驗(yàn),針對(duì)不足,即行補(bǔ)充調(diào)查; 2020年初補(bǔ)充和完善研究成果,已完成課題基本工作; 2020年底進(jìn)行課題研究總結(jié),并做準(zhǔn)備課題結(jié)項(xiàng)。
2、子課題 “藏文文獻(xiàn)全文數(shù)字化研究”一方面,進(jìn)一步完善底層技術(shù),包括:擴(kuò)大全文檢索技術(shù)的適應(yīng)范圍和檢索效率,引入文獻(xiàn)學(xué)檢索信息。采取的技術(shù)方案為,充分驗(yàn)證和提升復(fù)雜背景(字跡褪色、背景污損、版面殘缺、字符粘連和遮擋、字體多變等干擾)下算法的魯棒性,并在元數(shù)據(jù)中增設(shè)文獻(xiàn)學(xué)信息;另一方面,優(yōu)化軟件系統(tǒng),包括:對(duì)數(shù)據(jù)庫(kù)管理軟件、著錄軟件進(jìn)行適應(yīng)性更新,使之為全文檢索和文獻(xiàn)學(xué)信息檢索提供更優(yōu)的底層效率支撐。采取的技術(shù)方案為,把已有的原生XML數(shù)據(jù)庫(kù)更換為大型關(guān)系數(shù)據(jù)庫(kù),并對(duì)著錄軟件適時(shí)增加文獻(xiàn)學(xué)信息內(nèi)容。此外,擴(kuò)大藏文典籍圖像掃描、整理和數(shù)據(jù)著錄規(guī)模,充實(shí)藏文文獻(xiàn)全文數(shù)據(jù)庫(kù),力爭(zhēng)結(jié)題時(shí)達(dá)到200萬(wàn)頁(yè)規(guī)模。此項(xiàng)基本為人力密集型事務(wù),增設(shè)人力即可。
3、子課題“新疆、青海出土古藏文簡(jiǎn)牘的整理與數(shù)字化研究”計(jì)劃于2019年初完成本書上編《新疆、青海出土古藏文簡(jiǎn)牘敘錄》余下的約十萬(wàn)字的工作;2020年初完成本書下編《古藏文簡(jiǎn)牘研究與數(shù)字化文獻(xiàn)匯編》的收集與整理工作; 2020年底完成附錄部分的編寫工作,包括《引用和參考文獻(xiàn)》《古藏文簡(jiǎn)牘出土號(hào)、索引號(hào)和本書題名、頁(yè)碼號(hào)對(duì)照表》《藏漢對(duì)照譯名對(duì)照表》等,并做準(zhǔn)備課題結(jié)項(xiàng)。
4、子課題“佛教系屬藏文寫本文獻(xiàn)整理與全文數(shù)字化研究”計(jì)劃于2018-2020年基本完成館藏藏文古籍文獻(xiàn)目錄整理編輯工作和館藏藏傳木刻版畫資料的研究工作;2020年底爭(zhēng)取編輯完成《館藏藏傳木刻版畫集》,并做準(zhǔn)備課題結(jié)項(xiàng)。
(課題組供稿)