2015年10月31日,自治區(qū)民委、財(cái)政廳在內(nèi)蒙古大學(xué)組織召開2013年度自治區(qū)蒙古語言文字信息化專項(xiàng)扶持項(xiàng)目“蒙古語語言資源建設(shè)、信息化理論與相關(guān)技術(shù)研究”結(jié)項(xiàng)驗(yàn)收會(huì)。
該項(xiàng)目是第一批立項(xiàng)實(shí)施的自治區(qū)蒙古語言文字信息化專項(xiàng)扶持項(xiàng)目,建設(shè)期為兩年。項(xiàng)目開發(fā)內(nèi)容包括蒙古語言文字信息化基礎(chǔ)研究、蒙古語言文字資源庫建設(shè)和蒙古文信息處理言語工程技術(shù)研發(fā)3項(xiàng)內(nèi)容。主要建設(shè)成果有:基礎(chǔ)研究方面,一是蒙古語言文字信息化基礎(chǔ)研究—基礎(chǔ)標(biāo)準(zhǔn)和規(guī)范的研制完善,對(duì)《信息技術(shù) 傳統(tǒng)蒙古文名義字符、變形顯現(xiàn)字符和控制字符使用規(guī)則》(GB 25914—2010)等七項(xiàng)標(biāo)準(zhǔn)進(jìn)行了擴(kuò)充和完善。二是在面向信息處理的蒙古語語義研究、面向信息處理的蒙古語句法研究等基礎(chǔ)理論研究方面取得了顯著成績(起草2項(xiàng)國家標(biāo)準(zhǔn)文本、出版2部專著,發(fā)表20余篇論文),其成果在蒙古語自然語言處理領(lǐng)域有較大的理論創(chuàng)新。蒙古語言文字資源庫建設(shè)方面,已完成的數(shù)據(jù)資源建設(shè)包括1000萬詞蒙古語粗加工語料庫、500萬詞蒙古語精加工語料庫和80萬句對(duì)的漢蒙、蒙漢平行語料庫;同時(shí)完成了“蒙古語知識(shí)詞典庫”(包括具有6萬個(gè)詞條,69個(gè)屬性字段的“蒙古語語義信息詞典”、 3.5萬條熟語,15個(gè)屬性字段,4個(gè)輔助庫的“蒙古語熟語知識(shí)庫”、有3萬棵樹的“蒙古語句法結(jié)構(gòu)知識(shí)庫”等)。口語語料庫建設(shè)方面,已建立20個(gè)小時(shí)5個(gè)層次的標(biāo)注庫、5個(gè)小時(shí)的語料韻律標(biāo)注20小時(shí)的“喀爾喀方言口語語料庫”和“蒙古語口語韻律標(biāo)注庫”以及“面向言語工程的蒙古語語音數(shù)據(jù)庫”。蒙古文信息處理工程技術(shù)研發(fā)方面,開發(fā)了包括蒙古語語料庫自動(dòng)校對(duì)軟件、精加工語料庫軟件、詞法、短語、語義自動(dòng)標(biāo)注軟件、蒙古語語音識(shí)別、合成軟件以及蒙古語標(biāo)準(zhǔn)音自動(dòng)檢測(cè)系統(tǒng)在內(nèi)的蒙古語言資源加工系列軟件等。
經(jīng)專家組認(rèn)真聽取項(xiàng)目單位匯報(bào)、觀看成果演示,聽取項(xiàng)目監(jiān)理單位監(jiān)理意見,進(jìn)行項(xiàng)目組答辯后,一致認(rèn)為該項(xiàng)目內(nèi)容涉及面廣,涵蓋蒙古語言文字信息化基礎(chǔ)理論研究、標(biāo)準(zhǔn)規(guī)范研制和軟件系統(tǒng)研發(fā),涉及語言學(xué)、計(jì)算機(jī)科學(xué)等相關(guān)學(xué)科,工作量大,技術(shù)含量高。其研究成果具有重要的理論意義和應(yīng)用價(jià)值,將對(duì)蒙古語言文字信息化事業(yè)起到有力的推動(dòng)作用。
版權(quán)所有:中共內(nèi)蒙古自治區(qū)委黨史和地方志研究室
政府網(wǎng)站標(biāo)識(shí)碼:1500000032
技術(shù)支持: 內(nèi)蒙古傳星科技有限公司
2015年10月31日,自治區(qū)民委、財(cái)政廳在內(nèi)蒙古大學(xué)組織召開2013年度自治區(qū)蒙古語言文字信息化專項(xiàng)扶持項(xiàng)目“蒙古語語言資源建設(shè)、信息化理論與相關(guān)技術(shù)研究”結(jié)項(xiàng)驗(yàn)收會(huì)。
該項(xiàng)目是第一批立項(xiàng)實(shí)施的自治區(qū)蒙古語言文字信息化專項(xiàng)扶持項(xiàng)目,建設(shè)期為兩年。項(xiàng)目開發(fā)內(nèi)容包括蒙古語言文字信息化基礎(chǔ)研究、蒙古語言文字資源庫建設(shè)和蒙古文信息處理言語工程技術(shù)研發(fā)3項(xiàng)內(nèi)容。主要建設(shè)成果有:基礎(chǔ)研究方面,一是蒙古語言文字信息化基礎(chǔ)研究—基礎(chǔ)標(biāo)準(zhǔn)和規(guī)范的研制完善,對(duì)《信息技術(shù) 傳統(tǒng)蒙古文名義字符、變形顯現(xiàn)字符和控制字符使用規(guī)則》(GB 25914—2010)等七項(xiàng)標(biāo)準(zhǔn)進(jìn)行了擴(kuò)充和完善。二是在面向信息處理的蒙古語語義研究、面向信息處理的蒙古語句法研究等基礎(chǔ)理論研究方面取得了顯著成績(起草2項(xiàng)國家標(biāo)準(zhǔn)文本、出版2部專著,發(fā)表20余篇論文),其成果在蒙古語自然語言處理領(lǐng)域有較大的理論創(chuàng)新。蒙古語言文字資源庫建設(shè)方面,已完成的數(shù)據(jù)資源建設(shè)包括1000萬詞蒙古語粗加工語料庫、500萬詞蒙古語精加工語料庫和80萬句對(duì)的漢蒙、蒙漢平行語料庫;同時(shí)完成了“蒙古語知識(shí)詞典庫”(包括具有6萬個(gè)詞條,69個(gè)屬性字段的“蒙古語語義信息詞典”、 3.5萬條熟語,15個(gè)屬性字段,4個(gè)輔助庫的“蒙古語熟語知識(shí)庫”、有3萬棵樹的“蒙古語句法結(jié)構(gòu)知識(shí)庫”等)??谡Z語料庫建設(shè)方面,已建立20個(gè)小時(shí)5個(gè)層次的標(biāo)注庫、5個(gè)小時(shí)的語料韻律標(biāo)注20小時(shí)的“喀爾喀方言口語語料庫”和“蒙古語口語韻律標(biāo)注庫”以及“面向言語工程的蒙古語語音數(shù)據(jù)庫”。蒙古文信息處理工程技術(shù)研發(fā)方面,開發(fā)了包括蒙古語語料庫自動(dòng)校對(duì)軟件、精加工語料庫軟件、詞法、短語、語義自動(dòng)標(biāo)注軟件、蒙古語語音識(shí)別、合成軟件以及蒙古語標(biāo)準(zhǔn)音自動(dòng)檢測(cè)系統(tǒng)在內(nèi)的蒙古語言資源加工系列軟件等。
經(jīng)專家組認(rèn)真聽取項(xiàng)目單位匯報(bào)、觀看成果演示,聽取項(xiàng)目監(jiān)理單位監(jiān)理意見,進(jìn)行項(xiàng)目組答辯后,一致認(rèn)為該項(xiàng)目內(nèi)容涉及面廣,涵蓋蒙古語言文字信息化基礎(chǔ)理論研究、標(biāo)準(zhǔn)規(guī)范研制和軟件系統(tǒng)研發(fā),涉及語言學(xué)、計(jì)算機(jī)科學(xué)等相關(guān)學(xué)科,工作量大,技術(shù)含量高。其研究成果具有重要的理論意義和應(yīng)用價(jià)值,將對(duì)蒙古語言文字信息化事業(yè)起到有力的推動(dòng)作用。