在這一背景下,以2015至2018年《人民日?qǐng)?bào)》發(fā)表的文章為對(duì)象,我們構(gòu)建了新版的人民日?qǐng)?bào)分詞語(yǔ)料。因?yàn)樾掳嬲Z(yǔ)料庫(kù)收錄的全部是進(jìn)入新世紀(jì)以后的《人民日?qǐng)?bào)》文章,而且均為2012年以后即中國(guó)特色社會(huì)主義進(jìn)入新時(shí)代以后的文章,為區(qū)別于北京大學(xué)的1998年人民日?qǐng)?bào)語(yǔ)料,將該語(yǔ)料命名為新時(shí)代人民日?qǐng)?bào)語(yǔ)料(New Era People’s Daily Segmented Corpus,簡(jiǎn)稱NEPD、NEPD語(yǔ)料或NEPD語(yǔ)料庫(kù))。為促進(jìn)語(yǔ)料資源的開(kāi)放和共享,NEPD的相關(guān)語(yǔ)料將對(duì)學(xué)界公布,供學(xué)術(shù)研究用,并且后續(xù)還將不斷補(bǔ)充最新語(yǔ)料[1]。
參考文獻(xiàn):
[1] 黃水清,王東波.新時(shí)代人民日?qǐng)?bào)分詞語(yǔ)料庫(kù)構(gòu)建、性能及應(yīng)用(一)——語(yǔ)料庫(kù)構(gòu)建及測(cè)評(píng)[J].圖書情報(bào)工作,2019,63(22):5-12.
原文出處:http://corpus.njau.edu.cn/wiki/001
相關(guān)文章閱讀
幾個(gè)常見(jiàn)的漢語(yǔ)語(yǔ)料庫(kù)分析
互聯(lián)網(wǎng)上開(kāi)放的中文語(yǔ)料庫(kù)有哪些
分詞介紹
新時(shí)代人民日?qǐng)?bào)分詞模型