2 搜狗實(shí)驗(yàn)室(Sogou Labs)
3 Acollection of Chinese corpora and frequency lists
4 Corpus-basedLanguage Study
TheLancaster Los Angeles Spoken Chinese Corpus
5 lingcorpus.iis.sinica.edu.tw
收費(fèi):中央研究院-中文剖析樹(shù)檢索系統(tǒng)
6 LivacOnline
7 哈工大信息檢索研究中心(HIT CIR)語(yǔ)言技術(shù)平臺(tái)共享資源和程序步驟
8 ToRCH2014語(yǔ)料庫(kù) 布朗家族中文語(yǔ)料庫(kù)
9 CCL語(yǔ)料庫(kù) 模式查詢
10 candlewill/Dialog_Corpus
11 MarkWuNLP/MultiTurnResponseSelection
12 Short-TextConversation
13 語(yǔ)料庫(kù)在線--資源共享
14 BCC語(yǔ)料庫(kù)
15 LDC語(yǔ)料庫(kù) 據(jù)說(shuō)有一些中文文本
16 公布一批中文文本分類的新聞?wù)Z料庫(kù) | 我愛(ài)自然語(yǔ)言處理
17 THCHS-30 清華大學(xué)大學(xué)生30小時(shí)語(yǔ)音
18 數(shù)據(jù)下載 - BosonNLP
19 北京宇音天下科技有限公司-下載中心
20 水木社區(qū)-源于清華的高知社群
21 語(yǔ)料庫(kù) - 自然語(yǔ)言處理與信息檢索共享平臺(tái) NLPIR.org - Poweredby SupeSite
(參考鏈接:https://www.zhihu.com/question/21177095)
原文出處:http://corpus.njau.edu.cn/wiki/003
相關(guān)文章閱讀
幾個(gè)常見(jiàn)的漢語(yǔ)語(yǔ)料庫(kù)分析
分詞介紹
新時(shí)代人民日?qǐng)?bào)分詞模型