www.日本精品,久久中文视频,中文字幕第一页在线播放,香蕉视频免费网站,老湿机一区午夜精品免费福利,91久久综合精品国产丝袜长腿,欧美日韩视频精品一区二区

DKTC:一種中文文本聚類(lèi)方法_python中文文本聚類(lèi)

發(fā)布時(shí)間:2020-03-07 來(lái)源: 美文摘抄 點(diǎn)擊:

  [摘要]在對(duì)DBSCN與K-means兩種經(jīng)典聚類(lèi)算法分析研究基礎(chǔ)上,結(jié)合中文文本數(shù)據(jù)的特點(diǎn),對(duì)這兩種方法進(jìn)行結(jié)合與改進(jìn),提出一種中文文本聚類(lèi)方法:DKTC。該算法能自動(dòng)產(chǎn)生簇的個(gè)數(shù),且對(duì)“噪聲”或異常數(shù)據(jù)不敏感,對(duì)數(shù)據(jù)的輸入順序不敏感,另外,與DBSCAN相比,該算法有更高的處理效率。實(shí)驗(yàn)表明,DKTC算法不僅能對(duì)中文文本進(jìn)行聚類(lèi),且與傳統(tǒng)DBSCN與K-means法相比,聚類(lèi)效果都有一定程度的改善。
  [關(guān)鍵詞]文本聚類(lèi) 聚類(lèi)算法 中文信息處理
  [分類(lèi)號(hào)]TP391
  
  1 引言
  
  文本聚類(lèi)是一種無(wú)指導(dǎo)的文本分類(lèi),由于該項(xiàng)技術(shù)能將大量信息組織成少數(shù)有意義的簇,從而達(dá)到協(xié)助人們更好地對(duì)大規(guī)模文本進(jìn)行理解,同時(shí)也能作為一種有效的預(yù)處理步驟,為進(jìn)一步的文本分析提供初步的語(yǔ)料結(jié)構(gòu),因此,文本聚類(lèi)技術(shù)作為文本信息挖掘技術(shù)中的核心技術(shù),越來(lái)越受到廣大研究者的重視。

相關(guān)熱詞搜索:中文 文本 方法 DKTC:一種中文文本聚類(lèi)方法 一種中文文本聚類(lèi)方法 一種中文文本聚類(lèi)新方法

版權(quán)所有 蒲公英文摘 www.newchangjing.com