資料介紹
一種改進(jìn)的基于粗糙集理論的特征選取方法_王作飛
文本分類是文本挖掘的重要組成部分。通過(guò)該技術(shù)可以自 動(dòng)地為文檔集合中的每篇文檔確定類別, 并對(duì)它們進(jìn)行有效組 織和分類,以便檢索和分析,從而能夠使用戶方便、快捷地瀏覽 文檔,具有很高的實(shí)際應(yīng)用價(jià)值。文本分類一般分為訓(xùn)練和分類 階段,在分類階段,文本集經(jīng)過(guò)文本預(yù)處理后得到特征集。但是 特征集仍然是個(gè)高維的特征空間, 對(duì)于所有的分類算法來(lái)說(shuō)維 數(shù)都太大。因此,選擇一個(gè)合適的特征方法,以降低特征空間的 維數(shù),提高分類的效率和精度,往往成為文本分類的首選任務(wù)和 關(guān)鍵。 目前,常用的特征選擇算法一般是先構(gòu)建一個(gè)評(píng)估函數(shù),對(duì) 特征集中的每個(gè)特征獨(dú)立地進(jìn)行評(píng)估每個(gè)特征獲得一個(gè)評(píng)估 值,然后根據(jù)評(píng)估值對(duì)特征進(jìn)行排序,最后選取最佳的特征作為 類別中心特征向量。而選取多少個(gè)最佳特征主要針對(duì)某一個(gè)具 體的問(wèn)題通過(guò)實(shí)驗(yàn)來(lái)決定?,F(xiàn)在這樣的評(píng)估函數(shù)有:文檔頻數(shù), 信息增益,期望交叉熵,互信息,CHI 統(tǒng)計(jì)法等。 作為一種處理含糊和不精確問(wèn)題的新型數(shù)學(xué)工具, 粗糙集 在處理不完備、不確定、不一致數(shù)據(jù)方面顯現(xiàn)出了其特有的優(yōu) 勢(shì)。針對(duì)以往基于粗糙集理論中正區(qū)域約簡(jiǎn)特征選取在處理不 一致決策表時(shí)存在的不足,本文通過(guò)過(guò)引入粒度函數(shù)的概念,并 以此為基礎(chǔ)采用粗糙集啟發(fā)式屬性約簡(jiǎn)方法實(shí)現(xiàn)了特征在分 類中的重要性度量標(biāo)定和約簡(jiǎn), 使原來(lái)的特征維數(shù)得到一定的 降低,建立了特征選擇與文本分類之間的聯(lián)系。該方法有效地提 高了分類的效率和準(zhǔn)確度,大大降低了文本分類子集的維數(shù),生 成規(guī)則易于理解, 適應(yīng)性強(qiáng)。最后用實(shí)驗(yàn)驗(yàn)證了該方法的可行
文本分類是文本挖掘的重要組成部分。通過(guò)該技術(shù)可以自 動(dòng)地為文檔集合中的每篇文檔確定類別, 并對(duì)它們進(jìn)行有效組 織和分類,以便檢索和分析,從而能夠使用戶方便、快捷地瀏覽 文檔,具有很高的實(shí)際應(yīng)用價(jià)值。文本分類一般分為訓(xùn)練和分類 階段,在分類階段,文本集經(jīng)過(guò)文本預(yù)處理后得到特征集。但是 特征集仍然是個(gè)高維的特征空間, 對(duì)于所有的分類算法來(lái)說(shuō)維 數(shù)都太大。因此,選擇一個(gè)合適的特征方法,以降低特征空間的 維數(shù),提高分類的效率和精度,往往成為文本分類的首選任務(wù)和 關(guān)鍵。 目前,常用的特征選擇算法一般是先構(gòu)建一個(gè)評(píng)估函數(shù),對(duì) 特征集中的每個(gè)特征獨(dú)立地進(jìn)行評(píng)估每個(gè)特征獲得一個(gè)評(píng)估 值,然后根據(jù)評(píng)估值對(duì)特征進(jìn)行排序,最后選取最佳的特征作為 類別中心特征向量。而選取多少個(gè)最佳特征主要針對(duì)某一個(gè)具 體的問(wèn)題通過(guò)實(shí)驗(yàn)來(lái)決定?,F(xiàn)在這樣的評(píng)估函數(shù)有:文檔頻數(shù), 信息增益,期望交叉熵,互信息,CHI 統(tǒng)計(jì)法等。 作為一種處理含糊和不精確問(wèn)題的新型數(shù)學(xué)工具, 粗糙集 在處理不完備、不確定、不一致數(shù)據(jù)方面顯現(xiàn)出了其特有的優(yōu) 勢(shì)。針對(duì)以往基于粗糙集理論中正區(qū)域約簡(jiǎn)特征選取在處理不 一致決策表時(shí)存在的不足,本文通過(guò)過(guò)引入粒度函數(shù)的概念,并 以此為基礎(chǔ)采用粗糙集啟發(fā)式屬性約簡(jiǎn)方法實(shí)現(xiàn)了特征在分 類中的重要性度量標(biāo)定和約簡(jiǎn), 使原來(lái)的特征維數(shù)得到一定的 降低,建立了特征選擇與文本分類之間的聯(lián)系。該方法有效地提 高了分類的效率和準(zhǔn)確度,大大降低了文本分類子集的維數(shù),生 成規(guī)則易于理解, 適應(yīng)性強(qiáng)。最后用實(shí)驗(yàn)驗(yàn)證了該方法的可行
下載該資料的人也在下載
下載該資料的人還在閱讀
更多 >
- 權(quán)重模糊粗糙集的改進(jìn)規(guī)則挖掘算法 4次下載
- 程度多粒度軟粗糙集模型綜述 1次下載
- 一種基于粗糙集聚類的報(bào)文格式推斷方法 3次下載
- 一種統(tǒng)計(jì)粗糙集模型 0次下載
- 一種改進(jìn)的變精度粗糙集漏洞威脅評(píng)估模型 0次下載
- 粗糙集理論的數(shù)據(jù)挖掘方法在水泥生產(chǎn)分解爐中的應(yīng)用_王夙娟 0次下載
- 粗糙集方法在紅外圖像增強(qiáng)中的應(yīng)用
- 基于粗糙集理論的網(wǎng)絡(luò)入侵檢測(cè)系統(tǒng)
- 基于粗糙集理論的空氣質(zhì)量智能數(shù)據(jù)分析
- 基于粗糙集規(guī)則提取算法的研究及應(yīng)用
- 基于遺傳算法的誤差因子粗糙集模型
- 基于粗糙集的啟發(fā)式約簡(jiǎn)算法
- 基于概率粗糙集模型的信息檢索
- 基于粗糙集理論的除氧系統(tǒng)智能控制器設(shè)計(jì)
- 基于粗糙集理論的入侵檢測(cè)方法研究
- 一種簡(jiǎn)單高效配置FPGA的方法 745次閱讀
- 一種完全分布式的點(diǎn)線協(xié)同視覺(jué)慣性導(dǎo)航系統(tǒng) 469次閱讀
- 電源濾波電容如何選取? 3097次閱讀
- FLAT的一種改進(jìn)方案 1779次閱讀
- 基于改進(jìn)FCOS的鋼帶表面缺陷檢測(cè)算法 1692次閱讀
- 一種基于DSP+FPGA結(jié)構(gòu)的通用飛控計(jì)算機(jī)設(shè)計(jì)方法介紹 2453次閱讀
- 人工智能是一種改進(jìn)數(shù)據(jù)控制和處理的方法 3165次閱讀
- 研究人員提出了一種多尺度高效率的新模型FAMED-Net 3911次閱讀
- OpenAI提出了一種回報(bào)設(shè)置方法RND 3202次閱讀
- 一種自動(dòng)生成反向傳播方程的方法 3857次閱讀
- 【新專利介紹】一種改進(jìn)電表 1314次閱讀
- 基于激光誘導(dǎo)超塑性的卷對(duì)卷工藝制程是一種新的制造方法 5152次閱讀
- 一種新的基于電穿孔的皮膚高效核酸遞送方法 5187次閱讀
- 基于特征模理論和CMA技術(shù)的天線設(shè)計(jì) 9819次閱讀
- 一種matlab調(diào)用signaltap采集數(shù)據(jù)的方法 3949次閱讀
下載排行
本周
- 1貼片三極管上的印字與真實(shí)名稱的對(duì)照表詳細(xì)說(shuō)明
- 0.50 MB | 87次下載 | 1 積分
- 2802.11_Wireless_Networks
- 4.17 MB | 12次下載 | 免費(fèi)
- 33D AD庫(kù)文件
- 16.96 MB | 2次下載 | 免費(fèi)
- 4BDR6121G直流電機(jī)驅(qū)動(dòng)芯片中文手冊(cè)
- 0.54 MB | 1次下載 | 免費(fèi)
- 5ANT8817 1%3.5W/3.7V,同步自適應(yīng)升壓,超長(zhǎng)續(xù)航,H類防破音單聲道音頻功放中文手冊(cè)
- 1.11 MB | 1次下載 | 免費(fèi)
- 610K-100K B3950-B3435NTC熱敏電阻快速查詢對(duì)照表
- 0.10 MB | 1次下載 | 1 積分
- 7ANT8825S內(nèi)置同步升壓,防破音,AB/D類雙模立體聲音頻功放中文手冊(cè)
- 1.29 MB | 次下載 | 免費(fèi)
- 8ANT3270 2×75W/2×38W+75W,免電感,低EMI,D類音頻功率放大器中文手冊(cè)
- 1.33 MB | 次下載 | 免費(fèi)
本月
- 1AI智能眼鏡產(chǎn)業(yè)鏈分析
- 4.43 MB | 311次下載 | 免費(fèi)
- 2蘇泊爾電磁爐線路的電路原理圖資料合集
- 2.02 MB | 286次下載 | 5 積分
- 3長(zhǎng)虹液晶電視R-HS310B-5HF01的電源板電路原理圖
- 0.46 MB | 87次下載 | 5 積分
- 4貼片三極管上的印字與真實(shí)名稱的對(duì)照表詳細(xì)說(shuō)明
- 0.50 MB | 87次下載 | 1 積分
- 5U盤一鍵制作
- 23.84 MB | 41次下載 | 免費(fèi)
- 6AO4803A雙P通道增強(qiáng)型場(chǎng)效應(yīng)晶體管的數(shù)據(jù)手冊(cè)
- 0.11 MB | 28次下載 | 2 積分
- 7長(zhǎng)虹液晶彩電LS29機(jī)芯的技術(shù)資料說(shuō)明
- 3.42 MB | 16次下載 | 2 積分
- 8802.11_Wireless_Networks
- 4.17 MB | 12次下載 | 免費(fèi)
總榜
- 1matlab軟件下載入口
- 未知 | 935127次下載 | 10 積分
- 2開(kāi)源硬件-PMP21529.1-4 開(kāi)關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計(jì)
- 1.48MB | 420064次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233089次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191387次下載 | 10 積分
- 5十天學(xué)會(huì)AVR單片機(jī)與C語(yǔ)言視頻教程 下載
- 158M | 183342次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81586次下載 | 10 積分
- 7Keil工具M(jìn)DK-Arm免費(fèi)下載
- 0.02 MB | 73815次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65988次下載 | 10 積分
評(píng)論