首頁: 電子電路圖,電子技術資料網站首頁

電子資料下載: 電子資料下載頻道 -- 為電子工程師提供激發創新靈感的新方案、新的參考設計、新的設計構想等可下載的電子資料！

電子技術應用: 電子技術應用頻道 -- 為電子工程師提供電子產品設計所需的技術分析、設計技巧、設計工具、測試工具等技術文章！

電子元器件: 專業的電子元器件平臺 -- 及時發布大量最新IC、分立器件、模組等電子元器件產品信息！

電子電路圖: 電路圖頻道 -- 提供電子電路圖,原理圖,汽車電路圖,手機電路圖,功放電路圖,電源電路圖等電路圖紙

電子技術論壇: 構建電子工程師交流的平臺 -- 在交流中進一步學習設計技巧、規劃技術人生、提升自我價值！

源碼下載: 源碼下載頻道; uCOS編程 C/C++語言編程 Symbian編程 Linux/uClinux/Unix編程 Windows編程 matlab源程序 php源碼下載 asp.net源碼下載 java源碼下載匯編編程驅動程序單片機編程數值算法/人工智能

您的位置：電子發燒友網>源碼下載>數值算法/人工智能>

基于詞頻信息的改進的IG文本特征選擇算法

大小：0.56 MB 人氣： 2018-01-25 需要積分：2

推薦 + 挑錯 + 收藏(0) + 用戶評論（0）

前往下載地址

分享到:

標簽：信息(35446)選擇算法(8913)

　　向量空間的高維性和文檔表示向量的稀疏性不但增加了分類的時間復雜度和空間復雜度，而且還大大影響到分類的精度，因此，特征選擇顯得特別重要。目前，文本分類研究中常用的特征選擇算法主要有：文檔頻度、互信息、信息增益、開方擬合檢驗、期望交叉熵、特征權和文本證據權等。Ng等比較了文檔頻率（ Document Frequency，DF）、信息增益（Information Cain，IG）、互信息（Mutual Information，MI）、開方擬合檢驗（X2 -test，CHI）和特征權（Term Strength，TS）五種特征選擇算法，得出IC、DF和CHI比MI和TS效果好的結論。Yang等研究得出IC是最有效的特征選擇算法之一的結論。目前IC已成為文本分類研究中常用的特征選擇算法。因此，尋找該方法中的不足，并針對不足作出有效的改進，提高特征提取的效率具有非常重要的現實意義。

　　近年來，一些學者針對IG算法的不足作了一些改進工作。李文斌等提出了三種基于特征信息增益權重的分類算法，通過添加權重系數來平衡“正貢獻”和“負貢獻”的特征項對分類的影響，但是由于權重系數的設置是根據人為的經驗設定．所以存在很大的偶然性，且不適用于各種情形。黃秀麗等針對傳統IC算法過分看重高頻特征項的缺點，提出一種強調中低頻特征項的改進的算法SIC，此算法在一定程度上提高了特征選擇的效率，但算法中沒有考慮到特征項在不同類別的分布差異對分類能力的影響。郭頌等在以上改進算法的基礎上，通過引入特征分布差異因子、類內和類間加權因子，提出一種加權的IC改進算法，該方法比較全面地考慮到了詞頻對特征提取的作用，但此算法沒有考慮到特征項在類內位置上分布對算法的影響。本文針對上述改進算法的不足之處，充分考慮特征項頻數對分類能力的作用，提出一種基于詞頻的改進的IC特征選擇算法。

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

下載地址

不能下載？請通知我們

基于詞頻信息的改進的IG文本特征選擇算法下載

普通下載普通下載

用戶評論

發表評論即可獲得積分！ 詳見積分規則

發表評論

用戶評論

評價:好評中評差評

發表評論，獲取積分！請遵守相關規定！

注冊會員

游客:

那曲檬骨新材料有限公司

基于詞頻信息的改進的IG文本特征選擇算法

下載地址

基于詞頻信息的改進的IG文本特征選擇算法下載

相關電子資料下載

用戶評論

發表評論

分享你我的電子世界

實用電子設計資料下載

源碼下載排行

熱門詞