一種融合采樣技術(shù)和RE算法的微博轉(zhuǎn)發(fā)行為預(yù)測方法
針對微博轉(zhuǎn)發(fā)預(yù)測方法研究中的數(shù)據(jù)集不平衡問題,提出了一種融合過采樣技術(shù)和隨機森林(RF)算法的微博轉(zhuǎn)發(fā)行為預(yù)測方法。首先,定義了個體信息、社交關(guān)系和微博主題3類與微博轉(zhuǎn)發(fā)行為相關(guān)的特征,并基于信息增益算法實現(xiàn)了關(guān)鍵特征選取;其次,綜合微博特征數(shù)據(jù)的特點來改進少數(shù)類樣本合成過采樣技術(shù)( SMOTE),對原始數(shù)據(jù)集進行非參數(shù)概率分布估計,并根據(jù)近似概率分布對數(shù)據(jù)集進行過采樣處理,從而使正反例數(shù)據(jù)量達到平衡;最后,利用隨機森林算法,依據(jù)微博轉(zhuǎn)發(fā)關(guān)鍵特征進行分類器訓(xùn)練,并利用袋外(OOB)數(shù)據(jù)誤差估計來分析和設(shè)置隨機森林算法的相關(guān)參數(shù)。通過與基于決策樹(DT)、支持向量機(SVM)、樸素貝葉斯(NB)和隨機森林等算法的微博轉(zhuǎn)發(fā)預(yù)測方法進行對比,所提方法整體性能優(yōu)于基準(zhǔn)方法中性能最優(yōu)的SVM方法,召回率提高了8%,F(xiàn)值提高了5%。實驗結(jié)果表明,所提方法在實際應(yīng)用中能夠有效提高微博轉(zhuǎn)發(fā)行為預(yù)測的準(zhǔn)確率。
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%
下載地址
一種融合采樣技術(shù)和RE算法的微博轉(zhuǎn)發(fā)行為預(yù)測方法下載
相關(guān)電子資料下載
- 利用高頻采樣技術(shù)進行高速差分阻抗測試方案 778
- 采樣技術(shù)對信噪比的提升方法 3535
- 什么是工業(yè)過程控制 2371
- 單片機片上的ADC如何利用過采樣技術(shù) 4094
- 對過采樣技術(shù)的理解與記憶 777
- 受制于汽車芯片短缺,豐田減產(chǎn)40%;Intel推出超采樣技術(shù),利好IoT市場…… 1551
- ADC中采樣技術(shù)的信號鏈設(shè)計挑戰(zhàn) 2741
- Switch Pro或?qū)⒅С諲VIDIA的DLSS深度學(xué)習(xí)超采樣技術(shù) 1505
- 消息稱Switch Pro將支持NVIDIA的DLSS深度學(xué)習(xí)超采樣技術(shù) 1673
- 三相交流標(biāo)準(zhǔn)源采用高精度采樣技術(shù),具備多種功能 650