那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

深度神經決策樹:深度神經網絡和樹模型結合的新模型

nlfO_thejiangme ? 來源:未知 ? 作者:工程師郭婷 ? 2018-08-19 09:14 ? 次閱讀

近日,來自愛丁堡大學的研究人員提出了一種結合深度神經網絡和樹模型的新型模型——深度神經決策樹(Deep Neural Decision Trees, DNDT)。

這種模型不僅具有了基于樹模型的可解釋性的優點,同時還可以利用神經網絡中的梯度下降法來進行訓練,并可方便地利用現有的神經網絡框架實現,將使得神經網絡的過程得以用樹的方式得到有效的解釋。論文的作者均來自于愛丁堡大學信息學院感知、運動和行為研究所ipab。

對于感知模型來說可解釋性是十分重要的,特別是在一些涉及倫理、法律、醫學和金融等場景下尤其如此,同樣在關鍵領域的控制中,我們希望能夠回溯所有的步驟來保證模型因果邏輯和結果的正確性。深度神經網絡在計算機視覺語音識別和語言模型等很多領域取得了成功,但作為缺乏可解釋性的黑箱模型,限制了它在模型必須求證因果領域的應用,在這些領域中我們需要明確決策是如何產生的以便評測驗證整個決策過程。除此之外,在類似于商業智能等領域,知曉每一個因素是如何影響最終決策比決策本身有時候更為重要。與此不同的是,基于決策樹模型(包括C4.5和CART等)擁有清晰的可解釋性,可以追隨樹的結構回溯出決策產生的因由。

愛丁堡大學的研究人員們基于樹和神經網絡的結構提出了一種新型的模型——深度神經決策樹(DNDT),并探索了樹和網絡之間的相互作用。DNDT是一種具有特殊結構的神經網絡,任意一種配置下的DNDT都對應著決策樹,這使其具有了可解釋性。同時由于DNDT實現自神經網絡,使得它擁有了很多傳統決策樹不曾具有的特性:

1.DNDT可以通過已有的神經網絡工具便捷的實現,可能只需要幾行即可;

一個實現的例子

2.所有的參數可以通過隨機梯度下降法(SGD)同時優化,代替了復雜的貪婪優化過程;

3.具有大規模處理數據的能力,可以利用mini-batch和GPU加速;

4.可以作為一個模塊插入到現有的神經網絡模型中,并整體訓練。

在這種網絡中研究人員們使用了一種稱為soft binning function的函數,并將它用于DNDT中的分支操作。一個典型的soft binning函數可以得到輸入標量的二進制值,與Hard binning不同的是,這是一種可微的近似。這使得決策樹中的的參數是可導的,也就可以利用梯度下降法來進行訓練了。下式是MDMT中的一層神經元表示:

深度神經決策樹:深度神經網絡和樹模型結合的新模型

其中w為權重參數[1,2,。。。,n+1],b表示為[0,-β1,-β2...-βn],代表了n個分支點。式中的τ代表了溫度因子,其趨向于0時將為生成one-hot編碼。下圖是不同τ作用下的softbinning函數:

其中x在[0,1]區間內,此時的分割點為0.33和0.66,三個圖分別代表了τ為1,0,1和0.01的情況,越小意味著分支越陡峭。其中,

o1 = x

o2 = 2x-0.33

o3 = 3x-0.99

在決策過程中,通過上式給出的二進制函數利用克羅內克內積來實現,下圖中顯示了DNDT在Iris數據集上的學習過程,上半部分描述了深度神經決策樹的運行過程,其中紅色表示為可訓練的變量,黑色數字為常量。下半部分作為對比顯示了先前決策樹的分類過程。

通過本文提出的方法,研究人員將決策樹的訓練過程轉換為了訓練二進制分支點和葉子分類器。同時由于前傳過程是可微的,所以所有的點都可以同時利用SGD的方法來訓練。由于可以利用與神經網絡類似的mini-batch,DNDT可以便捷的實例規模化。但目前存在的問題是克羅內克積的存在使得特征的規模化不易實現。目前的解決方案是引入多棵樹來來訓練特征集中的子特征組合,避免了較“寬”的數據。

研究人員通過實驗驗證了中模型的有效性,在常見的14個數據集上(特別是Tabular類型的數據)取得了較好的結果。其中決策樹使用了超參數,“基尼”尺度和“best”分支;神經網絡使用了兩個隱藏層共50個神經元作為基準。而DNDT則使用了1最為分支點數目的超參數。

研究顯示DNDT模型隨著分割點的增加,整體激活的比重卻在下降,顯示了這種模型具有正則化的作用。

同時研究還顯示了分割點數量對于每一個特征的影響;

并利用了GPU來對計算過程進行了加速。

在未來還會探索DNDT與CNN的結合與應用,并將SGD應用到整個模型的全局優化中去,并嘗試基于決策樹的遷移學習過程。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4779

    瀏覽量

    101166
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4774

    瀏覽量

    129351
  • 決策樹
    +關注

    關注

    3

    文章

    96

    瀏覽量

    13587

原文標題:愛丁堡大學研究人員提出「深度神經決策樹」,可結合深度神經網絡和樹模型

文章出處:【微信號:thejiangmen,微信公眾號:將門創投】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    深度神經網絡模型量化的基本方法

    深度神經網絡模型量化是深度學習領域中的一種重要優化技術,旨在通過減少模型參數的精度(即從高精度浮點數如32位浮點數FP32降低到低精度整數如
    的頭像 發表于 07-15 11:26 ?782次閱讀

    殘差網絡深度神經網絡

    殘差網絡(Residual Network,通常簡稱為ResNet) 是深度神經網絡的一種 ,其獨特的結構設計在解決深層網絡訓練中的梯度消失和梯度爆炸問題上取得了顯著的突破,并因此成為
    的頭像 發表于 07-11 18:13 ?1179次閱讀

    pytorch中有神經網絡模型

    當然,PyTorch是一個廣泛使用的深度學習框架,它提供了許多預訓練的神經網絡模型。 PyTorch中的神經網絡模型 1. 引言
    的頭像 發表于 07-11 09:59 ?813次閱讀

    PyTorch神經網絡模型構建過程

    PyTorch,作為一個廣泛使用的開源深度學習庫,提供了豐富的工具和模塊,幫助開發者構建、訓練和部署神經網絡模型。在神經網絡模型中,輸出層是
    的頭像 發表于 07-10 14:57 ?563次閱讀

    基于神經網絡的語言模型有哪些

    文本或預測文本中的下一個詞。隨著深度學習技術的飛速發展,涌現出了多種不同類型的神經網絡語言模型。以下將詳細介紹幾種主流的基于神經網絡的語言模型
    的頭像 發表于 07-10 11:15 ?867次閱讀

    rnn是什么神經網絡模型

    RNN(Recurrent Neural Network,循環神經網絡)是一種具有循環結構的神經網絡模型,它能夠處理序列數據,并對序列中的元素進行建模。RNN在自然語言處理、語音識別、時間序列預測等
    的頭像 發表于 07-05 09:50 ?701次閱讀

    人工神經網絡模型的分類有哪些

    人工神經網絡(Artificial Neural Networks, ANNs)是一種模擬人腦神經元網絡的計算模型,它在許多領域,如圖像識別、語音識別、自然語言處理、預測分析等有著廣泛的應用。本文將
    的頭像 發表于 07-05 09:13 ?1360次閱讀

    深度神經網絡與基本神經網絡的區別

    在探討深度神經網絡(Deep Neural Networks, DNNs)與基本神經網絡(通常指傳統神經網絡或前向神經網絡)的區別時,我們需
    的頭像 發表于 07-04 13:20 ?1059次閱讀

    bp神經網絡深度神經網絡

    BP神經網絡(Backpropagation Neural Network)是一種常見的前饋神經網絡,它使用反向傳播算法來訓練網絡。雖然BP神經網絡在某些方面與
    的頭像 發表于 07-03 10:14 ?947次閱讀

    基于神經網絡算法的模型構建方法

    和應用等方面。 1. 引言 神經網絡是一種模擬人腦神經元網絡的計算模型,由大量的節點(神經元)和連接(突觸)組成。神經網絡具有自學習能力,能
    的頭像 發表于 07-02 11:21 ?656次閱讀

    構建神經網絡模型方法有幾種

    構建神經網絡模型深度學習領域的核心任務之一。本文將詳細介紹構建神經網絡模型的幾種方法,包括前饗神經網絡
    的頭像 發表于 07-02 10:15 ?437次閱讀

    深度神經網絡模型cnn的基本概念、結構及原理

    深度神經網絡模型CNN(Convolutional Neural Network)是一種廣泛應用于圖像識別、視頻分析和自然語言處理等領域的深度學習
    的頭像 發表于 07-02 10:11 ?9929次閱讀

    深度神經網絡有哪些主要模型?各自的優勢和功能是什么?

    神經網絡模型及其優勢和功能: 多層感知器(Multilayer Perceptron, MLP) 多層感知器是一種基本的深度神經網絡,由多個全連接層組成。每個隱藏層包含多個
    的頭像 發表于 07-02 10:01 ?3046次閱讀

    深度神經網絡模型有哪些

    模型: 多層感知器(Multilayer Perceptron,MLP): 多層感知器是最基本的深度神經網絡模型,由多個全連接層組成。每個隱藏層的
    的頭像 發表于 07-02 10:00 ?1638次閱讀

    助聽器降噪神經網絡模型

    抑制任務是語音增強領域的一個重要學科, 隨著深度神經網絡的興起,提出了幾種基于深度模型的音頻處理新方法[1,2,3,4]。然而,這些通常是為離線處理而開發的,不需要考慮實時性。當使用
    發表于 05-11 17:15
    V博百家乐官网的玩法技巧和规则 中骏百家乐官网的玩法技巧和规则 | 任你博百家乐官网现金网| 大发888游戏下载官方| 百家乐赢钱| 鑫鼎国际| 亲朋棋牌游戏下载| 百家乐游戏什么时间容易出| 太阳城百家乐手机投注| 百家乐官网游戏什么时间容易出对 | 在线百家乐策| 诸子百家乐的玩法技巧和规则| 百家乐庄闲分布概率| 昆明百家乐装修装潢有限公司| 伟博百家乐现金网| A8百家乐游戏| gt百家乐平台假吗| 百家乐最好打法与投注| 百家乐的破解方法| 最好的百家乐投注| 欢乐谷百家乐的玩法技巧和规则 | 大发888娱乐城官网下载真钱| 舟山星空棋牌游戏大厅下载| 电动扑克| 大世界百家乐官网现金网| 真钱百家乐官网游戏大全| 百家乐官网号技巧| tt百家乐官网的玩法技巧和规则| 百家乐游戏规测| 大世界百家乐娱乐网| 大发888老虎机技巧| 大发888-dafa888uk.com| 轮盘必胜法| 百家乐官网网址多少| 作弊百家乐官网赌具| 百家乐官网投注组合| 加州百家乐官网的玩法技巧和规则| 赌场百家乐台| 明升国际| 百家乐官网破战| 百家乐技真人荷官| 澳门顶级赌场金鹰娱乐|