那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

詳解機器學習算法流形學習

fcsde-sh ? 來源:工程師曾玲 ? 2019-02-02 15:40 ? 次閱讀

在格物匯之前的文章中,我們系統(tǒng)性的介紹了特征抽取的經典算法——主成分分析PCA與線性判別分析LDA的原理、應用場景,以及這兩種算法的局限性和改進方法。今天的格物匯要給大家介紹一種新的機器學習算法——流形學習。

流形學習

流形學習是一類借鑒了拓撲流形概念的降維方法,與核PCA的目的一樣,它想要在低維空間中盡量保持在高維空間中的結構。一個形象的流形降維過程如下圖,我們有一塊卷起來的布,我們希望將其展開到一個二維平面,我們希望展開后的布能夠在局部保持布結構的特征,其實也就是將其展開的過程,就像兩個人將其拉開一樣。

流形學習方法有很多種,但是他們具有一些共同的特征:首先構造流形上樣本點的局部鄰域結構,然后用這些局部鄰域結構來將樣本點全局的映射到一個低維空間。它們之間的不同之處主要是在于構造的局部鄰域結構不同,以及利用這些局部鄰域結構來構造全局的低維嵌入方法的不同。下面我們簡要介紹兩種最常見的流形學習方法:Isomap和LLE。

Isomap

高維數(shù)據(jù)結構可能太過于抽象,很難去理解。我們先來看一個具體的實例:在上一篇文章中,我們所看到的三維空間上的數(shù)據(jù)是呈現(xiàn)”S”型,假設我們想尋找圖中兩點的測地距離(延曲面距離),就不能用這兩點坐標所計算的歐式距離,如下圖(a)黑色線所示,因為黑色線所構成的路徑延曲面不可達。而應該使用其沿著“S”形曲面所生成的距離,想象一下一只螞蟻在數(shù)據(jù)曲面上爬行,它不能脫離曲面行走,行走的路徑如下圖(a)紅色線所示。下圖(b)則顯示的是兩條線本真二維結構上所顯示的路徑,很明顯紅色的線更加真實的反映了兩個數(shù)據(jù)點在三維數(shù)據(jù)上的距離。

詳解機器學習算法流形學習

上述這種尋找數(shù)據(jù)曲面測算距離的方法稱為Isomap(等度量映射),它是流形學習中的一種方法。它是如何實現(xiàn)的呢?它假設數(shù)據(jù)點與K個最近鄰的點可以構成一個子集,這個子集可以用普通的歐式距離來衡量,而這個子集中的點又與其他子集中的點相連,這樣兩個目標點的距離就可以分解成若干子集的歐式距離疊加來近似得到,最后這些相連的點可以降維到低維空間中展現(xiàn)出來。

詳解機器學習算法流形學習

局部線性嵌入(LLE)

流形學習另外一個典型案例是局部線性嵌入(LLE)。Isomap假設近鄰的測地距離可以用歐式距離來表示。而LLE則假設在近鄰內可以用線性加權互相表達。比如對于任意一個樣本x0,我們都可以用他附近的幾個點x1 x2 x3 x4的線性組合表示出來,即

詳解機器學習算法流形學習

經過LLE降維投影后,原來的點x0 x1 x2 x3 x4,投影變成了

詳解機器學習算法流形學習

LLE降維的想法是,降維后盡量去保留高維時的線性組合關系:

詳解機器學習算法流形學習

詳解機器學習算法流形學習

如何求解呢?我們需要先求出線性組合的權重w,對于樣本x0我們需要找到其最近的k個其他樣本點,假設為x1 x2 x3 x4,我們根據(jù)線性表示誤差最小來求出w:

詳解機器學習算法流形學習

根據(jù)上式確定出線性組合的w以后,我們還需要讓其在低維空間也能盡可能滿足線性組合的表達關系式,也就是說對于x0 x1 x2 x3 x4……的低維投影點z0 z1 z2 z3 z4……滿足:

詳解機器學習算法流形學習

兩個優(yōu)化目標函數(shù)類型很像,但需要明確的是第一個目標函數(shù)優(yōu)化的是權重w,而第二個目標函數(shù)優(yōu)化的是降維后的坐標z。經過優(yōu)化即可得出樣本集在低維空間上的投影坐標。

總的來說,對于不在某一個點x0鄰域內的其他點A,不管A怎么變動,都不會影響到點x0,這種變動局部限制的思想在很多地方都有用,此外LLE盡可能的保存了局部線性信息,使得其在局部能反映出數(shù)據(jù)原本的結構。它的流程大致如下圖所示:

詳解機器學習算法流形學習

小結

LLE是廣泛使用的圖形圖像降維方法,它實現(xiàn)簡單,但是對數(shù)據(jù)的流形分布特征有嚴格的要求。比如不能是閉合流形,不能是稀疏的數(shù)據(jù)集,不能是分布不均勻的數(shù)據(jù)集等等,這限制了它的應用。

優(yōu)點

1、可以學習任意維的局部線性的低維流形

2、算法歸結為稀疏矩陣特征分解,計算復雜度相對較小,實現(xiàn)容易

缺點

1、算法所學習的流行只能是不閉合的,且樣本集是稠密均勻的

2、算法對最近鄰樣本數(shù)的選擇敏感,不同的最近鄰數(shù)對最后的降維結果有很大影響

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 拓撲
    +關注

    關注

    4

    文章

    341

    瀏覽量

    29671
  • 機器學習
    +關注

    關注

    66

    文章

    8441

    瀏覽量

    133087
  • 張飛電子
    +關注

    關注

    55

    文章

    175

    瀏覽量

    12652

原文標題:【眾籌突破25W銷量】馬達驅動開發(fā)板+45小時視頻教程

文章出處:【微信號:fcsde-sh,微信公眾號:fcsde-sh】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    基于流形學習的毫米波探測器目標識別方法研究【個人收藏】

    流形學習是一種機器學習理論,旨在發(fā)現(xiàn)高維數(shù)據(jù)分布的內在規(guī) 律,并 從中恢復低維流形結構 ,實現(xiàn)維數(shù)約簡 。本文將流形學習方法應用于毫米波探測
    發(fā)表于 12-20 15:43

    有監(jiān)督流形學習算法SLLESVM 在圖像檢索中的應用

    基于內容的圖像檢索中,高維特征向量的有效降維是一項關鍵技術,流形學習算法LLE 是有效的非線性降維方法,而SVM 的泛化能力較強,本文將二者結合在一起,成為一種新的有
    發(fā)表于 06-10 15:59 ?10次下載

    Spark機器學習庫的各種機器學習算法

    本文將簡要介紹Spark機器學習庫(Spark MLlibs APIs)的各種機器學習算法,主要包括:統(tǒng)計
    發(fā)表于 09-28 16:44 ?1次下載

    增量流形學習正則優(yōu)化算法

    高維流式大數(shù)據(jù)的產生與發(fā)展對傳統(tǒng)機器學習和數(shù)據(jù)挖掘算法提出了諸多挑戰(zhàn)。本文結合流式大數(shù)據(jù)流式到達的特性,首先建立自適應增量特征提取算法模型。然后,針對噪聲環(huán)境,建立基于特征空間校準的增
    發(fā)表于 02-27 11:07 ?1次下載

    如何刻畫數(shù)據(jù)的本質?流形學習能幫到你

    在格物匯之前的文章中,我們系統(tǒng)性的介紹了特征抽取的經典算法——主成分分析PCA與線性判別分析LDA的原理、應用場景,以及這兩種算法的局限性和改進方法。今天的格物匯要給大家介紹一種新的機器學習
    的頭像 發(fā)表于 04-28 19:08 ?2937次閱讀
    如何刻畫數(shù)據(jù)的本質?<b class='flag-5'>流形學習</b>能幫到你

    詳解機器學習分類算法KNN

    本文主要介紹一個被廣泛使用的機器學習分類算法,K-nearest neighbors(KNN),中文叫K近鄰算法
    的頭像 發(fā)表于 10-31 17:18 ?6202次閱讀

    流形學習與非負矩陣分解架構綜述

    為處理目標數(shù)據(jù)集僅有部分成對約束信息可用的半監(jiān)督聚類場景,基于非負矩陣分解(NMF)架構,通過學習給定成對約束知識和運用流形正則化理論提岀了流形學習與成對約東聯(lián)合正則化非負矩陣分解聚類方法(NMF-
    發(fā)表于 04-12 11:25 ?4次下載
    <b class='flag-5'>流形學習</b>與非負矩陣分解架構綜述

    基于流形學習的T分布式多傳感器體域網

    異常影響較小的優(yōu)點,但是針對無線多傳感器體域網的數(shù)據(jù)降維效果并不理想。對此,提岀了一種基于流形學習的T分布式隨機鄰域嵌入(TSNE)算法對多傳感器體域網數(shù)據(jù)進行融合。T-SNE算法首先將高維數(shù)據(jù)點與其對應的低維數(shù)據(jù)點間的歐氏距離
    發(fā)表于 05-18 11:26 ?5次下載

    流形學習LLE算法的配套Matlab源碼匯總

    流形學習LLE算法的配套Matlab源碼匯總
    發(fā)表于 08-25 09:30 ?1次下載

    機器學習算法的基礎介紹

    現(xiàn)在,機器學習有很多算法。如此多的算法,可能對于初學者來說,是相當不堪重負的。今天,我們將簡要介紹 10 種最流行的機器
    的頭像 發(fā)表于 10-24 10:08 ?2012次閱讀

    機器學習算法匯總 機器學習算法分類 機器學習算法模型

    機器學習算法匯總 機器學習算法分類 機器
    的頭像 發(fā)表于 08-17 16:11 ?1169次閱讀

    機器學習算法總結 機器學習算法是什么 機器學習算法優(yōu)缺點

    機器學習算法總結 機器學習算法是什么?機器
    的頭像 發(fā)表于 08-17 16:11 ?2050次閱讀

    機器學習算法入門 機器學習算法介紹 機器學習算法對比

    機器學習算法入門 機器學習算法介紹 機器
    的頭像 發(fā)表于 08-17 16:27 ?1005次閱讀

    機器學習有哪些算法機器學習分類算法有哪些?機器學習預判有哪些算法

    機器學習有哪些算法機器學習分類算法有哪些?機器
    的頭像 發(fā)表于 08-17 16:30 ?2071次閱讀

    機器學習算法原理詳解

    機器學習作為人工智能的一個重要分支,其目標是通過讓計算機自動從數(shù)據(jù)中學習并改進其性能,而無需進行明確的編程。本文將深入解讀幾種常見的機器學習
    的頭像 發(fā)表于 07-02 11:25 ?1363次閱讀
    找真人百家乐官网的玩法技巧和规则 | 澳门百家乐官网网络游戏信誉怎么样| 百家乐官网最好的平台是哪个| 武隆县| 香港六合彩开奖记录| 大发888支付宝代充| 威尼斯人娱乐城真人游戏| 赌百家乐可以赢钱| 百家乐直杀| 百家乐桌布小| 玩百家乐如何看路| 属马做生意坐向| 百家乐官网微笑打| 福布斯百家乐官网的玩法技巧和规则 | 全讯网信息| 威尼斯人娱乐城易博| 游艇会百家乐的玩法技巧和规则| 百家乐比较好的网站| 线上百家乐攻略| 欢乐博百家乐娱乐城| 百家乐隔一数打投注法| 百家乐的技术与心态| 百家乐赌牌技巧| 做生意风水问题| 百家乐打水策略| 百家乐赢的方法| 风水24山里的四维八干| 闲和庄百家乐官网的玩法技巧和规则 | 百家乐官网规律和方法| 电脑赌百家乐官网可靠吗| 百家乐官网是怎么赌法| 百家乐官网机器出千| 赌片百家乐官网的玩法技巧和规则| 真人百家乐官网赌城| 新世百家乐官网的玩法技巧和规则 | 大发888是什么东| 大发888 娱乐场| 大发888m磨卡游戏| 大发888 com| bet365手机| 六合彩开奖查询|