水聲被動定位中的機器學習方法研究進展綜述
來源:《信號處理》,作者牛海強等
摘 要:?本文對基于機器學習方法的水聲被動定位研究進展進行了綜述。所涉及的機器學習方法有多層感知機(前饋神經網絡)、支持向量機、隨機森林及以卷積網絡層和全連接層為主要組成單元的深度神經網絡。本文通過重點引述近幾年發表在國際期刊和會議上的相關前沿研究工作,詳細論述了將機器學習方法應用于水聲被動定位的關鍵理論基礎、單水聽器和陣列前端信號預處理算法設計及幾種典型的機器學習模型。此外,還指出了現有算法在推向實際應用中面臨的困難及挑戰。最后,基于作者的思考,文章展望了未來基于機器學習的水聲定位算法的幾個潛在的研究方向。
關鍵詞:水聲被動定位;機器學習;深度學習;神經網絡;監督學習
1?引言
近幾年,機器學習方法(尤其是深度學習方法)在語音識別[1]、圖像處理[2]、自然語言理解[3]等科學領域取得了突破性進展,促進了自動駕駛、人臉識別、語音個人助理、醫學影像分析等領域的技術變革。不僅如此,機器學習方法也在深刻影響著其他自然科學領域(如地球物理學[4-7])的發展方向。從統計學的角度看,機器學習方法是一種最優化方法。利用大量統計數據對具有特定結構、包含未知參數的數學模型進行訓練,可生成含有訓練數據內在統計特征的擬合器。從這個角度看,機器學習方法是一種可應用于最優化問題求解的普適性的框架。因此,其可被應用于其他多個自然科學領域。水聲遠程被動定位問題是根據觀測到的遠距離聲源輻射的聲壓數據,通過合適的信號處理算法,在空域內尋找聲源最優或最可能的位置。顯然,給定合適的經過預處理之后的訓練數據,該問題可用機器學習方法進行求解。例如,將機器學習用于分類問題時,模型的輸出為可能類型的概率分布。類似地,尋找最優聲源位置也可作為機器學習的分類問題進行求解,此時模型輸出為聲源距離或深度的概率分布。本文對基于機器學習的水聲被動定位算法進行綜述,通過對目前最新的研究成果進行引述,重點討論和給出所涉及到的算法理論基礎、單陣元及陣列的前端信號預處理算法、模型選擇和訓練及性能評價等。
將機器學習方法應用到水聲被動定位,可以追溯到上世紀九十年代。1991年,Steinberg[8]等人將神經網絡用于對均勻介質中點聲源的定位。同年,Ozard[9]等人仿真研究了在匹配場處理中利用神經網絡進行距離和深度判別。之后,Caiti[10-11]等人(1994、1996)利用徑向基函數神經網絡估計海底沉積層的特性。另外,Michalopoulou[12](1995)、Stephan[13](1998)和Benson[14](2000)等人分別將神經網絡用于海底分類和地聲參數反演。總的來說,以上工作為神經網絡在水聲學中的應用作了探索性的研究。但是,受限于當時的計算資源及缺乏高效的訓練算法,加之當時主流的被動定位算法——匹配場定位[15-19],正處于飛速發展階段,在之后的很長一段時間,機器學習方法在水聲學領域并沒有受到足夠重視,而基于物理場聲學建模的匹配場處理方法則成為水聲被動定位的研究熱點。然而,盡管匹配場處理方法經過幾十年的發展取得了巨大的進步,目前也被廣泛應用于相關的工程實踐,但是匹配場處理方法在實際應用中仍然面臨著諸多困難和挑戰,如典型的環境失配問題。海洋是一種時變、空變的復雜聲信道,導致實測聲場與理論建模聲場之間必然存在一定的偏差和失配,這種失配有時會給匹配場定位造成較大影響。為克服和降低海洋環境參數不確定性對匹配場定位的影響,研究人員相繼提出了一些將環境參數納入未知參數集的改進的匹配場處理方法,如環境聚焦匹配場處理[20-24]或貝葉斯匹配場定位[25-26]。但同時這些方法帶來的問題是計算量顯著增加,增加了實時處理的難度。
由于匹配場處理方法的局限性及近幾年機器學習理論和技術的新發展,一些基于機器學習的水聲被動定位方法開始重新嶄露頭角,相關研究和報道也陸續出現。2017年,Lefort[27]等人利用水箱實驗數據模擬研究了在起伏海洋環境下非線性回歸算法的定位性能,表明機器學習算法在水聲目標定位中有一定的優勢和潛力。同年,Niu[28-29]等人提出了一類可行的基于機器學習算法的水下聲源定位方法,系統性研究了前饋神經網絡、支持向量機和隨機森林三種機器學習模型的聲源定位性能,并首次通過海試實測實驗數據驗證了機器學習算法的定位性能。2018年,Wang[30]等人將實測數據作為實驗數據,利用廣義回歸神經網絡對聲源進行定位。同年,Huang[31]等人嘗試將仿真聲場作為訓練數據,利用多層的深度卷積神經網絡對聲源進行定位。2019年,Liu[32]等人利用集合卷積網絡對深海直達聲區進行聲源測距。Niu[33]等人利用50層殘差卷積神經網絡和單水聽器對不確知環境條件下的聲源進行定位。所有這些工作都表明了機器學習方法在水聲被動定位中的應用潛力。同時,值得注意的是,相關研究在國際水聲學領域也開始顯示出影響力,越來越多的學者投入到相關研究中。以美國聲學學會年會為例,基于機器學習的水聲定位或反演研究在2016年的兩次會議上還較為少見。到2018年11月的秋季年會,相關的會議報告[34- 40]已明顯增加。由此可見,該研究方向正處于快速發展階段,并逐步在整個水聲學領域產生影響力。
2?定位算法
到目前為止,水聲遠程被動定位中所涉及的機器學習方法,絕大多數屬于有監督學習類算法。即利用有標注的數據對機器學習模型進行訓練。若機器學習模型的輸出為連續的,則為回歸器。若模型輸出為多個離散值,則將這種機器學習模型稱之為分類器。理論上,利用回歸器或分類器對聲源距離和深度進行估計都是可行的。定位算法的框圖如圖1所示。定位算法分為兩個階段:訓練階段和預測階段。
圖1 機器學習定位算法框圖
Fig.1 Localization algorithm using machine learning
在圖1所示的訓練階段,原始聲壓數據經過前端預處理(見第2.2節)之后作為機器學習模型的輸入。用于訓練的標注數據為聲源位置或與聲源位置相關的量。對于回歸器,標注為連續的聲源距離或深度[28],對于分類器,標注一般采用位向量[28](即組成元素為0和1)對聲源距離或深度進行編碼表示。給定對應的標注之后,結合模型輸出,就可以利用特定的訓練損失函數對機器學習模型進行訓練,目的是得到模型中的未知參量。幾種典型的機器學習模型及對應的訓練損失函數見第2.3節。在訓練階段訓練好的機器學習模型可用于預測階段對未知數據的預測,預測階段機器學習模型的輸入為經過同樣預處理之后的測量數據。對于回歸器,模型的輸出為聲源距離或深度;對于分類器,輸出為聲源距離或深度的概率分布,一般取概率最大值為聲源位置的估計值。
2.1?理論基礎
雖然在某些應用中機器學習模型被認為是無法解釋的“黑盒子”模型,但是將機器學習方法應用到水聲被動定位中,是有合理的物理理論基礎的。如引言所述,機器學習模型實際上是一個函數擬合器,它將輸入按照一定的規則映射為輸出。在水聲學中,不同位置(距離和深度)處的聲源所產生的聲場是不同的。具體來說,不同位置處聲源對應的信道響應是不同的,而聲源激勵一般來說與位置無關。因此,我們可以將預處理之后的物理量映射為聲源位置或與聲源位置相關的量。以某淺海環境下單陣元為例,圖2所示為仿真得到的單個陣元接收信號幅度的距離-頻率圖,可見不同距離處對應不同的頻率干涉結構。同樣,在深海直達聲區,也存在類似的干涉結構[32]。因此,這種特征[32-33]可用來作為機器學習模型的輸入。陣列信號的采樣協方差矩陣也包含類似的信息(矩陣的對角線元素對應每個陣元信號的幅度,非對角線元素對應不同陣元信號間的相位差)。第2.2節所述的前端預處理算法的目的是將原始測量信號轉換為信道響應或近似信道響應,從而盡量減小訓練數據和預測數據可能存在的差異。在實際應用中,二者差異一般由聲源激勵不同引起,包括相位和幅度差異。對于陣列信號采用的歸一化采樣協方差矩陣[28-29]以及單陣元信號采用的分段歸一化幅度[32-33],就是為了減小這種差異。
圖2 接收信號的干涉結構(距離-頻率圖)
Fig.2 Interference structure of received signals (range-frequency)
2.2?前端預處理算法
其中,nf為每一分段的頻點數。向量
即為預處理之后機器學習模型輸入的單個樣本點。
p(?f?)=S(?f?)g(f,r)+ε(?f?)
(1)
其中,S(?f?)為復數聲源激勵項,g(f,r)為與聲源位置有關的信道響應或格林函數,ε(?f?)為噪聲。因為一般情況下聲源激勵項與聲源位置無關,并且訓練數據與預測數據的聲源激勵可能會存在差異,為使機器學習模型的輸入數據保持相同的特征,預處理算法的目的是消除或減小聲源激勵譜幅度和相位的影響[28-29]。
首先,復聲壓數據被歸一化為[28-29]
(2)
若噪聲為零,公式(2)的歸一化方法可將聲源激勵的幅度譜的影響完全消除。在較高信噪比情況下,聲源幅度譜的影響可被有效抑制。
然后,利用歸一化后的復聲壓,可得到多次快拍平均的采樣協方差矩陣(SCM)[28-29]:
(3)
其中,Ns為快拍數。由公式(1)和(3)可見,在較高信噪比的條件下,聲源激勵相位的影響可被有效抑制和減弱。公式(2)和(3)保證了將與聲源激勵近似無關的物理量作為用于水聲被動定位的機器學習模型輸入,而非原始測量的聲壓。由于公式(3)計算得到的采樣協方差矩陣是共軛對稱的,因此為提高計算效率和較少內存占用,可取上三角矩陣對應元素的實部和虛部作為機器學習模型的輸入。對于單頻信號,L個水聽器數據經預處理之后每個樣本點的輸入維數為L×(L+1)。若考慮輸入為多頻信號,可將多個頻點的數據拼接為一個長向量作為模型輸入。
公式(2)和(3)是針對陣列信號的預處理方法。對于單陣元信號,水聲被動定位也是可行的,比如典型的利用波導不變量原理進行測距。基于波導不變量的測距方法,實際上是利用寬帶信號的干涉結構,即不同距離上干涉結構不同。從另一個角度出發,波導不變量測距方法利用的是寬帶信號的幅度譜,基于機器學習的定位方法也可借鑒這一點。因此,類似于陣列信號預處理方法的出發點,對于單陣元的寬帶信號,預處理算法使得訓練數據和預測數據的特征分布保持一致。記單陣元接收到的F個頻率的復聲壓矢量為p=[p1,…,pf,…,pF],對應的幅度譜可寫為:
q=[|p1|,…,|pf|,…,|pF|]
(4)
然后,將公式(4)向量中的元素歸一化到[0, 1]區間[33]:
(5)
與陣列信號預處理相似,為降低訓練數據和測試數據聲源譜不一致造成的影響,對于緩變的聲源譜,可用如下的分段歸一化方法[33]:
(6)
在線實時融冰技術,將可以有效防止輸電線路覆冰災害,減少輸電線路覆冰承載參數,降低輸電線路設計成本。文獻[7]提出一種自融冰導線設計方法,并設計了自融冰設備,為實現輸電線路實時在線融冰提供了新思路和新方法。
另外,除了以上預處理算法外,還可以利用協方差矩陣的本征向量[31]作為模型的輸入。該方法將多次快拍平均的采樣協方差矩陣進行分解,理論上可將整個空間分解為模態信號空間和噪聲空間。然后取前M個較大本征值(即理想情況下的前M階簡正波)對應的本征向量作為機器學習模型的輸入。理想情況下,由于只取前M個特征向量,故該方法可抑制部分噪聲。但同時存在的問題是若采樣協方差矩陣統計不充分,子空間的分解可能存在一定的問題。另外,信號有效模態數M的值不太好確定,與海洋傳播環境及信號頻率等密切相關。總之,機器學習模型輸入特征的提取和構造是一個非常值得研究的問題,關系到機器學習模型的學習效率和穩健性。
2.3?典型機器學習模型
根據現有文獻,用于水聲被動定位的機器學習模型有支持向量機、隨機森林、前饋神經網絡、深度神經網絡以及集成神經網絡模型等。其中,支持向量機、隨機森林和單隱層的前饋神經網絡屬于淺層模型,對于小訓練數據集具有很好的定位性能。而深度神經網絡屬于深度學習模型,學習能力更強,可構建高度復雜的機器學習模型,但同時需要的訓練數據也越多。在訓練數據不足的情況下,機器學習模型可能會出現過擬合的現象。選擇哪種模型取決于訓練數據集的大小及水聲被動定位具體的應用場景(見第3節中對海試試驗結果的概述)。下面對這幾種模型進行簡要介紹。
支持向量機[41]是一種典型的分類模型,它通過使間隔(margin)最大化的策略尋找一個超平面實現輸入樣本的分類。如果訓練數據空間是線性可分的,可通過硬間隔最大化得到線性支持向量機分類器;若輸入空間是近似線性可分時,可通過引入松弛變量即軟間隔最大化,得到線性分類器;當訓練數據為線性不可分時,可通過核技巧實現非線性支持向量機。以二分類為例,首先假設輸入樣本空間{xn;?n=1,2,…,N}是線性可分的,對應的類型為sn∈{1, -1},則分類模型具有以下的形式:
yn=wTxn+b
(7)
其中,w和b是待求解的權重和偏置項。用于分類的超平面滿足wTxn+b=0,若估計值yn在超平面之上(yn>0),則對應的估計類型為
相反,若yn位于超平面之下(yn<0),則估計類型為
樣本點xn到超平面的垂直距離d等于點xn與其在超平面上投影點x0之間的距離,滿足:
(8)
因此,距離d可寫為[28]:
(9)
間隔距離dM定義為從超平面到間隔邊界上最近的樣本點(即支持向量)的距離。模型參數可由最大化間隔求解得到:
(10)
公式(10)等價于求解如下優化問題:
(11)
若訓練數據是線性不可分的,可引入松弛變量ξn≥0,使得部分樣本點有一定的誤分類。此時對應的優化問題為[41]:
n=1,…,N
(12)
其中,參數C>0控制間隔最大化和誤分類之間的權重。另外,對于非線性的分類問題,公式(7)可寫為:
yn=wT
(xn)+b
(13)
其中
(xn)表示特征空間的變換。對于該類問題,可通過核函數的技巧進行求解。與支持向量機分類器不同,支持向量回歸器則是最小化如下ε敏感度的誤差函數[41]:
(14)
其中,rn是樣本xn對應的真實的聲源位置。
隨機森林模型[42- 43]是決策樹模型的推廣,它將輸入數據劃分到不同的特征空間中。即從根節點開始,對樣本的某一特征進行測試,根據測試結果將樣本分配到相應的子節點(每個子節點對應特征的一個取值),然后依次遞歸,最終將樣本劃分到不同葉節點。若輸入樣本{xn;?n=1,2,…,N}是D維空間中的向量。按照決策樹的思想,通過在第i維空間上定義一個截止門限c,輸入數據可被劃分到左右兩個區域(或特征空間):
(15)
在每個分支處的代價函數可寫為:
(16)
nleft和nright分別為劃分到左右兩個區域中的樣本點數,H(·)為純凈度函數。對于分類問題,一種表達純凈度的函數為基尼指數(Gini Index):
(17)
nm為區域xm內的樣本點數,lm為區域xm對應的標注預測,表示區域內樣本數量最多的類型標注:
(18)
其中,rk為聲源位置對應的預測類型,tn為樣本xn對應的標注,且
(19)
對于回歸算法,區域的標注預測lm和純凈度函數H(·)為:
(20)
(21)
其中rn為對應樣本的聲源位置(標注)。單個決策樹模型容易產生過擬合的問題,而隨機森林則是一種通過統計自助抽樣集成,綜合多個決策樹的模型,穩健性更好。對于給定的訓練集,隨機森林模型通過自助法產生Mr個訓練集,在每個訓練集上訓練產生一個決策樹。最終通過多個決策樹的統計結果,樣本被歸為出現頻次最多的類型。
另一類機器學習模型是前饋神經網絡[41],一般也被稱之為多層感知機,它具有前向直連的非循環結構。記輸入層L1為D維的向量x=[x1,…,xD]T,與輸入層相連的第二層L2含有M個神經元,每個神經元的激活值為輸入層單元的線性組合:
(22)
其中,
和
被稱之為權重和偏置,上標代表當前的層數。該層神經網絡的輸出為激活值經過一個激活函數f(·)的變換:
zj=f(aj)
(23)
激活函數有多種選擇,包括sigmoid函數、tanh函數、ReLU函數等。以sigmoid函數為例,其數學形式為:
(24)
可以看出該函數為單調遞增函數,當a→+
,?f(a)→1,當a→-
,?f(a)→0。以此類推,第三層L3中K個神經元對應的激活值為:
(25)
若該層為輸出層,對于多分類問題,一般采用softmax函數作為激活函數,對應的K個輸出為:
(26)
yk表示樣本屬于第k個類型的概率,滿足0≤yk≤1且∑kyk=1。記tn為二進制的位向量(one-hot vector),向量中僅有一個數為非零,其在向量中的位置代表相應的類型。訓練神經網絡時,互熵一般作為訓練的代價函數:
(27)
對于N個樣本,對應的平均互熵及最優的權重分別為[41]:
(28)
(29)
對于回歸問題,一般將平方誤差函數作為最小化的代價函數[41]:
(30)
其中,rn為聲源位置(標注)。神經網絡的訓練一般采用誤差反向傳播算法進行權重的更新。
深度神經網絡一般被認為是在深度方向上擁有許多層結構的神經網絡。例如,上文介紹的具有多個隱層的前饋神經網絡也是一種深度神經網絡,層與層之間通過全連接的方式進行互連。除了前饋神經網絡,在圖像和語音處理領域,被廣泛采用的深度神經網絡還有深度卷積神經網絡及循環神經網絡。深度卷積神經網絡的基本組成單元為卷積層,通過權值參數共享的方式極大地減少了待求解的參數數量。循環神經網絡則主要用來對序列進行建模,典型特點為具有有向環的結構。到目前為止,循環神經網絡還未在水聲被動定位中有所應用,因此本文僅簡要介紹卷積神經網絡。對于卷積層,記輸入樣本I的維度為W×H×D,在圖像處理中代表寬、高及通道數,對于水聲定位,輸入可為一維或二維。卷積操作即為輸入I與卷積核K的卷積(convolution),在卷積網絡算法實現中,經常用互相關(cross-correlation)代替卷積,二者的區別在于是否對卷積核進行翻轉。對于單個通道D=1,數學表達式為:
(31)
卷積操作后的輸出經常被稱之為特征圖(feature map),卷積核的維度通常遠小于輸入的維度。然后,與其他神經網絡類似,卷積之后的輸出經過一個激活函數(卷積網絡中一般為修正線性單元ReLU),最后經過一個池化層(pooling)對輸出進行進一步修正處理。例如,常見的兩種池化操作為最大池化和平均池化,分別對某一矩形區域內的元素取最大值或平均值。多個卷積層的級聯可構成深度卷積神經網絡,深度越深,模型的表達能力越強,但同時帶來的問題是梯度消失問題,導致模型越難訓練。為此,有研究人員提出殘差神經網絡(ResNet)[44]來緩解深度模型的訓練問題。與常規卷積神經網絡模擬輸入x與輸出H(x)之間的映射不同,殘差網絡模擬的是輸入輸出的殘差函數F(x),即H(x)=F(x)+x。圖3所示的瓶頸(bottleneck)結構[44]是一種實現殘差網絡的基本單元。
圖3 殘差網絡中的瓶頸結構
Fig.3 Bottleneck structure in ResNet
另外,還有研究人員利用集成神經網絡對聲源進行測距[32]。集成神經網絡模型是利用集成學習的思想(類似單個決策樹和隨機森林之間的關系),并綜合多個神經網絡模型,對結果進行統計預測,可在一定程度上提高模型的穩健性和性能。
機器學習模型的訓練可在現有主流框架上進行高效地訓練,如TensorFlow[45]和Scikit-learn[46]等。
2.4?性能評價
為度量機器學習方法的定位性能,有三種常見的評價準則,分別是均方誤差(MSE)、平均絕對值誤差(MAE)以及平均絕對百分比誤差(MAPE)。記測試樣本數為N、第i個樣本對應的距離或深度的真實值為gi、第i個樣本對應的距離或深度的預測值為yi,則均方誤差的計算公式為:
(32)
平均絕對誤差的計算公式為:
(33)
平均絕對百分比誤差的計算公式為:
(34)
對于同一數據集,這三種評價準則的結果并不完全一致,一般情況下,可選擇一種或多種度量對定位結果進行比較和評價。
2.5?與匹配場定位的區別
基于機器學習的水聲定位方法,與經典的匹配場定位相比,有以下幾點明顯區別:
(1)算法的執行策略和效率不同。機器學習方法可以被認為是一種離線訓練、在線預測的策略。大量密集的計算集中在模型的訓練階段,訓練好的模型在預測階段進行輕量級的計算,因此可較為容易地實現數據的實時處理。相反,匹配場處理方法采用的則是在一個參數空間內進行在線匹配的策略,如果參數空間較大(如同時包含環境參數),則計算效率會顯著降低,導致無法進行實時處理。
(2)用于定位的代價函數不同。機器學習方法根據回歸或者分類任務,大多采用最小均方誤差或最小化互熵等訓練的代價函數。而匹配場處理大多采用相關處理的方式。
(3)大數據處理的能力。機器學習方法可以很自然的采用大數據集結合深度學習模型進行訓練,數據量越大,在統計意義上越有可能逼近真實的數據分布,并且可以同時利用仿真數據和實測數據作為訓練數據。匹配場處理方法一般情況下無法有效處理大數據。
3?部分海試實驗數據概述
本節對近幾年公開發表文獻中所涉及的海試實驗數據處理中用到的機器學習模型和應用場景進行總結和概括,以便于讀者了解目前機器學習方法應用于水聲被動定位的概況。表1總結給出了對應的試驗海域及類型、傳感器和訓練數據類型、機器學習模型及定位類型。在文獻[28-30]中,實際測量數據被用于機器學習模型的訓練,由于訓練數據規模較小,模型均為結構較為簡單的淺層模型。采用實驗數據作為訓練數據的好處是可避免對未知環境的聲場理論建模,從而最大限度避免了環境失配造成的影響,但同時對應用場景有較大的限制,即訓練好的機器學習模型僅適用于某一特定海域相似環境條件下(如固定式陣列的岸基系統)的聲源定位。對于缺乏實驗數據的場景,文獻[31-33]利用環境參數生成的仿真聲場作為模型的訓練數據,結果表明深度學習算法的定位性能優于傳統的匹配場處理定位算法。在文獻[31-32]中,由于環境參數的先驗信息較為準確,因此仿真聲場數據集的規模不大。而文獻[33]的應用場景是不確知海底參數情況下的聲源定位。為降低海底參數的不確定性,訓練數據采用基于多種假定海洋環境參數生成的仿真聲場,訓練數據樣本數超過上千萬個,對應的深度學習模型也更加復雜,采用了50層的深度殘差網絡,可適用于多種不同海底環境參數下的聲源被動定位。由表1也可以看出,水聲被動定位中用到的機器學習模型逐漸向大數據集、深度學習模型演進。究其原因,主要是在推向實際應用中,針對實測數據集有限和環境不確定性的應對策略。
表1 部分海試實驗機器學習定位方法總結
Tab.1 Summary of machine learning methods in sea experimental data processing
4?現有模型存在的問題及解決思路
從近期公開發表的相關文獻來看,基于機器學習的水聲被動定位方法具有較好的應用前景和潛力。但同時,這類方法作為水聲學領域中一種新興的技術,尚處于起步階段,在推向實際應用時還面臨著多個問題和挑戰。具體來說有以下幾點:
(1)不確知海洋環境下的聲源被動定位。對于實際應用,海洋環境是時變和空變的,海底參數的準確獲取也具有相當大的難度。在不確知海洋環境條件下,如何訓練機器學習模型成為關鍵。一種思路是收集不同水文、不同海底參數條件下的實測數據,將實測數據作為訓練數據,對機器學習模型進行訓練。但難點在于不同環境條件下、不同聲源位置的實測數據獲取難度較大。另外一種思路是利用仿真聲場數據作為訓練數據,這種方法的好處是可以低成本地獲取足夠多環境條件下的訓練數據樣本,不足之處是訓練數據的質量依賴于聲場建模的準確度,如目前復雜的二維或三維海洋聲場的準確建模仍然具有挑戰性。
(2)低信噪比條件下的聲源被動定位。目前的研究都集中在較高信噪比條件下的定位,現有模型在低信噪比條件下定位性能會急劇下降。相應的解決思路是利用傳統的陣列信號處理方法(如波束形成或空域濾波等)提高信噪比[33],或者通過將帶噪聲的數據作為訓練數據,也可能提高機器學習模型在低信噪比條件下的定位穩健性。
(3)多聲源同時定位。在實際應用中,存在多聲源同時存在(或在同一方向上)的可能性。現有的機器學習模型目前考慮僅有一個聲源存在,如何建立針對多聲源情況的機器學習模型,也是水聲被動定位中亟待解決的問題。
5?結論
本文對目前基于機器學習的水聲被動定位方法進行了綜述和回顧,介紹了前端信號預處理算法、幾種典型的機器學習模型、評價準則,并對部分海試試驗結果進行了概述。作者還簡要討論了基于機器學習的水聲被動定位與經典的匹配場處理方法之間的區別。同時針對目前機器學習方法存在的問題,給出了相應的解決思路。基于機器學習的水聲被動定位具有很好的發展潛力和工程化應用前景,該研究方向開始逐漸引起國際水聲學界的興趣,正處于快速發展時期。以作者的觀點看,針對第4節所述的難點,未來的幾個潛在的研究方向為:大數據和深度學習模型相結合的定位方法;低信噪比條件下的機器學習定位方法;適用于多聲源定位的機器學習模型和方法。
審核編輯:符乾江
評論
查看更多