“優(yōu)化”是生活中經(jīng)常使用的詞:開車時希望能在安全的前提下以最短時間到達目的地;雙11做功課考慮各種優(yōu)惠活動,希望獲得最大優(yōu)惠;超市進貨時需要考慮動銷存,最大化提高物品周轉(zhuǎn)效率。 這些問題都是“最優(yōu)化問題”,也是數(shù)學(xué)建模中的典型問題,是各大數(shù)學(xué)建模比賽里的常客。 優(yōu)化題型有三要素:決策變量、目標(biāo)函數(shù)、約束條件。 (1)決策變量:是決策者可以控制的因素,例如根據(jù)不同的實際問題,決策變量可以選為產(chǎn)品的產(chǎn)量、物資的運量及工作的天數(shù)等。 (2) 目標(biāo)函數(shù):是以函數(shù)形式來表示決策者追求的目標(biāo)。例如目標(biāo)可以是利潤最大或成本最小等。 (3) 約束條件:是決策變量需要滿足的限定條件。 歷年國賽優(yōu)化問題: 優(yōu)化問題的出發(fā)點是系統(tǒng)思維,其基本思路是在一定的約束條件下,保證各方面資源的合理分配, 最大限度地提升系統(tǒng)某一性能或系統(tǒng)整體性能,最終實現(xiàn)最理想結(jié)果。對于這類問題,想要建立并求解數(shù)學(xué)模型,可以參考以下思路: (1)明確目標(biāo),分析問題背景,確定約束條件,搜集全面的客觀數(shù)據(jù)和信息。 (2)建立數(shù)學(xué)模型,構(gòu)建變量之間的數(shù)學(xué)關(guān)系,設(shè)立目標(biāo)函數(shù)。 (3)分析數(shù)學(xué)模型,綜合選擇最適合該模型的優(yōu)化方法。 (4)求解模型,通常借助計算機和數(shù)學(xué)分析軟件完成。 (5)對最優(yōu)解進行檢驗和實施。 PS.北太天元內(nèi)已有優(yōu)化工具箱optimization,可以調(diào)用工具箱解決優(yōu)化類問題。 下面給大家分享幾種數(shù)學(xué)建模中常用優(yōu)化算法: 1、線性規(guī)劃 在人們的生產(chǎn)實踐中,經(jīng)常會遇到如何利用現(xiàn)有資源來安排生產(chǎn),以取得最大經(jīng)濟效益的問題。此類問題構(gòu)成了運籌學(xué)的一個重要分支—數(shù)學(xué)規(guī)劃,而線性規(guī)劃(Linear Programming 簡記 LP)則是數(shù)學(xué)規(guī)劃的一個重要分支。 1.1 用北太天元求解線性規(guī)劃問題 北太天元內(nèi)已有優(yōu)化工具箱optimization,其中的linprog等相關(guān)函數(shù)可用于求解線性規(guī)劃問題。 1.2 線性規(guī)劃特點 優(yōu)點: (1)作為經(jīng)營管理決策中的數(shù)學(xué)手段,在現(xiàn)代決策中的應(yīng)用非常廣泛。 (2)有統(tǒng)一算法,任何線性規(guī)劃問題都能求解,解決多變量最優(yōu)決策的方法。 (3)訓(xùn)練速度快。 (4)預(yù)測速度快,可以推廣到非常大的數(shù)據(jù)集,對稀疏數(shù)據(jù)也很有效。 缺點: (1)對于數(shù)據(jù)的準(zhǔn)確性要求高,只能對線性的問題進行規(guī)劃約束,而且計算量大。 1.3 相關(guān)問題 運輸問題(產(chǎn)銷平衡)、指派問題(匈牙利算法)、對偶理論與靈敏度分析、投資的收益和風(fēng)險。 2、整數(shù)規(guī)劃 規(guī)劃中的變量(部分或全部)限制為整數(shù)時,稱為整數(shù)規(guī)劃。若在線性規(guī)劃模型中,變量限制為整數(shù),則稱為整數(shù)線性規(guī)劃。目前所流行的求解整數(shù)規(guī)劃的方法,往往只適用于整數(shù)線性規(guī)劃。目前還沒有一種方法能有效地求解一切整數(shù)規(guī)劃。 2.1 用北太天元求解線性混合整數(shù)規(guī)劃問題 可在北太天元內(nèi)調(diào)用優(yōu)化工具箱optimization,使用intlinprog等相關(guān)函數(shù)求解線性混合整數(shù)規(guī)劃問題。 2.2 整數(shù)規(guī)劃的分類 如不加特殊說明,一般指整數(shù)線性規(guī)劃。對于整數(shù)線性規(guī)劃模型大致可分為兩類: (1)變量全限制為整數(shù)時,稱純(完全)整數(shù)規(guī)劃。 (2)變量部分限制為整數(shù)的,稱混合整數(shù)規(guī)劃。 2.3 整數(shù)規(guī)劃特點 原線性規(guī)劃有最優(yōu)解,當(dāng)自變量限制為整數(shù)后,其整數(shù)規(guī)劃解出現(xiàn)下述情況: (1)原線性規(guī)劃最優(yōu)解全是整數(shù),則整數(shù)規(guī)劃最優(yōu)解與線性規(guī)劃最優(yōu)解一致。 (2)整數(shù)規(guī)劃無可行解。 (3)有可行解(當(dāng)然就存在最優(yōu)解),但最優(yōu)解值變差。 整數(shù)規(guī)劃最優(yōu)解不能按照實數(shù)最優(yōu)解簡單取整而獲得。 2.4 求解方法分類 (1)分枝定界法—可求純或混合整數(shù)線性規(guī)劃。 (2)割平面法—可求純或混合整數(shù)線性規(guī)劃。 (3)隱枚舉法—求解“0-1”整數(shù)規(guī)劃:過濾隱枚舉法;分枝隱枚舉法。 (4)匈牙利法—解決指派問題(“0-1”規(guī)劃特殊情形)。 (5)蒙特卡洛法—求解各種類型規(guī)劃。 3、非線性規(guī)劃 如果目標(biāo)函數(shù)或約束條件中包含非線性函數(shù),就稱這種規(guī)劃問題為非線性規(guī)劃問題。一般說來,解非線性規(guī)劃要比解線性規(guī)劃問題困難得多。而且,也不象線性規(guī)劃有單純形法這一通用方法,非線性規(guī)劃目前還沒有適于各種問題的一般算法,各個方法都有自己特定的適用范圍。 3.1 線性規(guī)劃與非線性規(guī)劃的區(qū)別 如果線性規(guī)劃的最優(yōu)解存在,其最優(yōu)解只能在其可行域的邊界上達到(特別是可行域的頂點上達到);而非線性規(guī)劃的最優(yōu)解(如果最優(yōu)解存在)則可能在其可行域的任意一點達到。 3.2 相關(guān)問題 無約束問題(一維搜索方法、二次插值法、無約束極值問題的解法)、約束極值問題(二次規(guī)劃、罰函數(shù)法)、飛行管理問題 4、動態(tài)規(guī)劃 動態(tài)規(guī)劃(dynamic programming)是運籌學(xué)的一個分支,是求解決策過程(decisionprocess)最優(yōu)化的數(shù)學(xué)方法。例如最短路線、庫存管理、資源分配、設(shè)備更新、排序、裝載等問題,用動態(tài)規(guī)劃方法比用其它方法求解更為方便。 雖然動態(tài)規(guī)劃主要用于求解以時間劃分階段的動態(tài)過程的優(yōu)化問題,但是一些與時間無關(guān)的靜態(tài)規(guī)劃(如線性規(guī)劃、非線性規(guī)劃),只要人為地引進時間因素,把它視為多階段決策過程,也可以用動態(tài)規(guī)劃方法方便地求解。應(yīng)指出,動態(tài)規(guī)劃是求解某類問題的一種方法,是考察問題的一種途徑,而不是一種特殊算法(如線性規(guī)劃是一種算法)。因而,它不象線性規(guī)劃那樣有一個標(biāo)準(zhǔn)的數(shù)學(xué)表達式和明確定義的一組規(guī)則,而必須對具體問題進行具體分析處理。因此,在學(xué)習(xí)時,除了要對基本概念和方法正確理解外,應(yīng)以豐富的想象力去建立模型,用創(chuàng)造性的技巧去求解。 5、多目標(biāo)規(guī)劃 多目標(biāo)規(guī)劃已經(jīng)應(yīng)用到科學(xué)的許多領(lǐng)域,包括工程、經(jīng)濟和物流,在兩個或更多沖突的目標(biāo)之間存在取舍時,需要采取最優(yōu)決策。 解決多目標(biāo)規(guī)劃問題的方法: (1)將多目標(biāo)化為單目標(biāo) (給多個目標(biāo)賦予權(quán)重) (2)保持多目標(biāo)不變,根據(jù)自己的偏好選擇解 實際問題中,目標(biāo)函數(shù)相互沖突是很常見的,例如購買汽車時,要求花費少且舒適度高或者要求性能好油耗低,這種問題并沒有絕對最優(yōu)解(因為并沒有確定多個目標(biāo)的權(quán)值),但是我們可以根據(jù)自己的需要選擇一個相對好的(達到我們想要的最佳平衡)。為了尋求這種“最佳平衡”,可以采用算法帕累托最優(yōu)(Pareto optimal)。 以上部分內(nèi)容引用公眾號“科研交流”,希望對大家有幫助,覺得有用就點個贊吧。小助手會不定期更新數(shù)學(xué)建模干貨,可以多多關(guān)注喲。
線性調(diào)頻信號是一種頻譜擴展調(diào)制技術(shù),在雷達等領(lǐng)域具有廣泛應(yīng)用,信號頻率是一個關(guān)于時間t的線性函數(shù)。線性調(diào)頻信號時域表達式如下:其中,T為采樣周期,K為線性調(diào)頻率,K=B/T,B為信號帶寬。基于北太天元仿真線性調(diào)頻信號如下:北太天元代碼如下:
clear clc close all clf tao=1e-5;%脈沖寬度 B=20e6;%帶寬20MHz fs=2*B;%采樣頻率 Ts=1/fs; K=B/tao;%調(diào)頻斜率 N=floor(tao/Ts); % 線性調(diào)頻信號 t=linspace(-tao/2,tao/2,N); st=exp(j*pi*K*t.*t);%線性調(diào)頻信號 figure(1)sst = real(st); plot(t*1e5,sst); title('線性調(diào)頻信號時域?qū)嵅?#39;); f=linspace(-fs/2,fs/2,N); load_plugin("fft") sf=abs(fft(st));%線性調(diào)頻信號頻域信號 figure(2) ssf = [sf(N/2+1:end),sf(1:N/2)]; plot(f*1e5,ssf); title('線性調(diào)頻信號頻譜幅值'); figure(3) plot(angle(st)) title('線性調(diào)頻信號相位');
17.1 原理 完整思想請看我前面寫的路徑規(guī)劃(十三)基于搜索的路徑規(guī)劃算法-前言,,和其他的基于搜索的路徑規(guī)劃算法的區(qū)別僅在于啟發(fā)式函數(shù)的不同. 雙向A*則稍微復(fù)雜些,但可以簡單理解為起始節(jié)點和終點同時將對方視為目標(biāo)節(jié)點,并按照A*的啟發(fā)式函數(shù),相向生長,當(dāng)兩者相遇時,則停止迭代,并分別往回追溯自己的父節(jié)點即可得到路徑。17.2 程序示例
16.1 原理 完整思想請看我前面寫的路徑規(guī)劃(十三)基于搜索的路徑規(guī)劃算法-前言,,和其他的基于搜索的路徑規(guī)劃算法的區(qū)別僅在于啟發(fā)式函數(shù)的不同 A*則是結(jié)合了Best-first Searching和Dijkstra,它將當(dāng)前節(jié)點到初始節(jié)點和到目標(biāo)節(jié)點的距離之和作為啟發(fā)式函數(shù)。16.2 程序示例16.3 參考A Formal Basis for the heuristic Determination of Minimum Cost Paths
15.1 原理完整思想請看我前面寫的路徑規(guī)劃(十三)基于搜索的路徑規(guī)劃算法-前言,和其他的基于搜索的路徑規(guī)劃算法的區(qū)別僅在于啟發(fā)式函數(shù)的不同Dijkstra則和Best-first-searching相反,它不是將到目標(biāo)節(jié)點的距離作為啟發(fā)式函數(shù),而是將到起始節(jié)點的距離作為啟發(fā)式函數(shù)。15.2 程序示例
14.1 原理這里的Best-first-searching和數(shù)據(jù)結(jié)構(gòu)里學(xué)的圖搜索算法BFS(廣度優(yōu)先搜索)不是一個東西。完整思想請看我前面寫的路徑規(guī)劃(十三)基于搜索的路徑規(guī)劃算法-前言下面說說Best-first-searching的核心思想:Best-first Searching的啟發(fā)式函數(shù)f(x)=dist(x,x_goal),即Best-first Searching每一步都在預(yù)選集合中尋找距離目標(biāo)節(jié)點最近的的那個節(jié)點。這里的dist(x,y),如果節(jié)點x,y無法通過碰撞檢測,則為inf,如果能通過碰撞檢測,可以直接用歐幾里得距離代替。14.2 程序示例14.3 參考https://blog.csdn.net/potato_uncle/article/details/109124362?ops_request_misc=&request_id=&biz_id=102&utm_term=best%20first%20search&utm_medium=distribute.pc_search_result.none-task-blog-2~all~sobaiduweb~default-1-109124362.nonecase&spm=1018.2226.3001.4187
基于搜索的路徑規(guī)劃算法基本都是一個套路,它們都是根據(jù)啟發(fā)函數(shù)重備用節(jié)點的集合中來尋找下一個節(jié)點,不同的啟發(fā)函數(shù)也就有不同的搜索類算法。搜索類算法是離散化的算法,體現(xiàn)在整個圖的區(qū)域是由有限個小方塊區(qū)域組成的。我們暫且把這些小方塊區(qū)域稱為“節(jié)點”。因此,整個區(qū)域被有限個節(jié)點填充,且每個節(jié)點的鄰居節(jié)點為有限個。設(shè)置兩個集合OPEN,CLOSE,OPEN初始狀態(tài)設(shè)為{x_init},CLOSE 初始狀態(tài)設(shè)為空集。依據(jù)不同的啟發(fā)式函數(shù),從open集中選擇一個點加入到close集中,然后拓展open集,如上圖,右下角的某個點被某種啟發(fā)式函數(shù)選中,加入到close集中,并相繼拓展open集下面介紹下搜索類算法的前進過程:當(dāng)上述偽碼退出循環(huán)后,沿著x_goal的父節(jié)點往前回溯極為路徑各搜索類算法的區(qū)別在于第三行啟發(fā)函數(shù)的類型的不同,導(dǎo)致連接的節(jié)點不同。
幾種RRT對比如下:幾種RRT對比視圖mp4 RRT及其變種都是依托于采樣+在樹結(jié)構(gòu)上加減枝的形式進行路徑規(guī)劃的,具有全局收斂特性,但是效率穩(wěn)定性不高。不過可以針對性地對其主要函數(shù)進行優(yōu)化進行效率的改進:優(yōu)化采樣,優(yōu)化樹結(jié)構(gòu)等。一種加速RRT的思路就是,從起始點和目標(biāo)節(jié)點同時生長RRT樹,這就是connected_RRT。此外,針對變化的環(huán)境,還有extend_RRT和Dynamic_RRT。 RRT*是一種趨近于最優(yōu)路徑的方案,它通過重布線來實現(xiàn)這一目的,它在理論上能達到最優(yōu)解,但它全局隨機撒點的特性導(dǎo)致它在遠(yuǎn)離目標(biāo)路徑的地方做了過多的生長。 為了集中優(yōu)化資源,RRT*-smart應(yīng)運而生,它比較在乎路徑和障礙物的拐點的附近的優(yōu)化,它通過路徑優(yōu)化步驟判斷出路徑和障礙物的拐點,并在拐點的鄰域內(nèi)投入更多的資源(即撒更多的點),以實現(xiàn)集中優(yōu)化資源。 但RRT*-smart依然浪費了太多的隨機點在遠(yuǎn)離目標(biāo)路徑的區(qū)域,那什么才叫不遠(yuǎn)離目標(biāo)路徑的區(qū)域呢?informed RRT*則解決了這一問題,它利用初始路徑的長度,起始點和目標(biāo)點,畫出了一個橢圓,informed RRT*認(rèn)為,這個橢圓區(qū)域就是不遠(yuǎn)離目標(biāo)路徑的區(qū)域,生成這個橢圓后,后續(xù)的隨機撒點只灑在這個橢圓區(qū)域內(nèi),當(dāng)更優(yōu)的路徑被發(fā)現(xiàn),則根據(jù)這個新路徑的長度,縮小橢圓,進一步在有效區(qū)域集中撒點資源,以實現(xiàn)加速。 然而,RRT*類的算法是總會面臨一個問題,那就是重布線,這個令RRT*能夠逼近最優(yōu)解的創(chuàng)新恰恰成為了它慢的原因。 于是,另一種思路被提出,那就是提前給定隨機點,然后通過啟發(fā)式函數(shù)來連接這些點以生長路徑,這就是FMT*,F(xiàn)MT*專門針對解決高維構(gòu)型空間中的復(fù)雜運動規(guī)劃問題,在預(yù)先確定的采樣點數(shù)量上執(zhí)行前向動態(tài)規(guī)劃遞歸,并相應(yīng)地通過在代價到達空間中穩(wěn)步向外移動生成路徑樹。FMT*能很快的找到一條路徑,但是當(dāng)我們想對這條路徑進行優(yōu)化時,只有通過加密隨機采樣點的方式,然而,F(xiàn)MT*是一種單批算法,面對新的采樣點分布時,它只能重新開始計算。 為了融合informed RRT*在有效區(qū)域集中隨機點的特點和FMT*快速生長的特點,就誕生了BIT*。它能夠在橢圓區(qū)域內(nèi)分批撒點,實現(xiàn)快速生長的同時,還能自我優(yōu)化。參考https://www.youtube.com/watch?v=TQIoCC48gp4
11.1 原理 簡單來說,BIT*是結(jié)合了Informed RRT*和FMT*的優(yōu)點的一種算法。回顧一下,Informed RRT*是對RRT*的一種優(yōu)化,在RRT*生成一個初始路徑后,則以初始路徑的長度,起始點和目標(biāo)點為焦點,畫一個橢圓,Informed RRT*在后續(xù)隨機采點時,只取落在這個橢圓內(nèi)的點,一次采一個點,重復(fù)lm次。FMT*則與RRT那一套不同,它不是邊采點,邊生長樹,而是一次性提前在整個區(qū)域(不包含障礙物區(qū)域)內(nèi)采lm個點,只重復(fù)一次。 下面我們來說說,Informed RRT*和優(yōu)缺點FMT*,然后就知道為什么要引出BIT*了。 先說FMT*,F(xiàn)MT*的優(yōu)點是從起始位置開始構(gòu)建,沒有重布線過程,因此節(jié)約時間,適用于復(fù)雜的障礙物環(huán)境。但是FMT*的缺點是,它只有1批,F(xiàn)MT*路徑的精度完全取決于當(dāng)前批撒點的密度,當(dāng)你想要提升精度時,只能重新開始一批,重新更密集的撒點,然后重新開始規(guī)劃。 再說Informed RRT*,Informed RRT*的優(yōu)點恰好彌補了FMT*的缺點,想要提升精度,只需撒更多的點就好了,而Informed RRT*的撒點過程時一直在進行的,它一批只撒一個點,重復(fù)很多批,開始新的批的時候之前的信息不會被拋棄,只要Informed RRT*一直撒點,就可以達到任意精度。但是Informed RRT*的缺點也顯而易見,它需要重布線,計算效率低。 所以自然就想到,能不能利用FMT*的優(yōu)點,提前撒好點,不用重布線,提升計算效率,又能多批進行,以不斷提升精度?當(dāng)然能,這就是BIT*算法 BIT*的過程總結(jié)為下圖:11.2 偽碼11.3 參考1、Batch Informed Trees (BIT*): Informed Asymptotically Optimal Anytime Search2、Batch Informed Trees (BIT*): Sampling-based Optimal Planning via the Heuristically Guided Search of Implicit Random Geometric Graphs
10.1 原理 在RRT中,當(dāng)初始路徑已經(jīng)生成之后,如果重點在初始路徑周圍進行采樣的話,可以明顯提高路徑優(yōu)化效率。Informed RRT就是進一步優(yōu)化了采樣函數(shù),采樣的方式是以起點和終點為焦點構(gòu)建橢圓形采樣區(qū)域。 回顧一下RRT*-smart,因為在某區(qū)域撒點越多,該區(qū)域的優(yōu)化效果越好,而單純的RRT*是在全域內(nèi)隨機撒點,優(yōu)化效果沒有得以集中,RRT*-smart認(rèn)為經(jīng)過路徑優(yōu)化后的路徑的拐點在障礙物的附近,它認(rèn)為這個拐點的附近需要著重優(yōu)化,所以RRT*-smart在進一步撒點的過程中,將一些隨機點偏袒的撒在這個拐點的附近鄰域。 這里的informed RRT*也是這樣認(rèn)為,它認(rèn)為單純的RRT*在整個區(qū)域內(nèi)隨機撒點,優(yōu)化效果太過分散,如果我能知道我最終優(yōu)化的路徑在哪一塊區(qū)域,那我就只在這一區(qū)域內(nèi)撒點不就好了嗎?informed RRT*就是這樣做的。注意: informed RRT*是在RRT*算法給出一條初始路徑后,對這個初始路徑繼續(xù)優(yōu)化的步驟才起作用的,它對于這個初始路徑的生成沒有幫助。10.2 思路 根據(jù)高中數(shù)學(xué)知識可以知道,在橢圓上的點到橢圓兩焦點的距離之和相同,橢圓外的點的距離到兩焦點的距離之和大于橢圓上的點到兩焦點的距離之和,橢圓內(nèi)的點反之。 回顧一下RRT*的搜索圖,根據(jù)上面這個知識點可以發(fā)現(xiàn),其實RRT在已經(jīng)得到一條可行路徑之后,可以將采樣空間收縮到一個橢圓形區(qū)域中,區(qū)域之外的點對于縮短規(guī)劃出的路徑長度并沒有實際價值。 informed RRT就是的主要思想就是上面這種思想,在獲取可行路徑之后,將采樣空間限制在一個橢圓形區(qū)域中,并且隨著路徑長度的不斷縮短,逐漸縮小該橢圓形區(qū)域。這個思想其實在以前就有,但是提出informed RRT的論文中提出了對這個橢圓形區(qū)域直接采樣的方法。 可能有人會直接想,這里只不過是縮小了采樣空間,并不會明顯改進算法。但是實際上,當(dāng)拓展到高維空間時,效率的提升是巨大的。那么,如何表達這個橢圓呢?下面介紹橢圓采樣區(qū)域的表達方式方法1:先在標(biāo)準(zhǔn)橢圓的方程中采樣,再將采樣點旋轉(zhuǎn)平移到實際采樣區(qū)域,需要兩個矩陣:平移向量、旋轉(zhuǎn)矩陣。這兩個參數(shù)只需要在初始化時計算即可轉(zhuǎn)換后的坐標(biāo)為:方法2:利用超橢圓體然后在二維平面映射這里放一段.m文件取橢圓隨機點的代碼(思路如方法2):除了采樣過程外,Informed RRT*的流程和RRT*是一樣的。10.3 偽碼偽代碼中是在RRT的偽代碼基礎(chǔ)上改的,標(biāo)紅的地方是informed RRT 更改的地方??梢钥闯?,其實主體框架上面并沒有太多更改,實際上也是,主要的更改都在第七行,也就是采樣這一步。這是采樣這一步的偽代碼。informed RRT將目前已經(jīng)搜索到的最短路徑作為cbest,起點和終點之間的距離作為cmin,以此構(gòu)建橢圓。當(dāng)還沒有規(guī)劃結(jié)果時,cbest為inf,也就是和經(jīng)典RRT沒有區(qū)別。10.4 程序示例程序在尋找初始路徑的過程和普通RRT*一樣,在全局域中隨機撒點,迭代到1282次時首次找到初始路徑,然后我們以起始點和目標(biāo)點為焦點,初始路徑的長度為點到兩焦點的距離之和,畫出一個橢圓:我們隨后的隨機點的選取范圍不再是全局域了,新采的樣本點被限制在這個橢圓中,下圖中的圓圈代表迭代1283-2509次的隨機點的分布,可見,新的隨機點全部被限制在橢圓中:當(dāng)?shù)?510次時,新的總長度更短的路徑被找到,,隨后,我們以起始點和目標(biāo)點為焦點,以這個新的路徑的長度為到兩焦點的距離,畫出一個比之前更小的橢圓:同樣的,迭代次數(shù)為2510-2865次的循環(huán)中的新的隨機點被限制在這個新的更小的橢圓中,使隨機點資源進一步集中:當(dāng)?shù)?866次時,找到一個路徑更短的路徑:10.5 參考Informed RRT*: Optimal Sampling-based Path Planning Focused via Direct Sampling of an Admissible Ellipsoidal Heuristic
9.1 原理 FMT*算法專門針對解決高維構(gòu)型空間中的復(fù)雜運動規(guī)劃問題,它是為高密度障礙物的環(huán)境構(gòu)建的算法。該算法被證明是漸近最優(yōu)的,并且比同類型算法(RRT*)更快收斂到最優(yōu)解。FMT*算法在預(yù)先確定的概率繪制的樣本數(shù)量上執(zhí)行“惰性”動態(tài)規(guī)劃遞歸,以生長路徑樹,該路徑樹在成本到達空間中穩(wěn)定地向外移動。 FMT*的最終產(chǎn)物是一棵樹,它在連續(xù)空間中獲取一批樣本,然后它能在圖中使用惰性的動態(tài)編程搜索該樣本集合,并以此找到路徑,這也是一個漸進最優(yōu)的解決方案,F(xiàn)MT*相比于RRT*的加速效果優(yōu)勢在高維和碰撞檢查很昂貴的情況下尤其突出。很棒的一點是,F(xiàn)MT*是從起始位置開始構(gòu)建,而不是像RRT*是在空間的任意位置采點,因為這可能會得到非常遠(yuǎn)的點或非常近的點,這有什么好處呢?這意味著你不必在樹中回溯以進行重布線,因為這在計算上效率低下。FMT*比RRT*更好,因為它創(chuàng)建的連接接近最佳,沒有重布線。 FMT*算法在預(yù)先確定的采樣點數(shù)量上執(zhí)行前向動態(tài)規(guī)劃遞歸,并相應(yīng)地通過在代價到達空間中穩(wěn)步向外移動生成路徑樹。FMT*執(zhí)行動態(tài)規(guī)劃遞歸,其特點有三個關(guān)鍵特征:·它是為磁盤連接圖量身定制的,其中兩個樣本的距離低于給定的界限(稱為連接半徑)則這兩個樣本被認(rèn)為是鄰居,因此是可連接的?!に瑫r執(zhí)行圖構(gòu)造和圖搜索?!榱嗽u估動態(tài)規(guī)劃遞歸中的即時成本,算法“懶惰地”忽略了障礙物的存在,每當(dāng)與新樣本的局部最優(yōu)(假設(shè)沒有障礙物)連接與障礙物相交時,該樣本就會簡單地跳過并留待以后,而不是在鄰域中尋找其他連接。注意:FMT*的樣本點是提前生成好的,然后把這些點固定,再利用這些固定好的點來生成行進樹,注意區(qū)別于RRT*那一套,RRT*是生成隨機點的同時,生成行進樹。9.2 算法思路上圖(a)是RRT*添加新節(jié)點的某一步,上圖(b)(c)是FMT*添加新節(jié)點的某一步。 先看RRT*,節(jié)點9是新考慮的節(jié)點,它在第一次重布線時,需要從它的所有鄰居節(jié)點中找出一個父節(jié)點,使得節(jié)點9到達起始節(jié)點的cost最小,因此節(jié)點9需要計算它到4、5、6、8號節(jié)點的距離并同時進行碰撞檢測,因此,第一次重布線過程就要求待加入的節(jié)點對它的所有鄰居節(jié)點進行一次碰撞檢測,第二次重布線過程也需要計算距離和碰撞檢測,但這在第一次重布線過程中做過了,可以記錄先來直接利用,因此第二次重布線過程碰撞檢測這一步可以不用重復(fù)進行,因此,總的來說,RRT*每新加入一個節(jié)點,該節(jié)點需要對它的所有鄰居節(jié)點進行一次碰撞檢測。 再看FMT*,上圖(b)(c)中的x就是新考慮的節(jié)點,在圖(b)中,x需計算它到集合V_open中所有的鄰居節(jié)點的cost,但不需要進行碰撞檢測,從中選擇一個能使它到達初始節(jié)點總cost最小的節(jié)點作為它的父節(jié)點,然后,對它和這個父節(jié)點的連線進行碰撞檢測,如果能通過碰撞檢測,則加入x,若不能,則下一個x,因此,總的來說,F(xiàn)MT*每新加入一個節(jié)點,永遠(yuǎn)只需要進行一次碰撞檢測。FMT*比RRT*每新加入一個節(jié)點需要進行的碰撞檢測次數(shù)少得多,而且FMT*也是漸進最優(yōu)的,這就是FMT*相比于RRT*的優(yōu)勢所在。9.3 偽碼9.4 程序示例下圖中的 圓圈代表提前采好的隨機點9.5 參考Fast Marching Tree: a Fast Marching Sampling-Based Method for Optimal Motion Planning in Many Dimensions?
8.1 原理 最初,RRT*-Smart 像 RRT* 一樣隨機搜索狀態(tài)空間。類似地,找到第一條路徑就像 RRT* 會嘗試通過配置空間中的隨機采樣來找到路徑一樣。一旦找到第一條路徑,它就會通過互連直接可見的節(jié)點來優(yōu)化它。此優(yōu)化路徑產(chǎn)生用于智能采樣的偏置點。在這些偏置點,采樣以規(guī)則的間隔進行 隨著算法的進展和路徑的不斷優(yōu)化,此過程將繼續(xù)進行。每當(dāng)找到更短的路徑時,偏差就會轉(zhuǎn)向新路徑。 RRT*是一邊生長一邊優(yōu)化的,RRT*的重心在于找到最優(yōu)路徑。RRT*樹生長到能連接起點和終點后,這就已經(jīng)有一條初始路徑了。 這顆RRT*樹可以繼續(xù)生長,越生長可以得到的路徑相比初始路徑會越優(yōu)。然而,這個繼續(xù)生長的過程對于RRT*而言效率非常低,由此衍生出RRT*-smart算法,專門解決這一問題。 注意到,RRT*-smart是在RRT*算法已生成初始路徑后,在此基礎(chǔ)上,想對初始路徑繼續(xù)優(yōu)化的步驟才起作用,所以RRT*-smart對于生成初始路徑并沒有加速幫助。 RRT*-smart的優(yōu)勢在于:它專注于提升路徑接近障礙物拐點處的優(yōu)化速度。RRT*-smart算法的思路是這樣的:在原始RRT*算法的基礎(chǔ)上加了兩步:①路徑優(yōu)化路徑優(yōu)化的本質(zhì)是利用三角形兩邊之和大于第三邊 假設(shè)RRT*生成的初始路徑長這樣 具體操作如下: 一旦RRT*給出了一條初始路徑,將初始路徑中彼此可見的節(jié)點直接相連。迭代過程從xgoal開始,向xinit檢查與每個節(jié)點的連續(xù)父節(jié)點的直接連接,直到無沖突條件失敗。下圖給出一個示例。 信標(biāo)(Z_beacons):經(jīng)過路徑優(yōu)化后的路徑中除了起點和終點之外的節(jié)點,標(biāo)記為信標(biāo)(Z_beacons),如上圖中的綠點。②智能采樣在RRT*算法中,在生成初始路徑后,在此RRT*樹的基礎(chǔ)上繼續(xù)采點,采點越多,路徑優(yōu)化效果越好,但此采點,是完全隨機的采點,因此效率低下,RRT*-smart則不是完全隨機的采點。在RRT*-smart算法中,利用了這樣一種思想:智能采樣背后的想法是通過生成盡可能靠近障礙物頂點的節(jié)點來接近最優(yōu)性。在基于采樣的RRT*-smart中,路徑僅沿著靠近障礙物拐點的外圍進行優(yōu)化,解決的辦法就是:在障礙物拐點的外圍多多采點。如下圖所示: 問:那么RRT*-smart如何實現(xiàn)在障礙物拐點的外圍多多采點呢?答:利用①路徑優(yōu)化過程中給出的信標(biāo)(Z_beacons)。一旦找到初始路徑,智能采樣就會開始,在以Z beacons為中心的半徑為R beacons的球中直接生成一定數(shù)量的樣本。采樣偏向于這些信標(biāo),因為它們提供了有關(guān)障礙物頂點(或圓形障礙物的外圍)位置的有用線索。因此,這些信標(biāo)需要被最大節(jié)點包圍,以優(yōu)化這些轉(zhuǎn)彎處的路徑。與 RRT* 相比,這一特征迫使所提出的算法以更少的迭代次數(shù)達到最優(yōu)解。注意:信標(biāo)(Z_beacons)是需要隨著優(yōu)化路徑的更新而更新的。即當(dāng)z_goal.cost變小時,說明路徑得到了優(yōu)化,那么就要啟用之前①路徑優(yōu)化算法來重新確定新的z_beacons。 8.2 偽碼 8.3 程序示例下圖中的線段代表由RRT*生成的初始RRT樹,圓圈代表在初始RRT樹基礎(chǔ)上,繼續(xù)采點的分布,可見在幾個“拐點處”的圓形領(lǐng)域內(nèi)我們有額外的采點以加強在這部分的采點 路徑優(yōu)化后確定出拐點 經(jīng)過路徑優(yōu)化后的路徑: 8.4 參考1、RRT*-SMART: A Rapid Convergence Implementation of RRT*2、Rapid convergence implementation of RRT* towards optimal solution
7.1 原理 RRT*是一種基于采樣的最優(yōu)化路徑規(guī)劃方式,與RRT的區(qū)別是,RRT盡量使新節(jié)點以及其周圍的節(jié)點到起點的cost(可以是路徑或者時間等目標(biāo)函數(shù))最短,而不是僅僅尋找離它近的節(jié)點,而且在找到路徑后不會停止,而是繼續(xù)進行采樣來優(yōu)化得到的路徑。 盡管RRT算法是一個相對高效率,同時可以較好的處理帶有非完整約束的路徑規(guī)劃問題的算法,并且在很多方面有很大的優(yōu)勢,但是RRT算法并不能保證所得出的可行路徑是相對優(yōu)化的。因此許多關(guān)于RRT算法的改進也致力于解決路徑優(yōu)化的問題,RRT*算法就是其中一個。RRT*算法的主要特征是能快速的找出初始路徑,之后隨著采樣點的增加,不斷地進行優(yōu)化直到找到目標(biāo)點或者達到設(shè)定的最大循環(huán)次數(shù)。RRT*算法是漸進優(yōu)化的,也就是隨著迭代次數(shù)的增加,得出的路徑是越來越優(yōu)化的,而且永遠(yuǎn)不可能在有限的時間中得出最優(yōu)的路徑。因此換句話說,要想得出相對滿意的優(yōu)化路徑,是需要一定的運算時間的。所以RRT*算法的收斂時間是一個比較突出的研究問題。但不可否認(rèn)的是,RRT*算法計算出的路徑的代價相比RRT來說減小了不少。RRT*算法與RRT算法的區(qū)別主要在于兩個針對新節(jié)點 xnew 的重計算過程,分別為:·重新為 xnew 選擇父節(jié)點的過程·重布線隨機樹的過程7.1.1 重新選擇父節(jié)點過程 在新產(chǎn)生的節(jié)點 xnew 附近以定義的半徑范圍內(nèi)尋找“近鄰”,作為替換 xnew 父節(jié)點的備選。依次計算“近鄰”節(jié)點到起點的路徑代價加上 xnew 到每個“近鄰”的路徑代價,具體過程見上圖。 圖(a)中表現(xiàn)的是隨機樹擴展過程中的一個時刻,節(jié)點標(biāo)號表示產(chǎn)生該節(jié)點的順序,0節(jié)點是初始節(jié)點,9節(jié)點是新產(chǎn)生的節(jié)點 xnew,6節(jié)點是產(chǎn)生9節(jié)點的 xnear,節(jié)點與節(jié)點之間連接的邊上數(shù)字代表兩個節(jié)點之間的歐氏距離(這里我們用歐氏距離來表示路徑代價)。 在重新找父節(jié)點的過程中,以9節(jié)點 xnew 為圓心,以事先規(guī)定好的半徑,找到在這個圓的范圍內(nèi) xnew 的近鄰,也就是4,5,8節(jié)點。 原來的路徑0 - 4 - 6 - 9代價為10 + 5 + 1 = 16,備選的三個節(jié)點與 xnew 組成的路徑0 - 1 - 5 - 9,0 - 4 - 9和0 - 1 - 5 - 8 - 9代價分別為3 + 5 + 3 = 11,10 + 4 = 14和3 + 5 + 1 + 3 = 12,因此如果5節(jié)點作為9節(jié)點的新父節(jié)點,則路徑代價相對是最小的,因此我們把9節(jié)點的父節(jié)點由原來的節(jié)點4變?yōu)楣?jié)點5,則重新生成的隨機樹如圖(b)所示。7.1.2 重布線隨機樹過程 在為xnew 重新選擇父節(jié)點之后,為進一步使得隨機樹節(jié)點間連接的代價盡量小,為隨機樹進行重新布線。過程示意如上圖重布線的過程也可以被表述成:如果近鄰節(jié)點的父節(jié)點改為 xnew 可以減小路徑代價,則進行更改。 如圖(c),9節(jié)點為新生成的節(jié)點 xnew ,近鄰節(jié)點分別為節(jié)點4 , 6 , 8 。它們父節(jié)點分別為節(jié)點0 , 4 , 5。路徑分別為0 - 4,0 - 4 - 6,0 - 1 - 5 - 8,代價分別為10,10 + 5 = 15 和3 + 5 + 1 = 9。 如果將4節(jié)點的父節(jié)點改為9節(jié)點 xnew ,則到達節(jié)點4的路徑變?yōu)? - 1 - 5 - 9 - 4,代價為3 + 5 + 3 + 4 = 15 大于原來的路徑代價10,因此不改變4節(jié)點的父節(jié)點。 同理,改變了8節(jié)點的父節(jié)點,路徑代價將由原來的9變?yōu)?4,也不改變8節(jié)點的父節(jié)點。如果改變6節(jié)點的父節(jié)點為 xnew 則路徑變?yōu)? - 1 - 5 - 9 - 6,代價為3 + 5 + 3 + 1 = 12小于原來的路徑代價15,因此將6的父節(jié)點改為節(jié)點9,生成的新隨機樹如圖(d)。 重布線過程的意義在于每當(dāng)生成了新的節(jié)點后,是否可以通過重新布線,使得某些節(jié)點的路徑代價減少。如果以整體的眼光看,并不是每一個重新布線的節(jié)點都會出現(xiàn)在最終生成的路徑中,但在生成隨機樹的過程中,每一次的重布線都盡可能的為最終路徑代價減小創(chuàng)造機會。 RRT*算法的核心在于上述的兩個過程:重新選擇父節(jié)點和重布線。這兩個過程相輔相成,重新選擇父節(jié)點使新生成的節(jié)點路徑代價盡可能小,重布線使得生成新節(jié)點后的隨機樹減少冗余通路,減小路徑代價。7.2 偽碼7.3 程序示例7.4 參考1、Sampling-based Algorithms for Optimal Motion Planning2、https://blog.csdn.net/weixin_43795921/article/details/88557317#t03、https://zhuanlan.zhihu.com/p/51087819
6.1原理 Dynamic RRT和Extended RRT一樣,也是用來解決動態(tài)路徑規(guī)劃問題,它們的思想有一點是共通的,那就是不要完全放棄初始RRT生成的樹或初始路徑的信息,而是在此基礎(chǔ)上重新規(guī)劃。Dynamic RRT和Extended RRT的區(qū)別在于,Extended RRT利用的是RRT生成的初始路徑的信息,而Dynamic RRT利用的是RRT生成的初始RRT樹的信息。思路如下: 在老地圖中,用RRT算法生成了一個RRT樹,在新地圖中,原始RRT樹的節(jié)點信息(坐標(biāo)、父節(jié)點)存儲在一個節(jié)點集合中。在新地圖中,先檢測新地圖中比老地圖多出的障礙物,然后,以碰撞檢測為評判根據(jù),刪除老節(jié)點集合中與新障礙物無法通過碰撞檢測的節(jié)點和邊。的到一顆修建過后的與新地形無碰撞的修剪后RRT樹,然后再在這顆修剪后的額RRT樹的基礎(chǔ)上,繼續(xù)生長這棵樹,直到這棵樹連接起點和終點,然后回溯路徑,得出新路徑。①從從初始配置到目標(biāo)配置生成的 RRT 開始(圖(a))。 ②當(dāng)配置空間發(fā)生變化時(例如通過接收新信息),將RRT中因這些變化而失效的所有部分標(biāo)記為無效(圖(b)和(c))。 ③然后我們修剪樹以去除所有這些無效部分(圖(d))。 ④此時,保證樹中剩余的所有節(jié)點和邊都是有效的,但樹可能不再達到目標(biāo)。最后,我們把樹長出來,直到再次達到目標(biāo)6.2 偽碼6.3 程序示例加入新的障礙物后,被該障礙物折斷的剩余的圖:在原來的樹的基礎(chǔ)上,繼續(xù)生長后的圖:6.4 參考Replanning with RRTs
5.1 原理 在現(xiàn)實世界的場景中,通常會出現(xiàn)這樣的情況:有關(guān)環(huán)境的初始可用信息是不完整的,或者環(huán)境本身是動態(tài)的。在這些情況下,當(dāng)接收到新信息時,初始解決方案可能會失效,例如通過機載傳感器。當(dāng)這種情況發(fā)生時,通常會放棄當(dāng)前的 RRT,并從零開始生長新的 RRT。這可能是一項非常耗時的操作,尤其是在規(guī)劃問題很復(fù)雜的情況下。另一方面,在確定性規(guī)劃界存在重規(guī)劃算法,當(dāng)這種變化發(fā)生時,它們能夠有效地修復(fù)之前的解決方案,而不需要從頭重新規(guī)劃。這就是通過連續(xù)域規(guī)劃路徑的問題,如果每次更新地圖,都用RRT重新規(guī)劃,效率相當(dāng)?shù)拖?。Extended_RRT則專門用于解決這種動態(tài)路徑規(guī)劃問題。 Extended_RRT的思路是這樣的:在老地圖中,由RRT算法得出的路徑,在障礙物動態(tài)變化不太大的前提下,在新地圖中,大概率也是能通過的,就算障礙物變化很大,之前的路徑也或多或少包含了當(dāng)前障礙物區(qū)域的信息,所以,在新障礙物區(qū)域中,在重新規(guī)劃路徑時,原有的初始RRT路徑的信息可以利用上,而沒有必要完完全全重零開始用RRT來規(guī)劃。 那么如何利用上初始RRT路徑的信息呢?思路如下: 在老地圖上先用RRT算法的處一條初始路徑,將這條初始路徑上的節(jié)點存儲在集合waypoints中,當(dāng)環(huán)境更新后,希望在新地圖上得出一條路徑,在隨機撒點的步驟,新的隨機點有概率p落在目標(biāo)節(jié)點處,此外,還有r的概率落在waypoints的節(jié)點中,剩余1-p-r的概率在目標(biāo)區(qū)域內(nèi)隨即撒點。這樣在重規(guī)劃時,就可以把初始路徑的信息利用進來。完成隨機點選取后,剩余的碰撞檢測、樹的生長、路徑回溯步驟與RRT一致??偨Y(jié):Extended_RRT適用于需要反復(fù)路徑重規(guī)劃的場景中,效率比直接重新進行RRT要高得多,和RRT的主要區(qū)別在于,在選取新的隨機點時,利用上了初始路徑的信息,而不是完全隨機撒點。5.2偽碼5.3 程序示例5.4 參考1、Real-Time Randomized Path Planning for Robot Navigation* 2、Extended RRT algorithm with dynamic N-dimensional cuboid domains3、Replanning with RRTs
原理相比于最原始的 RRT 算法的一些缺點,提出的一種改進的 RRT 算法 為了加快隨機樹到達目標(biāo)點的速度,簡單的改進方法是:在隨機樹每次的生長過程中,根據(jù)隨機概率(0.0 到 1.0 的隨機值 p)來選擇生長方向是目標(biāo)點還是隨機點。2001 年,LaValle在采樣策略方面引入 RRT GoalBias 與 RRT GoalZoom,RRT GoalBias 方法中,規(guī)劃器隨機采樣的同時,以一定概率向最終目標(biāo)運動;RRTGoalZoom 方法中,規(guī)劃器分別在整個空間和目標(biāo)點周圍的空間進行采樣。 和普通RRT的區(qū)別僅在于隨機撒點的時候有區(qū)別,這個p越大,算法越快,但對于復(fù)雜地形,可能會陷入局部極小處,反而變慢。一般取p=0.1程序示例參考Rapidly-Exploring Random Trees: A New Tool for Path Planning
2.1 原理雙樹RRT是在原本RRT的基礎(chǔ)上多加了?顆隨機探索樹,各自從起點和終點向外探索拓展,直到兩棵樹相遇時規(guī)劃算法收斂。這種改進過的探索策略可以??提?RRT的運?效率。 雙樹RRT中存在兩顆隨機樹,我們將其命名為A和B,A以起點為根節(jié)點,B以終點為根節(jié)點。兩顆隨機樹的拓展方式和單樹RRT的別無二致,同樣都需要經(jīng)歷隨機采樣+步?限制+碰撞檢測這三個步驟,但是不同的地?在于雙樹RRT的隨機樹是交替生長的,??說第?輪迭代中A樹向外??,第?輪便切換為B樹??,如此循環(huán)。 在每輪迭代中,隨機樹除了向外拓展之外,還會多出?個步驟,就是遍歷另一顆隨機樹中的所有節(jié)點,找出離NewNode最近的節(jié)點,用于判斷兩顆隨機樹是否相遇。 假設(shè)算法經(jīng)歷了N次迭代以后,已經(jīng)拓展出如下圖所示的兩顆隨機樹。并且在下?輪迭代中,輪到A樹進?拓展,A樹在圖中?綠?線條表示,B樹?黃色線條表示。當(dāng)進?本輪迭代后,算法成功拓展出A樹的新節(jié)點NewNode_A,此時算法將遍歷B樹中的所有節(jié)點,找出B樹中離NewNode_A最近的節(jié)點ClosestNode_B。并判斷?者是否滿?步?限制以及是否可以通過步?檢測。如下圖所示,這種情況明顯?法通過碰撞檢測。那么A樹和B樹在這?輪迭代中?法相遇,需要接著下?輪迭代。進?下?輪迭代,這次便切換為B樹進?拓展,假設(shè)算法拓展出的NewNode_B以及遍歷A樹后得到的ClosestNode_A如下圖所示,經(jīng)過判斷發(fā)現(xiàn)?者滿?步?限制并且通過了碰撞檢測,那么這時A樹和B樹就成功得相遇了,規(guī)劃算法收斂當(dāng)算法收斂以后,只需在兩棵樹的相遇處分別沿著?節(jié)點回溯便可以找出從起點到終點的有效路徑。注意:雙向RRT和RRT的區(qū)別不僅僅是在于雙向生長,雙向RRT比RRT更“貪心”,相比于RRT在生長RRT樹的時候,是每產(chǎn)生一個隨機點,如果能通過碰撞檢測,就往該隨機點的方向生長一次,然后該隨機點就被廢棄了,下一步想繼續(xù)生長RRT樹的話,就只能繼續(xù)生成新的隨機點,每個隨機點最多利用一次。而雙向RRT在生長RRT樹時,先先生成一個隨機點,然后,該樹往該隨機點的方向生長,直到碰到障礙物或則生長到該隨機點,這樣,一個隨機點就被多次利用,加快了速度。2.2 偽碼2.3 程序示例2.4 收斂性分析雙向RRT的收斂性分析可以應(yīng)用RRT的收斂性分析2.5 參考1、RRT-Connect: An Efficient Approach to Single-Query Path Planning2、https://www.guyuehome.com/9405
1.1 RRT算法思路我們有兩個節(jié)點,一個綠色的起點,一個黃色的終點對于RRT,我們做的第一件事就是將起點設(shè)置為隨機樹的根,那么我們就擁有了一顆只有根節(jié)點的樹這棵樹光禿禿的,只有根節(jié)點的話不但難看,而且還沒用。那么我們這時候就需要從這個根節(jié)點出發(fā),向外拓展出新的葉?。拓展的方式很簡單,就是隨機采樣+步?限制+碰撞檢測。 RRT在每輪迭代中會?成?個隨機采樣點NewNode,如果NewNode位于自由區(qū)域,那么我們就可以遍歷隨機樹中已有的全部節(jié)點,找出距離NewNode最近的節(jié)點ClosestNode。利?距離函數(shù)dist(NewNode, ClosestNode)得到二者之間的距離,如果滿足步長限制的話,我們將接著對這兩個節(jié)點進?碰撞檢測,如果不滿足步長限制的話,我們需要沿著NewNode和ClosestNode的連線?向,找出?個符合步長限制的中間點,用來替代NewNode。最后如果NewNode和ClosestNode通過了碰撞檢測,就意味著二者之間存在邊(edge),我們便可以將NewNode添加進隨機樹中。首先以第一輪迭代為例,因為剛開始我們的隨機樹中只有根節(jié)點,所以?論NewNode位于何處,遍歷出的最近節(jié)點ClosestNode必然是根節(jié)點。 假設(shè)我們遇到下圖這種情況,雖然采樣點NewNode位于步?限制之內(nèi),但是卻很不巧沒有落在自由區(qū)域,即采樣點落在障礙物的位置時,這個采樣點會被算法舍棄。假設(shè)我們的步?限制為R,也就是說對于每個ClosestNode節(jié)點來說,只有當(dāng)NewNode落在其半徑為R的圓的范圍內(nèi)時,這個隨機采樣點NewNode才有可能被直接采納。如下圖所示,該紅?隨機采樣點雖然位于?由區(qū)域,但是明顯在根節(jié)點的步?限制之外。不過這個節(jié)點并不會被簡單粗暴地舍棄。?是會沿著ClosestNode和NewNode的連線,找出符合步?限制的中間點,將這個中間點作為新的采樣點。如下圖所示,藍(lán)點就可以替代紅點作為新的采樣點。那么假設(shè)我們已經(jīng)通過第?輪迭代拓展出第?個葉?節(jié)點A,毫?疑問地A的?節(jié)點就是根節(jié)點,假設(shè)我們第?輪迭代的隨機采樣點NewNode為圖中的點B,B落在A的步?限制范圍內(nèi),但是A,B之間由于障礙物的阻擋,?法通過碰撞檢測,于是B就會被算法舍棄。假設(shè)我們的隨機采樣點是下圖中的B’,明顯B’位于?由區(qū)域,滿?步?條件,并且可以通過與點A的碰撞檢測,那么我們就在B’和A之間添加?條邊,并且將A設(shè)置為B’的?節(jié)點。學(xué)過數(shù)據(jù)結(jié)構(gòu)的?伙伴?定知道,在樹結(jié)構(gòu)中每個節(jié)點最多只有?個?節(jié)點,?節(jié)點可以擁有多個?節(jié)點。在經(jīng)歷了N輪迭代后,我們已經(jīng)獲得了?顆如下圖所示的隨機樹,這時我們發(fā)現(xiàn)此時的隨機采樣點竟然幸運地落在了終點的步?限制范圍內(nèi),并且?者之間不存在障礙物。這時我們便可以認(rèn)為,該采樣點和終點之間存在?條邊,于是將該節(jié)點設(shè)為終點的?節(jié)點,并把終點添加進隨機樹。此時算法就可以結(jié)束迭代了,即規(guī)劃算法收斂。當(dāng)規(guī)劃算法收斂以后,只需要從終點開始,沿著其?節(jié)點進?回溯,就可以找 到起點-終點之間的有效路徑。那么總結(jié)?下,RRT?成的每輪迭代中都包含以下這些流程:1. ?成?個隨機采樣點NewNode,并判斷采樣點是否位于?由區(qū)域2. 遍歷隨機樹,找出距離NewNode最近的節(jié)點ClosestNode3. 判斷NewNode是否在ClosestNode的步?限制范圍內(nèi),否則尋找中間點替代NewNode4. 判斷NewNode和ClosestNode之間是否存在障礙物,即碰撞檢測。5. 如果NewNode滿?以上所有約束條件,則將NewNode添加進隨機樹,設(shè)置ClosestNode為NewNode的?節(jié)點。6. 判斷NewNode是否在終點的步?限制范圍內(nèi),并對其?者做碰撞檢測。如果滿?條件則將該NewNode設(shè)為終點的?節(jié)點,并將終點加?隨機樹,即可結(jié)束迭代。否則繼續(xù)迭代。1.2 偽碼1.3 RRT的收斂性分析本節(jié)主要介紹了該規(guī)劃?法的理論特性。Theorem 1 如果存在長度為k的連接序列,則將 x_init 連接到 x_goal 所預(yù)期的迭代次數(shù)不超過k/p Pf. 參考S.M. Lavalle and J.J. Kuffffner. "Randomized Kinodynamic Planning." The International Journal of Robotics Research. Vol. 20, Number 5, 2001, pp. 378 – 400. 第392頁Theorem 2 Pf. 參考S.M. Lavalle and J.J. Kuffffner. "Randomized Kinodynamic Planning." The International Journal of Robotics Research. Vol. 20, Number 5, 2001, pp. 378 – 400. 第393頁Theorem 3 當(dāng)頂點數(shù)趨于無窮時,在 x_init 處初始化的RRT包含 x_goal 的概率將趨近于1 Pf. 參考S.M. Lavalle and J.J. Kuffffner. "Randomized Kinodynamic Planning." The International Journal of Robotics Research. Vol. 20, Number 5, 2001, pp. 378 – 400. 第394頁定理1和定理2表示了規(guī)劃器的收斂率,定理3建?了規(guī)劃器是概率完備的(即,當(dāng)?shù)鷶?shù)趨于?窮時,找到解的概率趨于1我們可以看出,由于算法在未達到收斂條件之前是在不斷進?迭代的,所以只要在規(guī)劃的起點和終點之間是存在有效的路徑,那么只要迭代的次數(shù)夠多,那么采樣點就夠多,隨機樹就長得越茂密,能探索到的區(qū)域就?夠?,就必然可以找到有效的路徑。所以RRT是概率完備的。但是由于采樣點每次都是隨機的,所以算法并不能保證找到的路徑是最優(yōu)的路徑。因此RRT是?最優(yōu)的。1.4 程序示例1.5 參考1、S.M. Lavalle and J.J. Kuffffner. "Randomized Kinodynamic Planning." The International Journal of Robotics Research. Vol. 20, Number 5, 2001, pp. 378 – 400.2、Rapidly-Exploring Random Trees: A New Tool for Path Planning3、https://www.guyuehome.com/9405
什么是路徑規(guī)劃? 路徑規(guī)劃(也叫運動學(xué)規(guī)劃),任務(wù)是確定控制輸入,以驅(qū)動機器人從初始配置和速度到目標(biāo)配置和速度,同時服從基于物理的動力學(xué)模型,且能確保機器人在環(huán)境中避開障礙。說白了,就是給你一張地圖,且已知障礙物分布,以及起始點和目標(biāo)點的坐標(biāo),希望你根據(jù)這些信息,找到一條從起點到終點的能繞開障礙物的有效路徑,如果可以,還希望這條有效路徑盡可能最優(yōu)(最短),并且希望找到這條有效路徑的時間盡可能短(算法足夠高效) 目前流行的路徑規(guī)劃分為兩大類:基于采樣的路徑規(guī)劃和基于搜索的路徑規(guī)劃。運動規(guī)劃的狀態(tài)空間是應(yīng)用于機器人變換的集合,稱為位姿空間(configuration space),引入了 C-空間、C-空間障礙物、自由空間等一系列概念,下面介紹一些概念:位姿(configuration)機器人一個位姿指的是一組相互獨立的參數(shù)集,它能完全確定機器人上所有的點在工作空間 W 中的位置,這些參數(shù)用來完整描述機器人在工作空間 W 中的狀態(tài)。一個位姿通常表示為帶有位置和方向參數(shù)的一個向量(vector),用 q 表示。自由度(degrees of freedom)機器人的自由度定義為機器人運動過程中決定其運動狀態(tài)的所有獨立參數(shù)的數(shù)目,即 q 的維數(shù)。位姿空間(configuration space)位姿空間是機器人所有可能位姿組成的集合,代表了機器人所有可能的運動結(jié)果,稱為 C-空間,也可簡記為 C。距離函數(shù)(distance function)C-空間中的距離函數(shù)定義為該空間中的一個映射