手機(jī)站首頁散文詩歌雜文隨筆日記小小說

散文網(wǎng) » 科技 »學(xué)習(xí) » 【路徑規(guī)劃】基于蟻群算法實(shí)現(xiàn)機(jī)器人柵格地圖路徑規(guī)劃

【路徑規(guī)劃】基于蟻群算法實(shí)現(xiàn)機(jī)器人柵格地圖路徑規(guī)劃

2021-08-16 00:13 作者:Matlab工程師 0人讀過 | 我要投稿

一、柵格地圖介紹

柵格地圖有兩種表示方法，直角坐標(biāo)系法和序號(hào)法，序號(hào)法比直角坐標(biāo)法節(jié)省內(nèi)存

室內(nèi)環(huán)境柵格法建模步驟

1.柵格粒大小的選取

柵格的大小是個(gè)關(guān)鍵因素，柵格選的小，環(huán)境分辨率較大，環(huán)境信息存儲(chǔ)量大，決策速度慢。

柵格選的大，環(huán)境分辨率較小，環(huán)境信息存儲(chǔ)量小，決策速度快，但在密集障礙物環(huán)境中發(fā)現(xiàn)路徑的能力較弱。

2.障礙物柵格確定

當(dāng)機(jī)器人新進(jìn)入一個(gè)環(huán)境時(shí)，它是不知道室內(nèi)障礙物信息的，這就需要機(jī)器人能夠遍歷整個(gè)環(huán)境，檢測(cè)障礙物的位置，并根據(jù)障礙物位置找到對(duì)應(yīng)柵格地圖中的序號(hào)值，并對(duì)相應(yīng)的柵格值進(jìn)行修改。自由柵格為不包含障礙物的柵格賦值為0，障礙物柵格為包含障礙物的柵格賦值為1.

3.未知環(huán)境的柵格地圖的建立

通常把終點(diǎn)設(shè)置為一個(gè)不能到達(dá)的點(diǎn)，比如（-1，-1），同時(shí)機(jī)器人在尋路過程中遵循“下右上左”的原則，即機(jī)器人先向下行走，當(dāng)機(jī)器人前方遇到障礙物時(shí)，機(jī)器人轉(zhuǎn)向右走，遵循這樣的規(guī)則，機(jī)器人最終可以搜索出所有的可行路徑，并且機(jī)器人最終將返回起始點(diǎn)。

備注：在柵格地圖上，有這么一條原則，障礙物的大小永遠(yuǎn)等于n個(gè)柵格的大小，不會(huì)出現(xiàn)半個(gè)柵格這樣的情況。

二.蟻群算法基本原理

2.1 算法綜述

　　對(duì)于VRP問題,求解算法大致可分為精確算法和人工智能算法兩大類。精確性算法基于嚴(yán)格的數(shù)學(xué)手段,在可以求解的情況下,解的質(zhì)量較好。但是由于算法嚴(yán)格,運(yùn)算量大,特別是大規(guī)模的問題幾乎無法求解。所以其應(yīng)用只能是小規(guī)模的確定性問題，面對(duì)中小規(guī)模問題,人工智能算法在精度上不占優(yōu)勢(shì)。但規(guī)模變大時(shí),人工智能方法基本能在可接受時(shí)間里,找到可接受的滿意解,這是精確算法難以做到的。由于的實(shí)際問題,各種約束錯(cuò)綜復(fù)雜,人工智能算法顯示出了巨大的優(yōu)越性,也正因?yàn)槿绱?實(shí)際應(yīng)用中,人工智能算法要更廣泛。求解車輛路徑調(diào)度問題的精確算法有動(dòng)態(tài)規(guī)劃法、分枝定界法等。并開始尋求所得結(jié)果可接受的啟發(fā)式算法,以處理大規(guī)模實(shí)際問題，一些其他學(xué)科的新一代優(yōu)化算法相繼出現(xiàn),如禁忌搜索算法,遺傳算法,人工神經(jīng)網(wǎng)絡(luò)算法,以及現(xiàn)在研究較多的蟻群算法等。

2.2 蟻群算法的原理

　　蟻群算法是受到對(duì)真實(shí)螞蟻群覓食行為研究的啟發(fā)而提出。生物學(xué)研究表明：一群相互協(xié)作的螞蟻能夠找到食物和巢穴之間的最短路徑,而單只螞蟻則不能。生物學(xué)家經(jīng)過大量細(xì)致觀察研究發(fā)現(xiàn),螞蟻個(gè)體之間的行為是相互作用相互影響的。螞蟻在運(yùn)動(dòng)過程中,能夠在它所經(jīng)過的路徑上留下一種稱之為信息素的物質(zhì),而此物質(zhì)恰恰是螞蟻個(gè)體之間信息傳遞交流的載體。螞蟻在運(yùn)動(dòng)時(shí)能夠感知這種物質(zhì),并且習(xí)慣于追蹤此物質(zhì)爬行,當(dāng)然爬行過程中還會(huì)釋放信息素。一條路上的信息素蹤跡越濃,其它螞蟻將以越高的概率跟隨爬行此路徑,從而該路徑上的信息素蹤跡會(huì)被加強(qiáng),因此,由大量螞蟻組成的蟻群的集體行為便表現(xiàn)出一種信息正反饋現(xiàn)象。某一路徑上走過的螞蟻越多,則后來者選擇該路徑的可能性就越大。螞蟻個(gè)體之間就是通過這種間接的通信機(jī)制實(shí)現(xiàn)協(xié)同搜索最短路徑的目標(biāo)的。我們舉例簡單說明螞蟻覓食行為：

如上圖a,b,c的示意圖：

a圖是原始狀態(tài)，螞蟻起始點(diǎn)為A，要到達(dá)E，中途有障礙物，要繞過才能到達(dá)。BC和BH是繞過障礙物的2條路徑(假設(shè)只有2條)。各個(gè)路徑的距離d已經(jīng)標(biāo)定。

b圖是t=0時(shí)刻螞蟻狀態(tài)，各個(gè)邊上有相等的信息素濃度，假設(shè)為15；

c圖是t=1時(shí)刻螞蟻經(jīng)過后的狀態(tài)，各個(gè)邊的信息素濃度，有變化；因?yàn)榇罅课浵伒倪x擇概率會(huì)不一樣，而選擇概率是和路徑長度相關(guān)的。所以越短路徑的濃度會(huì)越來越大，經(jīng)過此短路徑達(dá)到目的地的螞蟻也會(huì)比其他路徑多。這樣大量的螞蟻實(shí)踐之后就找到了最短路徑。所以這個(gè)過程本質(zhì)可以概括為以下幾點(diǎn)：

1.路徑概率選擇機(jī)制信息素蹤跡越濃的路徑,被選中的概率越大

2.信息素更新機(jī)制路徑越短,路徑上的信息素蹤跡增長得越快

3.協(xié)同工作機(jī)制螞蟻個(gè)體通過信息素進(jìn)行信息交流。

從螞蟻覓食的原理可見,單個(gè)個(gè)體的行為非常簡單螞蟻只知道跟蹤信息素爬行并釋放信息素,但組合后的群體智能又非常高螞蟻群能在復(fù)雜的地理分布的清況下,輕松找到蟻穴與食物源之間的最短路徑。這種特點(diǎn)恰恰與元啟發(fā)算法的特點(diǎn)相一致,蟻群優(yōu)化算法正是受到這種生態(tài)學(xué)現(xiàn)象的啟發(fā)后加以模仿并改進(jìn)而來,覓食的螞蟻由人工蟻替代,螞蟻釋放的信息素變成了人工信息素,螞蟻爬行和信息素的蒸發(fā)不再是連續(xù)不斷的,而是在離散的時(shí)空中進(jìn)行。

　　上述例子如果不好理解，我在這里貼幾張PPT，個(gè)人感覺非常不錯(cuò)，也是我找了很多資料覺得最好理解的【來源是大連理工大學(xué)谷俊峰】，點(diǎn)擊這里提供下載：蟻群算法基本知識(shí).rar。

從深層意義上來講,蟻群算法作為優(yōu)化的方法之一,屬于人工群集智能領(lǐng)域。人工群集智能,大都受自然群集智能如昆蟲群和動(dòng)物群等的啟發(fā)而來。除了具有獨(dú)特的強(qiáng)有力的合作搜索能力外,還可以利用一系列的計(jì)算代理對(duì)問題進(jìn)行分布式處理,從而大大提高搜索效率。

回到目錄

三.蟻群算法的基本流程

　　我們還是采用大連理工大學(xué)谷俊峰的PPT來說明問題，重要公式進(jìn)行截圖計(jì)算和解釋，對(duì)PPT難以理解的地方進(jìn)行單獨(dú)解釋：

3.1 基本數(shù)學(xué)模型

　　首先看看基本TSP問題的基本數(shù)學(xué)模型：

　　問題其實(shí)很簡單，目標(biāo)函數(shù)就是各個(gè)走過路徑的總長度，注意的就是距離矩陣根據(jù)實(shí)際的問題不一樣，長度是不一樣的。

3.2 蟻群算法說明

　　在說明群蟻算法流程之前，我們對(duì)算法原理和幾個(gè)注意點(diǎn)進(jìn)行描述：

1.TSP問題的人工蟻群算法中，假設(shè)m只螞蟻在圖的相鄰節(jié)點(diǎn)間移動(dòng)，從而協(xié)作異步地得到問題的解。每只螞蟻的一步轉(zhuǎn)移概率由圖中的每條邊上的兩類參數(shù)決定：1. 信息素值也稱信息素痕跡。2.可見度，即先驗(yàn)值。 2.信息素的更新方式有2種，一是揮發(fā)，也就是所有路徑上的信息素以一定的比率進(jìn)行減少，模擬自然蟻群的信息素隨時(shí)間揮發(fā)的過程；二是增強(qiáng)，給評(píng)價(jià)值“好”(有螞蟻?zhàn)哌^)的邊增加信息素。 3.螞蟻向下一個(gè)目標(biāo)的運(yùn)動(dòng)是通過一個(gè)隨機(jī)原則來實(shí)現(xiàn)的，也就是運(yùn)用當(dāng)前所在節(jié)點(diǎn)存儲(chǔ)的信息，計(jì)算出下一步可達(dá)節(jié)點(diǎn)的概率，并按此概率實(shí)現(xiàn)一步移動(dòng)，逐此往復(fù)，越來越接近最優(yōu)解。 4.螞蟻在尋找過程中，或者找到一個(gè)解后，會(huì)評(píng)估該解或解的一部分的優(yōu)化程度，并把評(píng)價(jià)信息保存在相關(guān)連接的信息素中。

3.3 蟻群算法核心步驟

　　更加我們前面的原理和上述說明，群蟻算法的2個(gè)核心步驟是路徑構(gòu)建和信息素更新。我們將重點(diǎn)對(duì)這2個(gè)步驟進(jìn)行說明。

3.3.1 路徑構(gòu)建

　　每個(gè)螞蟻都隨機(jī)選擇一個(gè)城市作為其出發(fā)城市，并維護(hù)一個(gè)路徑記憶向量，用來存放該螞蟻依次經(jīng)過的城市。螞蟻在構(gòu)建路徑的每一步中，按照一個(gè)隨機(jī)比例規(guī)則選擇下一個(gè)要到達(dá)的城市。隨機(jī)概率是按照下列公式來進(jìn)行計(jì)算的：

　　上述公式就是計(jì)算當(dāng)前點(diǎn) 到每一個(gè)可能的下一個(gè)節(jié)點(diǎn) 的概率。分子是信息素強(qiáng)度和能見度的冪乘積，而分母則是所有分子的和值。這個(gè)剛開始是很不容易理解的，我們?cè)谧詈髮?shí)例計(jì)算的時(shí)候，可以看得很清楚，再反過來理解公式。注意每次選擇好節(jié)點(diǎn)后，就要從可用節(jié)點(diǎn)中移除選擇的節(jié)點(diǎn)。

3.3.2 信息素更新

　　信息素更新是群蟻算法的核心。也是整個(gè)算法的核心所在。算法在初始期間有一個(gè)固定的濃度值，在每一次迭代完成之后，所有出去的螞蟻回來后，會(huì)對(duì)所走過的路線進(jìn)行計(jì)算，然后更新相應(yīng)的邊的信息素濃度。很明顯，這個(gè)數(shù)值肯定是和螞蟻所走的長度有關(guān)系的，經(jīng)過一次次的迭代，近距離的線路的濃度會(huì)很高，從而得到近似最優(yōu)解。那我們看看信息素更新的過程。

　　初始化信息素濃度C(0)，如果太小，算法容易早熟，螞蟻會(huì)很快集中到一條局部最優(yōu)路徑上來，因?yàn)榭梢韵胂?，太小C值，使得和每次揮發(fā)和增強(qiáng)的值都差不多，那么隨機(jī)情況下，一些小概率的事件發(fā)生就會(huì)增加非最優(yōu)路徑的信息素濃度；如果C太大，信息素對(duì)搜索方向的指導(dǎo)性作用減低，影響算法性能。一般情況下，我們可以使用貪婪算法獲取一個(gè)路徑值Cnn，然后根據(jù)螞蟻個(gè)數(shù)來計(jì)算C(0) = m/Cnn ,m為螞蟻個(gè)數(shù)

　　每一輪過后，問題空間中的所有路徑上的信息素都會(huì)發(fā)生蒸發(fā),然后，所有的螞蟻根據(jù)自己構(gòu)建的路徑長度在它們本輪經(jīng)過的邊上釋放信息素，公式如下：

　　信息素更新的作用： 1.信息素?fù)]發(fā)(evaporation)信息素痕跡的揮發(fā)過程是每個(gè)連接上的信息素痕跡的濃度自動(dòng)逐漸減弱的過程，這個(gè)揮發(fā)過程主要用于避免算法過快地向局部最優(yōu)區(qū)域集中，有助于搜索區(qū)域的擴(kuò)展。 2.信息素增強(qiáng)(reinforcement)增強(qiáng)過程是蟻群優(yōu)化算法中可選的部分，稱為離線更新方式（還有在線更新方式）。這種方式可以實(shí)現(xiàn) 由單個(gè)螞蟻無法實(shí)現(xiàn)的集中行動(dòng)?；鞠伻核惴ǖ碾x線更新方式是在蟻群中的m只螞蟻全部完成n城市的訪問后，統(tǒng)一對(duì)殘留信息進(jìn)行更新處理。

3.3.3 迭代與停止

　　迭代停止的條件可以選擇合適的迭代次數(shù)后停止，輸出最優(yōu)路徑，也可以看是否滿足指定最優(yōu)條件，找到滿足的解后停止。最重要的是，我剛開始理解這個(gè)算法的時(shí)候，以為每一只螞蟻?zhàn)咭粭l邊就是一次迭代，其實(shí)是錯(cuò)的。這里算法每一次迭代的意義是：每次迭代的m只螞蟻都完成了自己的路徑過程，回到原點(diǎn)后的整個(gè)過程。

回到目錄

function [R_best,L_best,L_ave,Shortest_Route,Shortest_Length]=pathplan %%========================================================================= %% ACATSP.m %% Ant Colony Algorithm for Traveling Salesman Problem %% %% %% All rights reserved %%------------------------------------------------------------------------- %% 主要符號(hào)說明 %% G 地圖，n×n的矩陣 %% NC_max 最大迭代次數(shù) %% m 螞蟻個(gè)數(shù) %% Alpha 表征信息素重要程度的參數(shù) %% Beta 表征啟發(fā)式因子重要程度的參數(shù) %% Rho 信息素蒸發(fā)系數(shù) %% Q 信息素增加強(qiáng)度系數(shù) %% R_best 各代最佳路線 %% L_best 各代最佳路線的長度 %%========================================================================= m=30;Alpha=1;Beta=6;Rho=0.1;NC_max=50;Q=14; n=10; ? ? ? ? ? ? ? ?%n表示問題的規(guī)模（n×n個(gè)節(jié)點(diǎn)） G=[0 0 0 1 0 0 0 0 0 1; ? 1 0 1 1 0 0 1 0 0 0; ? 0 0 0 0 0 0 1 0 0 0; ? 0 1 1 1 0 0 1 0 0 0; ? 0 1 1 0 0 0 1 0 1 0; ? 0 0 0 0 0 1 1 0 0 0; ? 0 0 1 1 0 0 0 0 0 1; ? 0 0 0 0 0 0 1 1 0 0; ? 0 1 0 0 0 0 1 0 0 0; ? 0 1 0 0 1 0 0 0 0 0]; obstacle =find(G'); %obstacle start = 1; ? ? ? ? ? %起點(diǎn) dest = 100; ? ? ? ? ?%終點(diǎn) %%第一步：變量初始化 D=caldistmat(n); ? ? %D表示完全圖的賦權(quán)鄰接矩陣，圖中任意兩點(diǎn)的距離 Eta=1./D; ? ? ? ? ? ?%Eta為啟發(fā)因子，這里設(shè)為距離的倒數(shù) ? ? Tau=ones(n*n,n*n); ? %Tau為信息素矩陣 Tabu=zeros(m,n*n); ? %存儲(chǔ)并記錄路徑的生成 NC=1; ? ? ? ? ? ? ? ?%迭代計(jì)數(shù)器 for iter=1:NC_max ? ?R_best(iter).path=[]; ? ? ? ? %記錄各代最佳路線 end L_best=inf.*ones(NC_max,1); ? ? ? %記錄各代最佳路線的長度 L_ave=zeros(NC_max,1); ? ? ? ? ? ?%記錄各代路線的平均長度 %%第七步：輸出結(jié)果 ? ?Pos=find(L_best==min(L_best)) ? ?Shortest_Route = (R_best(Pos(1)).path)'; ? ?Shortest_Length = L_best(Pos(1)) ? ?%subplot(2,3,i) ? ?subplot(1,2,1) ? ?%DrawMyRoute(Shortest_Route,n); ? ?%DrawRoute(C,Shortest_Route) ? ?DrawMyR(Shortest_Route,n,G); ? ?hold on subplot(1,2,2) plot(L_best) axis([1 NC 13 20]); hold on %plot(L_ave)

標(biāo)簽：