【路徑規(guī)劃】基于蟻群算法實(shí)現(xiàn)機(jī)器人柵格地圖路徑規(guī)劃
一、柵格地圖介紹
柵格地圖有兩種表示方法,直角坐標(biāo)系法和序號(hào)法,序號(hào)法比直角坐標(biāo)法節(jié)省內(nèi)存


室內(nèi)環(huán)境柵格法建模步驟
1.柵格粒大小的選取
柵格的大小是個(gè)關(guān)鍵因素,柵格選的小,環(huán)境分辨率較大,環(huán)境信息存儲(chǔ)量大,決策速度慢。
柵格選的大,環(huán)境分辨率較小,環(huán)境信息存儲(chǔ)量小,決策速度快,但在密集障礙物環(huán)境中發(fā)現(xiàn)路徑的能力較弱。
2.障礙物柵格確定
當(dāng)機(jī)器人新進(jìn)入一個(gè)環(huán)境時(shí),它是不知道室內(nèi)障礙物信息的,這就需要機(jī)器人能夠遍歷整個(gè)環(huán)境,檢測(cè)障礙物的位置,并根據(jù)障礙物位置找到對(duì)應(yīng)柵格地圖中的序號(hào)值,并對(duì)相應(yīng)的柵格值進(jìn)行修改。自由柵格為不包含障礙物的柵格賦值為0,障礙物柵格為包含障礙物的柵格賦值為1.
3.未知環(huán)境的柵格地圖的建立
通常把終點(diǎn)設(shè)置為一個(gè)不能到達(dá)的點(diǎn),比如(-1,-1),同時(shí)機(jī)器人在尋路過程中遵循“下右上左”的原則,即機(jī)器人先向下行走,當(dāng)機(jī)器人前方遇到障礙物時(shí),機(jī)器人轉(zhuǎn)向右走,遵循這樣的規(guī)則,機(jī)器人最終可以搜索出所有的可行路徑,并且機(jī)器人最終將返回起始點(diǎn)。
備注:在柵格地圖上,有這么一條原則,障礙物的大小永遠(yuǎn)等于n個(gè)柵格的大小,不會(huì)出現(xiàn)半個(gè)柵格這樣的情況。
二.蟻群算法基本原理
2.1 算法綜述
對(duì)于VRP問題,求解算法大致可分為精確算法和人工智能算法兩大類。精確性算法基于嚴(yán)格的數(shù)學(xué)手段,在可以求解的情況下,解的質(zhì)量較好。但是由于算法嚴(yán)格,運(yùn)算量大,特別是大規(guī)模的問題幾乎無法求解。所以其應(yīng)用只能是小規(guī)模的確定性問題,面對(duì)中小規(guī)模問題,人工智能算法在精度上不占優(yōu)勢(shì)。但規(guī)模變大時(shí),人工智能方法基本能在可接受時(shí)間里,找到可接受的滿意解,這是精確算法難以做到的。由于的實(shí)際問題,各種約束錯(cuò)綜復(fù)雜,人工智能算法顯示出了巨大的優(yōu)越性,也正因?yàn)槿绱?實(shí)際應(yīng)用中,人工智能算法要更廣泛。求解車輛路徑調(diào)度問題的精確算法有動(dòng)態(tài)規(guī)劃法、分枝定界法等。并開始尋求所得結(jié)果可接受的啟發(fā)式算法,以處理大規(guī)模實(shí)際問題,一些其他學(xué)科的新一代優(yōu)化算法相繼出現(xiàn),如禁忌搜索算法,遺傳算法,人工神經(jīng)網(wǎng)絡(luò)算法,以及現(xiàn)在研究較多的蟻群算法等。
2.2 蟻群算法的原理
蟻群算法是受到對(duì)真實(shí)螞蟻群覓食行為研究的啟發(fā)而提出。生物學(xué)研究表明:一群相互協(xié)作的螞蟻能夠找到食物和巢穴之間的最短路徑,而單只螞蟻則不能。生物學(xué)家經(jīng)過大量細(xì)致觀察研究發(fā)現(xiàn),螞蟻個(gè)體之間的行為是相互作用相互影響的。螞蟻在運(yùn)動(dòng)過程中,能夠在它所經(jīng)過的路徑上留下一種稱之為信息素的物質(zhì),而此物質(zhì)恰恰是螞蟻個(gè)體之間信息傳遞交流的載體。螞蟻在運(yùn)動(dòng)時(shí)能夠感知這種物質(zhì),并且習(xí)慣于追蹤此物質(zhì)爬行,當(dāng)然爬行過程中還會(huì)釋放信息素。一條路上的信息素蹤跡越濃,其它螞蟻將以越高的概率跟隨爬行此路徑,從而該路徑上的信息素蹤跡會(huì)被加強(qiáng),因此,由大量螞蟻組成的蟻群的集體行為便表現(xiàn)出一種信息正反饋現(xiàn)象。某一路徑上走過的螞蟻越多,則后來者選擇該路徑的可能性就越大。螞蟻個(gè)體之間就是通過這種間接的通信機(jī)制實(shí)現(xiàn)協(xié)同搜索最短路徑的目標(biāo)的。我們舉例簡單說明螞蟻覓食行為:

如上圖a,b,c的示意圖:
a圖是原始狀態(tài),螞蟻起始點(diǎn)為A,要到達(dá)E,中途有障礙物,要繞過才能到達(dá)。BC和BH是繞過障礙物的2條路徑(假設(shè)只有2條)。各個(gè)路徑的距離d已經(jīng)標(biāo)定。
b圖是t=0時(shí)刻螞蟻狀態(tài),各個(gè)邊上有相等的信息素濃度,假設(shè)為15;
c圖是t=1時(shí)刻螞蟻經(jīng)過后的狀態(tài),各個(gè)邊的信息素濃度,有變化;因?yàn)榇罅课浵伒倪x擇概率會(huì)不一樣,而選擇概率是和路徑長度相關(guān)的。所以越短路徑的濃度會(huì)越來越大,經(jīng)過此短路徑達(dá)到目的地的螞蟻也會(huì)比其他路徑多。這樣大量的螞蟻實(shí)踐之后就找到了最短路徑。所以這個(gè)過程本質(zhì)可以概括為以下幾點(diǎn):
1.路徑概率選擇機(jī)制信息素蹤跡越濃的路徑,被選中的概率越大
2.信息素更新機(jī)制路徑越短,路徑上的信息素蹤跡增長得越快
3.協(xié)同工作機(jī)制螞蟻個(gè)體通過信息素進(jìn)行信息交流。
從螞蟻覓食的原理可見,單個(gè)個(gè)體的行為非常簡單螞蟻只知道跟蹤信息素爬行并釋放信息素,但組合后的群體智能又非常高螞蟻群能在復(fù)雜的地理分布的清況下,輕松找到蟻穴與食物源之間的最短路徑。這種特點(diǎn)恰恰與元啟發(fā)算法的特點(diǎn)相一致,蟻群優(yōu)化算法正是受到這種生態(tài)學(xué)現(xiàn)象的啟發(fā)后加以模仿并改進(jìn)而來,覓食的螞蟻由人工蟻替代,螞蟻釋放的信息素變成了人工信息素,螞蟻爬行和信息素的蒸發(fā)不再是連續(xù)不斷的,而是在離散的時(shí)空中進(jìn)行。
上述例子如果不好理解,我在這里貼幾張PPT,個(gè)人感覺非常不錯(cuò),也是我找了很多資料覺得最好理解的【來源是大連理工大學(xué)谷俊峰】,點(diǎn)擊這里提供下載:蟻群算法基本知識(shí).rar。



從深層意義上來講,蟻群算法作為優(yōu)化的方法之一,屬于人工群集智能領(lǐng)域。人工群集智能,大都受自然群集智能如昆蟲群和動(dòng)物群等的啟發(fā)而來。除了具有獨(dú)特的強(qiáng)有力的合作搜索能力外,還可以利用一系列的計(jì)算代理對(duì)問題進(jìn)行分布式處理,從而大大提高搜索效率。
回到目錄
三.蟻群算法的基本流程
我們還是采用大連理工大學(xué)谷俊峰的PPT來說明問題,重要公式進(jìn)行截圖計(jì)算和解釋,對(duì)PPT難以理解的地方進(jìn)行單獨(dú)解釋:
3.1 基本數(shù)學(xué)模型
首先看看基本TSP問題的基本數(shù)學(xué)模型:

問題其實(shí)很簡單,目標(biāo)函數(shù)就是各個(gè)走過路徑的總長度,注意的就是距離矩陣根據(jù)實(shí)際的問題不一樣,長度是不一樣的。
3.2 蟻群算法說明
在說明群蟻算法流程之前,我們對(duì)算法原理和幾個(gè)注意點(diǎn)進(jìn)行描述:
1.TSP問題的人工蟻群算法中,假設(shè)m只螞蟻在圖的相鄰節(jié)點(diǎn)間移動(dòng),從而協(xié)作異步地得到問題的解。每只螞蟻的一步轉(zhuǎn)移概率由圖中的每條邊上的兩類參數(shù)決定:1. 信息素值也稱信息素痕跡。2.可見度,即先驗(yàn)值。 2.信息素的更新方式有2種,一是揮發(fā),也就是所有路徑上的信息素以一定的比率進(jìn)行減少,模擬自然蟻群的信息素隨時(shí)間揮發(fā)的過程;二是增強(qiáng),給評(píng)價(jià)值“好”(有螞蟻?zhàn)哌^)的邊增加信息素。 3.螞蟻向下一個(gè)目標(biāo)的運(yùn)動(dòng)是通過一個(gè)隨機(jī)原則來實(shí)現(xiàn)的,也就是運(yùn)用當(dāng)前所在節(jié)點(diǎn)存儲(chǔ)的信息,計(jì)算出下一步可達(dá)節(jié)點(diǎn)的概率,并按此概率實(shí)現(xiàn)一步移動(dòng),逐此往復(fù),越來越接近最優(yōu)解。 4.螞蟻在尋找過程中,或者找到一個(gè)解后,會(huì)評(píng)估該解或解的一部分的優(yōu)化程度,并把評(píng)價(jià)信息保存在相關(guān)連接的信息素中。
3.3 蟻群算法核心步驟
更加我們前面的原理和上述說明,群蟻算法的2個(gè)核心步驟是 路徑構(gòu)建 和 信息素更新。我們將重點(diǎn)對(duì)這2個(gè)步驟進(jìn)行說明。
3.3.1 路徑構(gòu)建
每個(gè)螞蟻都隨機(jī)選擇一個(gè)城市作為其出發(fā)城市,并維護(hù)一個(gè)路徑記憶向量,用來存放該螞蟻依次經(jīng)過的城市。螞蟻在構(gòu)建路徑的每一步中,按照一個(gè)隨機(jī)比例規(guī)則選 擇下一個(gè)要到達(dá)的城市。隨機(jī)概率是按照下列公式來進(jìn)行計(jì)算的:

上述公式就是計(jì)算 當(dāng)前點(diǎn) 到 每一個(gè)可能的下一個(gè)節(jié)點(diǎn) 的概率。分子是 信息素強(qiáng)度 和 能見度 的冪乘積,而分母則是所有 分子的和值。這個(gè)剛開始是很不容易理解的,我們?cè)谧詈髮?shí)例計(jì)算的時(shí)候,可以看得很清楚,再反過來理解公式。注意每次選擇好節(jié)點(diǎn)后,就要從可用節(jié)點(diǎn)中移除選擇的節(jié)點(diǎn)。
3.3.2 信息素更新
信息素更新是群蟻算法的核心。也是整個(gè)算法的核心所在。算法在初始期間有一個(gè)固定的濃度值,在每一次迭代完成之后,所有出去的螞蟻回來后,會(huì)對(duì)所走過的路線進(jìn)行計(jì)算,然后更新相應(yīng)的邊的信息素濃度。很明顯,這個(gè)數(shù)值肯定是和螞蟻所走的長度有關(guān)系的,經(jīng)過一次次的迭代, 近距離的線路的濃度會(huì)很高,從而得到近似最優(yōu)解。那我們看看信息素更新的過程。
初始化信息素濃度C(0),如果太小,算法容易早熟,螞蟻會(huì)很快集中到一條局部最優(yōu)路徑上來,因?yàn)榭梢韵胂?,太小C值,使得和每次揮發(fā)和增強(qiáng)的值都差不多,那么 隨機(jī)情況下,一些小概率的事件發(fā)生就會(huì)增加非最優(yōu)路徑的信息素濃度;如果C太大,信息素對(duì)搜索方向的指導(dǎo)性作用減低,影響算法性能。一般情況下,我們可以使用貪婪算法獲取一個(gè)路徑值Cnn,然后根據(jù)螞蟻個(gè)數(shù)來計(jì)算C(0) = m/Cnn ,m為螞蟻個(gè)數(shù)
每一輪過后,問題空間中的所有路徑上的信息素都會(huì)發(fā)生蒸發(fā),然后,所有的螞蟻根據(jù)自己構(gòu)建的路徑長度在它們本輪經(jīng)過的邊上釋放信息素,公式如下:


信息素更新的作用: 1.信息素?fù)]發(fā)(evaporation)信息素痕跡的揮發(fā)過程是每個(gè)連接上的 信息素痕跡的濃度自動(dòng)逐漸減弱的過程,這個(gè)揮發(fā)過程主要用于避 免算法過快地向局部最優(yōu)區(qū)域集中,有助于搜索區(qū)域的擴(kuò)展。 2.信息素增強(qiáng)(reinforcement)增強(qiáng)過程是蟻群優(yōu)化算法中可選的部 分,稱為離線更新方式(還有在線更新方式)。這種方式可以實(shí)現(xiàn) 由單個(gè)螞蟻無法實(shí)現(xiàn)的集中行動(dòng)?;鞠伻核惴ǖ碾x線更新方式是 在蟻群中的m只螞蟻全部完成n城市的訪問后,統(tǒng)一對(duì)殘留信息進(jìn)行 更新處理。
3.3.3 迭代與停止
迭代停止的條件可以選擇合適的迭代次數(shù)后停止,輸出最優(yōu)路徑,也可以看是否滿足指定最優(yōu)條件,找到滿足的解后停止。最重要的是,我剛開始理解這個(gè)算法的時(shí)候,以為每一只螞蟻?zhàn)咭粭l邊就是一次迭代,其實(shí)是錯(cuò)的。這里算法每一次迭代的意義是:每次迭代的m只螞蟻都完成了自己的路徑過程,回到原點(diǎn)后的整個(gè)過程。
回到目錄
function [R_best,L_best,L_ave,Shortest_Route,Shortest_Length]=pathplan
%%=========================================================================
%% ACATSP.m
%% Ant Colony Algorithm for Traveling Salesman Problem
%%
%%
%% All rights reserved
%%-------------------------------------------------------------------------
%% 主要符號(hào)說明
%% G 地圖,n×n的矩陣
%% NC_max 最大迭代次數(shù)
%% m 螞蟻個(gè)數(shù)
%% Alpha 表征信息素重要程度的參數(shù)
%% Beta 表征啟發(fā)式因子重要程度的參數(shù)
%% Rho 信息素蒸發(fā)系數(shù)
%% Q 信息素增加強(qiáng)度系數(shù)
%% R_best 各代最佳路線
%% L_best 各代最佳路線的長度
%%=========================================================================
m=30;Alpha=1;Beta=6;Rho=0.1;NC_max=50;Q=14;
n=10; ? ? ? ? ? ? ? ?%n表示問題的規(guī)模(n×n個(gè)節(jié)點(diǎn))
G=[0 0 0 1 0 0 0 0 0 1;
? 1 0 1 1 0 0 1 0 0 0;
? 0 0 0 0 0 0 1 0 0 0;
? 0 1 1 1 0 0 1 0 0 0;
? 0 1 1 0 0 0 1 0 1 0;
? 0 0 0 0 0 1 1 0 0 0;
? 0 0 1 1 0 0 0 0 0 1;
? 0 0 0 0 0 0 1 1 0 0;
? 0 1 0 0 0 0 1 0 0 0;
? 0 1 0 0 1 0 0 0 0 0];
obstacle =find(G');
%obstacle
start = 1; ? ? ? ? ? %起點(diǎn)
dest = 100; ? ? ? ? ?%終點(diǎn)
%%第一步:變量初始化
D=caldistmat(n); ? ? %D表示完全圖的賦權(quán)鄰接矩陣,圖中任意兩點(diǎn)的距離
Eta=1./D; ? ? ? ? ? ?%Eta為啟發(fā)因子,這里設(shè)為距離的倒數(shù) ? ?
Tau=ones(n*n,n*n); ? %Tau為信息素矩陣
Tabu=zeros(m,n*n); ? %存儲(chǔ)并記錄路徑的生成
NC=1; ? ? ? ? ? ? ? ?%迭代計(jì)數(shù)器
for iter=1:NC_max
? ?R_best(iter).path=[]; ? ? ? ? %記錄各代最佳路線
end
L_best=inf.*ones(NC_max,1); ? ? ? %記錄各代最佳路線的長度
L_ave=zeros(NC_max,1); ? ? ? ? ? ?%記錄各代路線的平均長度
%%第七步:輸出結(jié)果
? ?Pos=find(L_best==min(L_best))
? ?Shortest_Route = (R_best(Pos(1)).path)';
? ?Shortest_Length = L_best(Pos(1))
? ?%subplot(2,3,i)
? ?subplot(1,2,1)
? ?%DrawMyRoute(Shortest_Route,n);
? ?%DrawRoute(C,Shortest_Route)
? ?DrawMyR(Shortest_Route,n,G);
? ?hold on
subplot(1,2,2)
plot(L_best)
axis([1 NC 13 20]);
hold on
%plot(L_ave)

