關(guān)鍵詞:強(qiáng)化學(xué)習(xí) 水下滑翔蛇形機(jī)器人 馬爾可夫決策過(guò)程 循環(huán)神經(jīng)網(wǎng)絡(luò)
摘要:研究了一種強(qiáng)化學(xué)習(xí)算法,用于水下滑翔蛇形機(jī)器人的滑翔運(yùn)動(dòng)控制.針對(duì)水動(dòng)力環(huán)境難以建模的問(wèn)題,使用強(qiáng)化學(xué)習(xí)方法使水下滑翔蛇形機(jī)器人自適應(yīng)復(fù)雜的水環(huán)境,并自動(dòng)學(xué)習(xí)僅通過(guò)調(diào)節(jié)浮力來(lái)控制滑翔運(yùn)動(dòng).對(duì)此,提出了循環(huán)神經(jīng)網(wǎng)絡(luò)蒙特卡洛策略梯度算法,改善了由于機(jī)器人的狀態(tài)難以完全觀測(cè)而導(dǎo)致的算法難以訓(xùn)練的問(wèn)題,并將水下滑翔蛇形機(jī)器人的基本滑翔動(dòng)作控制問(wèn)題近似為馬爾可夫決策過(guò)程,從而得到有效的滑翔控制策略.通過(guò)仿真和實(shí)驗(yàn)證明了所提出方法的有效性.
機(jī)器人雜志要求:
{1}參考文獻(xiàn)必須在文中用[數(shù)字]標(biāo)出對(duì)應(yīng)標(biāo)號(hào),參考文獻(xiàn)統(tǒng)一列在文后。
{2}著作類:作者(譯者)姓名、書(shū)名、出版地、出版社名稱、出版年份、頁(yè)碼(直接引文時(shí)標(biāo)明)。論文類:作者姓名、文章名、所載報(bào)刊名稱、年份、期號(hào)、頁(yè)碼。
{3}如一旦發(fā)現(xiàn)一稿兩用,本刊將刊登該文系重復(fù)發(fā)表的聲明,并在3年內(nèi)拒絕以該文第一作者和通訊作者的任何來(lái)稿。
{4}論文題目應(yīng)當(dāng)簡(jiǎn)潔明了,反映論文的主旨。論文題目應(yīng)便于讀者檢索、轉(zhuǎn)抄和引用,中文題名不宜超過(guò)20個(gè)字;外文題名不超過(guò)10個(gè)實(shí)詞。不宜采用抒情意味、反問(wèn)意味的主標(biāo)題和副標(biāo)題。
{5}任何來(lái)稿視為作者、譯者已經(jīng)閱讀或知悉并同意本須知約定。
注:因版權(quán)方要求,不能公開(kāi)全文,如需全文,請(qǐng)咨詢雜志社