最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網 會員登陸 & 注冊

北大公開課-人工智能基礎 49 決策理論規(guī)劃

2023-04-02 22:58 作者:朝朝暮暮1895  | 我要投稿


決策規(guī)劃,從初始狀態(tài),經過一系列動作,達到目標狀態(tài)

決策理論規(guī)劃,用最小代價,從初始狀態(tài),到達目標狀態(tài)

最小代價,相當于最大期望效應 MEU (一系列效用函數值最大化的節(jié)點集合)

馬爾可夫模型

離散時間,隨機控制,但是最終動作的結果,僅僅取決于當前狀態(tài)(定向擴散)

經典規(guī)劃的核心要素

環(huán)境確定,狀態(tài)完全可知,求解是找到一個從初始狀態(tài)出發(fā)到達目標狀態(tài)的解


馬爾可夫決策

智能體處于的環(huán)境是隨機的,時間是離散的;求解的目的是找到一個控制其(擴散)的過程

馬爾可夫決策的核心問題不在于找到策略和解,核心問題在于找到效用函數

效用值迭代等式

策略迭代

U效用相當于每一個步驟的相對最大值MEU的集合。




北大公開課-人工智能基礎 49 決策理論規(guī)劃的評論 (共 條)

分享到微博請遵守國家法律
南昌市| 绥芬河市| 莱阳市| 高台县| 肃北| 大邑县| 肥东县| 聊城市| 政和县| 张家港市| 任丘市| 姜堰市| 灵台县| 土默特右旗| 郴州市| 和林格尔县| 盐源县| 河北区| 吴忠市| 庆云县| 通城县| 台北市| 开化县| 三原县| 屏南县| 九龙县| 武强县| 凤庆县| 侯马市| 德格县| 尚志市| 灌阳县| 澳门| 禹州市| 东海县| 昌宁县| 维西| 溧水县| 资溪县| 玉树县| 门源|