北大公開課-人工智能基礎(chǔ) 30 對(duì)抗性搜索之博弈中的最優(yōu)決策


假設(shè)有max和min兩個(gè)玩家,各自需要找出在限定展示下的對(duì)于自己的最優(yōu)決策——兩個(gè)玩家的對(duì)抗性搜索(博弈)

兩個(gè)玩家的目標(biāo)一致,使自己的收益最大化 V,使對(duì)方的收益最小化 -V

馮諾伊曼式博弈理論(算法有馮諾伊曼式的,也有非馮諾伊曼式的)

兩個(gè)智能體的博弈(互相action),形成一棵決策樹
本質(zhì)上最優(yōu)決策是由一系列minimax的值來串接起來的,
在最優(yōu)決策路線上,每一個(gè)節(jié)點(diǎn)的值,都是使自己的價(jià)值V最大化,使對(duì)方的價(jià)值最小化 -V

標(biāo)簽: