北大公開課-人工智能基礎(chǔ) 29 對抗性搜索之博弈





game 博弈

搜索和對抗性博弈的區(qū)別
(博弈不一定是對抗性的,也可以是合作或者互相無關(guān)的多個智能體同時的行動)
對抗性博弈一定是多個智能體的,而搜索本質(zhì)上是單個智能體的。

對抗性搜索,一般就成為博弈
交互式?jīng)Q策理論


零和博弈,非零和博弈的區(qū)別

經(jīng)典博弈應用——囚徒困境


博弈的四象限
完全可觀測/不完全觀測
確定性/隨機性


用評價函數(shù),確定當前搜索策略/博弈策略/決策的優(yōu)劣



形式化地將博弈問題,定義為搜索問題(當然,博弈的本質(zhì)就是對抗性搜索)
核心是一個評價函數(shù) U(s,p),用這個評價函數(shù),來量化評估當前決策的優(yōu)劣


標簽: