北太天元用于算法博弈論(納什均衡-混合策略-線性規(guī)劃)

% 北太天元 解?算法博弈論(algorithm game theory)
% 關(guān)鍵詞: 納什均衡, 囚徒困境,混合策略,線性規(guī)劃
% 問(wèn)題是甲乙二人有不同的選擇,甲可以選擇 alpha_1, alpha_2
% 乙可以選擇 beta_1, beta_2,
% 有一個(gè)矩陣(utility matrix) 給出甲能得到的好處
%?U = [?...
%?5???9???
%?8???6 ]
%?其中U(1,1) = 5 表示 當(dāng)甲 采取策略 alpha1, 而乙采用策略 beta_1 時(shí) 甲的收益
%?其中U(2,1) = 8 表示 當(dāng)甲 采取策略 alpha2, 而乙采用策略 beta_1 時(shí) 甲的收益
%?其中U(1,2) = 9 表示 當(dāng)甲 采取策略 alpha1, 而乙采用策略 beta_2 時(shí) 甲的收益
%?其中U(2,2) = 6 表示 當(dāng)甲 采取策略 alpha2, 而乙采用策略 beta_2 時(shí) 甲的收益
% 最后我們得到的線性規(guī)劃問(wèn)題如下
%min x1+x2
% s.t. 5 x1 + 8 x2 >= 1
% s.t. 9 x1 + 6 x2 >= 1
% x1 , x2 >= 0
load_plugin("optimization");
opts = struct();
opts.Display = 'off';
f = [1, 1];
A = sparse([5, 8; ...
????9, 6]);
rl = [1; 1];
ru = [];
cl = 0;
cu = [];
[x, dr, dc, output] = linprog_hgs(f,?A, rl, ru, cl, cu, opts)
% 甲得到平均收益 (不管乙采用什么策略,甲保證可以平均收益可以大于這個(gè)V)
V = 1/sum(x);
% 甲的混合策略,就是選擇不同策略的概率是 p
p = V*x