追逃微分博弈的最优解

本文分析1965年的论文,微分博弈和追逃策略最优解Differential Game and Optimal Pursuit-Evasion Strategies

微分博弈问题的表示

求解下面式子的鞍点

$J=\phi(x(T),T)+ \int_{t_0}^T L(x,u,v,t)\,dt$,在约束条件为$\dot x=f(x,u,v,t); x(t_0)=x_0$

$J$是回报函数,$x$是博弈中的状态表示(向量),$u$和$v$是分段连续的向量函数,即策略,这二者受限于在特定的问题中可选的不同策略。

满足以下关系的对($u^0,v^0$)定义为鞍点:对$\forall u \in U,v \in V$,有$J(u^0,v) \leq J(u^0,v^0) \leq J(u,v^0)$。如果能够满足,那么就成$称^0$和$v^0$为最优纯策略,$J(u^0,v^0)=W(x_0,t_0)$为对弈价值.

微分博弈问题和最优控制问题的相似之处就很明显了,只需要辨别带有反馈控制的策略,且对弈价值满足:

$W(x_0,t_0)=MinMax{J}^2$

实际上,微分博弈是一类双边最优控制问题(或者说,最优控制问题是一种特殊的微分博弈问题)

追逃问题最优解

追逃博弈状态表示

追捕者和逃跑者的运动学方程如下:

$$\dot r_p=v_p, \dot v_p=f_p+a_p$$
$$\dot r_e=v_e, \dot v_e=f_e+a_e$$

其中,$r,v$是位置和速度矢量,$f$是施加的外力,$a$是控制量的累积,只考虑最小化$r_p(t)-r_e(t)$,对下式:

$$J=\frac{a^2}{2}[r_p(T)-r_e(T)][r_p(T)r_e(T)]+\frac{1}{2} \int_{0}^T [\frac {a_p \cdot a_p}{c_p} \frac{a_e \cdot a_e}{c_e}]\,dt$$

上式子中$c_p$和$c_e$表示追捕者和逃跑者的能量

Thank you for every coin~