ゲーム理論に基づく長期間持続可能な資源選択方式

個々のユーザの合理的な意思決定に基づく結果は必ずしもシステム全体の最適化とはならない場合があります.これは,個々のユーザの目的関数とシステムが目指す目的関数にギャップが存在するからです. 例えば,道路網において,各ユーザがカーナビなどを利用して早く目的地に行こうとした結果,ユーザ自身は交通情報に基づく最適な行動を取ったのにも関わらずユーザが集中する道路が混雑し,想定よりも目的地につく時間が遅くなる現象が挙げられます. このような状況において,ユーザの集中を避けるように交通情報をカーナビに提供することで渋滞緩和が実現できます. このような考えのもとで,本研究では,個々のユーザが知覚する情報を制御することで,全体の最適化を図る利己的最適誘導制御方式の確立を目指します. また,長期間持続可能なシステムを実現するためには,ユーザ間の公平性を担保しなければなりません.一方で,ユーザは,長期間な目線で自身の利得の最大化を目指すことが合理的な判断となります.このとき,ユーザが占有する資源は他のユーザにも影響を及ぼすことから,ユーザの利得を最大化しながら,ユーザ間の公平性を担保するようなインセンティブ設計が必要となります.そこで,本研究では,ネットワーク資源の選択問題を繰返し確率ゲームとして定式化するとともに,両者の制約を満たすようなインセンティブ設計をモデル化します.更に,リアプノフ最適化アルゴリズムなどの最適化手法を利用した解法を提案し,ネットワーク資源の選択方式の特性を分析します.

原 崇徳
原 崇徳
准教授