Mô hình quyết định Markov đa mục tiêu với chiết khấu và quan sát trạng thái không đầy đủ: tiêu chí theo thứ tự từ điển

Unternehmensforschung - Tập 54 - Trang 439-443 - 2014
Jia Rangcheng1, Ding Yuanyao1, Tang Shaoxiang1
1Department of Management, Ningbo University, Ningbo 315211 P.R. of China (e-mail: [email protected], [email protected]), CN

Tóm tắt

Mô hình quyết định Markov đa mục tiêu với thời gian rời rạc và chiết khấu, có quan sát trạng thái không đầy đủ được trình bày. Vấn đề tối ưu theo thứ tự từ điển được chứng minh là tương đương với vấn đề tối ưu của một mô hình quyết định Markov với một phần thưởng và quan sát trạng thái đầy đủ.

Từ khóa

#mô hình quyết định Markov #đa mục tiêu #chiết khấu #quan sát trạng thái không đầy đủ #tối ưu theo thứ tự từ điển