Nội dung được dịch bởi AI, chỉ mang tính chất tham khảo
Mô hình quyết định Markov đa mục tiêu với chiết khấu và quan sát trạng thái không đầy đủ: tiêu chí theo thứ tự từ điển
Tóm tắt
Mô hình quyết định Markov đa mục tiêu với thời gian rời rạc và chiết khấu, có quan sát trạng thái không đầy đủ được trình bày. Vấn đề tối ưu theo thứ tự từ điển được chứng minh là tương đương với vấn đề tối ưu của một mô hình quyết định Markov với một phần thưởng và quan sát trạng thái đầy đủ.
