Khả năng phân bổ tính toán phi tập trung cho điện toán biên di động đa người dùng: một phương pháp học tăng cường sâu
Tóm tắt
Điện toán biên di động (MEC) mới đây nổi lên như một giải pháp đầy hứa hẹn nhằm giảm bớt gánh nặng cho các thiết bị di động có tài nguyên hạn chế khỏi các tác vụ yêu cầu tính toán nặng, cho phép các thiết bị gửi tải công việc đến các máy chủ MEC gần đó và cải thiện chất lượng trải nghiệm tính toán. Trong bài báo này, một hệ thống MEC hỗ trợ nhiều người dùng với đầu vào và đầu ra đa điểm (MIMO) với các kênh vô tuyến ngẫu nhiên và sự xuất hiện của tác vụ được xem xét. Để tối thiểu hóa chi phí tính toán trung bình lâu dài về mức tiêu thụ năng lượng và độ trễ bộ đệm ở mỗi người dùng, một chiến lược phân bổ tính toán động dựa trên học tăng cường sâu (DRL) được điều tra nhằm xây dựng một hệ thống có thể mở rộng với phản hồi hạn chế. Cụ thể, một phương pháp DRL dựa trên không gian hành động liên tục có tên là độ dốc chính sách xác định sâu (DDPG) được áp dụng để học các chính sách phân bổ tính toán phân tán tại mỗi người dùng tương ứng, trong đó năng lượng thực hiện cục bộ và tải công việc sẽ được phân bổ thích ứng theo quan sát địa phương của mỗi người dùng. Kết quả số cho thấy chiến lược dựa trên DDPG đề xuất có thể giúp mỗi người dùng học được một chính sách phân bổ động hiệu quả và cũng xác nhận tính ưu việt của khả năng phân bổ năng lượng liên tục của nó so với các chính sách được học bởi các phương pháp học tăng cường truyền thống dựa trên không gian hành động rời rạc như mạng Q sâu (DQN) cũng như một số chiến lược tham lam khác với chi phí tính toán giảm. Bên cạnh đó, sự trao đổi giữa năng lượng và độ trễ cho việc phân bổ tính toán cũng được phân tích cho cả các chiến lược dựa trên DDPG và DQN.
Từ khóa
Tài liệu tham khảo
