Tín hiệu Phần thưởng Dự đoán của Các Nơron Dopamine
Tóm tắt
Schultz, Wolfram. Tín hiệu phần thưởng dự đoán của các nơron dopamine. J. Neurophysiol. 80: 1–27, 1998. Các tác động của tổn thương, chặn thụ thể, tự kích thích điện, và các loại thuốc gây nghiện cho thấy rằng các hệ thống dopamine ở giữa não có liên quan đến việc xử lý thông tin phần thưởng và học hỏi hành vi tiếp cận. Hầu hết các nơron dopamine thể hiện sự kích hoạt pha sau các phần thưởng chất lỏng và thực phẩm cơ bản và các kích thích thị giác và thính giác đã được điều kiện hóa, dự đoán phần thưởng. Chúng thể hiện các phản ứng kích hoạt-ức chế hai pha sau các kích thích giống các kích thích dự đoán phần thưởng hoặc là mới lạ hoặc đặc biệt nổi bật. Tuy nhiên, chỉ có một vài sự kích hoạt pha theo sau các kích thích khó chịu. Do đó, các nơron dopamine gán nhãn các kích thích môi trường với giá trị hấp dẫn, dự đoán và phát hiện các phần thưởng và đưa ra tín hiệu cảnh báo và động lực cho các sự kiện. Bằng cách không phân biệt giữa các phần thưởng khác nhau, các nơron dopamine dường như phát đi một thông điệp cảnh báo về sự hiện diện hoặc vắng mặt đầy bất ngờ của các phần thưởng. Tất cả các phản ứng đối với phần thưởng và kích thích dự đoán phần thưởng phụ thuộc vào độ dự đoán của sự kiện. Các nơron dopamine được kích hoạt bởi các sự kiện thưởng tốt hơn dự đoán, giữ nguyên không bị ảnh hưởng bởi các sự kiện tốt như dự đoán, và bị ức chế bởi các sự kiện tồi hơn dự đoán. Bằng cách tín hiệu phần thưởng theo lỗi dự đoán, các phản ứng dopamine có các đặc điểm hình thức của một tín hiệu giảng dạy mà các lý thuyết học củng cố đã giả định. Các phản ứng dopamine chuyển giao trong suốt quá trình học từ các phần thưởng cơ bản sang các kích thích dự đoán phần thưởng. Điều này có thể góp phần vào các cơ chế neuron dưới đây tác động ngược của các phần thưởng, một trong những câu đố chính trong việc học củng cố. Phản ứng xung phát ra một xung dopamine ngắn lên nhiều nhánh, do đó phát sóng một tín hiệu củng cố khá toàn cầu đến các nơron hậu synap. Tín hiệu này có thể cải thiện hành vi tiếp cận bằng cách cung cấp thông tin phần thưởng trước khi hành vi xảy ra và có thể góp phần vào việc học bằng cách thay đổi truyền dẫn synap. Tín hiệu phần thưởng dopamine được bổ sung bởi hoạt động trong các nơron ở striatum, vỏ não trán, và amygdala, những vùng xử lý thông tin phần thưởng cụ thể nhưng không đưa ra tín hiệu lỗi dự đoán phần thưởng toàn cầu. Sự hợp tác giữa các tín hiệu phần thưởng khác nhau có thể đảm bảo việc sử dụng các phần thưởng cụ thể để củng cố một cách chọn lọc các hành vi. Giữa các hệ thống chiếu sáng khác, các nơron noradrenaline chủ yếu phục vụ cho các cơ chế chú ý và các nơron hạt nhân basalis mã hóa phần thưởng một cách dị biệt. Các sợi leo trong tiểu não tín hiệu lỗi trong hiệu suất motor hoặc lỗi trong việc dự đoán các sự kiện khó chịu đến các tế bào Purkinje của tiểu não. Hầu hết các khiếm khuyết sau khi tổn thương làm giảm dopamine khó có thể giải thích dễ dàng bằng một tín hiệu phần thưởng thiếu sót nhưng có thể phản ánh sự thiếu vắng của một chức năng cho phép chung của mức dopamine ngoại bào tĩnh. Do đó, các hệ thống dopamine có thể có hai chức năng, truyền tải pha thông tin phần thưởng và cho phép tĩnh cho các nơron hậu synap.
Từ khóa
Tài liệu tham khảo
Contreras-Vidal J. L., 1996, Soc. Neurosci. Abstr., 22, 2029
Hollerman J. R., 1996, Soc. Neurosci. Abstr., 22, 1388
Hollerman J. R., 1994, Soc. Neurosci. Abstr., 20, 780
Linden A., 1990, J. Psychophysiol., 4, 145
Salamone J. D., 1987, Handbook of Psychopharmacology, 19, 576
Stein L., 1964, Federation Proc., 23, 836
Suri R. E., 1996, Soc. Neurosci. Abstr., 22, 1389
Tremblay L., 1995, Soc. Neurosci. Abstr., 21, 952