【
儀表網 研發快訊】近日,中國科學院合肥物質科學研究院健康所李海研究員團隊在決策元控制的計算建模研究中取得關鍵性進展。相關研究成果發表在認知神經科學的專業期刊Journal of Cognitive Neuroscience (JoCN) 上。
在日常生活中,人們經常需要完成一系列決策以實現最終目標。例如,在選擇餐廳時,我們首先決定目的地和路線,而就餐后的體驗會影響我們對餐廳的喜愛程度,進而決定下一次的選擇偏好。然而,個體在進行此類序貫決策時表現出顯著差異:有些人傾向于依賴習慣,選擇熟悉的選項;而另一些人則更靈活,會根據當前信息和目標動態調整選擇;更多的人則介于兩者之間。那么,習慣性和計劃性在序貫決策行為中的比重是如何決定的?這一問題是認知神經科學領域中的關鍵挑戰之一,即決策元控制中的仲裁機制。
通過行為實驗和計算建模的方法,該研究揭示了:個體決策中習慣性策略(無模型強化學習,model-free reinforcement learning)與目的性策略(基于模型的強化學習,model-based reinforcement learning)的權重由可用的工作記憶資源決定。研究團隊提出了一種新型混合強化學習模型(Hybrid-WM reinforcement learning model),將工作記憶資源的有限性納入決策機制的計算框架中。相較于傳統強化學習模型,該模型不僅能夠成功模擬任務負荷和延遲時間對決策行為的經典影響,還能更精準地擬合實驗數據。此外,該模型在獨立驗證數據集上的表現進一步支持其廣泛適用性。
本研究量化了工作記憶資源有限性在決策元控制中的核心作用及計算機制,為理解序貫決策行為提供了全新視角。這一發現不僅對認知科學基礎研究具有重要意義,還為人機交互領域的創新應用帶來啟發。此外,提出的混合強化學習模型為計算精神病學提供了新工具,有助于深入解析認知障礙、精神障礙及神經疾病患者在元控制機制中的缺陷,進而為制定更精準的診斷和干預策略提供理論依據。
該論文的第一作者為健康所碩士研究生左肇煜,通訊作者是李海研究員和楊立狀副研究員。本研究得到了國家自然科學基金、安徽省自然科學基金的支持。
計算機制原理圖
所有評論僅代表網友意見,與本站立場無關。