計算機類專業(yè)前沿系列名師專題課程 第七講——強化學習基本原理與典型應用
發(fā)布時間: 2024-06-03 10:23:17 瀏覽量:
5月30日上午,長沙理工大學計算機與通信工程學院“計算機類專業(yè)前沿系列名師專題課程”的第七講圓滿舉行。本次講座特別邀請了教育部青年長江學者、湖南芙蓉學者青年學者、湖南省優(yōu)青,湖南大學劉璇教授。劉璇老師為我們作了題為“強化學習基本原理與典型應用”的精彩報告。我院師生共200余人參加了此次報告會,活動由計通學院副院長蔡爍主持。
蔡爍代表學院熱烈歡迎劉璇老師的到來,并向參會師生介紹了劉璇老師在教學和科研方面的豐碩成果,以及目前的主要研究方向。
在講座的開篇,劉璇教授首先介紹了什么是強化學習。她詳細解釋了強化學習的定義、基本概念和工作機制。強化學習是一種機器學習方法,通過智能體與環(huán)境的交互,不斷調整策略,以最大化長期累積獎勵。這種方法在解決復雜決策問題中顯示出強大潛力。隨后,劉教授深入剖析了強化學習的基本原理。她詳細介紹了強化學習的核心要素,包括狀態(tài)、動作、獎勵、策略和價值函數(shù)。通過具體實例和圖示,劉教授生動地講解了推薦系統(tǒng)應用的經(jīng)典算法,幫助聽眾理解這些算法如何通過不斷試錯和學習優(yōu)化決策策略。接下來,劉教授探討了強化學習的廣泛應用前景。她列舉了強化學習在機器人控制、自動駕駛、智能游戲、金融交易和醫(yī)療診斷等領域的成功案例,展示了強化學習在實際應用中的巨大潛力。特別是在群智決策領域,強化學習為優(yōu)化集體智慧、提升決策效率提供了創(chuàng)新解決方案。最后,劉教授講述了強化學習在群智決策中所面臨的挑戰(zhàn)。她指出,群智決策中的多智能體協(xié)同、實時動態(tài)環(huán)境以及數(shù)據(jù)稀缺等問題,給強化學習算法的設計和實現(xiàn)帶來了巨大挑戰(zhàn)。針對這些挑戰(zhàn),劉教授提出了幾種可能的解決方案,并分享了她團隊在這一領域的最新研究進展。
此次講座內容豐富、深入淺出,不僅拓寬了與會者對強化學習的認知,也激發(fā)了他們對這一前沿領域的濃厚興趣。劉璇教授的精彩演講贏得了現(xiàn)場熱烈的掌聲,與會者紛紛表示受益匪淺。
人物介紹:劉璇,教育部青年長江學者,湖南省芙蓉學者青年學者,湖南省優(yōu)青。主要從事人工智能、大數(shù)據(jù)、智能感知等領域研究工作。相關研究工作發(fā)表于TMC、TPDS、TC、INFOCOM、MOBIHOC、 IJCAI等頂級國際期刊和會議,已發(fā)表/錄用論文70多篇。主持和參與國家重點研發(fā)計劃以及國家自然科學基金項目多項。擔任多個國內外學術會議相關程序委員和組織委員會委員,以及IEEE/ACMTRANS等多個國際期刊和會議審稿人。
(圖/文:趙陽洋、劉俊 一審:李秋桂 二審:蔡爍 三審:張錦)