5月30日上午,長沙理工大學(xué)計算機與通信工程學(xué)院“計算機類專業(yè)前沿系列名師專題課程”的第七講圓滿舉行。本次講座特別邀請了教育部青年長江學(xué)者、湖南芙蓉學(xué)者青年學(xué)者、湖南省優(yōu)青,湖南大學(xué)劉璇教授。劉璇老師為我們作了題為“強化學(xué)習(xí)基本原理與典型應(yīng)用”的精彩報告。我院師生共200余人參加了此次報告會,活動由計通學(xué)院副院長蔡爍主持。
蔡爍代表學(xué)院熱烈歡迎劉璇老師的到來,并向參會師生介紹了劉璇老師在教學(xué)和科研方面的豐碩成果,以及目前的主要研究方向。
在講座的開篇,劉璇教授首先介紹了什么是強化學(xué)習(xí)。她詳細(xì)解釋了強化學(xué)習(xí)的定義、基本概念和工作機制。強化學(xué)習(xí)是一種機器學(xué)習(xí)方法,通過智能體與環(huán)境的交互,不斷調(diào)整策略,以最大化長期累積獎勵。這種方法在解決復(fù)雜決策問題中顯示出強大潛力。隨后,劉教授深入剖析了強化學(xué)習(xí)的基本原理。她詳細(xì)介紹了強化學(xué)習(xí)的核心要素,包括狀態(tài)、動作、獎勵、策略和價值函數(shù)。通過具體實例和圖示,劉教授生動地講解了推薦系統(tǒng)應(yīng)用的經(jīng)典算法,幫助聽眾理解這些算法如何通過不斷試錯和學(xué)習(xí)優(yōu)化決策策略。接下來,劉教授探討了強化學(xué)習(xí)的廣泛應(yīng)用前景。她列舉了強化學(xué)習(xí)在機器人控制、自動駕駛、智能游戲、金融交易和醫(yī)療診斷等領(lǐng)域的成功案例,展示了強化學(xué)習(xí)在實際應(yīng)用中的巨大潛力。特別是在群智決策領(lǐng)域,強化學(xué)習(xí)為優(yōu)化集體智慧、提升決策效率提供了創(chuàng)新解決方案。最后,劉教授講述了強化學(xué)習(xí)在群智決策中所面臨的挑戰(zhàn)。她指出,群智決策中的多智能體協(xié)同、實時動態(tài)環(huán)境以及數(shù)據(jù)稀缺等問題,給強化學(xué)習(xí)算法的設(shè)計和實現(xiàn)帶來了巨大挑戰(zhàn)。針對這些挑戰(zhàn),劉教授提出了幾種可能的解決方案,并分享了她團隊在這一領(lǐng)域的最新研究進展。
此次講座內(nèi)容豐富、深入淺出,不僅拓寬了與會者對強化學(xué)習(xí)的認(rèn)知,也激發(fā)了他們對這一前沿領(lǐng)域的濃厚興趣。劉璇教授的精彩演講贏得了現(xiàn)場熱烈的掌聲,與會者紛紛表示受益匪淺。
人物介紹:劉璇,教育部青年長江學(xué)者,湖南省芙蓉學(xué)者青年學(xué)者,湖南省優(yōu)青。主要從事人工智能、大數(shù)據(jù)、智能感知等領(lǐng)域研究工作。相關(guān)研究工作發(fā)表于TMC、TPDS、TC、INFOCOM、MOBIHOC、 IJCAI等頂級國際期刊和會議,已發(fā)表/錄用論文70多篇。主持和參與國家重點研發(fā)計劃以及國家自然科學(xué)基金項目多項。擔(dān)任多個國內(nèi)外學(xué)術(shù)會議相關(guān)程序委員和組織委員會委員,以及IEEE/ACMTRANS等多個國際期刊和會議審稿人。
(圖/文:趙陽洋、劉俊 一審:李秋桂 二審:蔡爍 三審:張錦)