趙陽洋-計(jì)算機(jī)與通信工程學(xué)院

計(jì)算機(jī)學(xué)院 School of Computer Science and Technology

后臺(tái)管理
下載學(xué)寶
關(guān)注我們

講師

當(dāng)前位置: 首頁 > 師資隊(duì)伍 > 軟件系 > 講師 > 正文

趙陽洋

發(fā)布時(shí)間: 2023-10-30 14:43:50 瀏覽量:

長沙理工大學(xué)計(jì)算機(jī)學(xué)院研究生導(dǎo)師基本信息表

1、個(gè)人基本信息：

姓名：趙陽洋

性別：女

出生年月：1995.12

技術(shù)職稱：講師

畢業(yè)院校：華南理工大學(xué)

學(xué)歷（學(xué)位）：博士

所在學(xué)科：軟件工程

研究方向：強(qiáng)化學(xué)習(xí)、大模型、人機(jī)交互

2、教育背景：

2017.09----2022.12

華南理工大學(xué)大學(xué)

博士

2021.11----2022.11

Utrecht University

聯(lián)合培養(yǎng)博士

3、 目前研究領(lǐng)域：

強(qiáng)化學(xué)習(xí)、大模型、人機(jī)交互

4、已完成或已在承擔(dān)的主要課題：

1、基于大模型和強(qiáng)化學(xué)習(xí)的任務(wù)驅(qū)動(dòng)-情緒感知型對(duì)話策略研究，湖南省自然科學(xué)基金面上項(xiàng)目青年項(xiàng)目，主持，5萬

2、基于端云融合的網(wǎng)聯(lián)協(xié)同控制關(guān)鍵技術(shù)研究及應(yīng)用，廣東省重點(diǎn)領(lǐng)域研發(fā)計(jì)劃項(xiàng)目，新一代人工智能專項(xiàng)，參與，10000萬

3、面向在線社會(huì)網(wǎng)絡(luò)的信息傳播結(jié)構(gòu)分析與宏觀預(yù)測(cè)，廣東省基礎(chǔ)與應(yīng)用基礎(chǔ)研究基金，面上項(xiàng)目，參與，10萬元

4、基于大數(shù)據(jù)分析的移動(dòng)音樂智能搜索與推薦平臺(tái)，廣州市科技計(jì)劃項(xiàng)目，廣州市產(chǎn)業(yè)技術(shù)重大攻關(guān)計(jì)劃-現(xiàn)代產(chǎn)業(yè)技術(shù)專題項(xiàng)目，參與，1400萬元

5、面向移動(dòng)互聯(lián)網(wǎng)用戶大數(shù)據(jù)分析及推薦平臺(tái)的產(chǎn)業(yè)化應(yīng)用，廣東省應(yīng)用型科技研發(fā)專項(xiàng)資金項(xiàng)目重點(diǎn)項(xiàng)目，參與，400萬元

5、已出版的主要著作：

\

6、已發(fā)表的學(xué)術(shù)論文：

[1] Yangyang Zhao, Jinchuan Long*, Mehdi Dastani, Shihan Wang. Rescue Conversations from Dead-ends: Efficient Exploration for Task-oriented Dialogue Policy

Optimization. Transactions of the Association for Computational Linguistics, 2024. (TACL，一區(qū)TOP期刊)

[2] Yangyang Zhao, Hua Qin, Zhenyu Wang, Mehdi Dastani*, Shihan Wang*. Decomposed Deep-Q Network for Efficient Dialogue Policy Learning. IEEE Trans. Audio, Speech, and Lang. Process. (TASLP，一區(qū)TOP期刊)

[3]Yangyang Zhao, Ben Niu, Mehdi Dastani*, Shihan Wang*. Bootstrapped Policy Learning for Task-oriented Dialogue through Goal Shaping. EMNLP 2024. (CCF-B)

[4] Yangyang Zhao, Mehdi Dastani*, Shihan Wang*. Bootstrapped Policy Learning: Goal Shaping for Efficient Task-oriented Dialogue Policy Learning. AAMAS 2024. (CCF-B)

[5] Yangyang Zhao, Zhenyu Wang*, Zhenhua Huang. Automatic Curriculum Learning With Over-repetition Penalty for Dialogue Policy Learning. AAAI 2021. (CCF-A)

[6] Yangyang Zhao, Zhenyu Wang*, Kai Yin, Rui Zhang, Zhenhua Huang, Pei Wang. Dynamic Reward-based Dueling Deep Dyna-Q: Robust Policy Learning in Noisy Environments. AAAI 2020.oral (CCF-A)

[7] Yangyang Zhao, Zhenyu Wang *, Changxi Zhu, Shihan Wang. Complementary Policy Learning from Episodic Memory Policy and DQN Policy. EMNLP 2021. (CCF-B)

[8] Yangyang Zhao, Hua Qin, Zhenyu Wang*, Changxi Zhu, Shihan Wang*. A Versatile Adaptive Curriculum Learning Framework for Task-oriented Dialogue Policy Learning. NAACL 2022. (CCF-B)

[9] 趙陽洋，王振宇*，王佩，楊添，張睿，尹凱. 任務(wù)型對(duì)話系統(tǒng)研究綜述. 計(jì)算機(jī)學(xué)報(bào), 2020, 43(10): 1862-1896. (CCF-T1)

7、 所獲學(xué)術(shù)榮譽(yù)及學(xué)術(shù)影響：

指導(dǎo)研究生學(xué)生獲獎(jiǎng)情況：
“華為杯”中國研究生人工智能創(chuàng)新大賽（2024）（全國二等獎(jiǎng)）

湖南省研究生計(jì)算機(jī)創(chuàng)新大賽（2024）（湖南省一等獎(jiǎng)，優(yōu)秀指導(dǎo)老師）

指導(dǎo)本科生獲獎(jiǎng)情況：

中國大學(xué)生服務(wù)外包創(chuàng)新大賽（2024）（全國二等獎(jiǎng)）

中國機(jī)器人及人工智能大賽（2024）（全國二等獎(jiǎng)）

藍(lán)橋杯數(shù)字科技創(chuàng)新賽（2024）（全國三等獎(jiǎng)）

中國大學(xué)生計(jì)算機(jī)設(shè)計(jì)大賽（2024）（中南賽區(qū)一等獎(jiǎng)）

海峽兩岸暨港澳地區(qū)大學(xué)生計(jì)算機(jī)創(chuàng)新作品賽（2024）（湖南省三等獎(jiǎng)）

學(xué)術(shù)兼職：
中文信息學(xué)會(huì)，計(jì)算機(jī)學(xué)會(huì)會(huì)員

ACL, EMNLP, NAACL, COLING, AAAI，IJCAI等人工智能及自然語言處理領(lǐng)域頂級(jí)會(huì)議審稿人

上一篇：乃科

下一篇：徐聰

黄色在线网站wwwwww,亚洲一区免费观看,疯狂丑小鸭2,特黄毛片官网免费看