2024年11月8日下午,永利集團(tuán)3044am官方入口劉佳敏博士和常續(xù)陽副教授于理化樓404,作題為“Kernel-Based Decentralized Policy Evaluation for Reinforcement Learning”和“Brightness and Contrast Corrections for Space-Time Stereocorrelation via Proper Generalized Decomposition”的學(xué)術(shù)報(bào)告。該報(bào)告為“德賢數(shù)理”青年人才學(xué)術(shù)沙龍第三十二期,永利集團(tuán)官網(wǎng)多位師生參加了本次沙龍,本次沙龍由統(tǒng)計(jì)系主任劉秀芹和應(yīng)用力學(xué)系黨支部書記許鵬主持。
劉佳敏博士和常續(xù)陽副教授先后作學(xué)術(shù)報(bào)告分享。劉佳敏博士首先介紹了多智能體強(qiáng)化學(xué)習(xí)問題,對強(qiáng)化學(xué)習(xí)問題中的時間差分算法及存在的問題進(jìn)行了闡述。隨后,她討論了非參數(shù)框架下多智能體強(qiáng)化學(xué)習(xí)和去中心化分布式學(xué)習(xí)的聯(lián)系,重點(diǎn)講解了用于價(jià)值函數(shù)估計(jì)的多階段梯度下降算法及其收斂性,并通過數(shù)值模擬結(jié)果比較了新算法和傳統(tǒng)時間差分算法的估計(jì)誤差。最后劉佳敏博士展望了未來將算法推廣到狀態(tài)價(jià)值函數(shù)等其他強(qiáng)化學(xué)習(xí)問題的可能性。
常續(xù)陽副教授在報(bào)告開始引入了廣義本征正交分解表征PVB夾層玻璃的低速撞擊試驗(yàn),介紹了PVB夾層玻璃的特性,強(qiáng)調(diào)了表征其力學(xué)本構(gòu)模型的研究意義。隨后他從三個部分展開,具體講述了如何構(gòu)建三維表面數(shù)字圖像相關(guān)法、如何進(jìn)行全局亮度與對比度矯正、以及如何在時空有限元計(jì)算的框架內(nèi),通過廣義本征正交分解的方法,同時表征多物理場的時空變化。最后,常續(xù)陽副教授介紹了表征PVB夾層玻璃力學(xué)的研究進(jìn)展和使用三維表面數(shù)字圖像相關(guān)法進(jìn)行實(shí)驗(yàn)表征的優(yōu)勢。
交流環(huán)節(jié)中,劉佳敏博士和常續(xù)陽副教授與在座師生圍繞算法收斂性、誤差界和如何進(jìn)行PVB夾層玻璃的力學(xué)本構(gòu)關(guān)系進(jìn)行建模等問題進(jìn)行了詳細(xì)探討,學(xué)術(shù)沙龍最終在熱烈的掌聲中圓滿結(jié)束。
“德賢數(shù)理”青年人才學(xué)術(shù)沙龍?jiān)诒緦W(xué)期將持續(xù)開展,邀請各學(xué)科領(lǐng)域優(yōu)秀青年教師分享學(xué)術(shù)前沿問題及學(xué)術(shù)成長發(fā)展道路。
第三十三期學(xué)術(shù)沙龍將于11月11日(星期一)上午10:30在理化樓404舉行,主講人閆弘軒博士,歡迎各位老師和同學(xué)屆時參加。
關(guān)注微信
管理登錄