時間:2021年08月05日 分類:技巧指導 次數:
任何專業論文發表,參考文獻都是至關重要的,強化學習論文也是如此,為此學術顧問在這里分享了一些強化學習方面的論文文獻,發表論文人員可作為參考:
面向城市自適應交通信號控制的強化學習方法研究
由于城市交通的迅速發展,城市道路功能增多,密度加大,國外從20世紀60年代便開始了自適應交通信號控制的研究.自適應交通信號控制是緩解城市交通擁擠的很有潛力的方法...
夏新海 - 被引量: 9 - 2013年
來源: 知網
基于強化學習模型的科技用戶學習機制研究
本論文為國家自然科學基金項目“數據庫網站用戶信息搜索中的學習行為研究”(編號:70773054)的一個子課題,核心任務在于通過強化學習模型的擬合實驗研究來挖掘科技文...
賀娟 - 南京理工大學 - 被引量: 3 - 2008年
多智能體強化學習研究
算法的異步變體.然后將其應用到異步強化學習算法中,提出了一種新的名為基于反向Q學習的Sarsa算法和異步粒子群優化算法(APSO-BQSA)的異步強化學習算法.最后,通過實驗驗證了本文提出的異步PSO和APSO-BQSA算法的有效性.該論文有圖19幅,表7個,參考文獻...
杜威 - 被引量: 0 - 2020年
來源: 萬方 / 知網
基于強化學習的倒立擺控制
70年代以來,人們探索不同的學習策略和學習方法,且在本階段已開始把學習系統與各種應用結合起來,并取得很大的成功,促進機器學習的發展.1980年,在美國的卡內基—梅隆...
張慧 - 被引量: 4 - 2004年
樂學與學習目標、強化學習的綜述性研究
本論文以文獻法為主要研究方法,通過對近幾年關于中小學生教學模式研究的相關論文的分析和整理,以提高學生學習動機為出發點,從教學理念、課程設置、教學活動及教學...
齊新悅 - 被引量: 0 - 2018年
大學生使用文獻數據庫中的強化學習行為實驗分析
研究基于人機交互環境下的用戶自己摸索學習檢索知識的行為機理,對于網絡平臺建設的有效性提供理論保障.本文首先分析了強化學習特征,并選擇了強化學習模型中的Bush-...
白晨 , 李丹丹 - 海峽兩岸圖書資訊學學術研討會 - 被引量: 0
來源: 萬方
基于強化學習模型的科技文獻數據庫用戶學習行為研究
將心理學,經濟學中研究的強化學習模型應用于科技用戶對檢索方法學習的行為研究中,介紹兩個經典強化學習模型Bush-Mosteller模型和Brgers-Sarin模型;對科技用戶信...
白晨 , 甘利人 - 《數據分析與知識發現》 - 被引量: 4 - 2009年
來源: 維普網 / 萬方 / 知網 / OALib / manu44.magtech.com...
基于強化學習模型的科技文獻數據庫用戶學習行為研究*
將心理學,經濟學中研究的強化學習模型應用于科技用戶對檢索方法學習的行為研究中,介紹兩個經典強化學習模型Bush-Mosteller模型和Brgers-Sarin 模型;對科技用戶信息...
白晨 , 甘利人 - 《數據分析與知識發現》 - 被引量: 0 - 2009年
基于強化學習的無線網絡自組織性研究
傳統無線通信技術逐漸無法滿足5G通信系統中日益復雜的需求,而無線自組織網絡(self-organizing network,SON)相關技術的引入為5G網絡智能化管理提供了一套擴展性良好...
王超 , 王芷陽 , 沈聰 - 《中國科學技術大學學報》 - 被引量: 0 - 2018年
來源: 愛學術 / 萬方 / 知網 / 維普網 / 掌橋科研
基于樣本優選與演示的深度強化學習
正向強化學習網絡更新的損失函數.Gym與Atari實驗平臺結果表明,與其他經典的強化學習算法相比,由于采用了樣本優選并且利用了演示樣本構建新的回報函數,所提算法在深度強化學習環境中進一步加快了訓練速度,提高了訓練效率.該論文含有圖20幅,表4個,參考文...
向鎬鵬 - 《中國礦業大學》 - 被引量: 0 - 2020年
來源: 知網 / 萬方
強化學習及其應用研究
強化學習作為一種重要的機器學習方法,其最顯著的特點是通過與環境交互,利用環境反饋的獎懲,即增強信號來調整和改善自己的行為,最終獲得最佳策略.由于該方法具有對...
徐明亮 - 江南大學 - 被引量: 10
來源: 愛學術 / 萬方 / 知網 / kns.cnki.net
以上都是強化學習方向可參考的文獻,作者發表論文還需要注意文獻引用格式,或者更多強化學習文獻查詢,以及論文發表知識都可以咨詢在線學術顧問。