时间:2021年08月05日 分类:技术指导 次数:
任何专业论文发表,参考文献都是至关重要的,强化学习论文也是如此,为此学术顾问在这里分享了一些强化学习方面的论文文献,发表论文人员可作为参考:
面向城市自适应交通信号控制的强化学习方法研究
由于城市交通的迅速发展,城市道路功能增多,密度加大,国外从20世纪60年代便开始了自适应交通信号控制的研究.自适应交通信号控制是缓解城市交通拥挤的很有潜力的方法...
夏新海 - 被引量: 9 - 2013年
来源: 知网
基于强化学习模型的科技用户学习机制研究
本论文为国家自然科学基金项目“数据库网站用户信息搜索中的学习行为研究”(编号:70773054)的一个子课题,核心任务在于通过强化学习模型的拟合实验研究来挖掘科技文...
贺娟 - 南京理工大学 - 被引量: 3 - 2008年
多智能体强化学习研究
算法的异步变体.然后将其应用到异步强化学习算法中,提出了一种新的名为基于反向Q学习的Sarsa算法和异步粒子群优化算法(APSO-BQSA)的异步强化学习算法.最后,通过实验验证了本文提出的异步PSO和APSO-BQSA算法的有效性.该论文有图19幅,表7个,参考文献...
杜威 - 被引量: 0 - 2020年
来源: 万方 / 知网
基于强化学习的倒立摆控制
70年代以来,人们探索不同的学习策略和学习方法,且在本阶段已开始把学习系统与各种应用结合起来,并取得很大的成功,促进机器学习的发展.1980年,在美国的卡内基—梅隆...
张慧 - 被引量: 4 - 2004年
乐学与学习目标、强化学习的综述性研究
本论文以文献法为主要研究方法,通过对近几年关于中小学生教学模式研究的相关论文的分析和整理,以提高学生学习动机为出发点,从教学理念、课程设置、教学活动及教学...
齐新悦 - 被引量: 0 - 2018年
大学生使用文献数据库中的强化学习行为实验分析
研究基于人机交互环境下的用户自己摸索学习检索知识的行为机理,对于网络平台建设的有效性提供理论保障.本文首先分析了强化学习特征,并选择了强化学习模型中的Bush-...
白晨 , 李丹丹 - 海峡两岸图书资讯学学术研讨会 - 被引量: 0
来源: 万方
基于强化学习模型的科技文献数据库用户学习行为研究
将心理学,经济学中研究的强化学习模型应用于科技用户对检索方法学习的行为研究中,介绍两个经典强化学习模型Bush-Mosteller模型和Brgers-Sarin模型;对科技用户信...
白晨 , 甘利人 - 《数据分析与知识发现》 - 被引量: 4 - 2009年
来源: 维普网 / 万方 / 知网 / OALib / manu44.magtech.com...
基于强化学习模型的科技文献数据库用户学习行为研究*
将心理学,经济学中研究的强化学习模型应用于科技用户对检索方法学习的行为研究中,介绍两个经典强化学习模型Bush-Mosteller模型和Brgers-Sarin 模型;对科技用户信息...
白晨 , 甘利人 - 《数据分析与知识发现》 - 被引量: 0 - 2009年
基于强化学习的无线网络自组织性研究
传统无线通信技术逐渐无法满足5G通信系统中日益复杂的需求,而无线自组织网络(self-organizing network,SON)相关技术的引入为5G网络智能化管理提供了一套扩展性良好...
王超 , 王芷阳 , 沈聪 - 《中国科学技术大学学报》 - 被引量: 0 - 2018年
来源: 爱学术 / 万方 / 知网 / 维普网 / 掌桥科研
基于样本优选与演示的深度强化学习
正向强化学习网络更新的损失函数.Gym与Atari实验平台结果表明,与其他经典的强化学习算法相比,由于采用了样本优选并且利用了演示样本构建新的回报函数,所提算法在深度强化学习环境中进一步加快了训练速度,提高了训练效率.该论文含有图20幅,表4个,参考文...
向镐鹏 - 《中国矿业大学》 - 被引量: 0 - 2020年
来源: 知网 / 万方
强化学习及其应用研究
强化学习作为一种重要的机器学习方法,其最显著的特点是通过与环境交互,利用环境反馈的奖惩,即增强信号来调整和改善自己的行为,最终获得最佳策略.由于该方法具有对...
徐明亮 - 江南大学 - 被引量: 10
来源: 爱学术 / 万方 / 知网 / kns.cnki.net
以上都是强化学习方向可参考的文献,作者发表论文还需要注意文献引用格式,或者更多强化学习文献查询,以及论文发表知识都可以咨询在线学术顾问。