加载头像
cs234-4: SARSA、Q-learning、On policy 和off policy简单理解
cs234-3:蒙特卡洛、TD-learning
cs234-2: 马尔科夫奖励过程、Policy improvement
cs234-11: Fast Reinforcement Learning I
刷新cdn
Log-Barrier-method
主动增强学习 Active Reinforcement Learning
Learning from examples
前向网络和反向传播 feedforward and back-propagation
被动增强学习 Passive reinforcement learning
博客快捷键
shift K
关闭快捷键功能
shift A
打开/关闭中控台
shift M
播放/暂停音乐
shift D
深色/浅色显示模式
shift S
站内搜索
shift R
随机访问
shift H
返回首页
shift F
友链鱼塘
shift L
友链页面
shift P
关于本站
shift I
原版/本站右键菜单
引用到评论
随便逛逛博客分类文章标签
复制地址关闭热评深色模式轉為繁體