TA的每日心情 | 难过 8 小时前 |
---|
签到天数: 1337 天 [LV.10]以坛为家III

管理员
  
- 积分
- 5389
|
课程目标
q7 K6 u$ F7 @$ u% R/ c4 c" a, U带领同学们快速掌握机器学习界爆火的强化学习系列并将强化学习与深度学习进行结合,实例演示如何使用DQN网络让AI自己玩游戏!
7 J- P$ W$ W( t' \- a2 _+ f* b( `
适用人群
7 P+ z( X" p, p. n8 ~机器学习,深度学习,人工智能爱好者
8 j" ?9 C( o& q( G
; T3 I7 u3 B1 Y6 d8 s' v( d课程简介
# H2 `4 `0 Y6 C$ m( a4 S5 d: ]9 V强化学习是当下爆火的机器学习经典模型,由于深度学习发展的迅速,使得强化学习和深度学习可以紧密的联系在一起。从AlphaGo到无人驾驶汽车,强化学习的应用越来越广泛也使得更多的学者关注这个领域。) e- r) P! \ n2 `8 D# t
系列课程从实例出发,形象解读强化学习究竟做了一件什么事以及如何完成这一系列任务。由强化学习的基本概念过度到马尔科夫决策过程,通过实例演示如何通过值迭代求解来得出来最好的决策。举例讲解Q-Learning算法的原理以及如何讲强化学习和深度学习进行结合。最后通过让AI自动玩游戏的项目实战实例演示如何实现用强化学习和卷积神经网络打造DQN网络模型。
( s8 Q# X6 K1 ~% z: I6 [% B( Z9 f+ `& l8 l2 s/ D3 \& y
: \! p& p' w9 Q2 |
第1章强化学习基本原理1小时42分钟10节
% s, O8 t6 h" r( ]1-1强化学习简介09:34' Q1 P+ l9 f! p4 l8 |/ V
1-2强化学习基本概念09:55
5 ] f$ h8 ~3 C, A1-3马尔科夫决策过程09:06/ m# P- W. Q5 k" y
1-4Bellman方程12:22
% h9 t( _; {1 s2 Y+ ^1-5值迭代求解08:12/ b+ p6 A. R7 b9 o2 L. A
1-6代码实战求解过程11:145 Z* x" \, K! E+ \9 g, j1 w- E P
1-7QLearning基本原理10:00# S6 i& Z# y2 l- x) A
1-8QLearning迭代计算实例11:076 w4 D, u8 u+ D1 s" J& s
1-9QLearning迭代效果08:597 P' |- Q* |* |. m( p$ |# G: H7 T& z! d
1-10求解流程详解11:42
' \. U( p+ A1 ?, O
9 S( }' l* h, Q# P7 l第2章强化学习项目实战-DQN让AI自己玩游戏1小时38分钟11节1 |9 C b! c( Y- D, V2 V! w+ R
2-1DeepQnetwork原理06:38 J2 Z7 I* Y* G. E4 F4 H
2-2DQN网络细节11:008 v) E9 k9 A) Y2 O. _! J2 {$ y
2-3DQN网络参数配置08:23
) }" D, y" m6 \' \0 d8 g. ^2-4搭建DQN网络模型11:31/ R0 n" t- B/ u
2-5DQN卷积操作定义10:07
, U. b% v# Q) y8 m: N2-6数据预处理11:42
5 g2 z G. B) k2-7实验阶段数据存储08:18" j: c }( P% e- I1 N3 i- k# b
2-8实现训练模块10:50- @/ q% a* q$ F) b
2-9Debug解读训练代码05:05: s- r, T6 h2 R; Z8 o% X
2-10完整代码流程分析11:33* k. ?# h2 b3 A4 @6 J" b" x N
2-11DQN效果演示03:11 | 1 C$ Q$ J2 Y& g, H( f
# l0 N. n }2 @7 y3 z9 Z7 N链接:
0 O3 E# S+ X8 I% y3 d: O
: V' Y9 c6 Z5 W: C' S, E |
|