深層強化学習において用いられる,状態の「表現学習」の部分に注目したサーベイ.エージェントが観測の系列から自身の状態を推定するモデルの分類から,タスク・評価指標まで幅広くまとめた.なお,この分野では最近UC Berkeley一強の感があり焦る. https://t.co/0LTKiCovBE (@dl_hacks)