前期テキストは書き込みもなく、きれいです。Deep Reinforcement Learning Hands-On: Apply modern RL methods, with deep Q-networks, value iteration, policy gradients, TRPO, AlphaGo Zero and more。 駿台テキスト 英語構文HA 前期・後期|Yahoo!フリマ(旧PayPay 後期テキストは、本文中に出てくる単語の意味や、選択問題の解答のメモなどの書き込みがあります。相愛高等学校 2022年度受験用 赤本 187 (高校別入試対策シリーズ)。