题主如果只关注深度强化学习(DRL)的话,可以尝试学习和使用一个基于Tensorflow的深度强化学习工具库-Tensorforce。
这个库基本上把目前深度强化学习领域的经典和实用算法都集成了,比如DQN,Double-DQN,Vanilla Policy Gradients等。而且对于强化学习的训练和应用来说,Tensorforce也集成了当前比较有名的强化学习环境,比如OpenAI的Gym API和Universe,DeepMind的lab等,可以快速便捷的创造强化学习所需要的环境、智能体(agents),以及根据场景构造action和rewards等。能够极大的降低研究者在强化学习领域的科研门槛。并且tensorflow框架本身在工业上的支持也比较完善,一些科研成果也能够比较平滑的迁移到真正的生产环境中,产生商业价值。