新手上路 3小时前
主楼
[资源名称]
pytorch-trpo(Hessian-vector product version)
[资源来源]
github.com
[资源介绍]
196. pytorch-trpo(Hessian-vector product version) : 使用精确 Hessian-vector product 而不是有限差分近似的 "Trust Region Policy Optimization (TRPO)" 的 PyTorch 实现。
[资源合集]
😀 😊 😵‍💫 😡 🤝 🙏 👍 👎 ❤️