新手上路 3小时前
主楼
[资源名称]
TRL - 使用强化学习训练 transformer 语言模型
[资源来源]
github.com
[资源介绍]
* TRL - 使用强化学习训练 transformer 语言模型。
[资源合集]
😀 😊 😵‍💫 😡 🤝 🙏 👍 👎 ❤️