首页
版块
搜索
注册
登录
RLHF_in_notebooks
宝藏资源
收藏
回帖
github.com
新手上路
3小时前
主楼
[资源名称]
RLHF_in_notebooks
[资源来源]
github.com
[资源介绍]
RLHF_in_notebooks 一份 GitHub 上的 RLHF 学习教程,通过 3 个完整 Notebook 笔记带用户一步步实现 RLHF 全流程。基于 GPT-2 模型和电影评论情感数据集,演示从监督微调到奖励建模再到 PPO 强化学习的完整过程。
[资源合集]
开源软件宝典!总有一款软件值得你收藏使用!
回复
点赞
举报
😀
😊
😵💫
😡
🤝
🙏
👍
👎
❤️
回复