小不点搜索
登录
【吴恩达大模型 • 中英】使用 GRPO 对大模型进行强化微调丨Reinforcement Fine-Tuning LLMs with GRPO
收藏
举报
www.bilibili.com
5天前 10:06
[内容类型] 在线视频
[视频名字] 【吴恩达大模型 • 中英】使用 GRPO 对大模型进行强化微调丨Reinforcement Fine-Tuning LLMs with GRPO
[视频站点] www.bilibili.com
回复
编辑
⇧顶
⇩沉
影音视频访问链接
以下链接为影音视频“【吴恩达大模型 • 中英】使用 GRPO 对大模型进行强化微调丨Reinforcement Fine-Tuning LLMs with GRPO”在线访问地址,点击链接就可以访问查看啦
www.bilibili.com***774877
www.bilibili.com
说两句
X