新手上路 3小时前
主楼
[资源名称]
bandit-nmt
[资源来源]
github.com
[资源介绍]
126. bandit-nmt : 这是我们的 EMNLP 2017 论文《基于模拟人类反馈的强化学习用于 Bandit 神经机器翻译》的代码库,实现了在神经编码器-解码器模型上基于 A2C 算法,并在模拟噪声奖励下对组合进行基准测试。
[资源合集]
😀 😊 😵‍💫 😡 🤝 🙏 👍 👎 ❤️