DeepMind发布提高翻译质量的算法ReST

AI行业动态11个月前发布 ainavi

8,076 0 2800

据机器之心报道，谷歌DeepMind于8月21日发布论文，提出一种使LLM与人类偏好对齐更简单的算法ReST（Reinforced Self-Training）。不同于RLHF（基于人类反馈的强化学习）使用人类反馈改进语言模型，ReST通过生成和使用离线数据进行训练，从而使得LLM与人类偏好保持一致。研究团队表示，虽然ReST可用于所有生成任务，但本文的重点是机器翻译。研究者在机器翻译任务上进行了实验，测试基准包括IWSLT 2014、WMT 2020和Web Domain。结果表明，ReST可以极大地提高翻译质量。
论文地址：
https://arxiv.org/pdf/2308.08998.pdf

# AI行业动态

© 版权声明

文章版权归作者所有，未经允许请勿转载。

关注公众号，免费获取chatgpt账号

免费获取chatgpt

相关文章

之江实验室：计算+生物融合创新青年学术研讨交流会邀您参加！

ainavi

5,412 3600

盖茨：距美国大众广泛使用AI还有18到24个月

ainavi

5,508 400

OpenAI公开招人！骗骗大模型就给钱，一年只工作5-10小时，无需技术背景

ainavi

9,992 800

薪酬、人数上不封顶，这家互联网大厂正在疯抢超级毕业生

ainavi

6,416 3600

OpenAI上线新功能太强了，服务器瞬间被挤爆

ainavi

6,112 1600

安徽出台政策打造通用人工智能产业创新和应用高地单个项目最高资助5000万元

ainavi

7,600 1200

暂无评论

暂无评论...

AI中国(aicn.me)致力于收集与AI相关的热门工具，包括但不限于ChatGPT、AI视频、AI办公、AI语音等领域，并为广大AI爱好者提供学习平台，降低获取学习资源的成本。同时，同步分享最新的行业前沿AI工具和网站，旨在帮助AI爱好者不断探索AI技术的发展。

关于我们 AI教程

Copyright © 2024 优智创想智能工具导航粤ICP备2023063465号