您的位置:首页 >栏目首页 > 机构 >

DeepMind发布提高翻译质量的算法ReST


(资料图片)

谷歌DeepMind于8月21日发布论文,提出一种使LLM与人类偏好对齐更简单的算法ReST(Reinforced Self-Training)。不同于RLHF(基于人类反馈的强化学习)使用人类反馈改进语言模型,ReST通过生成和使用离线数据进行训练,从而使得LLM与人类偏好保持一致。研究团队表示,虽然ReST可用于所有生成任务,但本文的重点是机器翻译。研究者在机器翻译任务上进行了实验,测试基准包括IWSLT 2014、WMT 2020和Web Domain。结果表明,ReST可以极大地提高翻译质量。

关键词:
最新动态
相关文章
DeepMind发布提高翻译质量的算法ReST
国际实业:截至2023年8月18日,公司的股...
临泉县土陂乡中心学校召开义务教育阶段...
dnf技能补丁别人能看见吗(dnf技能补丁...
农业农村部:传说中的转基因食品致癌、...
孙海艇(关于孙海艇简述)