您的位置:首页 > 黄金 > 正文

DeepMind发布提高翻译质量的算法ReST

2023-08-25 16:42:01 来源:鞭牛士


(资料图片仅供参考)

谷歌DeepMind于8月21日发布论文,提出一种使LLM与人类偏好对齐更简单的算法ReST(Reinforced Self-Training)。不同于RLHF(基于人类反馈的强化学习)使用人类反馈改进语言模型,ReST通过生成和使用离线数据进行训练,从而使得LLM与人类偏好保持一致。研究团队表示,虽然ReST可用于所有生成任务,但本文的重点是机器翻译。研究者在机器翻译任务上进行了实验,测试基准包括IWSLT 2014、WMT 2020和Web Domain。结果表明,ReST可以极大地提高翻译质量。

标签:

相关阅读

大家爱看

香港与广东省签署加强教育交流与合作框架协议 香港与广东省签署加强教育交流与合作框架协议

中新社香港8月24日电香港特区政府教育局24日与广东省教育厅签署《关于

最近更新