168TY体育(中国)官方网站IOS/Android通用版/手机APP下载
最新公告: 诚信为本,市场在变,诚信永远不变...
产品中心
400-123-4657
电话:400-123-4657
地址:广东省广州市天河区88号
传真:+86-123-4567
邮箱:
新闻动态

当前位置: 首页 > 新闻动态

DeepMind发布提高翻译质量的算法ReST

文章来源:小编 更新时间:2024-04-10 12:09:24

  谷歌DeepMind于8月21日发布论文,提出一种使LLM与人类偏好对齐更简单的算法ReST(Reinforced Self-Training)。不同于RLHF(基于人类反馈的强化学习)使用人类反馈改进语言模型,ReST通过生成和使用离线数据进行训练,从而使得LLM与人类偏好保持一致。研究团队表示,虽然ReST可用于所有生成任务,但本文的重点是机器翻译。研究者在机器翻译任务上进行了实验,测试基准包括IWSLT 2014、WMT 2020和Web Domain。结果表明,ReST可以极大地提高翻译质量。

【返回列表】

上一篇 : 现代首款MPV终于亮相!168万就168体育app手机下载配独立航空座椅+侧滑门看啥GL8

下一篇 : 168体育app手机下载mpv是什么意思

网站首页 关于我们 产品中心 废旧知识 168体育 服务项目 新闻动态 在线留言 联系我们

地址:广东省广州市天河区88号电话:400-123-4657传真:+86-123-4567

版权所有:Copyright © 2012-2023 168TY体育 版权所有 XML地图| txt地图| html地图

分享到: