
谷歌昨日正式推出基于Gemma 3架构的全新开放翻译模型系列TranslateGemma。该系列包含4B、12B及27B三种参数规模,支持55种核心语言及多模态图像翻译,现已于Kaggle和Hugging Face平台开放下载。
性能测试显示,TranslateGemma在翻译质量上实现显著突破。其12B版本在WMT24++基准测试中,表现甚至优于参数量更大的27B基线模型,这意味着开发者能以更低的算力成本获得更高质量的翻译结果,有效提升效率并降低延迟。同时,小巧的4B模型性能可与12B基线媲美,为手机等移动设备提供了强大的端侧翻译能力。
这一成就得益于独特的两阶段微调工艺。谷歌首先使用合成数据与人工翻译数据对模型进行监督微调,随后通过强化学习阶段,利用先进奖励模型引导生成更自然、更符合语境的译文。该系列重点优化了55种核心语言,并初步探索训练近500种语言,为包括濒危语言在内的学术研究提供了新工具。
此外,得益于Gemma 3架构,模型继承了多模态能力,无需额外调整即可有效翻译图像中的文字。为满足不同场景需求,4B模型专为手机及边缘设备优化,12B模型适配消费级笔记本,27B模型则面向追求极致质量的云端或单卡部署。此次发布进一步降低了高质量机器翻译的应用门槛。
原创文章,作者:Google,如若转载,请注明出处:https://www.kejixun.co/article/743755.html