浪潮源1.0大模型登顶中文语言能力评测基准CUGE榜首
扫描二维码
随时随地手机看文章
(全球TMT2022年6月9日讯)近日,浪潮"源1.0"大模型登顶中文语言能力理解和生成评测基准CUGE总榜榜首,并获得语言理解(篇章级)、语言生成、对话交互、多语言、数学推理等5项评测最佳成绩。
在语言理解(篇章级)评测中,源1.0仅用时11分钟,便完成数千篇阅读理解回答4000多个问题,以86.9高分的成绩位居榜首,展现出顶尖的语言理解能力。在语言生成评测中,源1.0仅用时70秒,就完成近800条摘要内容的生成,登顶该项榜单。源大模型强大的文本生成能力可提升智能问答与对话、新闻摘要、报告生成等场景中AI智能化水平。在多语言机器翻译评测中,基于源1.0大模型蒸馏出来的翻译模型在完成近4000千对中英文互译后,登顶榜首,领先第二名15%。在对话交互评测中,基于源1.0大模型蒸馏出来的对话模型回答了电影、音乐、旅行3个领域共近万个主题对话,成绩位居榜首,领先第二名成绩30%。在CUGE数学推理评测中,源1.0大模型完成1000道小学数学应用题,以76.9的高分大幅领先高居榜首。