当前位置: 首页 > 适用对象 >

vivo自研大模型评分64.4分,接近GPT-4,成绩出色!

来源:腾讯网    时间:2023-08-17 21:50:36


(资料图片)

vivo自研大模型评分64.4分,接近GPT-4,成绩出色!

8月16日消息,小米的人工智能大模型MiLM-6B才发布不久,又有一家国内手机厂商的自研大模型面世。

vivo的自研大规模预训练语言模型“vivo_Agent_LM_7B”现身C-Eval,并取得了相当出色的成绩。C-EVAL是中文大语言模型评估基准。

覆盖更广泛的领域。具有四种不同的难度--特别是C-EVAL HARD基准是中国第一个提供复杂推理问题的基准。努力减少数据泄漏--作者的问题大多来自模拟考试的PDF或Microsoft Word文件,这些文件由作者进一步处理,而AGIEval和MMCU收集的是中国过去国家考试的确切题目。

C-EVAL的概览图。不同颜色的主体表示四个难度等级:初中、高中、大学和专业。

(图源:知乎)

从C-Eval可以得知,vivo_Agent_LM_7B是由vivo AI全球研究院自主研发的有着70亿参数的大规模预训练语言模型。

vivo_Agent_LM_7B最终得分为64.4分,位列C-Eval第五名,而且在社会科学领域的多个科目得到了80-90的高分。

它在总成绩上与排名第二的GPT-4(68.7分)相当接近。

而vivo_Agent_LM_7B模型大概率最终将被用在vivo的语音助手Jovi中,为用户带来更良好、智能、快捷的使用体验。

编辑点评:各家厂商都在发展自己家的人工智能大模型,现如今人工智能是另一个时代风口,没有厂商想落后一步,便疯狂地一同追赶。人工智能大模型将丰富手机的智能交互方式,也许是成为系统个性化的另一个核心竞争点。

X 关闭

Copyright ©  2015-2022 亚洲空净网版权所有  备案号:京ICP备2021034106号-51   联系邮箱:5 516 538 @qq.com