vivo自研大模型评分64.4分，接近GPT-4，成绩出色！

8月16日消息，小米的人工智能大模型MiLM-6B才发布不久，又有一家国内手机厂商的自研大模型面世。

vivo的自研大规模预训练语言模型“vivo_Agent_LM_7B”现身C-Eval，并取得了相当出色的成绩。C-EVAL是中文大语言模型评估基准。

覆盖更广泛的领域。具有四种不同的难度--特别是C-EVAL HARD基准是中国第一个提供复杂推理问题的基准。努力减少数据泄漏--作者的问题大多来自模拟考试的PDF或Microsoft Word文件，这些文件由作者进一步处理，而AGIEval和MMCU收集的是中国过去国家考试的确切题目。

C-EVAL的概览图。不同颜色的主体表示四个难度等级：初中、高中、大学和专业。

（图源：知乎）

从C-Eval可以得知，vivo_Agent_LM_7B是由vivo AI全球研究院自主研发的有着70亿参数的大规模预训练语言模型。

vivo_Agent_LM_7B最终得分为64.4分，位列C-Eval第五名，而且在社会科学领域的多个科目得到了80-90的高分。

它在总成绩上与排名第二的GPT-4（68.7分）相当接近。

而vivo_Agent_LM_7B模型大概率最终将被用在vivo的语音助手Jovi中，为用户带来更良好、智能、快捷的使用体验。

编辑点评：各家厂商都在发展自己家的人工智能大模型，现如今人工智能是另一个时代风口，没有厂商想落后一步，便疯狂地一同追赶。人工智能大模型将丰富手机的智能交互方式，也许是成为系统个性化的另一个核心竞争点。

X 关闭