科技之家

科技之家,汇聚专业声音 解析IT潮流

首页 > 软件 >

快手自研AI也来了:人文学科、中国特定主题等方面较强,平均分超61分

来源:快科技 时间:2023-08-21 23:11:41

  8月21日,近一段时间,国内生成式人工智能模型的推出可谓是你方唱罢我登台,好不热闹。

  近日,快手的自研大模型“快意”(KuaiYii)已经出现在了AI综合中文评估基准CMMLU的榜单中。

CMMLU中文向排名第一!快手自研AI也来了

  截至本文成稿,该模型的13B版本KwaiYii-13B同时位列five-shot和zero-shot项目下的中文向第一名,在人文学科、中国特定主题等方面较强,平均分超61分。

  而根据快意在GitHub页面给出的信息,该模型是快手AI团队独立自言的大规模语言模型。

  目前,快意覆盖了预训练模型(KwaiYii-Base)、对话模型(KwaiYii-Chat),主要特点包括:

  1、KwaiYii-13B-Base预训练模型具备优异的通用技术底座能力,在绝大部分权威的中/英文Benchmark上取得了同等模型尺寸下的State-Of-The-Art效果。

  例如,KwaiYii-13B-Base预训练模型在MMLU、CMMLU、C-Eval、HumanEval等Benchmark上目前处于同等模型规模的领先水平。

  2、KwaiYii-13B-Chat对话模型具备出色的语言理解和生成能力,支持内容创作、信息咨询、数学逻辑、代码编写、多轮对话等广泛任务,人工评估结果表明KwaiYii-13B-Chat超过主流的开源模型,并在内容创作、信息咨询和数学解题上接近ChatGPT(3.5)同等水平。

CMMLU中文向排名第一!快手自研AI也来了

相关文章