科技之家

科技之家,汇聚专业声音 解析IT潮流

首页 > 软件 >

期末考试结束了 带孩子来WAIC看看“最会做题的大模型”

来源:互联网 时间:2024-07-07 11:15:59

  期末考试结束,“神兽”放暑假了,带孩子去哪逛?来2024世界人工智能大会看看“更会做题的大模型”吧。带着孩子去感受中国科技力量,尤其是在大模型技术发展中,看到中国也有可以和世界PK的技术,对于从小培养孩子的科技创新能力和技术自信是非常有益的。

  “能根据10岁儿童的口吻,写一篇不超过500字且以上海为主题的童话故事吗?”在上海世博展览馆科大讯飞的展台,6月27日全新升级发布的讯飞星火V4.0成为大家围观的焦点。面对观众提出来了各种文字问题,包括音视频、图片解读类的多模态问题,讯飞星火V4.0都对答如流,给出逻辑清晰且正确的回答。

1

  现场,你可以带孩子一起体验在讯飞星火APP/DESK“个人空间”里上传工作、学习、生活、健康等各类资料,形成个人专属知识库,通过AI人设功能,让大模型生成更具个性化风格的内容,真正做到成为每个人在生活和工作中“用得上”的大模型。

  2024世界人工智能大会前夕,基于全国首个国产万卡算力集群“飞星一号”,讯飞星火大模型V4.0七大核心能力全面升级,全面对标GPT-4 Turbo。6月27日举行的发布会上,科大讯飞根据《通用认知智能大模型评测体系》构建测试集,结果显示讯飞星火V4.0在文本生成、语言理解、知识问答、逻辑推理、数学能力等维度全面超越GPT-4 Turbo,代码与多模态能力也大幅提升。而在国际组织的12项测试集对比中,讯飞星火V4.0也实现了8项超越,其中理解与推理能力在四大机构测试中取得“全胜”战绩。

  讯飞星火全面对标GPT-4 Turbo,可不是泛泛而谈,都是经过“实战”检验过的。

  今年中高考真题实测中,一些专业机构纷纷下场,使用市面上常见的大模型产品如通义千问、字节豆包、讯飞星火、文心一言、腾讯元宝、月之暗面Kimi等作为“考生”,围绕“大模型高考测试”得出了一系列结果。综合来看,国产大模型在中国高考的表现不落下风,有着教育行业背景的讯飞星火大模型在一众大模型中表现抢眼,语数外各科“成绩”均排名第一,被评为“更会做题的大模型”。

1

(新京报测评结果,星火大模型表现最好)

  在科研上,讯飞星火助力中国科学技术大学刘海燕教授团队,将蛋白质设计成功率从0.1%提升到64%,设计所需时间从6个月降到1天;赋能每个人,帮助一位不懂法律知识的70岁老人顺利要回养老钱欠款……家有孩子的,赶紧拿起手机,下载讯飞星火体验PK一把。

相关文章