当前位置：首页 >金融要闻>

中文通用大模型基准测试SuperCLUE发布，讯飞星火认知大模型国内第一

来源：IT之家作者:杜玉梅发布时间：2023-05-09 15:59

感谢IT之家网友你好啊_兔子的线索投递！

，今日，中文通用大模型综合性评测基准 SuperCLUE 正式发布。该基准测试主要关注以下问题:中文大模型在不同任务上的表现如何？与国际代表性模型相比，中文大模型的表现达到了何种程度？中文大模型与人类表现相比如何？

该模型可通过多个层面，考研市面上主流的中文 GPT 大模型的能力:

基础能力: 包括了常见的有代表性的模型能力，如语义理解、对话、逻辑推理、角色模拟、代码、生成与创作等 10 项能力。
专业能力: 包括了中学、大学与专业考试，涵盖了从数学、物理、地理到社会科学等 50 多项能力。
中文特性能力: 针对有中文特点的任务，包括了中文成语、诗歌、文学、字形等 10 项多种能力。

该机构利用 SuperCLUE 测试基准，对市面上主流的支持中文的通用大模型进行了评测与排名。从排名中我们可以看出，GPT-4 一骑绝尘，已经非常接近人类的能力。国产大模型中讯飞科技研发的星火认知大模型总排名第三，国内排名第一。

以下为该机构公布的各个子项目的具体得分。排行榜会定期更新，并于以下网站进行公示。CLUEbenchmarks 官方网站

声明：本网转发此文章，旨在为读者提供更多信息资讯，所涉内容不构成投资、消费建议。文章事实如有疑问，请与有关方核实，文章观点非本网观点，仅供读者参考。

责任编辑：中国金融新闻网

即时阅读

保险行业

百家点评

科技金融

比亚迪总市值首超9000亿元

EA提交新专利：玩家可用语音控制NPC

《绝地求生》PC版正式更名为《PUBG：Ba

荣耀X20手机包装盒曝光：售价或将定为169

小红书8月2日正式推行“号店一体”机制月销万

2021年7月份工业生产

任天堂回应玩家对SwitchOLED烧屏担忧：有这种可能性

莱克天狼星一体机，高效除

智能呼啦圈哪个牌子性价比

金融要闻

精彩公益发声：天猫动物品牌保

四川达古冰川首次发现荒漠猫：护珍稀动物成果显

壹大夫益生菌片好不好

首套百兆瓦级全人工地下储气库压缩空气储能项目

530亿元授信额度支持专精特新等企业发展第2

甘肃发布武威活动断层探测与地震危险性评价成果

省教育考试院部署江苏省2024年中职职教高考

银行业界

高通回应“英特尔为其代工芯片”：正在评估

IT之家8月1日消息英特尔在上月底的直播中高调公布了未来几年
华为P50/Pro系列官方保护壳渲染图曝

IT之家7月29日消息华为将于今晚19:30举行华为P50系
保持战略定力，保持稳定复苏态势

新华热评·新开局经济半年报丨保持战略定力，保持稳定复苏态势新

资讯排行

金融新闻网仅作为用户获取信息之目的,并不构成投资建议。市场有风险投资需谨慎

返回顶部

金融新闻网--金融行业的财经类权威网站!