(资料图)
8月13日,新华社研究院中国企业发展研究中心发布《人工智能大模型体验报告2.0》(以下简称《报告》),体验共设置500道题目,对标接受过高等教育的人类水平,强调对产业和生活的实际价值,严格按基础能力指数、智商指数、情商指数、工具提效指数四大测评维度进行权重设计。
体验结果显示,讯飞星火以总分1013分位列本次国产主流大模型测评榜第一,在智商评估、工作效率提升等测试项分数最高,而百度文心一言总分位列第二。
报告显示,与2023年6月相比,当前中国大模型产品进步显著。但与接受过高等教育的人类相比,大模型在智商、情商等方面还存在一定程度差距。同时,商汤商量则在情商方面表现优秀,智谱AI-ChatGLM也有不错的整体表现。
标签: