大语言模型综合性能评估报告：百度文心一言中文理解能力超越ChatGPT

当前位置：首页 > 滚动 > >正文

大语言模型综合性能评估报告：百度文心一言中文理解能力超越ChatGPT

来源：中关村在线时间：2023-08-10 14:51:50

【资料图】

近日，由清华大学新闻与传播学院教授、博士生导师沈阳团队发布的《大语言模型综合性能评估报告》显示，GPT-4在总得分率上排名第一，而百度的文心一言在20项指标的综合评分中位居国内首位，超越了ChatGPT，尤其在中文语义理解方面排名第一，部分中文能力甚至超越了GPT-4。该报告选取了GPT-4、ChatGPT 3.5、文心一言、通义千问、讯飞星火、Claude、天工等7个大语言模型，从生成质量、使用与性能、安全与合规三大维度进行全面考察，包括上下文理解、中文语义理解、误导信息识别、逻辑推理、内容安全性、隐私保护等20项指标。综合来看，文心一言在语义理解能力上表现突出，尤其在中文理解能力上具备优势，更懂中国文化，同时具有强大的时效性和对内容安全的细致把握，这得益于其在知识增强、检索增强和对话增强等方面的技术创新。在生成质量方面，文心一言在语义理解、输出表达、适应泛化的综合评测中得分率为76.98%，仅次于GPT-4，领先于包括ChatGPT在内的其他大语言模型。在部分中文语义理解方面，文心一言以92%的得分率排名榜首。在安全合规方面，文心一言在内容安全性、偏见和公平性、隐私保护等方面的综合评测中得分率为78.18%，与GPT-4并列排名第一。

X 关闭

最近更新

大语言模型综合性能评估报告：百度文心一言中文理解能力超越ChatGPT

2023-08-10 14:51:50

滚动
第二届中华武术健康大会在上海举行探讨“武”“医”结合推动产业发展

2023-08-10 14:18:39

滚动
光山：“小”警情彰显“大”情怀，当好群众“守护者”

2023-08-10 13:35:23

滚动
大和：予国泰航空(00293)“买入”评级目标价上调至10.3港元

2023-08-10 13:06:11

滚动
8月10日济南启辰化工氯化石蜡价格动态

2023-08-10 12:25:26

滚动
[职通车]入职要扣证件？果断拒绝！

2023-08-10 11:52:09

滚动
价格新低至1.2x元/瓦vs近700GW产能规划，N型时代来了！

2023-08-10 11:28:36

滚动
苹果iPhone 15发布会将采用提前录制 9月12日发布

2023-08-10 11:04:22

滚动
山东矿机：公司暂未涉及此类业务

2023-08-10 10:29:43

滚动
Win11退出安全模式的方法

2023-08-10 10:09:34

滚动
日益具体的“幸福株洲”

2023-08-10 09:38:55

滚动
百家云美股涨8%

2023-08-10 09:10:32

滚动
惠博普：第二大股东黄松拟减持不超1.68%公司股份

2023-08-10 08:38:53

滚动
“分对分”不再上浮寿险银保业务启动手续费自律约定

2023-08-10 07:55:29

滚动
炫酷清洁技巧化烟囱灰为灰魔法

2023-08-10 07:02:56

滚动
360防火墙在哪里（360防火墙在哪里）

2023-08-10 02:59:53

滚动
医药领域腐败怎么处理业内揭医药腐败：院长主任说了算基本情况讲解

2023-08-09 23:09:43

滚动
ihealth行业概念股票名单一览（2023/8/9）

2023-08-09 22:08:08

滚动
比亚迪第500万辆新能源汽车下线迈入新里程碑

2023-08-09 21:10:23

滚动
营业部最青睐个股曝光 5股净买入超5000万

2023-08-09 20:09:55

滚动
GUANZE MEDICAL(02427.HK)拟8月24日举行董事局会议审批中期业绩

2023-08-09 19:25:10

滚动
塘角鱼的功效与作用塘角鱼的功效与作用禁忌

2023-08-09 18:45:43

滚动
690万元买出新股王 N盟固利首日现象级大涨背后谁进谁出？

2023-08-09 18:10:04

滚动
莆田市市场监管局召开网络餐饮服务经营者约谈会

2023-08-09 17:44:55

滚动
松花江流域洪水过程已造成85条河流超警

2023-08-09 17:15:58

滚动
山西2023年二级建造师查分入口！

2023-08-09 16:28:32

滚动
精达股份：公司参股公司上海超导近期未曾参与kl99研发实验

2023-08-09 16:12:21

滚动
刺客信条英灵殿怎么钓鱼

2023-08-09 15:36:19

滚动
周口店古人类遗址安然无恙，遗址博物馆已于昨天恢复开放

2023-08-09 15:00:19

滚动
年轻人越变越“抠”，原价购物的都是大冤种？

2023-08-09 14:20:37

滚动
晨会焦点

2023-08-09 13:57:54

滚动
名单公布！武汉暂停30家驾校招生考试业务

2023-08-09 13:03:36

滚动
坐不下八万为何叫“八万人体育场”？

2023-08-09 12:15:58

滚动
港股异动 | 海昌海洋公园(02255)涨超5% 暑期游迎第二波高峰郑州海昌海洋公园开业在即

2023-08-09 12:10:52

滚动
黄金市场分析：若在1920美元水平处得到支撑，有望短暂获得空头回补性的修复

2023-08-09 11:35:39

滚动
澳洲殡葬巨头InvoCare同意接受TPG的18.3亿澳元收购要约，股价一度大涨6.2%

2023-08-09 11:08:04

滚动
东方快评丨高校录取通知书出现“笔误”实在不应该

2023-08-09 10:49:36

滚动
喜报：福建省两名九三学社社员荣获第十一届紫金科技创新奖

2023-08-09 10:29:00

滚动
钱江水利8月9日打开涨停

2023-08-09 09:56:05

滚动
安集科技08月08日被沪股通减持3.7万股

2023-08-09 09:27:09

滚动
泰山墨玉灯光照通透

2023-08-09 08:59:31

滚动
一周之内瘦大腿5cm（一周之内瘦大腿10cm）

2023-08-09 08:20:01

滚动
1500张消费券被“秒”空合肥将举办120余场次全民健身活动

2023-08-09 07:19:49

滚动
自驾游市场迎来5年最旺暑期

2023-08-09 06:16:17

滚动
“隐形”黑作坊｜案“鉴”85

2023-08-09 04:18:04

滚动
雷公峡漂流多长时间（雷公峡）

2023-08-09 01:08:43

滚动
哈佛教授称可能发现外星人存在证据，有望一个月内公布论文

2023-08-08 22:43:30

滚动
北京卫戍区官兵对房山、门头沟受灾地区开展全面消杀

2023-08-08 21:54:45

滚动
华裔青少年在清华上“建筑课”：很喜欢北京的红砖绿瓦

2023-08-08 21:09:43

滚动
涨疯了！每克直逼600元！

2023-08-08 20:24:34

滚动
济南月牙泉复涌泉城再现千泉竞喷景象

2023-08-08 19:30:52

滚动
“源来好创业”青年创业资源对接服务季活动启动

2023-08-08 18:53:25

滚动
北京发布地质灾害气象风险橙色预警

2023-08-08 18:21:31

滚动
领克08开启预售，汉兰达又多一上位替代

2023-08-08 17:37:06

滚动
鸡年是哪些年出生_鸡年是哪些年

2023-08-08 17:15:27

滚动
林宗毅：8月8日（周二）黄金多头持续被打压

2023-08-08 16:43:31

滚动
中天科技：近年来，在国家系列政策的大力支持下，我国海上风电从探索期、培育期进入了高速发展期

2023-08-08 16:17:56

滚动
天洋新材：拟使用3至6千万元回购公司股份

2023-08-08 15:50:47

滚动
三年营收翻番！“洛阳造”新能源汽车端板加紧扩产

2023-08-08 15:14:27

滚动
祥鑫企管2.67亿元摘得浙江诸暨宅地溢价率6.39%

2023-08-08 14:39:49

滚动
破坏交通工具的量刑标准,2023最新规定是什么

2023-08-08 14:07:08

滚动
兰州市三社联动：多元参与社治

2023-08-08 13:19:06

滚动
《八角笼中》大爆，王宝强能分多少钱？细看资产，真诚又精明

2023-08-08 12:35:20

滚动
印学者：欧盟实施“碳关税”或引发贸易摩擦

2023-08-08 11:59:39

滚动
陈思诚高调为前妻佟丽娅庆生，两个关键点曝光，网友：要复合？

2023-08-08 11:28:32

滚动
8.8香港恒生指数日内短线操作建议

2023-08-08 11:09:40

滚动
原油重心震荡中上移年内成品油零售限价或将达成首个“四连涨”

2023-08-08 10:45:50

滚动
成都大运会，到底有多“不同”

2023-08-08 10:12:14

滚动
做大“朋友圈”，深耕“试验田”

2023-08-08 09:56:04

滚动
湖南桂阳：碧水蓝天湿地美

2023-08-08 09:17:12

滚动
院校合作促双赢

2023-08-08 08:53:03

滚动
创业创新(创业创新领导力学习通答案)

2023-08-08 08:19:15

滚动
西安发布：TFBOYS演唱会带动4.16亿旅游收入

2023-08-08 07:47:54

滚动
中保车险电话号码多少（中国人保车险电话是多少）

2023-08-08 06:38:20

滚动
死神286集接多少集（死神282）

2023-08-08 05:25:09

滚动
免费使用office 全家桶，外加5T网盘，它不香吗？

2023-08-08 02:07:50

滚动
人心能有多薄凉？

2023-08-07 23:18:19

滚动
海外网评：“美国正走在错误道路上”，美式民主丢了民心

2023-08-07 22:07:36

滚动
广东银行业观察｜东莞银行注册资本提升至23.42亿元，上半年净利润同比增超15%

2023-08-07 21:20:39

滚动
中兴通讯官方回应股票跌停：公司经营正常

2023-08-07 20:24:30

滚动
甘肃发布三年挂牌上市行动方案华龙证券等9家后备企业冲刺IPO

2023-08-07 19:38:48

滚动
扑克牌概念上市公司龙头一览（2023/8/7）

2023-08-07 19:05:41

滚动
马斯克：“X”品牌价值将达收购价10倍约4400亿美元

2023-08-07 18:17:53

滚动
中电港：公司与华虹半导体目前无合作

2023-08-07 17:59:11

滚动
亚马逊捆绑销售《星空》:8月9日预载

2023-08-07 17:25:37

滚动
阳光电源：预计上半年净利润同比增长344％-400％

2023-08-07 16:53:40

滚动
口袋妖怪究极绿宝石55雷之石怎么获得

2023-08-07 16:26:01

滚动
今日63只个股突破半年线

2023-08-07 16:03:14

滚动
暴雨受灾后能提取公积金吗？一文盘点提取公积金的五种情况

2023-08-07 15:14:21

滚动
前沿科技信息篇：谷歌Duo启动邀请链接使发起群组视频聊天更加容易

2023-08-07 15:09:57

滚动
大型原创话剧《共饮一江水》在福建福州上演

2023-08-07 14:57:56

滚动
小米内测答题入口2023

2023-08-07 14:15:00

滚动
我的e家之e8套餐（我的e家e8套餐）

2023-08-07 13:17:46

滚动
水质从“轻度或重度黑臭”变为“不黑不臭”，大涌镇青岗涌治污见成效

2023-08-07 12:40:45

滚动
魔兽世界神器任务要做多久（魔兽神器第一个任务哪里接）

2023-08-07 12:07:40

滚动
正阳县：“多元化”助推花生产业“加速跑”

2023-08-07 11:35:55

滚动
传媒板块持续走高上海电影涨停

2023-08-07 11:05:32

滚动
晋江联通：今年将新增建设5G基站363个

2023-08-07 10:39:46

滚动
影视股快速拉升幸福蓝海涨超7%

2023-08-07 10:13:07

滚动
融媒宝最新抖音评论管理试用，抖音运营团队最不想外传的技巧

2023-08-07 09:39:10

滚动

大语言模型综合性能评估报告：百度文心一言中文理解能力超越ChatGPT

推荐内容

最近更新