微软推出 ZeRO++技术，可显著减少AI大模型训练时间和成本

当前位置：首页 > 滚动 > >正文

微软推出 ZeRO++技术，可显著减少AI大模型训练时间和成本

来源：搜狐号-IT之家时间：2023-06-27 13:15:45

【资料图】

IT之家 6 月 27 日消息，微软研究人员日前推出了名为 ZeRO++ 的新技术，用于优化在训练大型 AI 模型时，容易遇到的数据传输成本和带宽限制的难题，可显著减少大模型训练时间和成本。

据悉，ZeRO++ 建立在现有的 ZeRO 传输技术基础上，并提供增强的通信策略，可提高训练效率，同时减少训练时间和成本。

▲ 图源微软

为了减少参数通信量，ZeRO++ 可对权重进行量化，其利用基于块的量化方法来保持训练精度，这种优化的量化过程相对原始 Zero 传输技术更快更准确。为了能够尽量减少通信开销，ZeRO++ 通过在每台机器上保持完整的模型副本，以向 GPU 显存换取通信带宽。而在梯度通信方面，ZeRO++ 引入了一种名为 qgZ 的新的量化梯度通信方式，可以减少跨节点的流量和延迟。

▲ 图源微软

这些改进的通信技术大大减少了通信量，微软研究人员表示，与 ZeRO 相比，ZeRO++ 减少了高达 4 倍的通信量，提高了训练吞吐量和效率。当在每个 GPU 上使用小批量大小时，在高带宽集群中，ZeRO++ 相比 ZeRO-3 的吞吐量提高了 28% 至 36%。在低带宽集群中，与 ZeRO-3 相比，ZeRO++ 实现了平均 2 倍的加速，使得大模型训练在更多种类的集群上更为可行。

IT之家注：IT之家注意到，例如 Turing-NLG、ChatGPT 和 GPT-4 这样的大型模型，其训练需要跨多个 GPU 设备占用大量显存和计算资源，而 ZeRO++ 引入了通信优化策略，以克服在低带宽集群上进行训练时原有 ZeRO 传输技术的带宽限制。目前微软已经放出了相关技术文档，研究人员可以利用 ZeRO++ 更有效地训练模型，在 AI 领域探索新的可能性。

X 关闭

最近更新

微软推出 ZeRO++技术，可显著减少AI大模型训练时间和成本

2023-06-27 13:15:45

滚动
【视频】航拍汶川泥石流抢险现场

2023-06-27 12:46:16

滚动
2023全球数字经济大会数字安全高峰论坛将召开关注数字经济与数据安全问题

2023-06-27 12:01:48

滚动
播报：迪马：曼联未表明他们会报价奥纳纳，国米最低要价仍是5000万

2023-06-27 11:56:47

滚动
环球实时：600016股票行情雪球-600063雪球

2023-06-27 11:09:54

滚动
当前通讯！京津冀等地高温再发展局地或达40℃ 强降雨重点影响长江以北

2023-06-27 10:45:16

滚动
新闻1+1丨高考填报志愿，今年怎么选？

2023-06-27 10:23:27

滚动
环球最资讯丨【行情动态】——及时准确

2023-06-27 10:01:07

滚动
手机充电器头掉水里了还能用吗_手机充电器头|速讯

2023-06-27 10:03:42

滚动
夏季达沃斯论坛来了！6张海报让你心中有“数”

2023-06-27 09:25:00

滚动
新闻1+1丨高考填报志愿，今年怎么选？快资讯

2023-06-27 08:47:57

滚动
小众“救命药”亟待建立长效供给机制

2023-06-27 08:36:52

滚动
樱初音怎么画卡通（樱初音怎么画）天天播报

2023-06-27 08:05:44

滚动
三国志9威力加强版哪里下_三国志9威力加强版修改器|环球时讯

2023-06-27 07:14:53

滚动
南京英华达电子厂工资待遇怎么样_南京英华达

2023-06-27 05:58:09

滚动
柴口村_关于柴口村概略

2023-06-27 05:03:17

滚动
赶集网发布招聘信息怎么发_赶集网发布招聘信息

2023-06-27 04:45:03

滚动
12万余名考生走进中招考场民警提醒：遇到困难可随时求助

2023-06-27 02:32:17

滚动
热点聚焦：太湖风景名胜区门票（太湖风景名胜区）

2023-06-27 00:48:29

滚动
上海一知名酒店免费提供的矿泉水中，竟混杂一瓶清洁剂

2023-06-26 22:39:32

滚动
【世界说】美媒：美国枪支暴力失控与其政府对外战争政策息息相关

2023-06-26 22:02:44

滚动
黑龙江省国土资源厅电话_黑龙江省国土资源厅_当前通讯

2023-06-26 21:10:02

滚动
OpenAI 大神 Karpathy 最新分享：为什么 OpenAI 内部对 AI Agents 最感兴趣|世界快消息

2023-06-26 20:26:24

滚动
autocad如何统一修改点划线的比例大小（autocad如何统一修改点划线的比例）_全球视点

2023-06-26 19:57:49

滚动
上汽集团：“MG印度公司被当地强行低价收购股份、丧失控制权”相关内容严重背离事实

2023-06-26 18:59:32

滚动
当前观察：散文丨张觅：古村落的沧桑与青春

2023-06-26 18:51:44

滚动
商务部印发自贸试验区164项重点工作清单多省份“领取”交通运输重点工作

2023-06-26 18:04:51

滚动
世界快讯:京东商城投诉电话人工服务24小时京东投诉_京东商城投诉电话

2023-06-26 17:58:58

滚动
射阳县黄沙港：开展“残疾人之家”慰问活动|环球最资讯

2023-06-26 17:56:56

滚动
登上产业之巅，俯览AI前沿 ——从2023全球智博会看人工智能产业增长极

2023-06-26 17:11:54

滚动
全球今日讯！合同中的承诺和要约是指什么

2023-06-26 16:57:59

滚动
股民关注太辰光：AI光模块供销存相关问题。_环球热闻

2023-06-26 16:27:02

滚动
世界今日报丨这样穿“衬衫”才是正确的，时尚、大气又很得体，轻松变时髦精

2023-06-26 15:55:23

滚动
这些都是“野鸡大学”！报了=白读！|微资讯

2023-06-26 15:40:02

滚动
“智慧”夏管中国粮看中国丰收地图→

2023-06-26 14:59:23

滚动
全球今亮点！广东特产食品送礼_广东特产食品有哪些

2023-06-26 15:03:51

滚动
联想摩托罗拉折叠手机什么时候上市联想摩托罗拉折叠手机图片

2023-06-26 14:18:02

滚动
数据图解丨1－5月份中部地区完成软件业务收入2014亿元同比增长15.6%-环球聚焦

2023-06-26 13:39:31

滚动
跳桥救人小哥，记二等功+邀请落户！|环球时讯

2023-06-26 13:11:46

滚动
记者：B罗还未答应前往沙特，哈维正全力说服他加盟巴萨-报资讯

2023-06-26 12:41:17

滚动
韩媒： U17国足晋级世界杯却遭遇中国裁判的荒唐判罚全球快看

2023-06-26 11:41:58

滚动
邀您“点单”！杨浦区政府开放月来了

2023-06-26 10:57:24

滚动
《堡垒之夜》日服怎么登录

2023-06-25 16:01:46

滚动
农业银行内江分行打造“适老服务”标杆让金融服务更有温度

2023-06-25 15:52:53

滚动
天天热门:配网线路故障精确定位系统的功能指标

2023-06-25 15:26:59

滚动
热点！深圳长沙北京地铁规划获批，下一城会是谁？

2023-06-25 14:56:46

滚动
广东白云学院：本科招生6805人，培养高素质人才助力湾区高质量发展

2023-06-25 14:35:19

滚动
当前速看：范水_关于范水的简介

2023-06-25 13:45:02

滚动
焦点关注：国家电影局：2023端午档票房9.09亿元为影史第二高

2023-06-25 13:05:16

滚动
世界热讯:青海公布2023高考分数线

2023-06-25 12:35:54

滚动
2022~2023年吉林养老金调整方案细则和养老金调整计算公式最新消息（全文）

2023-06-25 11:56:21

滚动
隆源神州半岛怎么样好不好，海南万宁房价最新楼盘价格~|环球速递

2023-06-25 11:19:26

滚动
高温持续各地采取措施积极应对

2023-06-25 11:12:17

滚动
代谢组研究靶向和非靶向

2023-06-25 10:24:45

滚动
天天快讯:黄河调水调沙腾库迎汛

2023-06-25 10:07:39

滚动
天天日报丨一加Nord 3曝光：天玑9000处理器 16GB内存

2023-06-25 09:52:44

滚动
泰晤士报：前巴西队主帅蒂特将担任利雅得新月主教练天天视讯

2023-06-25 09:05:06

滚动
微信回了个“OK”表情，男子成被告

2023-06-25 08:36:35

滚动
全球焦点！必须安装熄火保护装置

2023-06-25 07:35:45

滚动
环球快报:合同因清偿而终止的情形有哪些观点

2023-06-25 06:21:44

滚动
漂亮爸爸樱花动漫漂亮爸爸

2023-06-25 05:21:10

滚动
王乐君泳装王乐君年龄

2023-06-25 02:20:30

滚动
每日速讯：借呗逾期被起诉的概率大不大？被起诉了怎么应诉？

2023-06-24 23:14:27

滚动
今年夏航首批俄罗斯进口木材抵达同江市天天快资讯

2023-06-24 22:06:03

滚动
环球今日报丨300英雄怎么听到英雄语音（300英雄没有声音）

2023-06-24 20:46:15

滚动
将来23天，四大生肖财运红得发紫，财气足，一路旺到底

2023-06-24 19:55:43

滚动
亮点抢先看！世界互联网大会数字文明尼山对话即将开幕

2023-06-24 18:27:40

滚动
世界最资讯丨崔永辉调研推进城中村现代化治理工作

2023-06-24 17:50:58

滚动
环球精选！中国最大内陆淡水湖螃蟹“抢鲜”上市

2023-06-24 16:52:10

滚动
必不可少！16G内存史低价149元

2023-06-24 15:58:01

滚动
端午假期前二天河南接待游客超904万人次旅游收入超39亿元

2023-06-24 14:42:59

滚动
俄执法人员进驻瓦格纳集团总部大楼

2023-06-24 13:30:41

滚动
杭州有什么“土特产”？这10样很优秀

2023-06-24 12:43:03

滚动
俄罗斯莫斯科市长：目前莫斯科正在进行反恐行动-今日报

2023-06-24 11:38:01

滚动
白鹤滩—浙江±800千伏特高压直流工程全容量投产

2023-06-24 11:04:07

滚动
深圳浦发银行网点查询附近

2023-06-24 09:55:38

滚动
5.0级地震，海南有震感！海口发布温馨提示！-每日快播

2023-06-24 09:16:51

滚动
靖黎、官新、芷铜、张官……来看怀化在建高速项目新进度→

2023-06-24 08:18:58

滚动
布袋和尚随口吟出一首《插秧诗》，短短四句话，点醒无数世人每日看点

2023-06-24 07:11:41

滚动
【环球时快讯】10级雷暴大风＋强降水＋强雷电！预计未来3天，广东天气……

2023-06-24 06:08:07

滚动
宋村镇

2023-06-24 04:55:56

滚动
老九门尹新月的结局是什么（老九门尹新月）

2023-06-24 02:41:11

滚动
5e对战平台进不去服务器_5e对战平台进不去游戏

2023-06-24 00:59:48

滚动
适合写给自己的心情文案-天天热资讯

2023-06-23 22:02:47

滚动
越南告急，中国出手！

2023-06-23 21:03:21

滚动
每日速讯：四川大学处分结果来了，张薇成最后赢家。网友：这个处理太轻了!

2023-06-23 19:54:09

滚动
杰士邦辨别真假_杰士邦真假

2023-06-23 19:09:56

滚动
今日看点：皮夹克配什么裤子高级_皮夹克配什么裤子

2023-06-23 17:59:13

滚动
男人婆近义词（男人婆）

2023-06-23 17:08:01

滚动
灰熊GM：对莫兰特禁赛25场的决定是合适的他必须专注于自身-环球观天下

2023-06-23 16:53:48

滚动
荷叶上的小蝌蚪简笔画_蝌蚪简笔画环球滚动

2023-06-23 15:37:08

滚动
交行最红星期五非特邀客户-2021交行最红星期五抢不到

2023-06-23 14:43:14

滚动
停水！涉及青岛这些区域 →

2023-06-23 13:51:14

滚动
全球快播：布达拉宫简介500字_布达拉宫简介资料

2023-06-23 12:57:00

滚动
不看后悔！顾九思的勇气和责任感震撼人心！环球滚动

2023-06-23 12:34:14

滚动
美妆巨头陷入焦虑：做VC、清库存、卷向线下-每日视讯

2023-06-23 11:55:17

滚动
硬核！大学校长考驾照开收割机数万人围观全球新动态

2023-06-23 10:55:22

滚动
成都猎人队退出OWL，联盟本身也已陷入困境-每日动态

2023-06-23 09:52:38

滚动
每日简讯：电动自行车通行收紧：“限行”也要做好“加法”

2023-06-23 09:06:51

滚动
天天最新：雄安新区至忻州高速铁路首片700吨高铁箱梁成功预制

2023-06-23 08:47:55

滚动

微软推出 ZeRO++技术，可显著减少AI大模型训练时间和成本

推荐内容

最近更新