2024人工智能 计算设备调度与协同第2部分:分布式计算框架.docx
《2024人工智能 计算设备调度与协同第2部分:分布式计算框架.docx》由会员分享,可在线阅读,更多相关《2024人工智能 计算设备调度与协同第2部分:分布式计算框架.docx(19页珍藏版)》请在优知文库上搜索。
1、人工智能计算设备调度与协同第2部分:分布式计算框架前言II1范困12规范性引用文件13术语和定义14缩珞语25慨述25.1 总体框架25.2 适用性36计匏设备技术要求36.1 云侧设备36.2 边缘设备46.3 终端设备17分布式计算力同技术要求57.1 架构57.2 通用要求57.3 组件要求67.4 云云协同要求87.5 云边培协同要求97.6 多端协同要求118云边端分布式计算怫同接口128.1 边修节点管理128.2 部署及更新M8.3 任务运行管理17参考文献19人工智能计算设备调度与协同第2部分:分布式计算框架1范围本文件敬立了人工智能计算设备分布式计算的架构,规定了功能和性能技
2、术要求,定义了分布式计算协同接口.本文件适用于用于分布式人工智能计算的系统设计、开发和冽试.2规葩性引用文件下列文件中的内卷通过文中的规范性引用而构成本文件必不可少的条款.其中,注I1.期的引用文件,仅该日期对应的版本适用于本文件:不注日期的引用文件,其G新版本(包括所有的修改单)适用于本文件.GB/TXXXXX.1-202X人工智能计算设备调度与协同第1部分:虚拟化与调度系统技术规范GB/TAAA-2O2X人工智能异构人工智能加速器统一接口3术语和定义GB/T41867-2022.GB/T42018-2022.GB/TXXXXX.1.-202Xfi)GBTAAA-2O2X中界定的以及下列术语
3、和定义适用于本文件。分布式机器学习distributedmachine1.earning一种机器学习的方法或过程,利用互联附笫作为首选通信蚊体,在不同于系统上完成同一个机潞学习任务,注1:互联网络可包含对域互联网及广域互联网,注2:分布式训练任务不同于系统上砂同完成个训I城任务.注3分布式推理任务,不同下廉统办问完成个推理任务.来源:ISO/1EC2382:2015,2178059.有修改3.2联邦机器学习federatedmachine1.earning一种机器学习方法或过程,能it多个参加者协作构建及使用机渊学习模型而不期谑参加者所拥有的原始数据或私有数据.来曲IEEE3652.1.3.1
4、3.3增量学习incrementa1.1.earning一种分为多个阶段的自适应学习方法,其中在前胆阶段学得的知识被转化为适当形式,以便为后第阶段的新知识提供域础。注1:在机JS学习儆域的某些文赋里.州81学习称为“(机涉学习模型的)f1.ifit(ff)训练-.注2:模型热调是埒Irt学习的方式之一.来源:ISO/IEC2382:2015.2123002.有修改3.4边壕计算edgecomputi11E一种分布式计算方法或过程.其中处理及存储过程发生在分布式系统的边缘.注:计。发生旅近边缘的程度按系统的需求定义设定.来源,ISO/IECTR23188:2020.3.1.33.5集合通信co1
5、.Iectivecommunication-H1.划信模式,其所传递数据在一组处理器单元(称为节点)上处理,其进程或计算节点之间协同工作以进行数据交换和同步.注:一次通倡一股包仃多个接受并和发送行.4缩略语下列缩略出适用于本文件.AI:人工智能(Artificia1.InteIIiKenCe)CPt:中央处理的元(Centra1.ProcessingUnit)FI1GA:现场可编程设排门阵列(Fie1.dProgramHab1.eGateArrayGP1.s图形处理的元(GraphicsProcessingUnitNPU;神经网络处理单元(NeUworkProcessingUnit)RDMA:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2024人工智能 计算设备调度与协同第2部分:分布式计算框架 2024 人工智能 计算 设备 调度 协同 部分 分布式 框架