信息技术视觉特征编码第4部分:深度特征图编制说明.docx
《信息技术视觉特征编码第4部分:深度特征图编制说明.docx》由会员分享,可在线阅读,更多相关《信息技术视觉特征编码第4部分:深度特征图编制说明.docx(7页珍藏版)》请在优知文库上搜索。
1、团体标准信息技术视觉特征编码第4部分:深度特征图(征求意见稿)编制说明一、工作简况新一代人工智能产业技术创新战略联盟(简称ArnSA联盟)是在科技部的指导下于2017年成立,由近200家来自行业内的顶尖企业、高校和科研院所、资本机构、服务机构、创新创业企业组成。在AVS工作组近20年标准制定经验及标准制定团队的基础上,联盟从成立开始,便以人工智能产业发展需求为引领,围绕产业发展中存在的共性问题,建立了AI标准工作组,着手人工智能标准体系的搭建和技术标准的制定。AI标准工作组内部成立了若干专题组,分别承担相关细分领域的标准制定工作,视觉特征编码专题组是其中之一,致力于视觉特征编码相关技术标准的制
2、订。信息技术视觉特征编码第4部分:深度特征图规定了图像分析任务中,深度网络提取的特征图数据的编码格式和解码工具。本标准适用于图像数据中目标或场景的分类、检索、识别等应用。根据中关村视听产业技术创新联盟2023年标准制修订计划的安排,下达了由鹏城实验室牵头制定的团体标准信息技术视觉特征编码第4部分:深度特征图(标准计划号为2021032504)的制定任务。工作组自2017年12月第一次会议开始,讨论启动视觉特征编码标准制定工作,为视觉特征建立新一代编解码技术体系架构,以解决视觉特征编码的难题,推进领域技术发展。在标准制定的整体路线方面,前三次会议(2017年12月-2018年6月)对视觉特征编码
3、的技术需求和应用场景进行讨论与梳理,首先形成了视觉特征编码提案征集书(草案)(AlMIO16)技术文档与视觉特征编码评价框架(草案)(AIM1017),前者明确了提案需求,并规提案阶段设置、提案内容、时间节点计划等,后者列出了典型视觉任务的验证数据集,设置核心实验中的测试任务、基本思路、测试条件、参考技术文档、性能度量等。经过后续会议(2018年8月-2019年12月)修订完善,最终形成了视觉特征编码核心实验数据集6.0(AlNII60)、视觉特征编码核心实验设计6.0(AlNll59)、视觉特征编码测试模型V1.0(AlNIO93)技术文档。关于深度特征编码,工作组在2018年8月第4次会议
4、首次收到基于视频编码标准的DeePfeatUre有损压缩框架(AlMlo30)技术提案,提出采纳预量化与视频编码相结合的方案作为特征图压缩的基础编码框架。在2018年12月第5次会议收到基于视频编码标准的特征图有损压缩框架及测试条件(AIM1061)技术提案,提出基于视频编码标准的深度特征图有损压缩框架,并最终审议通过。在2019年3月第6次会议收到多任务下特征图有损压缩测试及实验平台升级(AlMlO88)技术提案,该提案报告了在目标检测任务下的特征图有损压缩性能,并建议更新实验平台。在2019年8月第8次会议收到特征图有损压缩中预量化和重打包模块的模式拓展(AlMlI22)技术提案,并最终审
5、议通过。在2019年12月第9次会议收到特征图有损压缩试验补充(AlMiI54)技术提案,该提案对特征图有损压缩进行了试验补充,并对视频序列特征进行试验,探索含有时空冗余的特征序列编码压缩。在2020年3月第10次会议收到深度特征图量化技术更新(AlMI220)技术提案,该提案针对特征图有损压缩任务,提出了一种基于特征图统计特性的自适应量化方法,并最终审议通过。在上述技术提案的基础上,形成了信息技术视觉特征编码第4部分:深度特征图标准的第一份草案,之后,该草案在工作组内部进行公示与审阅,广泛采纳各单位专家的意见,对收到的反馈意见进行反复认真讨论和修订相应内容,并最终于2023年5月形成了标准的
6、征求意见稿。本标准起草单位:鹏城实验室,北京大学,中新国际联合研究院,青岛海信网络科技股份有限公司,青岛新一代人工智能技术研究院,青岛图灵科技有限公司,浙江邦盛科技股份有限公司本标准起草人:陈卓,段凌宇,AlexC.Kot,WeisiLin,杨文瀚,汪维,高峰,冯栋,王雯雯,王新宇,陈伟二、标准编制原则和确定主要内容的论据及解决的主要问题随着深度学习技术的发展和普及,诸多视觉分析任务开始以深度模型作为算法内核。深度模型的计算量往往十分巨大,云端更难以承受数以万计的视频分析需求,因此将特征提取转移至边缘端十分必要。深度模型的多层次结构产生不同语义层次的特征图,又使特征对视觉分析任务的泛化性得到保
7、证。本部分即是面向深度特征图编解码而制定的,目标是提高深度特征图的编码效率以及降低编解码过程中的信息损失。信息技术视觉特征编码第4部分:深度特征图是以我国科研机构和重点科研创新企业为首、引领信息技术领域有影响力的企业共同创新而成。为了形成优化的技术方案,专题组根据标准的通用性和实用性对编码方法的架构进行了多轮讨论和评估。技术评估的基本依据是综合考虑提案对解决深度特征图编解码的有效性、可实现性、可扩展性、对已有设备的兼容性和现有标准的复用性以及知识产权情况等,这些原则与手段为深度特征图编码的技术先进性和妥善解决知识产权问题奠定了坚实基础。本部分规范了深度特征图编码解码的过程和编码格式,适用于图像
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息技术 视觉 特征 编码 部分 深度 编制 说明