信息技术视觉特征编码第6部分:结构点序列编制说明.docx
《信息技术视觉特征编码第6部分:结构点序列编制说明.docx》由会员分享,可在线阅读,更多相关《信息技术视觉特征编码第6部分:结构点序列编制说明.docx(8页珍藏版)》请在优知文库上搜索。
1、团体标准信息技术视觉特征编码第6部分:结构点序列(征求意见稿)编制说明一、工作简况新一代人工智能产业技术创新战略联盟(简称ArnSA联盟)是在科技部的指导下于2017年成立,由近200家来自行业内的顶尖企业、高校和科研院所、资本机构、服务机构、创新创业企业组成。在AVS工作组近20年标准制定经验及标准制定团队的基础上,联盟从成立开始,便以人工智能产业发展需求为引领,围绕产业发展中存在的共性问题,建立了AI标准工作组,着手人工智能标准体系的搭建和技术标准的制定。AI标准工作组内部成立了若干专题组,分别承担相关细分领域的标准制定工作,视觉特征编码专题组是其中之一,致力于视觉特征编码相关技术标准的制
2、订。信息技术视觉特征编码第6部分:结构点序列规定了视觉特征编码中视频内容的结构点序列的定义、语义信息、获取方式、格式要求、编码、解码等内容。随着计算机视觉算法的发展及其在视频监控、自动驾驶中的广泛应用,结构点数据的数量和使用范围都在不断扩大。本部分提出一种高效的结构点序列无损压缩算法,可适用于视频目标跟踪、人群流量统计、人脸识别、运动目标行为分析等结构点序列的无损压缩,可以极大降低该类数据的传输带宽和存储空间要求,具有广泛应用价值。根据中关村视听产业技术创新联盟2023年标准制修订计划的安排,下达了由鹏城实验室牵头制定的团体标准信息技术视觉特征编码第6部分:结构点序列(标准计划号为202103
3、2506)的制定任务。工作组自2018年3月第2次会议开始,讨论视觉特征编码技术标准制定工作中,关于视频内容的结构点序列的压缩编码技术,以解决在智慧城市建设相关领域中涉及到的海量的数据压缩问题,推进城市大脑的建设。在标准制定的整体路线方面,前三次会议(2017年12月-2018年6月)对视觉特征编码的技术需求和应用场景进行讨论与梳理,首先形成了视觉特征编码提案征集书(草案)(AlMIo16)技术文档与视觉特征编码评价框架(草案)(AlMlOI7),前者明确了提案需求,并规提案阶段设置、提案内容、时间节点计划等,后者列出了典型视觉任务的验证数据集,设置核心实验中的测试任务、基本思路、测试条件、参
4、考技术文档、性能度量等。经过后续会议(2018年8月-2019年12月)修订完善,最终形成了视觉特征编码核心实验数据集6.0(AIN1160)视觉特征编码核心实验设计6.0(AINll59)、视觉特征编码测试模型V1.0(AINlO93)技术文档。关于结构点序列编码的部分,经过多次会议和对在智慧城市建设中相关数据压缩需求的分析和讨论,以及结合未来城市大脑建设中可能涉及的数据形式的预期,首先于2018年3月第2次会议形成了基于时域差分关系的位置及骨架信息编码(AIM1006)技术提案。提出了使用多模式方式,充分使用视频帧间信息对人体骨架序列进行无损压缩编码的技术。在2018年8月第4次会议的基于
5、时域差分关系的骨架信息编码(AlMlO25)中完善了技术描述。在2018年12月第5次会议的人体骨架数据的无损压缩编码(AlMlO65)和2019年3月第6次会议的基于多模态的视频骨架序列无损压缩方法(AlM1087)技术提案在广泛采纳成员单位意见的基础上,进一步改进了使用多模式对视频中骨架序列进行压缩的过程,完善了相应的技术内容描述,并得到采纳。在2019年6月第7次会议的视频中人体骨架的无损压缩编码(AlMlO98)提案中,对序列输入格式,参数定义等内容进行了完善。结合对未来智慧城市建设中数据的多样性分析,工作组将技术对象从单一的人体骨架序列扩展到了通用的结构点序列(比如人脸关键点,ROl
6、区域的识别框,汽车关键点等)中,并在2019年8月第8次会议提出了面向视频的关键点信息无损压缩方法(AlMIl23)技术提案,对技术中的特殊处理操作进行了内容完善。在2019年12月第9次会议中,形成了关键点序列的无损编码测试结果(AIMl157),并对除人体骨架信息外的通用结构点序列进行了测试,实验验证了技术的性能。在2020年6月第11次会议中,提出了视频中结构点序列无损编码的待改进问题(AIM1287),在后续代码维护过程中对所提及的问题进行了改进。在2020年8月第12次会议中,工作组形成了信息技术视觉特征编码第6部分:结构点序列(AlMl338)标准文档的第一份草案。在2020年12
7、月第13次会议中,提案监控视频的骨架序列无损压缩(AlMl343)对参考软件及技术的改进进行了描述。在后续的工作组会议中,广泛采纳各单位专家的意见,对收到的反馈意见进行讨论和完善,不断修订标准文档的内容,并最终于2023年5月形成了标准的征求意见稿。本标准起草单位:上海交通大学,鹏城实验室,北京大学,博云视觉(北京)科技有限公司,青岛海信网络科技股份有限公司,青岛新一代人工智能技术研究院本标准起草人:林巍晓,刘鸣洲,陈一航,段凌宇,陈杰,高雪松,张四海,王雯雯,熊红凯二、标准编制原则和确定主要内容的论据及解决的主要问题在我国建设智慧城市的过程中,智能驾驶技术、智能监控和追踪技术等会产生大量的视
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息技术 视觉 特征 编码 部分 结构 序列 编制 说明