人工智能数据标注总体框架规范(征求意见稿).docx
《人工智能数据标注总体框架规范(征求意见稿).docx》由会员分享,可在线阅读,更多相关《人工智能数据标注总体框架规范(征求意见稿).docx(10页珍藏版)》请在优知文库上搜索。
1、ICS01.140.20CCS1.7011B23黑龙江省地方标准DB23/TXXXX-2024人工智能数据标注总体框架规范(征求意见稿)起草单位:黑龙江省网络空间研究中心联系人:白瑞联系电话:18845165426联系邮箱:guines2024-XX-XX发布2024-XX-XX实施黑龙江省市场监督管理局发布本文件按照GB/T1.1-2020标准化工作导则第1部分:标准化文件的结构和起草规则的规定起草。请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这些专利的责任。本文件中共黑龙江省委网络安全和信息化委员会办公室提出并归口。本文件起草单位:黑龙江省网络空间研究中心本文件主要起草人
2、:人工智能数据标注总体框架规范1范围本文件规定了人工智能数据标注的要求,为人工智能数据标注的生产过程提供建议。本文件适用于面向人工智能学习、研发或应用等需要实施数据标注的企业、高校、研究机构、政府机关。其他行业和机构可参照执行。2规范性引用文件下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T35295信息技术大数据术语GB/T25069信息安全技术术语3术语和定义下列术语和定义适用于本文件。3. 1数据标注对准备使用人工智能研究的文本、图像、音频和视频
3、等数据进行特征标注以满足正常可用的过程。4. 2数据标签用于标识出数据特征并建立标注数据与人工智能可用数据之间联系的信息。5. 3数据标注工具能够进行数据标注及在数据标注过程中进行管理、控制等过程中发挥作用的软件的统称。6. 4数据标注技术对数据进行转写、切割、提取、选择、富集标注、点标注、线标注、框标注、区域标注等操作的技术。7. 5数据标注合格率某项标注任务中,符合标注规则要求的已标注数据总量与所有已标注数据总量的比值。4基本要求4,1标注人员参与数据标注的人员应具有相应的资质,对于确定符合要求的人员培训环节,应做到:a)根据标注任务说明,对标注人员进行岗前能力培训。标注能力合格者,参与标
4、注任务;b)建立标注人员能力档案,记录标注人员承担标注任务的相关内容,用于进行标注人员能力评估与标注质量追踪。4. 2明确职责规定参与人工智能数据标注的所有角色的职能,应做到:a)设立人工智能数据管理岗位。该岗位要求对业务、法律法规比较熟悉,应根据业务实际需要确定承担数据管理工作的部门或人员的职责;b)明确各环节角色的职责。应明确数据标注人员、数据标注培训人员、数据标注质量控制员以及与人工智能数据标注相关的其他角色的职责。8. 3合法合规应出台规章制度保障人工智能数据标注活动的合法合规性,并做到:a)学习并严格执行与数据保护、数据安全相关的法律法规、制度等;b)正确的对个人隐私和敏感数据进行处
5、理,确保标注过程合法合规;c)建立跨部门、跨组织数据标注、传输的保护制度。4,4保障质量应确保人工智能数据标注的质量,并做到:a)确保人工智能数据标注的准确性、可用性、完整性;b)建立质量保障制度,提高数据标注合格率;c)建立定期抽查,不定期检测的质量控制制度。8.5 标注范围最小化应确保数据标注相关角色对数据掌握范围的最小化,做到:a)数据标注任务开始前,明确数据接触范围及使用范围;b)提供技术或者建立制度保证数据标注过程中,数据范围不扩散;c)数据标注任务完成后,及时回收数据操作权限。8.6 数据安全应从以下几方面做好数据保密工作,确保数据安全:a)数据分发,使用必要的安全方式确保人工智能
6、数据分发过程中的安全性要求;b)数据存储,建立访问控制制度以及加密机制确保人工智能数据存在保密性要求;c)加密数据的标注,使用加密算法对加密人工智能数据进行运算标注,如同态加密算法等;cl)数据汇总,使用数据隔离等方式确保人工智能数据汇总时满足保密性要求;e)密码密钥的安全,建立人工智能数据密码密钥管理系统。8.7 数据完整为确保标注过程数据完整性,应做到:a)接收人工智能数据可验证,应保证接收的数据已通过认证;b)人工智能数据传输过程完整性,应保证标注活动数据完整性;c)数据标注可靠性,确保标准过程只执行了批准的范围;d)数据储存完整性,确保数据标注存储及备份数据完整行。对数据标注各环节建立
7、审计机制或制度,确保数据标注全过程能够对数据进行审计,应做到:a)对数据标注过程信息进行记录,并保证记录过程真实可靠;b)利用合理的技术方案确保数据标注的所有过程和行为可溯源。8.9 其他要求数据标注除了考虑以上要求外,还应针对人工智能数据的特点从数据标注任务的其他方面分析,包括但不限于:a)数据标注需不影响社会和公共安全;b)数据标注需考虑跨部门、跨组织的数据开放共享;c)跨境数据流动;d)知识产权保护及数据价值保护。5总体框架人工智能数据标注框架应包括任务规划、任务执行、任务评审、交付验收和总结、后期维护六过程。具体过程可根据数据标注任务规模简化或裁剪,人工智能数据标注总体框架见图1。图1
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 人工智能 数据 标注 总体 框架 规范 征求意见