XX市行政执法多维模型智能分析应用项目采购需求.docx
《XX市行政执法多维模型智能分析应用项目采购需求.docx》由会员分享,可在线阅读,更多相关《XX市行政执法多维模型智能分析应用项目采购需求.docx(11页珍藏版)》请在优知文库上搜索。
1、XX市行政执法多维模型智能分析应用项目采购需求一、项目背景结合关于印发“XX城市大脑2.O三大提升工程实施方案”的通知X城脑指2024)1号文要求:围绕体征监测、事件处置、指挥调度、分析研判、综合评价、数字赋能等六大中心建设,有序推进政务服务“一网通办”、城市运行“一网统管”、社会治理“一网共治”“三个一网”核心场景综合集成,打造“城市治理操作系统”,促进“三个一网”融合发展,为形成超大城市数字治理系统解决方案,打造数字化平台载体。在当前国家大力推进数字中国建设的背景下,XX市积极响应数字中国建设整体布局规划的号召,依托XX数字挛生城市建设三年行动计划,启动多项关键软件项目建设,旨在全面提升城
2、市治理的智能化水平,推动数字经济与实体经济的深度融合。项目聚焦于解决当前城市治理中的痛点与难点,特别是针对涉企、扰企等问题,通过构建智能化执法检查管理系统,优化营商环境,减少对企业正常运营的干扰。同时,项目还注重分析执法趋势,支撑政府决策,紧盯群众诉求,分析治理重点,确保城市治理工作能够精准施策、靶向治理。二、建设内容(一)行政执法领域垂直模型训练1.数据归集、清洗依据业务需求,会对执法监管、执法监管非结构化文书、执法协同、政务服务、投诉举报、行政复议、行政诉讼、监管对象、执法主体、执法规则、法治知识等数据进行采集和清洗,从不同数据源采集的数据整合到统一数仓,在整合过程中会剔除重复数据,修正错
3、误数据,对数据的类型、单位、根据开发规范转换、空值处理,提高数据质量,保证模型训练高效使用。(1)执法监管数据:包括风险线索、行政检查、行政处罚、行政强制等案件数据。(2)执法监管非结构化文书数据:包括行政检查、行政处罚、行政强制等文书数据。(3)执法协同数据:包括线索流转、案件移送、两法衔接、执法公示等。(4)政务服务数据:包括告知承诺、行政许可、服务办件等。(5)投诉举报数据:包括投诉信息、办理信息、回访数据、复查复核信息、满意度评价等。(6)行政复议、行政诉讼数据:包括复议案件、复议对象、诉讼案件、诉讼结果等。(7)监管对象数据:包括个体工商、企业、其他组织、特种设备、场地场所等。(8)
4、执法主体数据:包括执法人员、执法部门等。(9)执法规则数据:包括许可事项、检查事项、处罚事项、强制事项等。(10)法治知识数据:包括法律法规、执法依据、执法事项、两法衔接指引等。2 .指标、标签开发标注依据采集和清洗的数据,根据业务需求和数据探索分析,制定出相关数据的业务维度字段,进行维度建模,开发成各种业务类型、可多维度分析的模型宽表。数据标注涉及从模型宽表数据中提取信息,并为每个数据点添加合适的标签或注释。包括执法监管数据、执法监管非结构化文书数据、执法协同数据、政务服务数据、投诉举报数据、行政复议、行政诉讼数据、监管对象数据、执法主体数据、执法规则数据、法治知识数据。3 .训练数据加工训
5、练数据加工会对采集来的数据进行清洗,去除噪声和异常值,检测和处理缺失值、异常值、重复值等,确保数据的一致性和完整性。(1)提问模板汇编:设定好提问模版,根据不同的查询语句使用自动化工具生成同语义的自然语言问句。2 2)QA对汇编:将字段含义文本与生成的问句拼接,作为数据中的Q,对应的查询语句作为A,整合成ison格式。4 .异常监测(1)预警监测:预警监测任务设置,支持对异常趋势指标或异常指标设置监测任务,选择发送对象或其他规则。(2)预警提醒:创建指标预警触发规则,以特定的形式主动推送指标,触达业务相关人员,即时反馈业务问题。5 .行政执法垂直领域模型训练实现行政执法领域大模型的加载、微调、
6、强化及应用,在原有的基座大模型的基础上丰富其功能,限制其场景,规范其输出。(1)模型初始化从国内目前已有的开源大模型中,从安全性、可用性、可靠性等维度进行模型选型,实现基座大模型的加载与直接推理,验证基座大模型与微调框架的兼容性。(2)模型部分参数微调算法处理开发调整面向开源大模型的微调算法框架,实现LORA、QLoRA,DORA等部分参数微调能力,增加SinlP0、KTO等前沿调优算法的实现,增加UnShth等长文本输入优化策略,增加FSDP等高效GPU利用方案,增加SWift等模型推理加速应用。(3)执法问答场景算法强化针对执法问答辅助场景的微调,调整损失函数和训练目标,使模型能理解行政法
7、规、监管事项、处罚案件、文书等内容,从而服务于执法活动。同时训练多个相关任务(如问答、摘要、分类等),利用任务之间的关联性提升模型的综合能力。使用多种评估指标(如准确率、Fl-score.BLEU、RoUGE等)全面评估模型性能。(4)安全性算法处理安全性检查包括敏感信息获取和安全攻击预警。针对敏感信息获取任务,指定敏感信息类型,设定提示词指引模型对敏感信息内容进行识别并做脱敏处理,若提示词无法生效则通过相应的敏感信息类型整理训练数据进行参数调整;针对安全性攻击,主要形式为SQL注入和脚本注入,主要通过页面访问参数进行规避。(5)兜底纠错算法处理预设兜底回复,设定提示词对模型回复进行约束,当提
8、问无法获知明确答案时启用兜底回复,当查询结果为空时引导用户更改提问方式。当提问中包含特定名称时通过任务链查找外挂词库进行纠错。6 6)PPO/DPO训练PPO指通过与环境交互并基于奖励信号优化策略模型,可以有效提升模型在对话任务中的表现。DPo指通过直接优化生成文本的偏好得分,使模型生成的回答更符合预期偏好,提高对话的质量。在微调过程中增加奖励机制和惩罚机制对模型回复进行对应的强化学习,修正模型在多轮对话过程中的话题保持和话题跳出决策,优化对话体验。6 .知识库向量化在知识问答环节不能将全量知识作为训练数据进行学习,大多数问答仍需通过外挂知识库进行知识补充,当外挂知识库准备好后使用大模型进行向
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- XX 行政 执法 多维 模型 智能 分析 应用 项目 采购 需求
