XX学院AI智慧中台建设项目建设需求说明.docx
《XX学院AI智慧中台建设项目建设需求说明.docx》由会员分享,可在线阅读,更多相关《XX学院AI智慧中台建设项目建设需求说明.docx(16页珍藏版)》请在优知文库上搜索。
1、XX学院AI智慧中台建设项目建设需求说明一、项目概况依据院校十四五规划中构建智慧中枢,打造智慧校园的要求,结合当前信息化能力建设阶段,提出构建非结构化信息资源处理能力建设的要求。项目应用自然语言处理、知识图谱、图像识别、机器学习等新一代人工智能技术,构建面向处理文本、图片、视频等非结构化资源的Al能力平台,向应用系统提供分类识别、信息抽取、智能搜索、常识校对、问答对话、OCR文本识别、知识图谱构建、NLP自主学习等认知计算能力。资源AI能力赋能到办公、办事等多个场景,实现智慧办公、智慧办事、智慧管理等,为汇聚和挖掘教学课件、项目资料、历史公文、科研资料、课外资料等大数据资源提供自动化加工和挖掘
2、能力。通过赋能和资源挖掘,助力构建完善“XX学院智慧中枢”,提升助学、助教、助研、助管等方面的效率和质量。本期项目结合当前时期的发展要务,优先搭建资源AI平台基础能力,在公文处理、行政办事、学习研究等场景上进行智慧化应用的落地,实现智慧办文、智慧办事、统一资源搜索等应用。采购人以“一站式、智能化”为建设定位,基于现有数据资源体系,需完成教育部在全国职业教育智慧大脑院校中台数据标准及计算指标文件中所规定的8大数据集31张标准表的数据上报工作。场景上进行智慧化应用的落地,实现智慧办文、智慧办事、统一资源搜索等应用。通过本期项目建设来提高采购人数据报送工作效率,保障报送数据的质量,减少人工工作量,并
3、且提供多维度预警分析服务,让校领导实时掌握校内真实数据,与上报进度,促进校内信息化建设,与前期数据治理体系做好联动,也为后续数据资产价值化奠定坚实基础。二、建设清单序号服务项目单位数量1资源Al赋能平台项12智能辅助办文应用顶13智能辅助办事应用项14统一资源搜索应用项15数据门户开发服务项16API管理平台服务年37ETL数据集成平台服务年38数据上报服务项19与学校相关平台对接1三、建设明细及要求序号具体技术(参数)要求一、资源Al赋能平台(1项)1.资源自动采集可通过可视化配置工具,设定采集来源、信息提取规则、定时任务,自动化的、大规模的从互联网网站上抓取非结构化的文本、图片、文件等资源
4、信息,并做初步加工后保存到资源库中。通过灵活的配置,对本地文件和第三方应用系统数据库数据进行简单清洗,并保存到资源库中。2 .自然语言处理基础能力(1)中文分词:将连续的汉字、标点符号、英文字母等字序列按一定中文规范重新组合成词序列,并根据汉语词性对照表标注出各个词的词性,(2)命名实体识别:识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等。(3)依存句法分析:确定句子的句法结构或者句子中词汇之间的依存关系,利用句子中词之间的依存关系来表示词语的句法结构信息(如主谓、动宾、定中等结构关系),并用树状结构来表示整句的结构(如主谓宾、定状补)。(4)文本相似度计算:计算两个文本
5、(文章)之间的相似度,支持短句、长文本。(5)新词发现:未登录词识别,针对随时代发展而新出现或旧词新用的词进行发现。(6)关键词提取:从一篇文本中发现表达文档中心内容的词语和置信度。(7)查询音/形近词:音近词即为读音近似的词语,音调可以相同也可以不同,形近词是指几个字形结构相近的词语,而形近词的含义却不一样,查询音/形近词是指根据中文词语,词语汉语拼音、英文词组查询音近词和形近词。3 .分类识别能力(1)文书体裁识别:分析文书标题、文书结构、文书风格,针对公文、合同、项目资料进行体裁分类。(2)文本热点抽取:分析一段长文本内容,根据词频计算,形成热点词汇及热度权重。分析一堆文档类文件内容,结
6、合篇频和词频计算,形成热点及热度权重。支持词汇范围限定和特定词汇过滤。(3)文本标签识别:提供标签定义、关系维护、标签识别规则设置邓功能。分析短文本和文书文本内容,按不同维度进行分类,生成标签和置信度。(4)图片人物标注:提供人物基本信息和人物头像维护功能。分析图片内容,识别图中人脸及范围,与人物头像进行匹配,标注图中人物的姓名和IDo4 .信息抽取能力(1)文书碎片化:把一份完整文书分解为内容片段,其中包括篇、章节、段落、句子、图片、表格等细粒度片段。需要支持txt、doc、docx、WPs、ppt、txNxls、xlsx、pdf%Ofd、htmlhtm等格式文件。(2)文书头抽取:针对文书
7、内容进行分析,从中提取各种文书的要点。支持txt、docdocxwpsppt、pptxxls、xlsx、pdfOfd、htmKhtm等格式文件,至少支持公文、合同、招标书等体裁。(3)视频碎片化:从视频中可以抽取首帧图片,关键帧图片、字幕内容、视频中文字、人物以及对应位置,也可以按主题对视频文件进行自动分段。支持mp4、avi、Wmv、asf、asxrm、rmvb等多种格式视频。(4)摘要生成:针对文档内容进行文字提取,根据不同体裁业务语义生成摘要,支持公文、合同、招标书、会议纪要等体裁。5 .智能搜索能力(1)以文找文:以标题找具体文档,以段落找出处文档,以主题词找多个文档,以段落找相似段落
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- XX 学院 AI 智慧 建设项目 建设 需求 说明
