互联网信息搜索与监测系统-网络舆情.docx
《互联网信息搜索与监测系统-网络舆情.docx》由会员分享,可在线阅读,更多相关《互联网信息搜索与监测系统-网络舆情.docx(18页珍藏版)》请在优知文库上搜索。
1、互联网信息搜寻与监测系统白皮书江苏金鸽网络科技有限公司2014年7月书目一、 开发背景1二、 系统概述1三、 系统结构2四、 功能简介3(一)信息采集3(二)信息监测4(三)智能分析5(四)信息预警6(五)统计报告7(六)舆情导控8(七)协助功能9(八)系统管理10五、 系统特色10(一)深度与广度相结合的信息采集方式10(二)基于语义的负面信息过滤技术11(三)智能的行业核心智能体11(四)信息采集智能倜度11(五)属性自动提取技术11(六)来源规则匹配技术11(七)黑名单网站自动发觉技术12(八)移动终端信息展示技术12六、 运行环境12七、公司资质14八、联系方式16一、开发背景依据第3
2、3次中国互联网络发展状况统计报告,截至2013年12月,中国网民规模达6.18亿,瓦联网普及率为45.8%。其中,手机网民规模达5亿。中国进入“大众麦克风”时代,各类网络媒体如微博、微信等新兴媒体层出不穷,导致社会舆论格局发生巨大改变,每一位网民和手机用户都可能成为“公民报道者“,在一些突发公共事务中常常成为第一信源。特殊是微博客、微信的异军突起,成为新闻曝光和舆论发酵的重要平台,信息的传播速度足以在数小时内传遍全球,因此,刚好驾驭舆论相关信息,无论对政府还是企事业单位,都有若至关全要的意义。由丁互联网具有虚拟性、隐藏性、发放性、渗透性和随意性等特点,越来越多的网民乐意通过这种渠道来表达观点、
3、传播思想。但是,网络信息存在很大的不行控性,使网络更简单成为种非理性的表达渠道,任何个被关注的事芬,都筒单在网上产生舆论风暴效应,短时间内形成新闻热点,进而对政府、公众产生巨大的舆论压力。为了有效的解决舆情管理工作中存在的滞后、被动的弊端,达到全面、刚好的获得互联网信息的目的,须要建立1.i联网信息搜寻与监测系统,形成全方位的监测网络体系,实现手工监测模式向信息化监测模式的转变。二、系统概述:联网信息搜寻与监测系统软件,是一款集信息的搜寻、采集、分析、预瞽、整合、呈报、导控为体的海量信息挖掘工具软件,以实现“发觉信息源头,追踪传播路径,监控传播主体,导控舆论倾向”为总体目标。系统针对不同行业的
4、业务需求,在领域专家的帮助下,实现对互联网上的论坛、博客、新闻、贴吧、微博、搜寻引擎、微侑等各类媒介信息的精准搜寻与实时监测:系统采纳自然语言理解、学问挖掘、本体构建等核心技术,对信息进行有效的提取、分析、过滤、聚类、分类和预警,以满意广阔用户对信息“刚好性、全面性、智能性、精准性”的运川要求:系统供应仃方信息权威发布和精准信息定向回豆功能,以达到“早监测、早发觉、早处置,、早导控”的目的。三、系统结构系统采纳B/S(BrouserZServer,阅读器/服务器系统结构。数据的分析和存储由位于网络中心的服务涔处理,不管是系统管理员还是终端用户,都通过阅读器来访问本系统获得、分析和处理信息。这种
5、结构能做到真正的分布式网络计算,有效降低网络流量,减轻客户端负担,还能平安、便利地与互联网接口。另外用户分布或行走于全国各地.通常都有移动办公需求,系统供应移动终端访问接口,用户只需随身携带移动通信设备,就可以访问系统,获得最新舆情信息。信息采JftKM(31.*%*)1.f1.2)采鬃信mmIiIf1.信息IR力搜索平台管理信息监制系统结构图四、功能简介系统首页(一)信息采集系统采纳定向采集和全网搜集相结合的信息采集方式,针对与日常业务具有亲密关系的网站进行实时监控,使网站的任何新的信息能快速刚好的被采集。(1)内置的搜寻信息整合功能系统内置了儿十个搜寻引擎,支持对知名新网媒体、论坛、贴吧及
6、微博网站、微信平台的站内垂直搜寻,扩大了信息采集的范围.管理抗依据系统的运行状态、服务耦资源运用状况,敏捷设置搜?引擎的启用或暂停,提升系统搜?引擎的臼动调度实力。采纳基于学问库的信息提取技术,过滤掉部分无效的信息,提取出关键、敏感的信息,达到精确搜寻。(2)新闻、资讯类网站的采集系统支持对新闻网站上的新闻、资讯信息的采集,可以采集信息中的标题、作拧、来源、时间、正文、点击率等信息项,可采集网站包括新华网、人民网、中国政府网、新浪新闻、搜狐新闻、联合早报、路透中文网、中国网、环球网、网易新闻、正义网等等。(3)博客类网站的采集系统支持对博客网站上的博文信息进行采集,可以采集博文标题、发表时间、
7、内容、标签、分类、评论、评论人、阅读人次、转发量等信息项,可采集网站包括新浪博客、博客网、网易网客、搜狐博客等等。(4)论坛、贴吧类网站的采集系统支持对论坛、贴吧网站上的发帖回帖信息进行采集,可以采集帖子标题、发表时间、发帖人昵称、帖子内容、阅读次数、回复次数、回帖人昵称、每个回帖内容等信息项,可聚集网站包括强国论坛、天际社区、西祠胡同、新浪论坛、百度贴吧等等.(5)微博、微信类网站的采集系统支持对新浪、腾讯、搜狐、网易等各大微博网站上的信息进行采集,同时支持对微信平台信息的搜寻采集,可以采集微博网站首页的热点信息、各行业及政府机关的官方微博信息、指定用户ID的微博上的信息。(6)特性化采集目
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 互联网 信息 搜索 监测 系统 网络 舆情
