2438.搜索引擎中搜索器的研究与实现 【计算机信息 毕业论文】 .doc
《2438.搜索引擎中搜索器的研究与实现 【计算机信息 毕业论文】 .doc》由会员分享,可在线阅读,更多相关《2438.搜索引擎中搜索器的研究与实现 【计算机信息 毕业论文】 .doc(12页珍藏版)》请在优知文库上搜索。
1、职业学院毕业论文(设计)题 目 搜索引擎中搜索器的研究与实现 毕业论文(设计)搜索引擎中搜索器的研究与实现 摘 要搜索引擎是从WWW上快速而有效地获取信息资源的捷径,而网络蜘蛛技术则是搜索引擎的关键。首先介绍了搜索引擎的工作原理及其系统结构,然后分析了搜索引擎中搜索器的地位和重要性,最后提出了实现一个中小型网站智能搜索引擎的设计思路。本文对于智能搜索器的设计与实现,主要是在现有网络蜘蛛的基础上,提出了以网页评价值或权威度为依据确定搜索策略的思路,并提出了更快捷、更全面的提取URL的策略。本文对如何提取文档摘要做了研究,提出以语句位置、关键词、与标题相关度、累计相似度四个参数为依据,按所得到的语
2、句权值对文中所有语句进行排序,确定语句在整个文档中的重要性,由此按照一定的压缩率得到整个文档的摘要。本文的研究既具有一定的理论意义和技术价值,又具有一定的市场价值,它将有助于搜索引擎智能化的提高,对生活信息、娱乐信息、科研信息、商业信息的检索和获取,扩大商业机会,具有较大的社会和经济效益。关键词:搜索器,URL,智能,搜索策略,文档摘要ii目 录搜索引擎中搜索器的研究与实现I目 录II第1章 前言11.1 课题的意义11.2 国内外研究现状11.3 课题的研究目标1第2章 搜索引擎的工作原理和系统结构22.1 搜索引擎的工作原理22.2 搜索引擎的系统结构32.3 本章小结3第3章 搜索引擎中
3、搜索器的设计思想43.1搜索器基本概念的理解43.2智能搜索器系统结构的设计43.3 搜索策略的设计思想43.4 文档摘要提取方法设计思想43.5 本章小结4第4章 智能搜索器的设计实现54.1 搜索器的搜索程序的设计54.2 文档摘要提取的具体设计54.3 本章小结5第5章 试验结果65.1 搜索算法的试验结果与性能分析65.3 本章小结6第6章 总结76.1 主要工作和创新点76.2 存在的问题及未来的方向7参考文献8致谢9毕业论文(设计)第1章 前言1.1 课题的意义因特网上的信息呈几何级数增长,面向因特网的信息获取与处理技术是当前计算机科学与技术领域急需研究的课题。1.2 国内外研究现
4、状国内关于搜索引擎和搜索器的研究始于对国外相关成果的介绍,到现在渐渐成为热点,从论文数量的分支专题分布看,综合性研究论文的数量远远超过细分化专门领域的论文及成果数量。国外未来搜索引擎的发展应朝着智能型综合化的方向发展1 2。1.3 课题的研究目标通过对搜索引擎工作原理及系统结构的研究,以Java为开发工具,编写智能搜索器来提高搜索引擎的搜索能力。尤其是在提高全、准、快、省方面有明显的效果。拟解决的关键问题:(1) 采用多线程编程技术设计中小型网站的爬行算法。(2) 根据语句位置、关键词权重、相似度等对文档内容进行摘要的提取。第2章 搜索引擎的工作原理和系统结构2.1 搜索引擎的工作原理2.1.
5、1 搜索引擎的工作原理搜索引擎一般由搜索器、索引器、检索器和用户接口四个部分组成。(1) 搜索器其功能是在互联网中漫游、发现和搜集信息。并行计算技术,以提高信息发现和更新的速度。(2) 索引器(3) 检索器(4) 用户接口2.1.2 搜索引擎的比较对几个著名搜索引擎从检索功能、结果显示格式、结果排序规则、标引内容、信息采集等方面作个总结。(1) 检索功能几种主要的搜索引擎均支持单词、关键词的简单和高级查询功能。支持布尔运算,一般缺省为or运算。(2) 结果排序规列关键词、检索词在所有这些搜索引擎中均是结果排序的重要依据。(3) 标引内容总之,由高到低的顺序是:InfoSeek、OpenText
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机信息 毕业论文 2438.搜索引擎中搜索器的研究与实现 【计算机信息 毕业论文】 2438. 搜索引擎 搜索 研究 实现 计算机信息 毕业论文