数据库检索方式.ppt
《数据库检索方式.ppt》由会员分享,可在线阅读,更多相关《数据库检索方式.ppt(45页珍藏版)》请在优知文库上搜索。
1、第四章计算机信息检索的基本技术与方法一、计算机信息检索的基本技术:一、计算机信息检索的基本技术: 布尔逻辑、截词检索、加权检索,位置算符等布尔逻辑、截词检索、加权检索,位置算符等。在进行计算机检索时,有时有一些比较复杂的课题,在进行计算机检索时,有时有一些比较复杂的课题,如:如:“GPSGPS在建筑中的应用在建筑中的应用”,既涉及,既涉及GPSGPS,又涉及又涉及建筑,还有建筑,还有“应用应用”,这时候就要编制出满足要求的计,这时候就要编制出满足要求的计算机检索式,它是机检的基础。算机检索式,它是机检的基础。1 1布尔逻辑检索(布尔逻辑检索(Boolean Logic Boolean Logi
2、c RetrievalRetrieval) 逻辑检索的基础是逻辑运算,逻辑运算中最常用的逻辑检索的基础是逻辑运算,逻辑运算中最常用的是布尔逻辑运算符(是布尔逻辑运算符(Boolean Logic OperatorsBoolean Logic Operators), ,即与、即与、或、非三种运算符号,或、非三种运算符号,用它们可以表示概念之间的逻辑用它们可以表示概念之间的逻辑关系。关系。检 索 要求逻辑检索 课题 表达式 检 索 结果概念相交、限定 AND与* 计算机用于制图 A BA AND BA * B 缩小检索范围提高查准率 概念平行、并列 OR或+ 土地管理与土地利用 A B A OR
3、B A+B扩大检索范围提高查全率 某一主题去掉一部分相关主题 NOT非- 除光电测距以外的 A 电磁波测距 BB NOT AB-A提高查准率 2 位置算符位置算符(Proximity Operators) 位置算符是表示检索词之间位置关系的一种运位置算符是表示检索词之间位置关系的一种运算符。由于英文对一句话有多种表达方法,写法可算符。由于英文对一句话有多种表达方法,写法可能不同。如:能不同。如:“GPS在铁路桥研究中的应用在铁路桥研究中的应用”这个这个课题,用英文表达可能是课题,用英文表达可能是“Using of GPS in Railway Bridge”, 也可能是也可能是“Using o
4、f GPS in Bridge of Railway”,因而可能编制出这样的检索因而可能编制出这样的检索式,式,GPS AND (Railway (2N)Bridge)我们可以通过位置检索提高检索的准确率(1) (W)算符与算符与(nW)算符算符 W 是是word与与 with的缩写。的缩写。 特点:特点:W词序不变,中间不可插词,但两词间可有词序不变,中间不可插词,但两词间可有一个标点,连字符或空格。一个标点,连字符或空格。 nW词序不变,中间可插入词序不变,中间可插入N 个词。个词。 如:如:potential (w) energy可能检出可能检出potential energy and
5、function 又如:又如:gone (2w)wind 可能检出可能检出gone with the wind (2) (N)与与(nN)算符算符 N是是near的缩写的缩写 特点:特点:N词序不限,中间不可插词,但两词间可有一词序不限,中间不可插词,但两词间可有一个标点,连字符或空格。个标点,连字符或空格。 nN词序不限,中间可插入词序不限,中间可插入N 个词。个词。 如:如:econom? (2N)recovery可能检出可能检出economic recovery,recovery of the economy,(3)同字段检索)同字段检索A(F)B,F是是field的缩写。的缩写。 特点
6、:特点:A、B两词必须出现在同一字段中,词序与两词必须出现在同一字段中,词序与词量不限。词量不限。 如:如:environment (F)impact/DE,表示两个词必须表示两个词必须同时出现在叙词字段内。同时出现在叙词字段内。(4) 同句检索同句检索A(S)B,S是是sentence的缩写的缩写。 特点:特点:A、B出现在同一自然句中(子字段),其出现在同一自然句中(子字段),其词序与词量不受限制。词序与词量不受限制。 如:如:electric (S)plant可检出可检出electric power plants如:如:EI中的中的NEAR;PQDD中的中的W/n (两词间距小于两词间距
7、小于n个单词,且前后位置任意个单词,且前后位置任意),Pre/n (两词间距小于两词间距小于n个单词,且前后位置一定个单词,且前后位置一定)3 3截词算符截词算符( (Truncating operators)Truncating operators) 原因原因:在英语词汇中,一个词可能有多种形态,如词的单、复:在英语词汇中,一个词可能有多种形态,如词的单、复数形式的不同,英美拼写方法不同、词性不同等。如果检索时将数形式的不同,英美拼写方法不同、词性不同等。如果检索时将这类词全部输入进去,会增加检索时间和费用,采用截词法可解这类词全部输入进去,会增加检索时间和费用,采用截词法可解决这一问题。决
8、这一问题。 所谓截词检索,是指在检索标识中保留相同的部分,用相应所谓截词检索,是指在检索标识中保留相同的部分,用相应的截词符代替可变化部分。检索中计算机会将所有含有相同部分的截词符代替可变化部分。检索中计算机会将所有含有相同部分标识的记录全部检索出来。常用标识的记录全部检索出来。常用“?”、“*”符号表示。符号表示。 (1)有限截词)有限截词。即在检索词后后截几个有限的字母,如名词的。即在检索词后后截几个有限的字母,如名词的单复数,动词的词尾变化等。单复数,动词的词尾变化等。如输入如输入computer?表示有表示有0-1个字母变化,可检出个字母变化,可检出computer和和computer
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据库 检索 方式