数据结构哈希表解析介绍资料.docx
《数据结构哈希表解析介绍资料.docx》由会员分享,可在线阅读,更多相关《数据结构哈希表解析介绍资料.docx(23页珍藏版)》请在优知文库上搜索。
1、在前面的系列文章中,依次介绍了基于无序列表的咽i查找,基于有序数组的二分查找,平衡查找树,以及红黑树,下图是他们在平均以及最差情况下的时间复杂改:Iimplementationworst-casecost(afterNinserts)average-casecost(afterNrandominserts)orderediteration?keyinterfacesearchinsertdeletesearchhitinsertdeletesequentialsearch(unorderedlist)NNNN/2NN/2noequals()binarysearch(orderedarray)I
2、gNNNIgNN/2N/2yesco11areTo()BSTNNN1.38IgN1.38IgN?yescoareTo()red-blackBST2IgN2IgN2IgN1.00IgN1.00IgN1.00IgNyescoareTo()可以看到在时间复杂度上,红黑树在平均情况下插入,查找以及删除上都达到了IgN的时间复杂度。那么有没有查找效率更高的数据结构呢,答案就是本文接下来要介绍了散列表,也叫哈希表(HaShTable)什么是哈希表哈希表就是一种以键-值(key-indexed)存储数据的结构,我们只要输入待查找的值即key,即可查找到其对应的值。哈希的思路很简单,如果所有的键都是整数,那么
3、就可以使用一个简单的无序数组来实现:将键作为索引,值即为其对应的值,这样就可以快速访问任意键的值。这是对于简单的键的情况,我们将其扩展到可以处理更加复杂的类型的键。使用哈希查找有两个步骤:1 .使用哈希函数将被查找的键转换为数组的索引.在理想的情况下,不同的键会被转换为不同的索引值,但是在有些情况下我们需要处理多个键被哈希到同一个索引值的情况。所以哈希查找的第二个步骤就是处理冲突2 .处理哈希碰撞冲突。有很多处理哈希碰撞冲突的方法,本文后面会介绍拉链法和线性探测法。哈希表是一个在时间和空间上做出权衡的经典例子。如果没有内存限制,那么可以直接将键作为数组的索引。那么所有的查找时间复杂度为0(1)
4、;如果没有时间限制,那么我们可以使用无序数组并进行顺序查找,这样只需要很少的内存。哈希表使用了适度的时间和空间来在这两个极端之间找到了平衡。只需要调整哈希函数算法即可在时间和空间上做出取舍。哈希函数哈希查找第一步就是使用哈希函数将键映射成索引。这种映射函数就是哈希函数。如果我们有一个保存0-M数组,那么我们就需要一个能够将任意键转换为该数组范围内的索引(O-MT)的哈希函数。哈希函数需要易于计算并且能够均匀分布所有键。比如举个简单的例子,使用手机号码后三位就比前三位作为key更好,因为前三位手机号码的重复率很高。再比如使用身份证号码出生年月位数要比使用前几位数要更好。在实际中,我们的键并不都是
5、数字,有可能是字符串,还有可能是几个值的组合等,所以我们需要实现自己的哈希函数。1 .正整数获取正整数哈希值最常用的方法是使用除留余数法。即对于大小为素数M的数组,对于任意正整数k,计算k除以M的余数。M一般取素数。2.字符串将字符串作为键的时候,我们也可以将他作为一个大的整数,采用保留除余法。我们可以将组成字符串的每一个字符取值然后进行哈希,比如publicintGetHashCode(stringstr)charts=str.ToCharArrayO;inthash=O;for(inti=O;is.Length;i+)(hash=si+(31*hash);)returnhash;)上面的哈
6、希值是HOrner计算字符串哈希值的方法,公式为:h=s031j+.+sL-33f+sL-231,+sL-131举个例子,比如要获取“Call”的哈希值,字符串C对应的UniCOde为99,a对应的UniCode为97,L对应的UniCode为108,所以字符串“call”的哈希值为3045982=993f+973l+10831+10831=108+31(108+31-(97+31-(99)如果对每个字符去哈希值可能会比较耗时,所以可以通过间隔取、个字符来获取哈西值来节省时间,比如,可以获取每8-9个字符来获取哈希值:publicintGetHashCode(stringstr)(chars=
7、str.ToCharArrayO;inthash=O;intskip=Math.Max(1,s.Length/8);for(inti=O;is.Length;i+=skip)hash=si+(31*hash);)returnhash;)但是,对于某些情况,不同的字符串会产生相同的哈希值,这就是前面说到的哈希冲突(HaShCollisions),比如下面的四个字符串:http:/www.cs.princeton.eduintrocs131oopHello.javahttp:/www.cs.princeton.eduintrocs131oopHello.classhttp:/wwwcsprince
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据结构 表解 介绍 资料