第04讲列联表与独立性检验(原题版).docx
备战2024年高考解读突破强化一轮复习讲义(新高考)第04讲列联表与独立性检验【考试要求】1 .掌握分类变量的含义.2 .通过实例,理解2X2列联表的统计意义.3 .通过实例,了解2X2列联表独立性检验及其应用.知识点一分类变量与列联表(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量;(2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X和匕X表示相互对立的两个事件=0和=I,Y表示相互对立的两个事件y=0和y=1,其中内b,C,d是事件X=x,Y=y(x,y=0,1)的频数,是样本量,其样本频数列联表(称为2X2列联表)如表所示:XY合计Y=Oy=X=OahabX=Cdc+d合计a+cb+d=+6+c+d知识点二独立性检验(1)小概率值。的临界值:对于任何小概率值。,可以找到相应的正实数总,使得关系P(2xJ=。成立.我们称Xa为的临界值,这个临界值可作为判瞰2大小的标准.概率值夕越小,临界值Xa越大;(2)炉的计算公式:* =Mad-be?(。+力(c*Xo+c)(6+<)'(3)独立性检验:利用炉的取值推断分类变量X和y是否独立的方法称为必独立性检验,读作“卡方独立性检验”,简称独立性检验;(4)基于小概率值的检验规则:当222%时,我们就推断办不成立,即认为X和丫不独立,该推断犯错误的概率不超过防当时,我们没有充分证据推断Ho不成立,可以认为X和y独立(其中Xa为的临界值);(5)应用独立性检验解决实际问题的主要环节:提出零假设“0:X和y相互独立,并给出在问题中的解释;根据抽样数据整理出2X2列联表,计算犬的值,并与临界值Xa比较;根据检验规则得出推断结论;在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和丫间的影响规律.(6)独立性检验中几个常用的小概率值和相应的临界值:a0.10.050.010.0050.001Xa2.7063.8416.6357.87910.8281 .下列判断正确的是()A分类变量中的变量与函数的变量是同一-概念.()B等高堆积条形图可初步分析两分类变量是否有关系,而独立性检验中炉取值则可通过统计表从数据上说明两分类变量的相关性的大小.()C独立性检验的方法就是用的反证法.()D/的大小是判断事件力与B是否相关的统计量.()2 .观察下面各等高堆积条形图,其中两个分类变量关系最强的是()3 .(多选)若在研究吸烟与患肺癌的关系中,通过收集、整理、分析数据得“吸烟与患肺癌有关''的结论,并且有99%以上的把握认为这个结论是成立的,则下列说法中正确的是()A.在犯错误的概率不超过0.01的前提下,认为吸烟和患肺癌有关系B.1个人吸烟,那么这个人有99%的概率患有肺癌4 .下面是一个2×2列联表:XY合计刃yXia2173X2222547合计b46120则表中的d=,b=.X,丫,由它们的样本数据计算得到z24.328,Z2的部分临界值表如下:aXa则最大有的把握说变量X,Y有关系(填百分数).考点一等高条形图例12018年12月28日,广州市地铁14号线开通,在一定程度上缓解从化到广州市区交通的拥堵,为了了解市民对地铁14号线开通的关注情况,某调查机构在地铁开通后的某两天抽取了部分乘坐地铁的市民作为样本,分析了其年龄和性别结构,并制作出如下等高条形图:根据图中(35岁以上含35岁)的信息,下列结论不一定正确的是()A.样本中男性比女性更关注地铁14号线开通B.样本中多数女性是35岁以上C.样本中35岁以下的男性人数比35岁以上的女性人数多D.样本中35岁以上的人对地铁14号线的开通的关注度更高【对点演练1】(多选)根据如图所示的等高堆积条形图,下列叙述正确的是()A.吸烟患肺病的频率约为0.2B.吸烟不患肺病的频率约为0.8C.不吸烟患肺病的频率小于0.05D.吸烟与患肺病无关系【对点演练2】(2022下山东临沂高二统考期中)某校为研究该校学生性别与体育锻炼的经常性之间的联系,随机抽取100名学生(其中男生60名,女生40名),并绘制得到如图所示的等高堆积条形图,则这100名学生中经常锻炼的人数为.知识点二列联表例2.(2022下海南高二统考期末)为考查某种营养品对儿童身高增长的影响,用一部分儿童进行试验,根据100个有放回简单随机样本的数据,得到如下列联表:由表可知下列说法正确的是()身高合计有明显增长无明显增长食用该营养品a1050未食用该营养品b3050合计6040100参考公式:参=(”人工)(工)9+4,其中+Hc+d.B.212.667C.从样本中随机抽取1名儿童,抽到食用该营养品且身高有明显增长的儿童的概率是1D.根据小概率值=0.001的独立性检验,可以认为该营养品对儿童身高增长有影响【对点演练1】(2023云南昆明校联考一模)考查棉花种子经过处理跟生病之间的关系得到如表数据:项目种子处理种子未处理总计得病32101133不得病192213405总计224314538根据以上数据,则()A.种子是否经过处理决定是否生病B.种子是否经过处理跟是否生病无关C种子是否经过处理跟是否生病有关D.以上都是错误的【对点演练2】(2024高三课时练习)如表是一个2x2列联表,则表中b的值分别为()y2合计王a2173巧222547合计b46120A.94,72B.52,50C.52,74D.74,52考点三独立性检验角度1独立性检验思想的辨析例3(2023上全国高三专题练习)下列关于独立性检验的说法正确的是()A.独立性检验是对两个变量是否具有线性相关关系的一种检验B.独立性检验可以100%确定两个变量之间是否具有某种关系C.利用/独立性检验推断吸烟与患肺病的关联中,根据小概率值=0.0i的独立性检验,认为吸烟与患肺病有关系时,则我们可以说在100个吸烟的人中,有99人患肺病D.对于独立性检验,随机变量/的值越小,判定”两变量有关系”犯错误的概率越大【对点演练1】(2022上广东东莞高三校考阶段练习)根据分类变量X与V的观测数据,计算得到/=3.974.依据=0.05的独立性检验,结论为()a0.10.050.010.0050.0012.7063.8416.6357.87910.828A.变量X与歹不独立,这个结论犯错误的概率不超过0.01B.变量X与N不独立,这个结论犯错误的概率不超过0.05c.变量X与y独立,这个结论犯错误的概率不超过0.05D.变量X与丁独立,这个结论犯错误的概率不超过0.01【对点演练2】(2023陕西榆林统考三模)若由个2x2列联表中的数据计算得K2=3,A.能有95%的把握认为这两个变量有关系B.能有95%的把握认为这两个变量没有关系C.能有97.5%的把握认为这两个变量有关系D.能有97.5%的把握认为这两个变量没有关系【对点演练3】(2023上全国高三专题练习)(多选)根据分类变量X与y的观察数据,计算得到/=2.974,依据表中给出的/独立性检验中的小概率值和相应的临界值,作出下列判断,A.根据小概率值a=0.05的独立性检验,分析变量X与y相互独立B.根据小概率值=0.05的独立性检验,分析变量X与y不相互独立C.变量X与yD.变量X与y角度2卡方的计算与应用例4.(2023全国模拟预测)某超市对一种商品受顾客的喜爱程度进行100份问卷调查,得2到了如下的2x2列联表,从100人中随机抽取1人,抽到喜爱该商品的男顾客的概率为不喜爱该商品不喜爱该商品合计男顾客10女顾客35合计100则有超过()的把握认为喜爱该商品与性别有关.下面的临界值表供参考:C. 90%D. 95%【对点演练1】(2023上全国高三专题练习)在某病毒疫苗的研发过程中,需要利用基因编辑小鼠进行动物实验.现随机抽取100只基因编辑小鼠对该病毒疫苗进行实验,得到如下2×2列联表(部分数据缺失):被某病毒感染未被某病毒感染合计注射疫苗1050未注射疫苗3050合计30100计算可知,根据小概率值Q =的独立性检验,分析”给基因编辑小鼠注射该种疫苗能起到预防该病毒感染的效果"()Mad - bc)( + 6)(c + d)( + c)(b + d),“=+>+c+d.附:Z角度3根据结论求参数(范围)例5. (2020河南濮阳统考二模)2020年2月,全国掀起了 “停课不停学”的热潮,各地教师通过网络直播、微课推送等多种方式来指导学生线上学习.为了调查学生对网络课程的热爱程度,研究人员随机调查了相同数量的男、女学生,发现有80%的男生喜欢网络课程,有40%的女生不喜欢网络课程,且有99%的把握但没有99.9%的把握认为是否喜欢网络课程与性别有关,则被调查的男、女学生总数量可能为()n(ad -be附.a+b)(c + d)(a + c)(b + d ),其中 = +b + c + d.【对点演练1】在研究某高中高三年级学生的性别与是否喜欢某学科的关系时,总共调查了N个学生(N=10011M"cN.),其中男女学生各半,男生中60%表示喜欢该学科,其余表示不喜欢;女生中40%表示喜欢该学科,其余表示不喜欢.若有99.9%把握认为性别与是否喜欢该学科有关,则可以推测N的最小值为()n(ad-be)2(a+b)(c+d)a+c)(b+d)附K? =A. 400C. 200D. 100B.300【对点演练2】(2023上陕西高三校联考阶段练习)第19届亚运会将于2023年9月23日至10月8日在杭州举行,某网络直播平台调研”大学生是否喜欢观看体育比赛直播与性别有关"从某高校男、女生中各随机抽取100人进行问卷调查,得到如下数据(5m15"N).喜欢观看不喜欢观看男生80-/H20+w女生50+zw50-/W通过计算,有95%以上的把握认为大学生喜欢观看直播体育比赛与性别有关,则在被调查的100名女生中喜欢观看体育比赛直播的人数的最大值为()Mad-bc)(+Z>)(c+6/)(a+c)(b+d)C. 58D. 60角度4独立性检验思想的实际应用例6(2022全国甲卷政编)甲、乙两城之间的长途客车均由4和B两家公司运营.为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:准点班次数未准点班次数A24020B21030(