还剩14页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
独立性检验§3课标要求L通过实例理解列联表的统计意义2了解随机变量/的意义,通过对典型案例分2X2析,了解独立性检验的基本思想和方法.素养要求通过运用列联表进行独立性检验,提升数学抽象及数据分析素养.预习教材-必备知识探究问题导学
1.思考山东省教育厅大力推行素质教育,增加了高中生的课外活动时间,某校调查了学生的体育文娱合计男生210230440女生60290350合计270520790课外活动方式,结果整理成下表如何判定“喜欢体育还是文娱与性别是否有联系”?提示可通过表格与图形进行直观分析,也可通过统计分析定量判断.
2.填空
(1)2X2歹」联表I设为两个变量,每一个变量都可以取两个值,变量变量A,B A4,4=4;B Bi,B=Bi,有下面列联表:2X2Bi Bi总计a ba~\~bc dc~\rd卜2总计〃+c b+d其中,表示变量取且变量取时的数据;表示变量取且变量取星时的数据;A Ai,88b A Ai,6c表示变量取且变量取时的数据;表示变量取小,且变量取时的数据.AA2,331d A3B2男1310女720为了判断主修统计专业是否与性别有关系,根据表中的数据,得到/=50义13X20—10X72一心
4.
8443.841,所以判定主修统计专业与性别有关系,那么这23X27X20X30种判断把握程度约为.答案95%解析因为/
3.841,所以有95%的把握认为主修统计专业与性别有关.
7.世界杯期间,某一电视台对年龄高于40岁和不高于40岁的人是否喜欢西班牙队进行调查,对高于40岁的调查了50人,不高于40岁的调查了50人,所得数据制成如下列联表不喜欢喜欢总计西班牙队西班牙队高于40岁50P Q不高于40岁153550总计a b1003若工作人员从所有统计结果中任取一个,取到喜欢西班牙队的人的概率为巳则有把握认为年龄与喜欢西班牙队有关.答案95%解析设“从所有人中任意抽取一个,取到喜欢西班牙队的人”为事件A,由已,/日q+353知得PA=鼠=亍所以9=25,p=25,=40,b=
60.0100X25X35-25X15225/=---------------------------------------=—1673841X40X60X50X506,皿—故有95%的把握认为年龄与喜欢西班牙队有关.
8.对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示又发作过心脏病未发作过心脏病总计心脏搭桥手术39157196血管清障手术29167196总计68324392试根据上述数据计算,能否作出这两种手术对病人又发作心脏病的影响有差别的结论填“能”或“不能”.答案
1.779不能…「卬卬门心士上,乙如卬上•/日392X39X167-29X15729解析根据列联表中的数据,可以求得%2=-----------------------------------------皆Qvao/MiQ/viovbo X324X19o X19ox
1.
7792.
706.所以,没有充分证据认为这两种手术对病人又发作心脏病的影响有差别.
9.甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表,级品二级品总计甲机床15050200乙机床12080200总计2701304001甲机床、乙机床生产的产品中一级品的频率分别是多少?2能否有99%的把握认为甲机床生产的产品的质量与乙机床生产的产品的质量有差异?2____________n ad-be,二a+b c+d a+c Z+J解1甲机床生产的产品中的一级品的频率为爆=75%,乙机床生产的产品中120400150X80—120X5040021=
6.635,270X130X200X200~39的一级品的频率为就=60%.故能有99%的把握认为甲机床生产的产品的质量与乙机床生产的产品的质量有差异.
10.为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM
2.5和SO2浓度单位u g/m3,得下表so2[0,50]50,150]150,475]PM
2.535]32184[0,35,75]681275,115]3710⑴估计事件“该市一天空气中PM
2.5浓度不超过75,且SO2浓度不超过150”的概率;⑵根据所给数据,完成下面的2X2列联表:SO2[0,150]150,475]PM
2.5[0,75]75,115]3根据2中的列联表,判断是否有99%的把握认为该市一天空气中PM
2.5浓度与SO2浓度有关?2___________n Qad-bc2c+d A+d•/Q+A Q+C解1由表格可知,该市100天中,空气中的PM
2.5浓度不超过75,且SO2浓度不超过150的天数有32+6+18+8=64天,所以该市一天中,空气中的PM
2.564浓度不超过75,且SO浓度不超过150的概率为砺=
0.
64.2⑵由所给数据,可得2义2列联表为SO2[0,150]150,475]总计PM
2.5[0,75]64168075,115]101020总计7426100
(3)根据2X2列联表中的数据可得儿ad—be2〃+/c+d〃+c Z+d100X64X10—16X102-^
7.
48446.635,故有99%的把握认为该市一天空80X20X74X26气中PM
2.5浓度与SO2浓度有关.
二、能力提升
11.(多选)有两个分类变量X,K其列联表如下所示,Ki YiXa20—aX115-aX230+Q其中m15—均为大于5的整数,若有95%的把握认为X,丫有关,则的值为()A.8B.9C.7D.6答案AB解析根据公式,得65[a(30+)一(15—a)(20—)]22XX=20X45X15X5013X1361-602-
3.841,根据〃〉5且15—〃5,a£Z,求得当〃=8或9时满足题意.20X45X3X
212.(多选)对甲、乙两个班级共105名学生的数学考试成绩按照优秀和不优秀统计人数后,得到下表成绩情况优秀不优秀总计班级甲班10b10+b乙班3030+cC总计10+c30+b40+b+c2已知在这105名学生中随机抽取1人,成绩优秀的概率为亍则()A.列联表中的值为20,b的值为45B.列联表中c的值为15,匕的值为50C.有95%的把握认为成绩是否优秀与班级有关系D.没有95%的把握认为成绩是否优秀与班级有关系答案AC2解析由题意,知成绩优秀的学生人数是105X]=30,成绩不优秀的学生人数是105—30=75,所以c=20,Z=45,选项A正确,B错误;因为*=105X10X30—20X452-弋
6.
13.841,所以有95%的把握认为成绩是否优秀与班级有55X50X30X75关系,选项C正确,D错误.
13.为调查某社区居民的业余生活状况,研究这一社区居民在2000〜2200时间段的休闲方式与性别的关系,随机调查了该社区80人,得到下面的数据表休闲方式看电视看书总计性另男105060女101020总计2060801根据以上数据,有多大把握认为“在2000〜22时间段居民的休闲方式与性别有关系”?⑵将此样本的频率估计为总体的概率,在该社区的所有男性中随机调查3人,设调查的3人在这一时间段以看书为休闲方式的人数为随机变量X,求X的数学期望和方差.解1根据样本提供的2X2列联表得,80义10X10—10X508022丫二60X20X20X60^
8.
8896.635,有99%的把握认为“在2000〜2200时间段居民的休闲方式与性别有关系”且PX=Z=C监k=01,2,3,92由题意得,X〜33EX=3X-=-DX=3X-X^=
三、创新拓展
14.某高校共有学生15000人,其中男生10500人,女生4500人.为调查该校学生每周平均体育运动时间的情况,采用分层随机抽样的方法,收集300位学生每周平均体育运动时间单位时的样本数据.1应收集多少位女生的样本数据?⑵根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图如图,其中样本数据的分组区间为[0,2],2,4],4,6],6,8],8,10],10,12].估计该校学生每周平均体育运动时间超过4小时的概率.频率瓯
0.
1500.
125.
10.075时间/时024681012⑶在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别的列联表,并判断能否认为“该校学生的每周平均体育运动时间超过4小时与性别有关”.解1由分层随机抽样可得300X恚意=90,所以应收集90位女生的样本数JL\J\J\J据.⑵由频率分布直方图得学生每周平均体育运动时间超过4小时的频率为1—2X
0.100+
0.025=
0.75,所以该校学生每周平均体育运动时间超过4小时的概率的估计值为
0.
75.3由2知,300位学生中有300X
0.75=225人的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时.样本数据中有210份是关于男生的,9份是关于女生的,可得每周平均体育运动时间与性别的列联表如下:男生女生总计每周平均体育453075运动时间不超过4小时每周平均体育运动时间超过4小时16560225总计21090300300X45X60-30X16575X225X210X90所以有95%的把握认为“该校学生的每周平均体育运动时间超过4小时与性别有关”.
(2)独立性检验的基本思想()n nd-be之(上一(、「、在2X2列联表中,令/=.当数据量较大时,人十)(c+a)(十c)(十d)在统计中,用以下结果对变量的独立性进行判断.
①当/W22畋时,没有充分的证据判断变量A,3有关联,可以认为变量A,B是没有关联的;
②当时,有90%的把握判断变量A,8有关联;
③当/
3.841时,有95%的把握判断变量A,3有关联;
④当/
6.635时,有99%的把握判断变量43有关联.
3.做一做
(1)关于分类变量X与丫的随机变量/的值,下列说法正确的是()A.f的值越大,“x和y有关系”可信程度越小B.f的值越小,“x和y有关系”可信程度越小C.Z2的值越接近于0,“X和Y无关”程度越小D.*的值越大,“x和y无关”程度越大答案B解析炉的值越大,x和y有关系的可能性就越大,也就意味着x和y无关系的可能性就越小.
(2)下面是一个2义2列联表总计f〃+21=73,解析由题意得(+
2.[CI%=529解:a2173X]啖=
54.22527X2总计b46100则表中a=,b=答案5254研析题型关键能力提升•互动合作题型一2X2列联表例1在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人.六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人饮食以蔬菜为主,另外33人则以肉类为主.请根据以上数据作出饮食习惯与年龄的列联表,并利用备与£判断a-rb c-rd二者是否有关系.解2义2列联表如下年龄在六年龄在六总计十岁以上十岁以下饮食以蔬菜为主432164饮食以肉类为主273360总计7054124将表中数据代入公式得a43c27-1==0*
671875.-・・7=C=045a+b64c+d60显然二者数据具有较为明显的差距,据此可以在某种程度上认为饮食习惯与年龄有关系.思维升华1作2义2列联表时,关键是对涉及的变量分清类别.、cb d/7A2根据频率特征,即将石石与不[/或丁分与丁司的值相比,直观地反映出两个分类变量间是否相互影响,但此方法较粗略.训练11假设有两个分类变量X与匕它们的可能取值分别为{汨,和其列联表X2}{y,”},2X2为%1018X1m26X2则当相取下面何值时,x与y的关系最弱A.8B.9C.14D.19答案c解析由10X2618相,解得加七
14.4,所以当根=14时,X与丫的关系最弱.
(2)某校为了检验高中数学新课程改革的成果,在两个班进行教学方式的对比试验,两个月后进行一次检测,试验班与对照班成绩统计如2X2列联表所示(单位:人),则其中m=,n=.80分及80分以上80分以下总计试验班321850对照班24m50总计5644n答案2610024+〃2=50,[m=26,解得《解析由题意得56+44=〃,[/=
100.题型二独立性检验的基本思想例2某校对学生课外活动进行调查,结果整理成下表,用你所学过的知识进行分析,喜欢体育还是文娱与性别有关系吗?体育丸吴总计男生212344女生62935总计275279解由题知,问题是“喜欢体育还是喜欢文娱与性别是否有关系b=23,c=6,d=29,〃=79,〃ad-be2(+人)c+d a+c Z7+d79义21X29—23X62-^
8.
1066.
635.44X35X27X52所以有99%的把握认为喜欢体育还是文娱与性别有关系.思维升华解决一般的独立性检验问题,首先由所给的2X2列联表确定出b9c,d,〃的值,然后代入Z2统计量的计算公式,根据所得结果确定有多大的把握判定两个变量有关联.训练2(多选)千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”等等.小波同学为了验证“日落云里走,雨在半夜后”,随机观察了他所在地区的100天中的“日落云里走”的情况和后半夜天气情况,得到如下数据,后半夜天气情况下雨未下雨总计“日落云里走”的蒋滞出现25530未出现254570总计5050100并计算得到/%
19.05,则小波对该地区天气的判断正确的是()A.后半夜下雨的概率约为:B.未出现“日落云里走”时,后半夜下雨的概率约为总C.有99%的把握认为“日落云里走是否出现与“后半夜是否下雨”有关D.若出现“日落云里走”,则后半夜有99%的可能会下雨答案AC解析对A,把频率看作概率,可得后半夜下雨的概率约为鲁=;,故A判断255正确;对B,未出现“日落云里走”时,后半夜下雨的概率约为而岳=瓦,故B判断错误;对C,由广
219.
056.635,知有99%的把握认为“日落云里走是否出现”与“后半夜是否下雨”有关,故C判断正确;易知D判断错误.题型三独立性检验的应用例3某校高三年级在一次全年级的大型考试中,数学成绩优秀和非优秀的学生中,物理、化学、总分成绩优秀的人数如下表所示,能否认为数学成绩优秀与物理、化学、总分成绩优秀有关系?物理优秀化学优秀总分优秀数学优秀228225267数学非优秀14315699注该年级在此次考试中数学成绩优秀的有360人,非优秀的有880人.解列出数学成绩与物理成绩的2X2列联表如下物理优秀物理非优秀总计数学优秀228132360数学非优秀143737880总计3718691240将表中数据代入独立性检验公式,得1240X228X737—132X1432-^
270.
16.
635.360X880X371X869列出数学成绩与化学成绩的2X2列联表如下:化学非优秀化学优秀总计数学优秀225135360数学非优秀156724880总计38185912401240X225X724-156X1352一心360X880X381X
859240.
66.
635.将表中数据代入独立性检验公式,得列出数学成绩与总分成绩的2X2列联表如下:总分优秀总分非优秀总计数学优秀26793360数学非优秀99781880总计3668741240将表中数据代入公式,得1240X267X781-93X9929祗=48616635心360X880X366X874所以,有99%的把握认为数学成绩优秀与物理、化学、总成绩优秀都有关系.思维升华先利用n ad-be2计算/的值,再用它与临界值的大小作比较b+d〃+0c+d〃+c/=来判断两变量之间有多大把握认为有关系.训练3某研究小组调查了在2〜3级风时的海上航行中男女乘客的晕船情况,共调查了71人,其中女性34人,男性37人.女性中有10人晕船,另外24人不晕船;男性中有12人晕船,另外25人不晕船.1根据以上数据建立2X2列联表;⑵判断晕船是否与性别有关系.晕船情况晕船不晕船总计性别女102434男122537总计2249712=解⑴2X2列联表如下.因为
0.
082.706,所以我们没有充分证据判断晕船与性别有关.[课堂小结]
1.牢记一个知识点独立性检验.71义10X25—12X242-^
0.
08.22X49X37X
342.辨清一个易错点计算出错,计算后不能得出合理的结论.分层精练-核心素养达成拓展延伸
一、基础达标
1.高二第二学期期中考试,按照甲、乙两个班学生的数学成绩优秀和及格统计人数后,得到如下列联表优秀及格总计甲班113445乙班83745总计197190则/的值约为()答案A90义(11X37134XW)解析根据列联表中的数据,可得炉=-45X45X19X71一P-
60.故选A.
2.某市政府调查市民收入增减与旅游愿望的关系时,采用独立性检验法抽查了3000人,计算得/=
6.023,则市政府断言市民收入增减与旅游愿望有关系的把握程度是()A.90%B.95%C.99%D.
99.5%答案B解析因
6.
0233.841,所以可断言市民收入增减与旅游愿望有关系的把握程度为95%.
3.(多选)分类变量x和y的列联表如下总计2a ba+bXI九C dc+d2总计a+c b~\~d a+A+c+d则下列说法不正确的是()A.ad—be越小,说明X与丫关系越弱B.ad一儿越大,说明X与丫关系越强C.(ad—儿)越大,说明X与丫关系越强2D.(ad—瓦)越接近于0,说明X与丫关系越强2答案ABD解析越小,说明X与丫关系越弱,bc|越大,说明X与Y关系越强.
4.某班主任对全班50名学生进行了作业量的调查,数据如下表认为作业量大认为作业量不大总计男生18927女生81523总计262450则判断“学生的性别与认为作业量大有关”把握程度约为()A.O B.90%C.95%D.99%答案C解析由公式得Z2=50:9)2「
5.
0593.
841.•••把握程度约为ZO X24X2/X2395%.
5.(多选)针对时下的“抖音热”,某校团委对“是否喜欢抖音与学生性别的关系”进行了一次调查,其中被调查的男、女生人数相同,男生中喜欢抖音的人数43占男生人数的最女生中喜欢抖音的人数占女生人数的热若有95%的把握认为是否喜欢抖音与学生性别有关,则被调查的学生中男生的人数可能为()A.25B.45C.60D.75答案BCD解析设男生的人数为5〃(〃£N+),根据题意列出2X2列联表如下所示男生女生总计喜欢抖音4〃3〃7n不喜欢抖音n2n3n总计5n5n小10nX(4〃X2〃—3〃X〃)210〃.上乙—但、)、目h士,川、」9t1X5nXlnX3n=5厂由于有95%的把握认为走否号队抖音与5rl学生性别有关,贝|/
23.841,即噜
3.841,得心
8.0661,,5〃〉
40.3305,又〃金N+,A5/^41,综合选项知B,C,D正确.
6.某高校“统计初步”课程的教师随机调查了选该课的一些学生的情况,具体数据如下表专业非统计专业统计专业。