还剩9页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
第十三章/检验与方差分析第一节拟合优度检验拟合优度检验(比率拟合检验)•正态拟合检验第二节无关联性检验独立性、理论频数及自由度•频数比较和连续性修正•关系强度的量度第三节方差分析总变差及其分解•自由度•检验统计量£的计算•相关比率•方差分析的几点讨论第四节回归方程与相关系数的检验回归系数的检验•积差系数的检验•回归方程的区间估计
一、填空方差分析可以对多个总体()是否相等进行检验
1.列联表是按()标志把两个变量的频数进行交互分类的
2.
3.在使用Z2检验法进行列联表检验所使用的自由度为()
4.在对()的列联表进行检验时,存在着=的关系列联表检验是通过()而不是通过相对频数的比较进行的
5.方差分析是()检验的推广,一般用于处理自变量是一个(或多个)定类变量
6.和因变量是一个定距变量之间的关系在对的列联表进行方差分析时,与组间平方和相联系的自由度为(),与
7.6x5组内平方和相联系的自由度为(),与总平方和相联系的自由度为()o方差分析中把已解释的变差对总变差的比值称为()
8.o检验两个总体变量(定距一定距变量)是否具有线性关系,主要是检验总体的()
9.是否等于零对于定距一定距变量计算积差系数厂时,要求相关的两个变量均为()变量
10.在回归分析中,只有()变量才是随机的在实际运用中,方差分析的结果常用一种称为()的标准形式的表格表示
11.
12.取匕±lSy/,那么在散点图上约有()%的观测点落在其间
13.取匕.±25,那么在散点图上约有()%的观测点落在其间
14.取匕±3Sy〃,那么在散点图上约有()%的观测点落在其间出来
二、单项选择.相关比率方差分析中把已解释的变差对总变差的比值称为相关比率,用符号/表9示—迎“i
210.估计标准误差:为回归剩余方差的平方根,即SY/X=n-2SST
1.
2.X
3.V
4.
5.
6.X
7.V
8.X
9.
10.X
11.V
12.X
13.
14.V
15.V
16.V
五、判断题
六、计算题各年级理论频数均为人,忘接受四个年级
1.1125/=
11.111053=
7.81,Hi的学生频数不构成均匀分布.白、粉、红三色花的理论频数分别是、和接
2.255025,=
5.020;=
5.99,K5受为:植株后代以白粉红的比例出现=
1213.四种特征后代的理论频数为
90、
30、
30、10,/=
12.267宕053=781,接受Hi杂交后代不是以9331的比例出现接受检验故障的实际分布与正态分布没有明显差别
4./O5,5=U・71/=
7.23,Ho/二接受儿居民对生活质量的要求与年龄没有明显的关
5.5,
49.448/=
0.16,系宕接受为车祸事故的频数与司机单程驾车的路程相互独立
6.0,4=
13.28/=
12.376,
7./=
94.79/054=
9.49,接受M子辈职业与父辈职业之间是存在相关关系力;拒绝为家长对学生延长在校时间的看法与其居住在城市或农
8.=
9.61012=
9.21,村无关、略;见下表;由于凡=吊.接受
9.
12340.4697v052,12=
3.98,三个商店的地点不同对每天的营业额没有显著的影响;Ho
50.0726自由度统计量临界值显著性SS MS组间
4.
133322.
06670.
46973.89组内
52.
800124.4000总
56.
93314、略;见下表;由于接受
10.1234a=O.72VFo.052,38=
3.24,不同职业的生育观没有显著的不同;Ho
50.0381自由度统计量临界值显著性SS MS组间
3.
593421.
79670.
723.24组内
94.
4066382.4843总
98.
0004011.1=
2.3011().025,产
2.201,拒绝0p=
012.lr=
0.9991;2t=
66.6to.o25,8=
2.3O6,拒绝Ho=0;3=
0.2310+
0.751IX;4=
0.9982,工二后;5SY/X=Q.0638;6匕=
6.2398,
6.1148〜
6.
364813.1-
0.8436;2t=
7.5344,o.o2523=
2.069,拒绝Ho〃=0;3匕=—
0.82952+
0.0378947;〉尸=则拒绝”两个变量间的线性关系不显著;X43=5675384428,5Sm=l.9799;
62.H405〜
3.80585
七、问答题答首先,当试验规模很小而作出维持原假设决定时,这可能只是数据太少,不是真的表14明实际情况切合零假设但是,数据少如果否定了零假设,这一否定的可靠性是很大的其次,当试验规模极大而得到否定零假设的结果时,需要进一步使用区间估计等方法考虑与零假设的偏离有多大,而不能只是宣布一下统计检验的结果就了事反之,若试验规模很大而仍能维持原假设,则可视为是对原假设的有力支持答当被用于研究定距一定距变量之间的关系时,不仅可以作为线性相关的量度,也可152以作为非线性相关的量度对线性相关,相关比率〃与产积差系数之平方有相同的性质2PRE*可以看做的特例定距一定距变量对于定距一定距变量,曲线相关要用〃来测量同一资2料通过相关指数〃与积差系数计算的比较,可以判断确定两定距变量的关系是不是直线如果r同时求出与此等于或略大于此可说明两变量关系是直线的,用去测量是合适的;如果r rr rVR则说明两变量关系可能是曲线的在比率拟合优度检验中,对于选定的显著性水平求临界值力,此时的自由
1.42a度是()o实验数据总数〃一A1变量的取值种类数B Xc—1实验数据总数〃一变量的取值种类数C Xc实验数据总数〃+变量的取值种类数D Xc在%正态拟合优度检验中,对于选定的显著性水平求临界值力此时的自由度是()
2.2a3数据的分组数数据的分组数一A B1数据的分组数一数据的分组数一C2D
33.使用,2检验法对nxc列联表进行无关联性检验,与乙;这个检验统计量相联系的自由度()o(()()A n~1B7—1C n~c Dn-1x c-1对于一个复杂的列联表,还可以把它进一步分解为许多子表,以确定表格的那一部分卡
4.方;影响最大这是利用了卡方分布的()d恒正性方差为期望值的倍可加性前三者A B2C D在方差分析中,自变量是()
5.定类变量定序变量定距变量定比变量A BC D在直线回归分析中,相关比率那么,积差系数厂()
6.PRC=
0.750A
0.750B
0.5625C
1.333D
0.866
三、多项选择可以用于拟和优度检验的方法有()
1.o/检验检验A BF累计频数检验游程检验C D方差分析法()
2.o可以用于一个总体均值是否相等的检验A可以用于两个总体均值是否相等的检验B可以用于三个总体均值是否相等的检验C可以用于多个总体均值是否相等的检验D对拟和优度推断结果,下列说法正确的是()
3.o当试验规模很小而作出维持原假设决定时,这可能只是数据太少,不是真的表明实际A情况切合零假设数据少如果否定了零假设,这一否定的可靠性是很大的B规模极大的试验可把零假设有极细微的差别检测出来,而这种差别可能并无多大实际C意义若试验规模很大而仍能维持原假设,则可视为是对原假设的有力支持D,使用力检验拟和优度,下列说法正确的是()4相对频数相同的列联表,在统计检验中其显著性相同A相对频数相同的列联表,在统计检验中其显著性并不相同B相对频数相同的列联表,样本容量增加倍,力;不变C K相对频数相同的列联表,样本容量增加倍,/变也扩大倍D KK相关比率度量的可以是()
5.PRE定类一定距变量之间的相关程度A定距一定距变量之间的相关程度B线性相关C非线性相关D下列说法正确的是()
6.o方差分析的优点在于,一个检验可以代替多个均值差检验A方差分析总是优于一系列的均值差检验B方差分析中的自变量如果是二分变量,不论采用方差分析或均值差检验,其结果完C X全相同总变差分解的思想可以直接推广至多因素显著性检验D方差分析所包含的假定包括()
7.o正态分布A独立随机样本B等方差性C非负性DI、名词解释拟和优度检验
1.列联表
2.理论频数
3.方差分析
4.方差分析表
5..总变差6组内变差
7.组间平方和
8.相关比率
9.估计标准误差
10.
五、判断题理论频数人与观测频数人越接近,经验分布与理论分布拟合程度越好
1.()对于拟合优度检验,在试验规模大时,否定零假设的意义大,接受零假设的意义不
2.大()规模极大的试验可把零假设有极细微的差别检测出来()
3.如何求得列联表中的理论频数就成了独立性检验的关键()
4.力检验法用于对交互分类资料的独立性检验,有其它方法无法比拟的优点
5.2()
6.z2检验不适用于定类变量和定序变量的相关统计()在列联表中,若不能从卡方表中准确得到所需要的临界值,可以取事先未预测方向
7.2X2的(Z”2)2来找出/的近似值()相对频数相同的列联表,在统计检验中其显著性也相同()
8.组内变差反映了数据的个“中心”的散布程度()
9.组间平方和反映了数据围绕各“中心”的散布程度()
10.方差分析是用(可以解释的方差)/(不能解释的方差)作为检验统计量()
11.我们不可以从总平方和减去组间平方和来求组内平方和()
12.只可用于一个定类变量与一个定距变量的相关程度的测定()
13.方差分析的优点在于,一个检验可以代替多个检验()
14.如果仔细运用均值差检验,它可能会提供比方差分析更多的信息()
15.拟合值匕上下设置一个合适区间,那么丫被估计到的可能性便会大大增加
16.()
六、计算题一位社会学家想知道私立本科大学每年的生源是否呈均匀分布为此,他在某校随机抽
1.取了个本科生,这些学生的分布是一年级人,二年级人,三年级人,四4500120011001150年级人试问,在给定显著性水平为
①下,四个年级学生人数构成是否均匀?1050a05一位遗传学家想知道某种紫花的颜色是否符合孟德尔隐性遗传规律,按照这种规律两种
2.粉色杂交后,后代将以白粉红=121的比例出现他做了一项杂交实验,植株了100株后代,结果发现株白,株粉,株红试问,在给定显著性水平为
①下,是否植216118a05株后代以白粉红=121的比例出现?某种动物的两个品种杂交后可能出现四种特征某种理论分析表明,可能出现的四种特
3.征的数量将以9331的比例出现生物学家为此做了一项实验,检查了160个后代,结果发现具有着四种特征的后代的数量分别是、、、试问,在给定显著性水平为
①72383218a05下,是否杂交后代以9331的比例出现?某公司对电视机的可靠性进行了一次调查,使用台电视机作样本,记录了在电视机
4.100出现故障之前所经历的月份根据经历的月份(按等级划分),下表给出了出现故障的实际分布月份和故障按照正态概率分布月份出现故障之前的月出现故障之前的实际月份出现故障之前的期望月份份(等级)以下176917—20241721—23282724—26182527—291415以上30107要求检验故障的实际分布与正态分布是否有明显差别(取)
0.05o下表是三个年龄组的名居民对生活质量要求的分布频数(按高、中、低分类):
5.100生活质量要求年龄(岁)总计高中低17—301215134011—351113113545—65810720总计313831100试问,居民对生活质量的要求与年龄是否有明显的关系(取)
0.05o下列表中是有关车祸事故的频数与司机单程驾车的路程分布资料
6.小于次次次以上合计55—105公里以内10423130103公里10—20322356020公里以上1971137合计936146200试问,车祸事故的频数与司机单程驾车的路程是否有明显的关系?(a取
0.05)为研究职业的代际流动问题,在某地随机抽取了名职业区民进行调查,调查的
7.160结果如下表所不:父辈职业合计脑力劳动体力劳动农业劳动258538脑力劳动体力15351060子辈职业劳动农业劳动575062合计455065160试问,子辈职业与父辈职业之间是否存在相关关系?(取)
0.05某中学想知道城市学生家长和农村学生家长对延长学生在校时间是否持不同看法研究
8.者随机抽出来自农村和城市的两个家长样本,调查结果表明在来自城市的位家长中,200123人支持,人反对,人没有看法;在来自农村的位家长中,人支持,人反对,36413001458570人没有看法试问,家长对学生延长在校时间的看法是否与其居住在城市或农村有关?取)
0.01某连锁商业企业在同城三个不同地点开设了三个分店,从这三家商店随机抽出天的营
9.5业额的数据如下表所示单位万元第一家分店第二家分店第三家分店10714第一天第二天121189812第三天81310第四天笫五天111011要求
(1)求三家店每天的平均每天的营业额和5天的平均每天营业额;()求总变差、组内变差和组间平方和;2
(3)编制方差分析表;
(4)检验三个商店的地点不同对每天的营业额是否有显著的影响()计算商店的地点不同对每天的营业额之间的相关比率5为了研究职业与家庭子女数之间的关系,随机地抽出了户家庭进行了调查,调
10.41查三种职业家庭的子女数的资料如下工人;1,3,4,4,6,2,3,4,3,5,2,4干部3,5,0,5,4,4,2,3,1,3,2,3,3,2,4,2,6,1;知识分子6,4,2,2,3,0,5,3,1,2,k要求
(1)求三种职业家庭户均子女数;()求总变差、组内变差和组间平方和;2
(3)编制方差分析表;()检验不同职业的生育观是否有显著的不同4()计算职业与子女数量之间的相关比率5有关雇员初始年薪和他年后的年薪之间的一项调查,共抽取了名雇员数据表明,
11.1013二者之间的积差系数是现给定试检验此相关系数是否显著
0.570a=
0.05,年我国城镇居民人均消费性支出和人均可支配收入的数据见下表
12.1992—2003单位千元年份人均可支配收入人均消费性支出
19922.
0271.
67219932.
5772.
11119943.
4962.
85119954.
2833.
53819964.
8393.
91919975.
1604.
18619985.
4254.
33219995.
8544.
61620006.
2804.
99820016.
8605.
30920027.
7036.
03020038.
4726.511要求()计算我国城镇居民人均消费性支出和人均可支配收入的积差系数;1
(2)检验所计算的积差系数的显著性;
(3)建立我国居民人均消费支出依人均可支配收入的线性回归模型;
(4)计算居民人均消费支出与人均可支配收入之间的相关比率,说明这一相关比率与积差系数的数量关系;
(5)计算估计标准误差;
(6)已知某年我国居民人均年可支配收入为8000元,试以95%的置信度预测人均年消费性支出的估计区间某银行家分行的不良贷款额与贷款余额调查数据如下(单位亿元):
13.25分行编号各项贷款余额不良贷款额
167.
30.
92111.
31.
131734.
8480.
83.
2199.
77.
85616.
22.
77107.
41.
68185.
412.
5996.
111072.
82.
61164.
20.
312132.
241358.
60.
814174.
63.
510.
215263.
51679.
331714.
80.
21873.
50.
41924.
7120139.
46.
821368.
211.
62295.
71.
623109.
61.
224196.
27.
2102.
23.225要求()计算各项贷款余额和不良贷款额的积差系数;1()检验所计算的积差系数的显著性;2
(3)建立不良贷款额依各项贷款余额的线性回归模型;
(4)对回归模型进行F检验;
(5)计算估计标准误差;
(6)求出贷款余额为100亿元时,不良贷款95%的置信区间.
七、问答题对于拟合优度检验,解释统计推断的结果时,应注意些什么?
1.简述相关比率、积差系数之平方和相关指数之间的关系
2.2J R参考答案
一、填空均值品质频数均值差
1.
2.
3.df=c-1z-
14.2x
25.
6.相关比率回归系数随机,因方差分析表
7.4,1,
58.
9.
310.
11.
12.
68.
2613.
95.
4614.
99.73
二、单项选择
1.B
2.D
3.D
4.C
5.A
6.D
三、多项选择
1.AC
2.BCD
3.ABCD
4.BD
5.ABCD
6.ACD
7.ABC
四、名词解释拟和优度检验是有关检定总体是否具有正态或其他分布形式的非参数统计检验
1.列联表是按品质标志把两个变量的频数进行交互分类的统计表格
2.理论频数是按照理论分布计算出的样本各组频数
3.方差分析研究多个总体均值是否存在差异的统计检验方法
4.方差分析表用于表达方差分析结果的标准形式的表格其基本形式如下
5.项目SS自由度MS检验统计量临界值显著性组间SSB c—1MSB MSB/MSW Fc—L n-c待定a组内SSw〃一c MSw———总SS〃一1————T.总变差记作它表示与对于总均值的偏差之平方和,即6SS,7ss=ZE/—丫了i=l
17.组内变差记作SSw,它是各观测值/对其所属类别均值匕的偏差的平方和,即c%_ZE%”11组间平方和记作,是自变量因素所没有解释的力的变异,即,•-尸尸
8.SSBi=i。