还剩28页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
《社会统计学》形成性考核作业形成性考核作业一表1是某大学二年级135个同学的《社会统计学》课程的期末考试成绩,请将数据输入SPSS软件,并
(1)对考试成绩进行排序和分组(40分),
(2)((制作频数分布表30分)并绘制频数分析统计图30分)请注思分组时按昭c c-A A-B+B B-C+D+D F
八、、下列标准■・等形成性考核作业
三一、单项选择题(在各题的备选答案中,只有1项是正确的,请将正确答案的序号,填写在题中的括号内每小题2分,共20分)
1.学校后勤集团想了解学校22000学生的每月生活费用,从中抽取2200名学生进行调查,以推断所有学生的每月生活费用水平这项研究的总体是(C)A.22000名学生B.2200名学生C.22000名学生的每月生活费用D.2200名学生的每月生活费用
2.从变量分类看,下列变量属于定序变量的是(C)A.专业B.性别C.产品等级D.收入(
3.在频数分布表中,比率是指D)A.各组频数与上一组频数之比B.各组频数与下一组频数之比C.各组频数与总频数之比D.不同小组的频数之比
4.某地区2001-2010年人口总量(单位:万人)分别为98,102,103,106,108,109,110,111,114,115,下列哪种图形最适合描述这些数据(D)A.茎叶图B.环形图C.饼图D.线图
5.根据一个样本均值求出的90%的置信区间表明(C)A.总体均值一定落入该区间内
8.总体均值有90%的概率不会落入该区间内C.总体均值有90%的概率会落入该区间内D.总体均值有10%的概率会落入该区间内
6.判断下列哪一个不可能是相关系数(C)A.-
0.89B.
0.34C.
1.32D.
07.期中考试中,某班级学生统计学平均成绩为80分,标准差为4分如果学生的成绩是正太分布,可以判断成绩在72分-88分之间的学生大约占总体的(A)A.95%B.68%C.89%D.90%
8.正态分布中,值越小,贝I](A)A.离散趋势越小B.离散趋势越大C.曲线越低平D.变量值越分散
9.下面哪一项不是方差分析中的假定(D)A.每个总体都服从正态分布B.观察值是相互独立的C.各总体的方差相等D.各总体的方差等于
010.对消费的回归分析中,学历、年龄、户口、性别、收入都是因变量,其中收入的回归系数为
0.8,这表明(A)A,收入每增加1元,消费增加
0.8元B.消费每增加1元,收入增加
0.8元C,收入与消费的相关系数为
0.8D.收入对消费影响的显著性为
0.8
二、名词解释(每题4分,共20分)抽样单位与抽样框
1.答抽样单位就是一次直接的抽样所使用的基本单位抽样单位有时与构成总体的个体是相同的,有时是不同的例如对育龄妇女的调查,当直接抽取育龄妇女时,两者是相同的;当我们从总体中一次直接抽取户时,以抽中的户中的育龄妇女作为样本时,抽样单位(户)与个体(育龄妇女)就不相同了抽样框是指一次直接抽样时样本中所有抽样单位的名单例如,从某校中抽取200名学生进行就业观的调查,那么这所学校的所有学生的名单就是这次抽样的抽样框但是,当我们先抽取班级,以抽中班级中的所有学生作为样本时,这所学校所有班级的名单就是这次抽样的抽样框均值
2.答均值是集中趋势最主要的测量值,它是将全部数据进行加总然后除以数据总6个数,也称为算数平均数均值包含一组数据中所有数值,它是先将所有数值进行加总,然后进行平均,在均值中所有数值都有所体现因而,我们说均值是集中趋势最主要的测量值散点图
3.答散点图是在坐标系中,用X轴表示自变量X,用丫轴表示因变量y,而变量组(x,y)则用坐标系中的点表示,不同的变量组在坐标系中形成不同的散点,用坐标系及其坐标系中的散点形成的二维图就是散点图散点图是描述变量关系的一种直观方法,从散点图中直观的看出两个变量之间是否存在相关关系、是正线性相关还是负线性相关,也可以大致看出变量之间关系强度如何,但是对于具体关系强度则需要相关系数来判断抽样分布
4.答抽样分布是指样本统计量的概率分布,它是在重复选取容量为n的样本时,由每个样本计算出来的统计量数值的相对频数分布例如样本均值的分布、样本比例分布等虚无假设与替换假设
5.答将需要通过样本信息来推断其正确与否的命题称为虚无假设,也成为原假设或者零假设,通常用表示如果虚无假设不成立,我们就拒绝虚无假设,需要在另个一假设中进行选择,这就是替换假设,替换假设通常用表示上面例子中,虚无假设为口=1800替换假设为u#1800a
三、简答题(每题10分,共30分)等距分组和不等距分组有什么区别?请举例说明
1.答在分组时,如果分组组距相等,就是等距分组,如学生平均每天上网时间组距设3,分成3-6,6-9,9-12,12-15共4个小组如果分组组距不相等,就是不等距分组如人口分析,分婴幼儿组(0-6),少儿组(7-17),中青年组(18-59),老人组(60-130),组距不相等简述定类变量、定序变量和数值型变量集中趋势测量的方法
2.定序变量是层次最低的变量,用众数作为其中心趋势的测量,定序变量主要使用中位数、四分位数作为集中趋势的测量,同时也可以使用众数作为测量值,但是中位数和四分数位利用序次关系,因而更多使用这两者数值型数据(定距和定比数据)的集中趋势测量指标是平均数,同样,数值型数据可以使用众数和中位数、四分位数作为中心趋势的测量,但是更主要的是使用均值,因为均值使用所有数据信息运用以下表格说明定类变量、定序变量和数值型变量集中趋势测量的数据类型定类数据定序数据数值型数据适用的测量值众数中位数均值分位数中位数众数分位数众数方法
3.如何对配对样本进行t检验答可运用以下2种方法对配对样本进行t检验
(1)配对样本T检验方法配对样本检验主要是判断不同的处理或试验结果是否有差异配对样本T检验(Paired—Sample Ttest)用于检验两个相关的样本(配对样本)是否来自具有相同均值的总体,因此针对配对样本我们可以首先计算出两个样本每个对应变量间的差值,然后再检验其差值的均值是否为零,若均值接近于零(即在给定的置信区间内),说明两个样本均值在给定的置信水平上没有差异;若均值在给定置信区间以外,说明两个样本均值在给定的置信水平上有差异
(2)利用SPSS进行配对样本T检验;在SPSS主菜单选中Analyze一>CompareMeans一>Paired一Sample TTest,出现图11一4所示窗口“Paired Variables”框中的变量作为分析变量,总是成对出现,指定要检验的两个变量到“Paired Variables”输入栏里的Variable1”和“Variable2”中,在CurrentSelections”栏中就会显示被选中的成对变量,在Options”选项中可以进行置信水平和缺失值的设置,同单样本T检验
四、计算题(每题15分,共30分)
1.某大学针对某项政策的态度调查,随机抽取300名被调查者,了解对政策的观(点,调查结果见表1所示15分)表对某项政策态度的调查结果1学生教师学校领导合计赞同685716141反对34411085中立25361374合计12713439300要求
(1)利用原始数据绘制包含百分比的二维表,并对绘制的列联表加以简要说明;
(2)并计算丫系数,并进行说明男女合计答对某项政策态度的调查结果初中及以243256下高中354075专科342155本科及以542276上合计
1471152622.某汽车生产商欲了解广告费用(万元)对销售量(辆)的影响收集了过去12年的有关数据,通过分析得到方程的截距为363,回归系数为
1.42,回归平方和SSR=1600,残差平方和SSE=450要求()1与出销售量y与广告费用x之间的线性回归方程y=363+l.42x假如明年计划投入广告费用为25万元,根据回归方程估计明年汽车销售量当x=25y=363+l.42*25=
398.5(辆)计算判定系数,并解释它的意义SSRR2=SSR+SSE()=1600+1600+450=
0.78表明在商品销售量的总变差中,有78%可以由回归方程解释,说明回归方程的拟合程度较好形成性考核作业
四一、单项选择题(在各题的备选答案中,只有]项是正确的,请将正确答案的序号,填写在题中的括号内每小题2分,共20分)
1.先将总体按某标志分为不同的类别或层次,然后在各个类别中采用简单随机抽样或系统抽样的方式抽取子样本,最后将所有子样本合起来作为总样本,这样的抽样方式称为(D)A.简单随机抽样B.系统抽样C.整群抽样D.分层抽样
2.在频数分布表中,某一小组中数据个数占总数据个数的比例称为(A)A.频率B.频数C.频次D.频谱
3.某专业共8名同学,他们的统计课成绩分别为
86.
77、
97、、
83.92,那么该班考试成绩的中位数是(D)A.86B.77C.90D.
884.经验法则表明,当一组数据正太分布时,在平均数加减2个标准差的范围之内大约有(C)A.50%的数据级分90-1086-883-880-876-773-770-766-663-660-60-5数09529529529表某专业二年级同学社会统计学期末考试成绩(百分制)1学生成绩学生成绩学生成绩学生成绩学生成绩186283455888270109712602965569383881108036530305785848811187428317858838568112665853286599386871138468733846095878811483770348761718891115858643585629089761167895136936386908711781105837966489918111881119038826589926111971125039786683937212086B.68%的数据C.95%的数据D.99%的数据
5.残差平方和(SSE)反映了y的总变差中(B)A.由于x与y之间的线性关系引起的y的变化部分B.除了x对y的现有影响之外的其他因素对y变差的影响C.由于x与y之间的非线性关系引起的y的变化部分D.由于x与y之间的函数关系引起的y的变化部分
6.某项研究中欲分析受教育年限每增长一年,收入如何变化,下列哪种方法最合适(A)A.回归分析B.方差分析C.卡方检验D.列联表分析
7.用样本统计量的值构造一个置信区间,作为总体参数的估计,这种方法称为(B)A.点估计
8.区间估计C.有效估计D.无偏估计
8.在假设检验中,虚无假设和备择假设(C)A,都有可能成立B,都不可能成立C.有且只有一个成立D.备择假设一定成立,虚无假设不一定成立
9.方差分析的目的是(D)A.比较不同总体的方差是否相等10判断总体是否存在方差C.分析各样本数据之间是否存在显著差异D.研究各分类自变量对数值型因变量的影响是否显著
10.用于说明回归方程中拟合优度的统计量主要是(D)A.相关系数B.离散系数C.回归系数D.判定系数
二、名词解释(每题4分,共20分)概率抽样
1.答概率抽样就是按照随机原则进行的抽样,总体中每个个体都有一定的、非零的概率入选样本,并且入选样本的概率都是已知的或可以计算的包括简单随机抽样、系统抽样、分层抽样、整群抽样、多阶段抽样普查
2.答普查是一种专门的调查,它是为了某种特定的目的而对总体中所有的个体进行的一次全面调查例如,我们历年进行的人口普查、工业普查、农业普查、第三产业普查、经济普查、统计基本单位普查等
3.置信水平答置信水平就是将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例
4.离散系数是一组数据的标准差与改组数据均值之比,称为变量系数
5.独立样本与配对样本配对样本是指一个样本中的数据与另一个样本中的数据相对应的两个样本独立样本是指我们得到的样本总体之间是相互独立的
三、简答题(每题10分,共30分)
1.按测度水平,变量可分为哪几类?举例说明按照测度水平,变量可以分为定类变量、定序变量、定距变量和定比变量四类()1定类变量当变量值的含义仅表示个体的不同类别,而不能说明个体的大小、程度等其他特征时,这种变量称为定类变量分类变量是最低层次的变量例如性别可以分为男、女两类2定序变量当变量值得含义不仅表示个体的不同类别还可以区分个体之间大小、程度等序次差异时,这种变量超为定序变量受教育程度是定序变量,可以分为文盲、小学初中、高中、大专及以上等3定距变量当变量值不仅可以将个体区分为不同类型并进行排序,而且可以确定不同类别之间的数量差别和间隔差距时,这样的变量称为定距变量定距变量具有测量单位,这些测量单位具有不变的相等区间的标准,使个体之间的比较更具客观性智商、温度等都是定距变量4定比变量除了上述三种变量的全部特征外,还可以计算两个变量值之间的比值时,这样的标量称为定比变量.定比变量是最高层次的变量在社会调查中,很多情况下我们使用的都是定比变量,例如身高、年龄、收入、一个地区的人口数、某产品的生产量等
2.举例简要说明社会研究过程一项系统、完整的社会研究通常遵循着比较固定的过程,一般包括五个主要过程;提出问题;形成假设;收集数据;分析数据;检验假设1提出问题是社会研究的第一步,研究者应首先明确要做什么,或者说进行研究的目的是什么
(2)研究问题往往是无法直接检验的,而是把研究问题形成假设才可进行检验假设是对两个变量间关系的陈述,是对它们关系的尝试性回答假设中的变量是相对具体的,是可以通过检验可测的
(3)收集数据是社会研究的关键步骤这一阶段要确定收集的变量、收集的方法、收集的总量等这一阶段所需投入的人力、物力最多,遇到的问题也最多,因而需要进行很好的组织和管理
(4)分析数据主要是对收集的原始数据进行系统的审核、整理、归类、统计和分析我们既要进行描述性统计,说明数据的总体情况,又要进行推断性统计,从收集的样本状况来推断研究总体的状况
(5)完成对数据的统计分析后,我们要根据对数据的分析来检验我们之前的假设和理论当结果支持我们的假设时,我们对研究问题得到了解释;当结果不支持我们的假设时,要回过头来修改我们的问题和假设,开始新的一轮检验;
3.一元线性回归模型中有哪些基本假定?一般地,在作一元线性回归分析过程中,回归分析是建立一系列假设基础上的,这些假设为
1、回归模型因变量y与自变量x之间具有线性关系
2、在重复抽样中自变量x值是固定的即假定x是非随机的
3、误差项的均值为零
4、误差项的方差为常数
5、误差项是独立随机变量且月及从正态分布,即多种检验都是基于以上假设从而确保回归模型的可靠性.
四、计算题每题15分,共30分
1.某行业管理局所属40个企业20H年产品销售额数据如下所示个企业年产品销售额402011企业编企业编企业编企业编销售额销售额销售额销售额号号号号115211105211033113621051212322103321463117131162313733127497141152413834135512415110259135117611916115261183611371081710027120371048881887281123812591291910729953910810115201193014240126要求对2011年销售额按由低到高进行排序,求出众数、中位数和平均数答销售额由低向高排列
87、
88、、
100、、
108、
108、
110、、
117、
118、
119、
119、
120、;、
129、、
138、;众数115;中位数115+116/2=
115.5平均数x=x1+x2+x3+x N/N=87+88+91+95+……+146+152/40=4647/40=
116.175,如果按照规定,销售额在125万元以上的为先进企业115万-125万之间的为,良好企业105万-115万之间的为一般企业,105万以下的为落后企业,请按先进企业、良好企业、一般企业、落后企业进行分组,编制频数分布表,并计算累积频数和累积频率向上累积向下累积按销售额分频率频数频率组(%)频数频率册)频数(%)105万元以
22.
59922.5%40100%下%105-115万820%
1742.5%
3177.5%元115-125万1230%
2972.5%
2357.5%元125万元以
27.51140100%
1127.5%上%
2.某单位为研究其商品的广告费用(x)对其销售量(y)的影响,收集了过去12年的有关数据通过分析得到以下结果方差分析表变差来SS dfMS FSig.源回归
1602708.6B D F
0.000残差——
40158.08C E总计A11———要求计算上面方差分析表中、D、E、F处的值答:A=
1602708.6+
40158.08=
1642866.68(SS回归+SS残差);;B二lC=ll-l=10(总计-B);D=
1602708.6/B=l
602708.6;;E=
40158.08/C=
4015.808F二D/E=
1602708.6/
4015.808=
399.10商品销售量的变差中有多少是由广告费用的差异引起的?答.c、3SR
1602708.6八5一SST
1642866.68
(3)销售量与广告费用之间的相关系数是多少?依r=口=,
0.9756=
0.9877销售量与广告费用之间的相关系数为
0.
9877.138740806784948612191148241746844952912266156542726968963712358166843737089978212468178644867184988212580188045857286998212677198146907379100851275520704769747810178128542180488675871028012962224949867688103901305423805084778210482131652470518178831057213274255952907992106861337026805334808610780134722752548481861088213573答案如下:、成成成成成成成1学生学生学生学生学生学生绩绩绩绩绩绩绩按成绩低至高排序如下表■・学生
4288644272408078836386658995293659372102801148372867089303015651057210780338480861190283429651347211080508481864690533413165437312580548494865290963711266135731981678410686629068441226641745181718412086103902249166813274918111384687889112506968897611781585138712191951856812677118813585348779922752124683178148245857587369312854476939783882578586875693130547707478778210085908759931275520701017897821158511187609510582470116789882186558837961235882707379998217867688255913370188010482328683882606171218010882448684889261109712380588348868788129621197126806683498664892.成绩分组A A-B+B B-c+C c-D+D F表如下•■等级分90-1086-883-880-876-773-770-766-663-660-60-5数人13281622841275317数
3.制作频数分A A-B+B B-C+C C-D+D F布表如下■・等级分90-1086-883-880-876-773-770-766-663-660-60-5数人13281622841275317数百
11.
812.5分
20.74%
2.2%%
9.63%
16.3%
5.93%
2.96%
8.89%
5.19%
3.7%比5%9%302520151050干干001001co1CzO1z191LOo z900co00o-g CO9oo os99等级c+c c-A A-B+B B-D+DF.频数分析统计图如下:4口百分比■系列2口系列3形成性考核作业二1表1为某大学对100个学生进行了一周的上网时间调查,请用SPSS软件:
(2)计算学生上网时间的中心趋势测量各指标(20分)和离散趋势测量各指标(30分)
(2)计算学生上网时间的标准分(Z值)及其均值和标准差(20分)
(3)假设学生上网时间服从正态分布,请计算一周上网时间超过20(小时的学生所占比例30分)表某专业一年级同学一周上网时间(小时)1学上网学上网学上网学上网上网学生生时间生时间生时间生时间时间1132118411461881102922224276219821038232243963248320412241044864138421582513451065218516626261046186621861071327124726671087108528224814681388219329194986920891910183010501070219010113312251137112913212103230522872159271320338531273269328141934205410742094191515351755975179515168361456107619961017837857127799720181538125824782198819203915592679179914202240136020801610018答案如下:(0集中趋势各^忝均数为
15.
2、中位数为
14.
0、靖为10离散趋势四分位数分为P25为
10、P50为
14、P75为
20、方差为
39.
515、标准差为
6.
286、极差为29步骤Analyze---Descriptive StatisticsFrequencies上网时间(勾选集巾趋势指标mean,median,mode,minimum,maximun离散趋势指标:quartlies,Variance,)Std.deviation,Range
(2)标准分Z值(详见作业Zsav)步骤Analyze DescriptiveStatistics DescriptiveSave standardizedvalues asvarianles即可。