还剩9页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
《统计学》教案第章数据与统1计学
一、教学目的从总体上对统计有基本认识,为以后各章的学习奠定基础了解统计的性质、研究对象及特点,统计工作过程,统计研究的基本方法,熟练掌握统计学的几个基本概念
二、教学重点统计学研究对象的特点,统计的涵义统计各学派的特点;总体、总体单位的含义以及它们之间的关系统计指标的概念、特点和构成要素标志与指标间的区别与联系
三、教学难点统计的涵义;总体、总体单位的含义以及它们之间的关系;统计指标的概念、特点和构成要素
四、教学内容统计数据与统计学§
1.1大数据时代,我们的工作和日常生活已经离不开各种各样的数据例如,早上起来要关心当天气温的高低空气质量状况在网络“百度搜索”输入“数据”后列出了与其相关的词汇信息外,还根据与查询“数据”的相关程度列出“相关术语”“相关网站”;球类比赛时解说员总要统计竞赛双方的进攻次数和成功率学生考试后非常关心自己的考试成绩和名次企业管理人员要掌握生产销售情况和利润额报刊和电视中常提到(国内生产总值)、(消费者GDP CPI价格指数)和经济增长率的数字等日常工作与生活中的这些数字就是我们所关心的统计数据统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据内在的数量规律性正是因为统计学总是在和数据打交道,因而我们也可称统计学为“数据的科学”怎样理解统计学是数据的科学呢我们先看看统计学英文的名词,再举几个例子统计学的英文是在英文词典中它有两个含义当它以单数名词出现时,表示一“statistics”门科学的名称一一“统计学”当它以复数名词出现时,表示“统计数据”或“统计资料一词的英文解释至少可以说明两件事情statistics第一,由于统计数据在英文中是以复数形式出现的,表明统计数据不是指个别的单个数字,而是指同类的较多数据因为单个数字如果不和其他数据进行比较,是不能说明问题的例如,某个学生在某门课程的考试中得了分,如果仅凭这一个数字,我们很难对这个学生的知识和85能力水平做出判断和评价因为这个分可能是班上的最高分,可能是中等水平85导好大喜功,虚报产值以图高升;又如,在调查市场物价时,某些负责人为表现自己的工作业绩,无视有关统计的法律法规,强行调低物价指数这种虚报、低报等瞒报的行为都触犯了《统计法》,统计人员要坚决抵制并予以揭露抽样误差是利用样本推断总体时产生的误差由于样本只是总体的一部分,用样本的信息去推断总体,或多或少总会存在误差,因而抽样误差对任何一个随机样本来讲都是不可避免的但它又是可以计量的,并且是可以控制的在坚持随机原则的条件下,一般来讲,样本的容量越大,抽样误差就越小确切地说,抽样误差与样本容量的平方根呈反比关系因而在抽样调查中,随机的原则极其重要,其中的原理和抽样方法将在第章进一步讨论3概括地讲,非抽样误差特别是其中的系统偏差是可以避免的但如果不注意,这类偏差造成的结果对调查质量来说又是致命的美国统计学会于年专门编写了一本题为《调查误差的主要来源是什么》1995的小册子,列出了种容易犯的错误并给出了应采取的措施加强统计数据质量的管理要体现在统计研究10的全过程,在描述统计和推断统计阶段都要时刻注意统计方法的科学、准确,注意统计方法的前提条件和假设,要根据统计数据的特点和研究的目的选择统计方法,在统计分析时要注意定性分析与定量分析的结合,等等我们将在后面的各章中根据不同的方法,从不同的角度强调统计数据的质量问题统计学的基本概念§16在开始学习统计学时,需要理解几个重要的概念,它们对课程的学习和理解至关重要,并将贯穿在本书的始终其中,描述统计和推断统计在前面已经介绍,这里不再赘述总体
1.
6.1总体是我们研究的所有基本单位通常是人、物体、交易或事件的总和例如,总体可以population包括
①中国的全部人口
②北京市的选民总人数
③某品牌移动电话的所有客户数;
④长春第一汽车制造厂某条生产线去年生产的所有汽车数
⑤中国航空维修设备行业的所有零部件库存数;
⑥去年北京市麦当劳餐厅所有窗口的销售量;
⑦一年内京津塘高速公路的交通事故次数;等等其中,
①至
③这三个总体是人的总和,
④和
⑤这两个总体是物体的总和,
⑥这一总体是交易的总和,
⑦这一总体是事件的总和同时也可以看出,每一个总和都包括了研究总体的所有单位变量
1.
7.2在研究总体时,我们重点关注的是总体单位具有哪些特征或属性,我们把这些特征称为变量variable变量是总体中个体单位所具有的特征或特性“变量”的名称是针对总体中每一基本单位的属性都存在着差异而言的例如,被调查的每位失业者的年龄、性别和收入等都不能事先确定,并且存在着差异样本
1.
6.3样本是总体的一部分单位例如,一家公司正在接受审计,审计人员没必要sample对该公司年度内的所有张发票全部审查,只需随机抽查一个张发票的本即可,审计人员通过这55400100张样本发票计算的差错率可对全部张发票的差进行推断10055400本章小结本章通过介绍统计数据与统计学、统计学的产生与发展、统计学的分科、数据的与来源、统计数据的质量以及统计学的几个基本概念,目的是在一开始就给读者留下一些统计学的初步印象,尤其是自始至终都要体会到统计学就是“数据的科学”,它的目的是“探索数据内在的数量规律性”我们研究问题的数据有些是原始数据,有些情况下只能得到经过加工的间接数据对待不同类型的数据,加工整理的方法有所不同,但关注数据的质量非常重要如果数据的质量出了问题,就算是我们再有本事,也难有科学准确的结果和结论在第章的学习中,我们还希望读者对统计学的学科体系和基本概念有所了解对于初学1者而言,由于缺乏感性认识,这种介绍通常会显得比较枯燥因此希望本章第节中的个例子,能使
1.16读者加深印象、引起兴趣,确立统计有用、要学好统计的信心在这个基础上,对章节内容和基本概念的理解掌握也将随着各章的展开,自然会有所收获原创力文档预览与源文档一致下载高清无水印的分数,也可能是较低的分数如果还知道其他学生的考分或者这次考试的平均分数,我们就可以对这个学生的成绩做出评价了在生产和生活实际问题中,我们通常可以收集到较多的数据,进而利用统计方法对数据进行加工整理,从而发现数据中的内在联系及数量规律第二,作为单数的统计学和作为复数的统计数据在英文中使用同一名词,显示出二者之间的密切关系统计学是由收集、整理、显示和分析统计数据的方法组成的,这些方法来源于对统计数据的研究,目的也在于对统计数据的研究离开了统计数据,统计方法乃至统计学就失去了其存在的意义这正如俗话所说“巧妇难为无米之炊”这里的“巧妇”就是掌握统计方法的统计学家或统计工作者,“米”就是统计数据,“炊”就是统计研究或统计工作的目的,即探索数据内在的数量规律性显然,没有统计数据或没有较好的统计数据,即使很科学的统计方法或很高明的统计学家也难有所作为那么,什么是数据内在的数量规律性呢?我们用下面几个简单例子来说明【例一个家庭新生婴儿的性别可能是男,也可能是女在过去没有实行计划生育时,有的家庭几个孩子都是男孩,也有的都是女孩从表面上看,新生婴儿的性别比例似乎没什么规律可循但如果对新生婴儿的性别进行大量观察,即观察成千上万个,就会发现性别比例还是有规律的,即婴儿总数中男孩要多于女孩,大致为每生育个女孩,就有个左右的男孩这个的比例就是新生婴儿男女性别的数量规律100105105:100性,古今中外都大致相同,它是由人类社会长期遗传与发展的结果因为人类社会要延续、要发展,就要保持男女人数的大致相同那么有人会问,新生儿男多于女,不是性别不平衡了吗是的,新生儿时男多于女而出现不平衡,但男孩的死亡率高于女孩,到了中青年时,男女人数就大致相同了进入中老年后,男性的死亡率仍然高于女性,导致男性的平均预期寿命比女性短,长寿男性要少于女性从一个国家乃至全人类看,如果没有人为的超、堕胎等干扰,其规律是婴幼儿时男性略多于女性,中青年时男女人数大致相同,老B年时女性又略多于男性这样既保证人类在中青年结婚生育时性别的大致平衡,又使得在人口总数上男女也大体相当有利于人类社会的进化和发展对人类性别比例的研究是统计学的起源之一,也是统计方法探索的最早的数量规律之一max.o
118.com预览与源文档一致下载高清无水EU【例]我们都做过掷硬币和掷骰子的游戏,都知道随机地掷一次硬币或骰子不能事先确定出现正面
1.2还是反面或某个点数,也就是说个别游戏或试验中充满了不确定性或偶然性机会游戏或赌博正是利用了这种不确定性和偶然性才能够吸引人但当我们进行大量观察,即不断做重复试验时,就会发现掷一枚均匀硬币出现正面和反面的次数会大体相同,即比值接近试验的次数越多,出现正面和反面的可能性就越接1:1近这一稳定的数值同样,在掷一枚均匀骰子时,出现其中任一点数的可能性也都接近1/21,2,3,4,5,6,1/6这里的和就是掷硬币和掷骰子出现某一特定结果的概率,也就是我们探索的数量规律性1/21/6【例】在进行农作物试验时,如果其他试验条件相对固定,我们会发现某种粮食作物的产量会随某L3种施肥量的增加而增加当开始增加施肥量时,产量增加较快以后增加同样的施肥量,粮食产量的增加量逐渐减少当施肥量增加到一定数值量,产量不再增加这时如果再增加肥料,产量反而会减少这一施肥量与粮食产量的数量关系就是我们要探索的规律性当我们从大量试验数据中用统计方法探索到施肥量与产量之间的数量关系,就可以考虑肥料的费用并选择最佳的施肥效果了【例】北京市公安局根据多年来各区县街道刑事案件数据的积累、整理和分析,利用大数据方法在
1.4年月日发布了“北京市治安地图”其中将动物园批发市场、新开发地区、锦绣大地市场等201371019处列为最不安全地区之后北京市公安局进一步公布治安重点整治区域、扒窃案高发地区、入室盗窃案高发地区等信息这些信息的公布既有利于公安部门有针对性地整治,也让老百姓有所防范【例】天津汽车制造场与丰田公司的威驰()汽车安装的是型发动机,排量为声称
1.5Vios8A
1.342L,其手动挡汽车每百公里油耗(等速情况下)不超过要检验购买的车辆是否达到了说明书上的节油标准,5L就需要计算在高速路上匀速行驶的平均油耗,假定你的汽车平均每百公里油耗为那么你的汽车是属于
5.5L,质量达标汽车中恰巧由于运气不好碰上的个例呢,还是该批产品本身就不合格呢统计方法可以做出检验并给予回答【例】某企业开发出一种新的化妆品,在正式投产之前,需要根据市场需求情况制定其价格和销售1,6策略等该企业委托某市场调查公司在全市万户家庭中抽取户家庭作为样本,免费赠送给这20010001000户家庭试用,然后了解该化妆品的销售前景如何科学地从该市万户家庭中抽出户家庭进行调查,2001000并由这户家庭反馈的市场信息科学地推断出全市万户家庭对该化妆品的购买意愿这一数量规律,1000200是统计工作者的任务为什么统计方法能够通过对数据的大量观察和处理而研究和探索出其内在的数量规律性呢这是由客观事物本身的特点和统计方法的特性共同决定的从客观事物方面来说,根据辩证法的基本原理,任何客观事物都是必然性与偶然性的对立统一同样,任何一个数据,也都是必然性与偶然性共同作用的结果,是二者作用的对立统一必然性反映了事物本质的特征和联系,是比较稳定的,因而它决定了事物的内在本质是有规律可循的偶然性反映了该事物每个表现形式的差异如果客观事物只有必然性一个方面的特征,事物的表现形式就会比较简单,就可以比较容易把握它的规律性正是由于偶然性的存在,造成了事物的表现形式与必然性和规律性发生偏移,从而形成了表面形式的千姿百态,形成数据表现形式的千差万别这样,必然性的数量规律性就被掩盖在表面的差异之中了前面举出的六个例子,本身都存在必然性的数量规律,但就每个新生儿的性别、每次掷硬币的结果、每次施肥带来的增产、每个地区增加的刑事案件、每辆汽车的百公里耗油量、每个家庭对化妆品的购买意愿都是不同的,是有差异的,其表现形式也是充满偶然性的但每个例子本身都是有规律可循的,应用统计方法就可以从偶然性中探索到内在的、本质的数量规律;从统计方法来看,统计学提供了一系列的方法,专门用来收集数据、整理数据、显示数据的特征,进而分析和探索(或推断)出事物总体的数量规律性当然,如果事物本身的规律比较简单,所用的统计方法也就相对容易如果事物本身的规律错综复杂,所用的统计方法也就相对复杂以上的六个例子中,前两个例子比较简单,用描述统计的方法就可以解决问题而后四个例子就需要应用比较复杂的推断统计方法,如后面章节中的抽样与抽样分布、假设检验和相关与回归分析等那么,用什么统计方法,取决于我们有什么样的数据以及要解决什么问题统计学的产生和发展§
1.
2、统计学发展的第一个阶段1统计学产生于世纪中叶,是从几个不同的领域开始的统计学的一个源头是来自英国威廉•17配第的《政治算术》年配第在书中用大量的数字、重量、尺度等定量方法William Patty1676对英国、法国、荷兰三国的经济实力进行分析比较,表达他的思想和观点马克思在《资本论》中评价配第“是政治经济学之父,在某种程度上也可以说是统计学的创始人”统计学的另一个创始人是英国的约翰•格朗特格朗特在年出版《关于死亡表的John Graunt16627o自然观察与政治观察》他通过大量观察的方法,研究并发现了人口与社会现象中重要的数量规律性如新生儿的性别比例稳定在即例中谈到的男性在各年龄组中死亡率高于女性新生14:13,L1105:100;儿的死亡率较高;一般疾病与事故的死亡率较稳定而传染病的死亡率波动较大等在研究中,格朗特不但探索了人口变化和发展的一些数量规律,而且还对伦敦市总人口数量做出了较科学的估计如果说配第是政府统计的创始人,则格朗特可被认为是人口统计的创始人统计学的第三个源头是古典概率论,奠基人包括法国的布莱士•帕斯卡B.和皮埃尔•德•费马早在他们之前,已有一些数学家在研究赌博中的数量规律了Pascal Pierrede Fermat0意大利诗人但丁早在世纪就讨论过掷三颗骰子可能出现的各种点数世纪中,意大利科学家伽利1516略讨论了掷三颗骰子出现点次数多于点次数的原因在数学家们对机会游戏研究的基础上,帕斯109卡和费马通过通信的方式,将赌博中出现的各种具体问题,归纳为一般的概率原理,为后来概率论和统计学的发展奠定了重要的基础、第二阶段2自世纪中叶上述几位科学家从不同角度开始了统计学研究后,经过几代统计学家的努力,历17经两个半世纪,到世纪末建成了古典统计学主要是描述统计学的基本框架19世纪初,大工业的发展对产品质量检验问题提出了新的要求,即只抽取少量产品作为样本对20全部产品的质量好坏做出推断因为大批量产品要做全面的检验,既费时、费钱,又费人力,加之有些产品质量的检验要做破坏性检验,全部检验已不可能年,英国的高赛特提出了小样本1908WSGosset统计量,利用统计量就可以从大量的产品中只抽取较小的样本完成对全部产品质量的检验和推断,t t这样就使统计学进入了现代统计学主要是推断统计学的新阶段以后经过著名统计学家费希尔R,A,给出了统计量、最大似然估计、方差分析等方法和思想,奈曼和Fisher FJ.Neyman皮尔逊的置信区间估计和假设检验,沃尔德的序贯抽样和统计决策函数等,到ESPearson A.Wald20世纪中叶构筑了现代统计学的基本框架、第三阶段3从世纪年代以来,统计理论、方法和应用进入了一个全面发展的新阶段一方面,统计2050学受计算机科学、信息论、人工智能等现代科学技术的影响,新的研究领域层出不穷,如多元统计分析、现代时间序列分析、贝叶斯统计、非参数统计、线性统计模型、探索性数据分析、数据挖掘等,特别是近一二十年来,海量数据的存储、互联网与云计算等科技的发展,大数据时代已经到来,这对统计学科的发展既是机遇,也带来挑战另一方面,统计方法的应用领域不断扩展,几乎所有的科学研究都离不开统计方法因为不论是自然科学、工程技术、农学、医学、军事科学,还是社会科学都离不开数据,要对数据进行研究和分析就必然要用到统计方法,现在连纯文科领域的法律、历史、语言、新闻等都越来越重视对统计数据的分析,国外的人文与社会学科普遍开设统计学的课程,因而可以说统计方法与数学、哲学一样成为所有学科的基础统计学的分科§
1.3统计学的内容十分丰富,研究与应用的领域非常广泛从统计教育的角度,统计学大致有以下两种分类描述统计和推断统计
1.
3.1描述统计是用图形、表格和概括性的数字对数据进行描述descriptive statistics的统计方法图的框图清楚地表明描述统计是对数据进行处理的第一阶段,即用直观的图形、汇总的表1格和概括性的数字如平均数表示数据的分布、形状等特征,并为进一步的统计推断提供根据推断统计是根据样本信息对总体进行估计、假设检验、预inferential statistics帧其雌删]细方法例如棚林媛帽试操审计人厕撕W1ttl科
5.Com张发票中有错误的发票数做出估计,然后公司可据此决定是否调整其营业额又如送400x
18.国盖洛普叩调查公司在美国总统大选前通常会从全美国的选民中随机抽取人下载高清无水印右,Gall1500对大选结果进行调查和预测,并会给出左右的预测误差以上这两个例子都是利用样本信息和概率论3%原理进行统计推断的过程闯仑分物题酚、六5常中心能阳定得物中偿检0资储计、够•范综理)总停兹姿f作统计学分为描述统计和推断统计,一方面反映了统计发展的前后两个阶段,另一方面也反映了统计方法研究和探索客观事物内在数量规律性的先后两个过程图即为统计方法探索客观现象
1.1数量规律性过程的框图由图可以得知,统计研究过程的起点是数据,终点是探索到客观事物总体内在的数量规律性要
1.1达到统计研究的目的,如果我们收集到的是总体数据(如普查),则经过描述统计之后就可以达到探索内在数量规律性的目的了;但如果所获得的数据只是研究总体的一部分数据,要探索到总体的数量规律性,就必须应用概率论的理论、并根据样本整理出的信息对总体做出科学的推断,显然,描述统计是整个统计学的基础和统计研究工作的第一步它包括对客观现象的度量,调查方案的设计,科学、及时、快速、经济地收集与整理数据用图表显示数据,分析和提取数据中的有用信息以最终推断总体推断统计是现代统计学的核心和统计研究工作的关键环节,因为统计最终能否科学准确地探索到总体内在的数量规律性与选用何种统计量,选用什么推断方法,如何进行推断有着直接的联系一个出色的统计工作者的能力和技巧在推断统计中将得到充分的体现和检验但如果没有描述统计收集可靠的数据并提供有效的样本信息,即使很高明的统计学家和很科学的推断方法也难于得出准确的结论因而,推断统计对描述统计乂有很强的依赖性应该认识到,尽管描述统计可以在获得总体数据时直接探索出总体数量规律性,但这种情况在实际工作中很少见到自然现象的总体多数是无限的,例如,统计物理研究中要弄清楚分子运动的规律,而分子又是无穷多的,不可能全部观察和试验社会经济现象的总体虽然多数是有限的,但要考虑获得数据以及推断总体的时效性、经济性和准确性,抽样调查往往比普查更有效,因而应用也就更普遍例如全国的人口数量和变化、耕地面积、企业个数和经营情况等,虽然可以通过普查得到全部数据,但普查要投入大量的人力、财力和物力,而且要很长的时间才能收集、整理出所要的数据,不是每年都能做的,因而我国确定每年进行•次人口普10查,每五年进行一次经济普查,其他各年均以抽样调查数据进行推断此外,大量的管理和研究工作不可档能组织普查,例如,城市居民家庭每月的收入出调查某种商品的市场调查、某个事件的民意测验等都只能通过抽样调查方法,对总体数量规律性「Com下载高清无水印进行科学的推断因而,在描述统计中收集、整理和分析的多是样本数据这样,科学地整理样本数据、显示样本数据的特征和规律、提取样本数据中的有用信息就显得格外重要了在这里特别要强调的是,在当今大数据网络时代,我们常常可以获得接近总体的海量数据因而,只要能从数据中探索到相互联系的数量特征,就基本把握了事物间的内在数量规律,也就是说,只需要描述统计一个阶段就够了例如,过去要计算由于衣食住行的商品成干上万种,只能抽样选择代表性商品CPI,和服务记录其价格面今相当数量的商品价格都可以从网络上获得,美国麻省理工学院()的两位教授MIT就利用网络价格数据编制了结果与抽样调查的差别很小这就是说,针对海量数据进行收集、整理、CPI,分析和显示的数据科学家和数据分析师越来越重要,他们需要更强的计算机技能和数据分析能力,本书将为他们提供学习数据分析的基础理论统计和应用统计
1.
3.2理论统计是指统计学的数学原理由于现代统计科学用到了几乎所有的数学知识,要成为优秀的统计工作者就必须经过严格的数学训练,特别是从事统计理论和方法研究的人员就必须有很好的数学基础从广义来讲,统计学是应该包括概率论的,因为概率论是统计推断的数学基础,面概率论是数学的一个分支,则理论统计应该是包括概率论在内的对统计方法数学原理的研究在统计工作者中,从事理论统计研究的人只是很少的部分,大部分是应用统计方法去解决实际问题的应用统计工作者统计学是门数据科学,由于在自然科学、社会科学的所有研究和实际工作中都要通过数据来分析和解决问题,统计方法的应用就自然而然地扩展到几乎所有的研究领域例如,统计方法在物理研究中的应用就形成了统计物理,统计方法在生物学中的应用形成了生物统计,统计方法在医学中的应用形成了医疗卫生统计,统计方法在风险管理与保险中的应用形成了保险精算学,统计方法在微观企业管理中的应用形成了管理统计,等等以上这些应用统计学的不同分支所应用的基本方法都是一样的,即都是描述统计和推断统计的主要方法但由于各应用领域都有其特殊性,统计方法在应用中就具有了不同的特点例如,在经济应用中要测量和探索物价变动的数量规律性,就在比率和平均数的基础上形成了物价指数法又如,正态分布在教育学中得到广泛应用,在教育测量和分数转化问题研究中得到了发展作为一名优秀的应用统计工作者,不但要能熟练地掌握和应用各种统计方法,而且必须具备所研究和应用领域的专业知识因而,专业知识和统计方法是做好统计应用的两个基本功例如,要做好经济统计工作,其基本条件是要具备经济理论和统计方法的知识和能力,当然还需有计算机操作能力、写作能力和其他能力这就要求统计应用人才是一一名复合型人才,这也是人文、社科、理、工、农、医所有院校都开设应用统计方法这门课程的缘由据的种类与来源§
1.4数据是一种未经加工的原始资料,数字、文字、符号、图像、音频、视频等都是数据现代科学技术使得我们可以获得广阔的数据来源,例如,条形码技术的成熟产生了大量的超市、商品扫描数据;(企业资源计划)系统的广泛实施产生了详细的业务流程数据;(客ERP CRM户关系管理)系统的成熟应用产生了大量客户的消费行为数据;地磁技术的应用产生了大量的交通路况监控数据;城市中铺天盖地的监控摄像头产生了海量的视频图像数据;(全球定位系统)技术的发展产GPS生了巨大的位置数据;以微博微信为代表的移动社交软件的普及产生了海量的文本以及社交关系网络数据等数据的种类
1.
4.
1.按性质分1数据的种类按性质可以分为(定位的,如各种坐标数据()定性的,如表示事物属性的数据(城镇、2河流、道路等);()定量的,反映事物数量特征的数据,如长度、面积、体积等几何量或重量、速度等3物理量;()定时的,反映事物时间特性的数据,如年、月、日、时、分、秒等4按表现形式分
2.数据的种类按表现形式可以分为()结构型数据,如各种数字、测量数据及其解释;()非结构型数12据,如网络日志、音频、视频、图片和地理位置信息等本书讨论的统计方法主要适用于结构型数据,也可以称为统计数据非结构型数据有些可以转化为结构型数据,有些用到机器学习、人工智能、数据挖掘等大数据分析方法,但也都以本书介绍的方法作为继续学习的基础数据的来源
1.
4.2统计数据来源于直接组织的调查、观察和科学试验,我们称之为第一手数据或直接的发据;或者来源于已有的数据,我们称之为第二手数据或间接的数据直接获取的数据
1.在进行科学研究和管理决策时,若没有现成的数据可以利用,就需要专门组织调查行科学试验或者从网络上获取对于社会经济管理和决策而言,主要是通过统计调查的方式获取数据,如客户满意度调查、电视收视率调查、家庭收支情况调查、居民闲暇时间利用调查等由于抽样调查是一项技术含量相当高的工作,从制订调查方案到抽取样本,从调查到数据整理,从质量控制到研究报告的撰写等,都需要有专门的技能和培训,因此调查公司和调查业因市场的需求而发展迅速统计调查的方法主要有以下几种()普查普查是为某一特定目的,专门组织的一次性全面调查这是一种摸清国情、国力的重1要调查方法世界各国都定期地(一般是年)进行人口普查、农业普查等例如,我国在年进行101982了第三次全国人口普查,年进行了全国工业普查,年、年和年分别进行了第四次、第五1985199020002010次和第六次全国人口普查,年年底、年年底和年年底进行了经济普查200420082013全国及各省、市、地区的普查可以摸清基本情况,获得丰富的统计数据但普查涉及土地家万户所max.
18.com普查之间的年份以抽样调查方法获得连续的统计数据预览与源文档一致下载高清无水印花费的时间、人力财力和物力都较大,因而只能问隔较长时间进行一次而两次乂后⑵抽样调查抽样调查是统计调查中应用最广、最为重要的调查方法,它是通过随机样本对总体数量规律性进行推断的调查研究方法虽然抽样调查不可避免地存在着由样本推断总体产生的抽样误差,但统计方法不仅可以估计出误差的大小,而且可以进一步控制这些误差由于以上这些特点,加之其节省人力、财力、物力,又能保证实效性的特点,抽样调查已经成为科学研究及管理决策最重要的方法之一⑶科学试验在自然科学和工程的研究领域,通常是通过科学试验的方法获得研究的统计数据例如,某化工厂生产种新产品,要在不同原料配方的不同水平中选择最优搭配,就要通过最少搭配试验的数据找出最佳方案在医学研究中通过临床试验的数据分析某种药物或治疗方案的疗效,这部分内容可以参阅试验设计的相关图书资料⑷网络获取由于互联网的普及,从网络上获取各种数据已经相当方便,因而越来越成为数据分析的重要来源数据库、数据挖掘、机器学习等相关领域的知识和能力已经成为现代数据分析人才的基本技能但要强调的是,网络参与人群只是一国、一地人口的一部分,网络参与人群的数据不能简单代表总体,不能简单代表全部人群除了以上四种直接数据来源外,还有音频、视频、图片和地理位置信息等大量非结构型直接数据可以得到,分析的工具也多种多样,读者可以参阅相关书籍进一步学习提高.间接获取的数据2在科学研究和管理决策中,要善于利用各种现成的数据这种数据既可以从报纸、图书、杂志、统计年鉴、网络等渠道获得,也可以从调查公司或数据库公司等处购买近年来,互联网已经成为数据来源的重要渠道,几乎所有的政府机构和大公司都有自己的网站并提供公共访问端口,访问者可以从中获得有用的数据统计数据的质量§
1.5统计的整个工作过程就是对数据的加工过程,从原始数据的收集开始,经过整理、显示、样本信息的提取到总体数量规律性的科学推断,都有一个减少误差、提高数据质量的问题也就是说,统计数据的质量控制问题是贯穿于统计研究全过程的重要问题但在不同的统计工作阶段,统计数据误差产生的原因是不同的,严重程度也不同统计调查阶段是统计研究的第一步,是直接收集统计数据的阶段因而这一阶段统计数据的质量如何,直接影响到整个统计工作在这一阶段中,从不同的角度分类,可以分为非抽样误差与抽样误差非抽样误差是由于调查过程中各有关环节工作失误造成的它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中不回答产生的误差等非抽样误差在普查、抽样调查中都可能发生显然,从理论上看,这类误差是可以避免的克服或降低非抽样误差时,一方面要加强统计调查人员的培训,使他们树立很强的责任心和数据质量意识,加强填报和汇总时的检查;另一方面要掌握获取完整抽样框的方法,以及科学抽样的方法与技术在非抽样误差中还有一种人为干扰造成的误差,即有意瞒报或低报数据,这是需要给予特别注意的例如,在填报产量产值时,某些领。