还剩24页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
BIG DATAEMPOWERSTO CREATEA NEWERAsampling抽样技术统计学专业课课件目录CONTENTS•抽样技术概述•随机抽样方法•非随机抽样方法•样本量的确定•抽样误差与非抽样误差•抽样调查的实施与数据分析BIG DATAEMPOWERSTO CREATEA NEWERA01抽样技术概述抽样的定义与目的定义抽样是从总体中选取一部分个体作为研究对象的过程目的通过对样本的研究,推断总体的特征和规律,达到节约成本、提高效率的目的抽样的分类随机抽样按照随机原则从总体中抽取样本,保证每个个体被选中的机会相等系统抽样按照固定的间隔或顺序从总体中抽取样本,如每隔10个人抽取一个分层抽样将总体分成若干层,从每层中随机或系统抽取样本,如按性别、年龄分层整群抽样将总体分成若干群,随机或系统抽取若干群作为样本抽样的基本原则0102代表性可靠性样本应能反映总体的特征和规律,样本应具有较高的可信度,能够真具有代表性实反映总体的实际情况经济性随机性抽样应考虑成本和效率,以最小的样本的抽取应遵循随机原则,避免成本获得最大的信息量主观因素对样本选择的影响0304BIG DATAEMPOWERSTO CREATEA NEWERA02随机抽样方法简单随机抽样每个样本单位被选中的概率相等,是最基本的随机抽样方法每个样本单位被独立地选入样本,且每个单位被选中的概率相等这种方法适用于总体单位数量不大且总体异质性较小的情况系统抽样将总体均分,按固定的样本间隔进行抽样,减少随机误差将总体均分为若干个部分,每个部分包含相同数量的单位,然后按照固定的样本间隔进行抽样这种方法适用于总体单位数量较大且总体异质性较小的情况分层抽样根据某些重要变量将总体分为若干层,然后在各层内进行随机抽样根据某些重要变量(如年龄、性别、收入等)将总体分为若干个层次,然后在每个层次内进行随机抽样这种方法适用于总体异质性较大的情况,能够提高样本的代表性和减小抽样的误差整群抽样将总体划分为若干个群,然后随机抽取若干个群作为样本将总体划分为若干个群(如学校、企业等),然后随机抽取若干个群作为样本这种方法适用于群内个体差异较小的情况,能够提高样本的代表性和减小抽样的误差BIG DATAEMPOWERSTO CREATEA NEWERA03非随机抽样方法判断抽样01判断抽样是一种非概率抽样方法,基于研究者的主观判断和经验选择样本02判断抽样的优点是简便易行,适用于对总体结构有一定了解的情况03判断抽样的缺点是主观性强,容易受到研究者个人偏见的影响,样本代表性可能不准确配额抽样配额抽样是根据已知的总体特征将总体分成若干个群01体,然后按比例从每个群体中抽取样本配额抽样的优点是能够保证样本的代表性,适用于分02层明显的总体配额抽样的缺点是难以保证每个群体内部的代表性,03且需要事先确定分层的标准雪球抽样010203雪球抽样是从已知的调查对象雪球抽样的优点是能够深入了雪球抽样的缺点是样本代表性开始,通过他们的人际关系网解特定群体的特征和行为,适较差,容易受到群体内部同质络不断向外扩展,以滚雪球的用于稀少或难以接触的群体性的影响方式抽取样本BIG DATAEMPOWERSTO CREATEA NEWERA04样本量的确定样本量估算的原则精确性原则经济性原则样本量应足够大,以确保估计的精确度和可样本量应考虑到调查成本和资源限制,力求信度以最小的样本量达到满意的估计精度代表性原则可操作性原则样本应能够代表总体,避免因样本偏差导致样本量应考虑到实际操作的可行性和便利性,估计误差如调查难度、时间限制等确定样本量的方法经验法统计法查表法根据以往的经验或常识来估算样利用统计学原理和公式来计算样查阅专门的样本量表或指南,根本量这种方法简单易行,但可本量这种方法需要一定的统计据不同的条件和要求选择合适的能不够精确学知识,但更为科学和精确样本量这种方法方便快捷,但需要使用可靠的样本量表或指南影响样本量的其他因素总体规模总体规模越大,需要的样本量相对较小这是因1为大总体中的变异较小,相对更容易代表总体容许误差容许误差越大,需要的样本量相对较小这是因2为较大的容许误差意味着对估计精度的要求较低,所需样本量也相应减少置信水平置信水平越高,需要的样本量相对较大这是因3为高置信水平要求更精确的估计,需要更多的样本数据来支持BIG DATAEMPOWERSTO CREATEA NEWERA05抽样误差与非抽样误差抽样误差的来源与控制抽样误差的来源抽样误差是由于从总体中随机抽取样本而产生的误差,主要来源于样本的随机性和代表性不足控制抽样误差的方法控制抽样误差的方法包括增加样本量、采用更科学的抽样方法、提高样本的代表性等,以减少随机性和偏差对样本结果的影响非抽样误差的来源与控制非抽样误差的来源控制非抽样误差的方法非抽样误差是由于非随机因素引起的误控制非抽样误差的方法包括加强调查设计、差,主要包括由于调查设计、数据采集、提高数据采集和处理的质量、加强数据审数据处理等方面的问题VS核和校验等,以减少非随机因素对样本结果的影响BIG DATAEMPOWERSTO CREATEA NEWERA06抽样调查的实施与数据分析调查表的编制与实施调查目的和主题明确调查目的和主题,确定调查范围和对象调查表设计根据调查目的和主题,设计合理的调查表,包括问题和答案的设计调查实施选择合适的调查方法,如随机抽样、分层抽样等,进行实地调查或在线调查,确保调查的准确性和可靠性数据整理与描述性分析数据收集收集调查得到的数据,进行数据清洗和整理,去除无效和错误数据数据描述使用统计方法对数据进行描述,如计算均值、中位数、众数、标准差等,了解数据的基本特征和分布情况数据可视化将数据以图表、图像等形式呈现,帮助理解和分析数据参数估计与假设检验参数估计利用样本数据对总体参数进行估计,如总体均值、总体比例等假设检验根据研究目的和假设,利用样本数据对假设进行检验,判断假设是否成立统计分析方法选择合适的统计分析方法,如t检验、卡方检验、方差分析等,进行数据分析。