您好、欢迎来到现金彩票网!
当前位置:秒速快3 > 数据偏斜 >

统计学 数据数值众数中位数平均数讲解与例题中ppt

发布时间:2019-06-19 00:50 来源:未知 编辑:admin

  1.本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

  第4章 统计数据的静态分析 4.1 总量指标 4.2 相对指标 4.3 平均指标 4.4 标志变异指标 4.5 数据分布的形态 本章学习目的 本章重点与难点 重点:总量指标的种类、相对指标的数值表现形式、种类及计算方法;平均指标的种类,算术平均数、调和平均数和几何平均数的计算方法、应用场合 ;众数和中位数概念和特点;变异指标的作用、应用场合和计算方法。 什么是态数列 静态数列——又称变量数列,是指某一时间在分组的基础上,同时列出总体的次数和比率所构成的数列。 静态三数(图) 数据描述的数值方法 4.1 总量指标 相对数 【例】 下周见 作业:课后练习计算题 数据描述的数值方法 第二模块 4.3平均指标 算术平均数(例子) 某企业的工会随机调查了20名工人2005 年6月加班的小时数,结果如下: 该组数据算术平均数等于 (13+18+ … +12)/20=11.6(小时)。 【练习2】假设某饮料公司7月份对几个零售店进行了一次调查,得到如表4-3所示数据,计算饮料销售量的均值 算术平均数的性质 1、 所有的定量数据都有算术平均数。 2、计算算术平均数时使用了所有数据。 3、一组数只有一个均值。 4、各变量值与均值的离差之和等于零。 总结 1.算术平均数的性质 1、 所有的定量数据都有算术平均数。 2、计算算术平均数时使用了所有数据。 3、一组数只有一个均值。 4、各变量值与均值的离差之和等于零。 2 中位数(Median) 一组数据按大小顺序排列后,处在数列中点位置的数值。 特点: 对一组数据是唯一的。 不受极端值的影响。 主要用于顺序数据,也可用数值型数据,但不能用于分类数据。 3 众数(Mode) 一组数据中出现次数最多的变量值。 主要特点: 不受极端值的影响。 有的数据无众数或有多个众数。 对未分组定量资料很少使用。 众数的不惟一性 众数、中位数和算术平均数的关系 小结:平均数、中位数、众数的特点 算术平均数 : 易受极端值影响(使用了全部数据) 数学性质优良,主要用于数值型数据 数据对称分布或接近对称分布时应用 中位数: 不受极端值影响 数据分布偏斜程度较大时应用;主要用于顺序数据 众数: 不受极端值影响 不具有惟一性 数据分布偏斜程度较大时应用;主要用于分类数据 四分位数(Quartile) 数据按大小顺序排序后把分割成四等分的三个分割点上的数值 。 在实际应用中四分位数的计算方法并不统一(数据量大时这些方法差别不大)。对原始数据: SPSS中四分位数的位置为(n+1)/4, 2(n+1)/4, 3 (n+1)/4。 Excel中四分位数的位置分别为(n+3)/4, 2(n+1)/4,(3 n+1)/4。 如果四分位数的位置不是整数,则四分位数等于前后两个数的加权平均。 四分位数计算(例子) 排序后的数据: 2,5,6,7,8,9, 10,12,15,16 4.4 标志变异指标 离散程度 反映各变量值远离其中心值的程度(离散 程度),从另一个侧面说明了集中趋势测 度值的代表程度。 不同类型的数据有不同的 离散程度测度指标。 (2) 四分位距(Inter-Quartile Range, IQR) 等于上四分位数与下四分位数之差 反映了中间50%数据的离散程度,数值越小说明中间的数据越集中。 不受极端值的影响。 可以用于衡量中位数的代表性。 方差和标准差 (variance and standard deviation) 数据离散程度的最常用测度值 反映各变量值与均值的平均差异 根据总体数据计算的,称为总体方差(标准差),记为?2(?);根据样本数据计算的,称为样本方差(标准差),记为s2(s) 总体方差和标准差 (Population variance and Standard deviation) 未分组数据 样本方差和标准差 (sample variance and standard deviation) 未分组数据 方差的计算公式 自由度 (degree of freedom) 自由度的概念由统计学家R.A Fisher提出 是指数据个数与附加给独立的观测值的约束或限制的个数之差 从字面涵义来看,自由度是指一组数据中可以自由取值的个数 当样本数据的个数为n时,若样本平均数确定后,则附加给n个观测值的约束个数就是1个,因此只有n-1个数据可以自由取值,其中必有一个数据不能自由取值 按着这一逻辑,如果对n个观测值附加的约束个数为k个,自由度则为n-k 自由度 (degree of freedom) 样本有3个数值,即x1=2,x2=4,x3=9,则 ?x = 5。当 ?x = 5 确定后,x1,x2和x3有两个数据可以自由取值,另一个则不能自由取值,比如x1=4,x2=9,那么x3则必然取2,而不能取其他值 为什么样本方差的自由度为什么是n-1呢?因为在计算离差平方和时,必须先求出样本均值?x ,而?x则是附加给离差平方和的一个约束,因此,计算离差平方和时只有n-1个独立的观测值,而不是n个 样本方差用自由度去除,其原因可从多方面解释,从实际应用角度看,在抽样估计中,当用样本方差s2去估计总体方差σ2时,它是σ2的无偏估计量 样本标准差 (例题分析) 标准分数(扩充内容) (standard score) 1. 也称标准化值 2. 对某一个值在一组数据中相对位置的度量 3. 可用于判断一组数据是否有离群点(outlier) 用于对变量的标准化处理 均值等于0,方差等于1 计算公式为 标准分数 (用于数据变换) z分数只是将原始数据进行了线性变换,它并没有改变一个数据在该组数据中的位置,也没有改变该组数分布的形状,而只是使该组数据均值为0,标准差为1 用SPSS对数据进行标准化 第1步:选择【Analyze】下拉菜单,并选择 【Descriptive statistics - Descriptive 】 选项进入主对线步:在主对话框中将变量选入【Variables】, 然后选中【Save standardized values as variables】。点击【OK】(SPSS会将标准化 后的变量以“Z”开头存放在原始变量工作表中) 离散系数:例子 4.某工业局全员劳动生产率的标准差为512元,标准差系数为8.4%。试求该工业局全员劳动生产率水平(要求列出公式和算式)。 4.5 分布形状的度量 偏态与峰态(了解) 偏态和峰度的类型 1 偏态及其测定(Skewness) 数据分布的不对称性称作偏态。 偏态系数就是对数据分布的不对称性(即偏斜程度)的测度。 偏态系数有多种计算方法,在统计软件中(如Excel等)通常采用以下公式: 偏态系数的含义 峰度系数的含义 Excel中的统计函数 MODE—计算众数 MEDIAN—计算中位数 QUARTILE—计算四分位数 AVERAGE—计算平均数 HARMEAN—计算简单调和平均数 GEOMEAN—计算几何平均数 AVEDEV—计算平均差 STDEV—计算样本标准差 STDEVP—计算总体标准差 SKEW—计算偏态系数 KURT—计算峰态系数 TRIMMEAN—计算切尾均值 用Excel和SPSS计算描述统计量 SPSS?【Analyze】?【Descriptive statistics】?【Descriptives】?【variables】(选入变量)?【Options】(选择需要的描述统计量)?【Continue】?【OK】 小结:本章要点(1) 总量指标与相对指标:第一,能辨别;第二能熟练地计算各种相对指标 集中趋势是一组数据向其中心值靠拢的倾向和程度。常用测度指标有:算术平均数、众数、中位数、分位数等。 离中趋势反映的是一组数据中各观测值之间的差异或离散程度。常用测度指标包括极差,四分位距,方差和标准差,离散系数等 数据分布的偏态与峰度的含义 .Z分数的计算和含义 前四章小结 第二章 数据的搜集 2.2.2 统计数据的来源 统计调查形式示意图 统计调查的方法 直接观察法 报告法 采访法 通讯法 电话调查法 网上调查法 问卷调查法 卫星遥感法 问卷设计的步骤 第3章 统计数据的整理与显示 ?统计数据的整理 ?统计分组 ?分配数列(频数分布) ?统计图与统计表 第4章 统计数据的描述 总量指标 相对指标 平均指标 标志变异指标 数据分布的形态 数据的描述统计量 3.标准差 (σ) 优点:容易理解, 计算方便,能反映全部数据分布状况 2.标准差 系数 (V σ ) 各标志值与 均值离差绝 对值的算术 *100% 平均 X 优点:消除了绝对数的影响,使不同总体的标志变异程度直接对比。 概念 特点 计算 各标志值与算术平均数离差平方的算术平均数的平方根 公式见教材 V σ= σ 结 束 成绩(分) 人数(人) 60-70 70-80 80-90 90以上 10 20 15 5 合计 50 (2)加权平均法 标志变异指标的测定 (2)加权平均法 式中: 表示各组的变量值或各组的 组中值; 表示各组的次数。 成绩(分) 人数(人) 60-70 70-80 80-90 90以上 10 20 15 5 合计 50 计算成绩的标准差。 例 (2)加权平均法 成绩(分) 人数(人) 组中值(分) 每组总成绩(分) 离差的 平方 离差的平方 乘以次数 60-70 70-80 80-90 90以上 10 20 15 5 合计 50 成绩 (分) 人数(人) 组中值 每组总成绩(分) 离差的 平方 离差的平方 乘以次数 60-70 70-80 80-90 90以上 10 20 15 5 65 75 85 95 650 1500 1275 475 169 9 49 289 1690 180 735 1445 合计 50 - 3900 - 4050 标准差的特点: 能综合反映全部单位标志值的实际差异程度; 用平方的方法消除各标志值与算术平均数离差的正负值问题,可方便地用于数学处理和统计分析运算. 月产量(件) 人数 (人) 900以下 900-1000 1000-1100 1100-1200 1200以上 20 50 80 30 20 合计 200 练习:计算月产量的标准差。 是非标志总体 分组 单位数 变量值 具有某一属性 不具有某一属性 1 0 合计 — 为研究是非标志总体的数量特征,令 指总体中全部单位只具有“是”或“否”、“有”或“无”两种表现形式的标志,又叫交替标志 是非标志 性别:男、女(非男)产品质量:合格、不合格 1 0 1 0 是非标志总体的指标 具有某种标志表现的 单位数所占的成数 不具有某种标志表现 的单位数所占的成数 指是非标志总体中具有某种表现或不具有某种表现的单位数占全部总体单位总数的比重 成数 是非标志总体的指标 平均数 标 准 差 是非标志总体的指标 方差 标准差系数 【例】某厂某月份生产了400件产品,其中合格品380件,不合格品20件。求产品质量分布的集中趋势与离中趋势。 是非标志总体的指标 解: 身高的差异水平:cm 体重的差异水平:kg 用变异系数可以相互比较 可比 可比 变异系数指标 十棵向日葵的高度(米) 0.8 0.9 1.1 1.2 1.2 1.3 1.5 1.5 1.7 1.8 十棵树木的高度(米): 29.5 29.6 29.8 29.9 29.9 30 30.2 30.2 30.4 30.5 两组变量值的绝对水平不同,不能用 、 比较平均数的代表性和变量值的差异程度 4.4.2标志变异指标的计算-4.离散系数 标准差系数 离散系数 离散系数是级差、平均差和标准差与其算术平均数的比值。 4.4.2标志变异指标的计算-4.离散系数 特点: 反映了相对于均值的相对离散程度; 可用于比较计量单位不同的数据的离散程度; 计量单位相同时,如果两组数据的均值相差悬殊,离散系数可能比标准差等绝对指标更有意义。 对30名经理人员的调查表明年平均收入=$500,000,标准差 = $50,000。 对30名工人的调查表明平均收入= $32,000,标准差 = $5,000。 离散系数: 经理人员: 工人: 虽然经理人员收入的绝对离散程度远远大于工人,但经理人员收入的相对离散程度小于工人。 【例】甲组运动员的平均身高为184厘米,标准差为8厘米;乙组运动员按身高分组资料如表所示,比较两组运动员平均身高的代表性。 身高(cm) 人数(人) 170以下 170-180 180-190 190以上 2 6 18 4 合计 30 乙组运动员按身高分组资料 身高(cm) 人数 (人) 组中值 170以下 170-180 180-190 190以上 2 6 18 4 165 175 185 195 330 1050 3330 780 -18 -8 2 12 324 64 4 144 648 384 72 576 合计 30 - 5490 - - 1680 乙组运动员相关资料计算表 甲组运动员的标准差系数: 乙组运动员的标准差系数: 计算结果表明 ﹥ 因此,乙组运动员比甲组运动员平均身高的代表性大。 偏态 左偏分布 右偏分布 正态分布 扁平分布 峰态 尖峰分布 左偏分布(也称负偏分布): 偏态系数 SK 0;偏态系数的绝对值越大,偏斜越严重 数据向左边延伸得更多 右偏分布(也称正偏分布) : 偏态系数SK 0;偏态系数的绝对值越大,偏斜越严重。 数据向右边延伸得更多 对称分布:偏态系数=0。 扁平分布 尖峰分布 峰度系数K0,与正态分布相比该分布一般为扁平、瘦尾,肩部较胖。 峰度系数K0,与正态分布相比该分布一般为尖峰、肥尾,肩部较瘦。 均值和方差相同的正态分布 SPSS Excel ?【工具】?【数据分析】? 【描述统计】 ? 【确定】?【输入区域】?【输出选项】 ? 【汇总统计】?【确定】 Excel 概 念 计 算 特 点 数列中最大值 与最小值之差 1.极差 (R) R=最大值-最小值 优点:容易理解, 计算方便 缺点:不能反映全部数据分布状况 2.平均差 (A、D) 各标志值与 均值离差绝 对值的算术 平均 简单: 优点:反映全部数据分布状况 缺点:取绝对值 ,数字上 不尽合理 衡量平均指标代表性的大小。 那个班的成绩更好? 4.4.1标志变异指标的概念与作用 例:A组:65、68、72、75分 B组:34、51、95、100分 A组的总成绩:280分,平均成绩70分 B组的总成绩:280分,平均成绩70分 平均分还能 说明问题吗? 两个品牌的节能灯泡各抽出5只进行使用时数测定资料如下: 使用时数(小时): 甲品牌:3000、4000、5000、6000、7000乙品牌:4998、4999、5000、5001、5002 那个品牌的质量更稳定 4.4.1标志变异指标的概念与作用 研究两组变量值的差异程度 4.4.2标志变异指标的测定 级差 (全距) 平均差 标准差 离散系数 标志变异指标的测定方法 测定标志变动度的相对指标(无名数) 测定标志变异指标的绝对指标(有名数) 五名学生的月生活费分别为520元、600元、480元、750元、440元。 原始资料: 计算标志变异指标常见的统计资料 按加工零件分组(件) 工人数(人) 20 30 40 50 60 2 2 8 6 2 合计 20 工人的日产量分组资料 工人的日产量分组资料 按加工零件分组(件) 比重 (%) 20 30 40 50 60 10 10 40 30 10 合计 100 单项分配数列 工人按月收入分组资料 组距式变量数列 月收入(元) 人数 (人) 900以下 900-1000 1000-1100 1100-1200 1200以上 20 50 80 30 20 合计 200 工人按月收入分组资料 月收入(元) 比重 (%) 900以下 900-1000 1000-1100 1100-1200 1200以上 10 25 40 15 10 合计 100 是总体中各总体单位最大标志值与最小标志值之差,又称全距。用 表示。 1(1)级差 (全距) 或最高组上限或开口组假定上限 最低组下限或开口组假定下限 【例】五名学生的月生活费分别为520元、600元、480元、750元、440元。 (二)标志变异指标的计算 月收入(件) 人数 (人) 900-1000 1000-1100 1100-1200 50 80 30 合计 160 【例】工人按月收入分组资料如下,计算月收入的全距。 最低组下限 最高组的上限 最低组假定下限 最高组的假定上限 全距的特点: 优点:计算方法简单、易懂; 缺点:易受极端数值的影响,不能全面反映所有标志值差异大小及分布状况。 评价方法: 全距值越小,标志值越集中,标志变动越小, 平均数的代表性越高; 全距值越大,标志值越分散,标志变动越大, 平均数的代表性越低。 2,5,6,7,8,9,10,12,15,16,20 Q1=6, Q2=9, Q3=15 (1)简单平均法 平均数 变量值 总体单位数 2.平均差 是总体各单位的标志值与其平均数的离差绝对值的算术平均数,用A.D 表示。 【例】5名学生的成绩分别为50分、60分、70分、80分、90分,求成绩的平均差。 4.4.2标志变异指标的测定 日产量(件) 企业数(个) 550 650 750 850 950 2 3 5 6 2 合计 18 企业按日产量分组资料 式中: 表示各组的变量值或各组的 组中值; 表示各组的次数。 平均差的计算 (2)加权平均法 日产量 (件) 企业数 (个) 550 650 750 850 950 2 3 5 6 2 合计 18 例:计算企业日产量的平均差。 日产量(件) 企业数(个) 550 650 750 850 950 2 3 5 6 2 1100 1950 3750 5100 1900 217 117 17 83 183 434 351 85 498 366 合计 18 13800 - 1734 例:计算企业日产量的平均差。 成绩(分) 人数(人) 60-70 70-80 80-90 90以上 10 20 15 5 合计 50 计算成绩的平均差。 平均差的计算 成绩 (分) 人数(人) 组中值 每组总成绩(分) 离差的 绝对值 离差的绝对值乘以次数 60-70 70-80 80-90 90以上 10 20 15 5 合计 50 成绩 (分) 人数(人) 组中值 每组总成绩(分) 离差的 绝对值 离差的绝对值乘以次数 60-70 70-80 80-90 90以上 10 20 15 5 65 75 85 95 650 1500 1275 475 13 3 7 17 130 60 105 85 合计 50 - 3900 - 380 平均差的特点: 优点:能综合反映全部单位标志值的实际差异程度; 缺点:用绝对值的形式消除各标志值与算术平均数离差的正负值问题,不便于作数学处理和参与统计分析运算。 评价方法: 平均差愈大,标志变动程度愈大,平均数代表性越低 平均差愈小,标志变动程度愈小,平均数代表性越高 两个品牌的节能灯泡各抽出5只进行使用时数测定资料如下: 使用时数(小时): 甲品牌:3000、4000、5000、6000、7000乙品牌:4998、4999、5000、5001、5002 哪个品牌的质量更稳定 研究两组变量值的差异程度 月收入(元) 人数 (人) 900以下 900-1000 1000-1100 1100-1200 1200以上 20 50 80 30 20 合计 200 练习:计算月产量的平均差。 4.4.2标志变异指标的测定 —方差与标准差 组距分组数据 未分组数据 组距分组数据 方差的计算公式 标准差的计算公式 组距分组数据 未分组数据 组距分组数据 方差的计算公式 标准差的计算公式 注意: 样本方差用自由度n-1去除! 分组数据 未分组 数据 样本方差 总体方差 样本方差用(n-1)去除,从数学角度看是因为它是总体方差σ2的无偏估计量。 4.4.2标志变异指标的测定 —3.标准差(例题分析) (1)简单平均法 【例】5名学生的成绩分别为50分、60分、70分、80分、90分,求成绩的标准差。 成绩 离差 离差的平方 50 60 70 80 90 合计 (1)简单平均法 成绩 离差 离差的平方 50 60 70 80 90 -20 -10 0 10 20 400 100 0 100 400 合计 0 1000 【例】计算计算9名员工的月工资收入的方差和标准差 1500 750 780 1080 850 960 2000 1250 1630 方差 标准差 统计函数—STDEV 【例】节能灯泡的使用时数资料如下表所示,计算使用时数的众数。 按使用时数分组 (小时) 个数 (只) 2000以下 2000-2500 2500-3000 3000-3500 3500-4000 4000-4500 4500以上 10 30 60 200 70 40 20 合计 430 1.确定众数组。 2.利用上限或下限公式计算众数。 【例】职工按月收入分组资料如下,求月收入的众数 年纯收入 (元) 人数(人) 1200-1400 1400-1600 1600-1800 1800-2000 2000-2200 2200-2400 2400-2600 2600-2800 5 10 80 130 180 50 30 15 合计 500 【例】农户按年收入分组资料如下,求年收入的众数 年纯收入 (元) 工人人数(人) 1200-1400 1400-1600 1600-1800 1800-2000 2000-2200 2200-2400 2400-2600 2600-2800 5 10 80 130 180 50 30 15 合计 500 1.确定众数组。 2.利用上限或下限公式计算众数。 当数据分布存在明显的集中趋势,且有显著的极端值时,适合使用众数; 当数据分布的集中趋势不明显或存在两个以上分布中心时,不适合使用众数(前者无众数,后者为双众数或多众数,也等于没有众数) 众数的原理及应用 五名学生的月生活费分别为440元、480元、 520元、600元、750元。 例 将总体各单位标志值按大小顺序排列后,处于数列中间位置的标志值,用 表示。 5.中位数 中位数 特点:不受极端数值的影响,在总体标志值差异很大时,具有较强的代表性。 2009年,浙江城镇居民人均可支配收入的平均数24611元,人均可支配收入中位数为20985元,比平均数低3626元。居民收入中位数是全部调查家庭按户人均可支配收入排序后,位于全部调查人口数一半位置的那个家庭的人均可支配收入。中位数不受极值的影响,较好地反映了浙江城镇居民收入的一般水平。 (资料来源:国家统计局浙江调查总队2010-03-17 题为:“浙江城镇居民收入平稳增长 消费热点有所显现”的节选) 5.中位数 1.根据未分组资料(原始资料)确定中位数 (1)先把总体各单位的标志值按大小顺序排列。 (2)确定中位数的位置和中位数。 求中位数的方法 【例】某售货小组5个人,某天的销售额按从小到大的顺序排列为440元、480元、520元、600元、750元,求中位数。 所以,中位数是第3个单位的标志值: 因为: 标志值的项数是奇数。 具体方法为:①当标志值的项数为奇数项时,中位数是第(n+1)/2个标志值(n为标志值的项数); 求中位数的方法 ②当标志值的项数为偶数项时,中位数等于第 个和第 个标志值的算术平均数。 【例】8名工人的日产量为 21件,23件,24件,26件,27件,29件,30件,33件。 2.根据分组资料(组距数列)确定中位数 下限公式 上限公式 式中: 表示中位数; 表示中位数所在组的下限; 表示中位数所在组的上限; 表示中位数所在的组以前各组次数之和; 表示中位数所在的组以后各组次数之和; 表示中位数所在组的次数; 各组的次数; 各组的组距。 (1)确定中位数的位置。 收入(元) 人数(人) 1200-1400 1400-1600 1600-1800 1800-2000 2000-2200 2200-2400 2400-2600 2600-2800 5 10 80 130 180 50 30 15 合计 500 2.根据分组资料(组距数列)确定中位数 (2)确定中位数所在的组。 年纯收入(元) 工人人数(人) 1200-1400 1400-1600 1600-1800 1800-2000 2000-2200 2200-2400 2400-2600 2600-2800 5 10 80 130 180 50 30 15 合计 500 年纯收入(元) 工人人数(人) 以下累计次数 1200-1400 1400-1600 1600-1800 1800-2000 2000-2200 2200-2400 2400-2600 2600-2800 5 10 80 130 180 50 30 15 5 15 95 225 405 455 485 500 合计 500 — (3)利用上限或下限公式求中位数。 (3)利用上限或下限公式求中位数。 练习:节能灯泡的使用时数资料如下,计算使用时数的中位数。 按使用时数分组(小时) 个数(只) 2000以下 2000-2500 2500-3000 3000-3500 3500-4000 4000-4500 4500以上 10 30 60 200 70 40 20 合计 430 按使用时数分组(小时) 个数 (只) 各组向上累计次数(只) 2000以下 2000-2500 2500-3000 3000-3500 3500-4000 4000-4500 4500以上 10 30 60 200 70 40 20 10 40 100 300 370 410 430 合计 430 - 2.由各组的向上累计次数知第215个标志值在第四组。 1.中位数是第215个标志值 单项数列确定中位数 30个银行按所属储蓄所数分组资料如下表所示,计算中位数。 银行按所属储蓄所个数分组 (个) 银行数 (个) 4 5 6 7 8 2 7 15 5 1 合计 30 中位数一定存在; 中位数与算术平均数相近; 中位数不受极端值影响; 中位数的作用及用法 张村有个张千万, 九个邻居穷光蛋; 统计平均算资产, 个个都是张百万。 缺点: 易受极端值的影响。 严格来说无法根据有开口组 的分组数据计算算术平均数。 众数 无众数 众数 1 众数2 对称分布 均值 = 中位数 = 众数 分配为钟形、轻微不对称的经验公式: 左偏分布 均值 中位数 众数 右偏分布 众数 中位数 均值 不能整除时需加权平均: ? ? ? 位置 2 2.75 3 数值 5 6 0.75×(6-5)=0.75 谚语说,张家有财 千百万,九个邻居穷光蛋。平均起来算一算,家家都是张百万。 4.4标志变异指标 1.标志变异指标的概念 4.4.1标志变异指标的概念与作用 平均指标将总体各单位标志值之间的差异抽象化。 标志变异指标 变异指标又称标志变动度,综合反映各个单位标志值差异的程度 变异指标能说明总体中各单位标志值之间的差异程度或标志值分布的变异情况,它是说明总体的另一个重要指标。 车间 月计划完成情况(%) 全月 上旬 中旬 下旬 甲车间 乙车间 100 100 25 33 35 35 40 32 4.4.1标志变异指标的概念与作用 1.标志变异指标的概念 作 用 (2)反映社会经济活动过程的均衡性和稳定性。 (1)衡量平均指标代表性的大小。 标志变异愈大,平均数的代表性愈小;标志变异愈小,平均数的代表性大。 2.标志变异指标的作用 4.4.1标志变异指标的概念与作用 (3)数据的离散程度 常用指标: 全距(极差) 四分位距 方差和标准差 离散系数 收入 (元) 比重 (%) 1000以下 1000-1200 1200-1400 1400-1600 1600以上 10 20 40 25 5 合计 100 加权算术平均数 计算平均收入 组中值 组距式变量数列计算平均数 计算组距式变量数列的平均数时,仍然采用加权算术平均数的计算公式,公式中的 为各组的组中值。组中值是各组变量值一般水平的近似值,用组中值代表各组变量值一般水平,计算的平均数也是一个近似值。 是各组 的组中值 【练习1】学生按学习成绩分组资料如下表所示, 计算平均成绩。 成绩(分) 人数(人) 60-70 70-80 80-90 90以上 10 20 15 5 合计 50 3900 - 50 合计 475 95 5 90以上 1275 85 15 80-90 1500 75 20 70-80 650 65 10 60-70 每组总成绩(分) 组中值 人数(人) 成绩(分) 按销售数量分组(瓶) 频数 频率 50-60 3 9.38% 60-70 7 21.88% 70-80 10 31.25% 80-90 4 12.50% 90-100 5 15.63% 100-110 2 6.25% 110-120 1 3.13% 合计 32 1 权数:指变量数列中各组标志值出现的次数(频率)。 绝对权数:即次数、频数 相对权数:频率、比重 权数 权数 权数 成绩(分) 人数(人) 甲班 乙班 丙班 60 39 1 20 100 1 39 20 平均成绩(分) 加权算术平均数 61 99 80 决定平均数的变动范围 起到权衡轻重的作用 决定平均数的变动范围 起到权衡轻重的作用 按加工零件分组(件) 工人数(人) 20 30 40 50 60 2 2 8 6 2 合计 20 工人的日产量分组资料 工人的日产量分组资料 按加工零件分组(件) 比重 (%) 20 30 40 50 60 10 10 40 30 10 合计 100 1.算术平均数 职工按收入分组资料 收入(元) 人数(人) 1000以下 1000-1200 1200-1400 1400-1600 1600以上 20 40 80 50 10 合计 200 职工按收入分组资料 收入(元) 比重(%) 1000以下 1000-1200 1200-1400 1400-1600 1600以上 10 20 40 25 5 合计 100 1.算术平均数 (二)调和平均数 【例】在市场上购买某种蔬菜,一等2元/千克,二等1.8元/千克,三等1.5元/千克,如果每个等级的蔬菜各买3元钱、2元钱、和1元钱的,计算平均价格。 价格 (千克/元) 购买金额(元) 2 1.8 1.5 3 2 1 价格 (千克/元) 购买金额(元) 2 1.8 1.5 3 2 1 2.调和平均数 市场 销售价格 (元/件) 销售量 (件) 甲 乙 丙 11 12 13 1000 2000 500 合计 【例】某商品在三个市场的销售量和销售价格资料如下,求平均价格。 2.调和平均数 2.调和平均数 【例】小张开了一个运动裤淘宝专卖店,服装品牌有kappa、nike、adidas三种,5月份成交数据如表4-5所示,计算5月份三种品牌的均销售价格。 品牌名称 销售单价(元) 成交额(元) kappa 260 1300 nike 310 2480 adidas 280 2800 合计 —— 6580 市 场 销售价格(元/件) 销售量(件) 甲 乙 丙 11 12 13 1000 2000 500 合计 - 3500 销售总量 (单位总量) 销售总额 (标志总量) 2.调和平均数 【例】某商品在三个市场的销售额和销售价格资料如下,求平均价格。 市场 销售价格(元/件) 销售额(元) 甲 乙 丙 11 12 13 11000 24000 6500 合计 2.调和平均数 加权调和平均数的计算公式 选择公式的方法: 选择公式的方法: 2.找 求哪些变量值的平均数,这些变量值就是 。 如果是分子,该已知为 计算公式为: 1.写原始形式: 如:求平均价格是的原始形式是: 3.看另外的已知条件之和是比的分子还是分母。 如果是分母,该已知为 计算公式为: 2.调和平均数 【例】 某企业某日工人的日产量资料如下: 计算该企业该日全部工人的平均日产量。 日产量(件) 各组工人日总产量(件) 10 11 12 13 14 700 1100 4560 1950 1400 合计 9710 (二)调和平均数 【例】某季度某公司下属18个工业企业产值计划完成情况如下: 计算该公司该季度的平均计划完成程度。 f 分析 销售额计划完成程度(﹪) 企业数 (个) 实际销售额 (万元) 100以下 100~110 110~120 120以上 4 16 7 3 3800 201600 12075 6750 合计 30 【练习】某集团公司30个企业的销售资料如下,计算该集团公司的平均计划完成程度。 分析 销售额计划完成程度(﹪) 企业数 (个) 实际销售额 (万元) 组中值(%) 100以下 100~110 110~120 120以上 4 16 7 3 3800 201600 12075 6750 95 105 115 125 合计 30 224225 - 【练习】某集团公司30个企业的销售资料如下,计算公司的平均计划完成程度。 分析 2.调和平均数 回顾 根据掌握 的资料变 形为 简单算术平均数 加权算术平均数 加权调和平均数 张村有个张千万, 九个邻居穷光蛋; 统计平均算资产, 个个都是张百万。 缺点: 易受极端值的影响。 严格来说无法根据有开口组 的分组数据计算算术平均数。 选择公式的方法: 选择公式的方法: 2.找 求哪些变量值的平均数,这些变量值就是 。 如果是分子,该已知为 计算公式为: 1.写原始形式: 如:求平均价格是的原始形式是: 3.看另外的已知条件之和是比的分子还是分母。 如果是分母,该已知为 计算公式为: 习题课 17.某蔬菜在农贸市场销售资料如下,试分析哪个市场的平均价格高,说明原因。 时间 价格(元/千克) 甲市场的销售额 (元) 乙市场的销售量(千克) 早 中 晚 3 3.2 3.6 750 400 450 125 250 125 合计 19.甲、乙、丙三个同类企业计划完成情况及一等品率如下, 计算:(1)平均计划完成程度相对数。(2)平均一等品率。 企业 计划产量(件) 计划完成相对数(%) 实际一等品率(%) 甲 乙 丙 600 300 200 95 100 102 90 92 96 实际产量 (件) 570 300 204 20.甲、乙、丙三个车间生产同类产品资料如下, 计算(1)平均计划完成程度;(2)平均单位产品成本。 车间 计划完成相对数(%) 实际产量(件) 单位产品成本(元/件) 甲 乙 丙 95 105 103 285 420 515 12 11 10 总体中出现次数最多或最普遍的变量值,用 表示。 4.众数 众数 【例】10名学生的考试成绩为50分、60分、65分、70分、75分、78分、78分、78分、78分、90分。 用众数说明总体的一般水平,不受极端数值的影响。 求众数的方法 (2)根据单项数列确定众数 【例】30个银行按所属储蓄所数分组资料如下表所示。 银行按所属储蓄所个数分组 (个) 银行数 (个) 4 5 6 7 8 2 7 15 5 1 合计 30 众数 次数最多 (1)根据原始资料确定众数 (3)根据组距数列确定众数 下限公式: 上限公式: 式中: 表示众数; 表示众数组的下限; 表示众数组的上限; 表示众数组次数与其前一组次数之差; 表示众数组次数与其后一组次数之差; 表示众数组的组距。 比较相对数,是同一时间,不同空间,同类指标对比的比值。 比较相对数 时间相同、性质相同 分子分母可以互换 4.比较相对指标 4.比较相对指标 比较相对数:它是同一种现象在不同地区(单位、部门)进行对比的结果。 【例】 2009年甲企业职工平均工资为3.52万元,乙企业为3万元。则 说明甲企业职工平均工资为乙企业的117.33%。 4.比较相对指标 强度相对指标也称强度相对数,是同一时期两个性质不同但有联系的总量指标的比值。 计算公式 强度相对指标 5.强度相对指标 2009年年末我国人口数为133474万人,按960万平方公里土地面积计算,计算我国的人口密度是每平方公里多少人。 例 5.强度相对指标 用复名数表示的强度相对数 加拿大的土地面积约为998.5万平方公里、人口数约为3242.3万人计算人口密度。(2006年1月末) 5.强度相对指标 某年某地区年平均人口数为100万人,在该年度内出生的人口数为8600人。则该地区人口出生率: 用﹪、‰等无名数表示的强度相对数 例 年平均人数是年初、年底人口数的平均数,也可以用年中人口数代替 5.强度相对指标 五名学生的外语成绩分别为60分、70分、80分、90分、100分,平均成绩的计算方法(60+70+80+90+100)/5=400/5=80(分) 标志总量 总体单位总量 两指标是同一总体的标志总量和单位总量,之间的关系是依附关系性质相同。 5.强度相对指标 强度相对指标的作用: 1.反映一个国家或一个地区的经济实力。 2.反映事物的密度和普遍程度; 3.反映企业经济效益的好坏。 5.强度相对指标 盈利能力: 平均收入利润率(美国4%、中国5.44%) 平均净资产收益率(美国7.79%、中国9.4%) 反映一个国家或一个地区的经济实力。例如,计算人均国内生产总值、人均钢产量等等主要产品的产量反映国家的经济实力。 反映事物的密度和普遍程度;例如,每百人手机拥有量、每百人图书拥有量,反映手机的普及程度和阅读书籍的保障程度。 反映企业经济效益的好坏。全员劳动生产率、商品流转次数、人均利税额。 5.强度相对指标 练习:某地区某年人口数为100万人,医院床位总数为24700张。分析该地区的医疗保证程度。 5.强度相对指标 逆指标:指标数值越大事物的密度、 强度、相对程度越小。 每千人拥有医院床位数 每张医院床位负担的人口 正指标:指标数值越大事物的密度强度、相对程度越大。 5.强度相对指标 1.在下列相对指标中,分子、分母可以对调的有( )。 强度相对指标 B. 计划完成程度相对指标 C. 比较相对指标 D. 结构相对指标 E. 比例相对指标 课堂练习: 2.下列指标属于平均指标的有( )。 A. 人均国内生产总值 B. 工人劳动生产率 C. 全员劳动生产率 D. 学生平均学习成绩 E. 某地区人口密度 3.下列指标中属于强度相对指标的是( )。 A.工人劳动生产率 B.人均GDP C.人口出生率 D.职工平均工资 课堂练习: 6.下列指标中,属于强度相对指标的有( )。 A.人口密度 B.人均国内生产总值 C.人均钢产量 D.商品流通费 E.每百元资金实现的利税额 2.将不同时期的结构相对数比较,反映现象发展变化的过程和发展趋势。 年份 产业增加值在国内生产总值中占的比重(%) 1952 一产业 二产业 三产业 51 20.8 28.2 2008 11.3 48.6 40.1 就业人数占总就业人数的比重(%) 一产业 二产业 三产业 1952 83.5 7.4 9.1 2008 39.6 27.2 33.2 建国初期,我国农业基础薄弱、工业素质不高、服务发展滞后。在整个产业构成中,农业居主导地位。 世界上第三产业占GDP比重平均水平是68%,低收入国家是48.5%,中等收入国家是54.2%,高收入国家是71.3%。美国的第三产业占GDP比重占75.3% 产业结构基本实现了由以农业为主向一产、二产和三产协同发展的转变。 数据描述的数值方法 分布的形状 集中趋势 离散程度 众 数 中位数 均 值 离散系数 方差和标准差 峰 度 四分位距 极差 偏 态 4.3 4.4 4.5 姓名 月生活费支出(元) 甲 乙 丙 丁 600 700 800 900 合计 3000 4.3平均指标 是反映总体各单位某一数量标志在一定时间、地点、条件下所达到的一般水平的综合指标。 4.3.1平均指标的概念和作用 1.平均指标的概念 平均月生活费支出750(元) (一般水平) 数量标志 标志值 总体单位 特点:平均指标是一个代表性数值; 谚语说,张家有财千百万,九个邻居穷光蛋。平均起来算一算,家家都是张百万。 4.3平均指标 将总体各单位标志值之间的差异抽象化了; 反映了总体分布的集中趋势。 (1)反映分布数列中各变量值分布的集中趋势。 (2)用于同类现象在不同时空的对比。 (3)利用平均指标分析现象之间的依存关系。 2.平均指标的作用 4.3平均指标 平均数 3.平均指标的种类 位置平均数 算术平均数调和平均数几何平均数 中位数(顺序数据) 众数(分类数据) 数值平均数 4.3平均指标 1.算术平均数 简单算术平均数 加权算术平均数 调和 平均数 根据掌握的资料变形为 12 11 7 6 19 12 13 9 10 12 7 17 12 5 15 7 15 12 18 13 五名学生的月生活费分别为520元、600元、480元、750元、440元。 标志总量 单位总量 简单算术平均数适用于总体资料未经分组整理、尚为原始资料的情况。 (1)简单算术平均数 1.算术平均数 按加工零件分组(件) 工人数(人) 20 30 40 50 60 2 2 8 6 2 合计 20 工人的日产量分组资料 工人的日产量分组资料 按加工零件分组(件) 比重 (%) 20 30 40 50 60 10 10 40 30 10 合计 100 职工按收入分组资料 收入(元) 人数(人) 1000以下 1000-1200 1200-1400 1400-1600 1600以上 20 40 80 50 10 合计 200 职工按收入分组资料 收入(元) 比重(%) 1000以下 1000-1200 1200-1400 1400-1600 1600以上 10 20 40 25 5 合计 100 1.算术平均数 (2)加权算术平均数 适用于总体资料经过分组整理形成变量数列的情况。 工人的日产量分组资料计算平均日产量 按加工零件分组(件) 工人数 (人) 20 30 40 50 60 2 2 8 6 2 合计 20 每组加工零件数(件) 40 60 120 300 120 840 (2)加权算术平均数 收入(元) 人数(人) 1000以下 1000-1200 1200-1400 1400-1600 1600以上 20 40 80 50 10 合计 200 收入(元) 比重(%) 1000以下 1000-1200 1200-1400 1400-1600 1600以上 10 20 40 25 5 合计 100 工人的日产量分组资料计算平均日产量 加权算术平均数 计算平均收入 加权算术平均数 收入 (元) 人数 (人) 1000以下 1000-1200 1200-1400 1400-1600 1600以上 20 40 80 50 10 合计 200 组中值 无名数 有名数 用倍数、系数、成数、﹪、‰等表示 有具体文字计量单位的称为名数。绝大多数的强度相对指标用有名数表示。用双重计量单位表示的复名数 2.相对指标的表现形式 2009末我国电线部/百人;万元国内生产总值用水量209.3立方米(209.3立方米/万元) 无名数 有名数 用倍数、系数、成数、﹪、‰等表示 用双重计量单位表示的复名数 2.相对指标的基本表现形式 分母为1.00 分母为10 分母为100 分母为1000 某城市出生人口性别比为1.08:1 2010年我国人口出生率为11.9‰;死亡率7.11‰,自然增长率为4.79‰。 4.2.2相对指标的种类与计算 相对数 比较相对指标 强度相对指标 结构相对指标 计划完成程度相对指标 按相对数的作用和对比的基础不同相对数分以下几种: 比例相对指标 4.2.2相对指标的种类与计算 1.计划完成相对指标 概念:计划完成程度相对指标是社会经济现象的实际完成数与计划数对的比值,一般用百分数表示。 计算公式: 计划数所属的时间如果为1个月、1个季度、半年、一年的为短期计划。 计划数所属的时间如果为五年、十年的称为长期规划。 1.计划完成相对指标 (1)短期计划,计划完成程度相对指标的计算 短期计划 计划数是绝对数(平均数)。 例如:某年某商业企业,商品销售额计划指标为3000万元。 计划数是相对数。例如:某企业计划利税额要比上年提高2%。 1.计划完成相对指标 ①绝对数(平均数)的形式规定计划任务 某年某商业企业,商品销售额计划指标为3000万元,当年该企业实际商品销售额为3600万元,计算该企业的计划完成程度。 例 (1)短期计划,计划完成程度相对指标的计算 ①绝对数(平均数)的形式规定计划任务 某企业报告期计划生产甲种产品35000吨,实际生产了为38000吨,则甲种产品产量的计划完成 程度为: 例 (1)短期计划,计划完成程度相对指标的计算 说明该公司甲种产品产量实际超计划8.57%完成任务。 ②按提高率(降低率)等相对数规定计划任务,计划完成程度相对指标的计算 某年某企业计划某产品的单位成本要比上年降低4%,实际比上年降低为5%,计算该企业单位成本计划完成程度相对数,说明该企业是否完成计划了任务。 例 同期计划数 实际完成数 该企业超额1.04%(100%-98.96%)完成了计划任务。 (1)短期计划,计划完成程度相对指标的计算 评价计划完成情况,要以计划指标的性质和要求为标准。 财政收入、商品销售额、利润额是以最低限额提出计划任务的成果性指标,计划完成程度大于100%是超额完成计划; 产品单位成本、商品流通费用、单位产品原材料消耗是以最高限额提出计划任务的支出性指标,计划完成程度小于100%是超额完成任务。 (1)短期计划,计划完成程度相对指标的计算 某企业计划利税额要比上年提高2%,实际利税额比上年提高了3%,计算该企业利税额计算完成程度相对数。 练习 (1)短期计划,计划完成程度相对指标的计算 1.计划完成相对指标 超额1.98%(101.98%-100%)完成计划任务。 1.计划完成相对指标 (2)长期计划完成程度相对指标的计算 长期计划 水平法:五年规划的指标是最后一年应达到的水平。 累积法:五年规划的指标是全期应完成的累计数。 1.计划完成相对指标 时间 第一年 第二年 第三年 第四年 第五年 一季 二季 三季 四季 一季 二季 三季 四季 产量 (万吨) 50 54 57 13 14 15 15 16 18 18 20 某企业规定五年规划最后一年产品产量要达到60万吨,执行情况如下,计算计划完成程度相对数和提前完成任务的时间。 例 ①水平法长期计划完成程度相对指标的计算 1.计划完成相对指标 (2)长期规划完成程度相对指标的计算 ①水平法长期计划完成程度相对指标的计算 (一)计划完成相对数 2.长期规划完成程度相对指标的计算 该企业超额20%完成规划任务,提前完成任务的时间是9个月(14+15+15+16=60)。 用水平法计算五年规划完成程度相对指标时,提前完成任务时间的计算方法是:如果在五年中有连续12个月(可跨年度计算)的数值之和,达到或刚好超过规划指标,剩余的时间就是提前完成任务的时间。 时间 第一年 第二年 第三年 第四年 第五年 一季 二季 三季 四季 一季 二季 三季 四季 产量 (万吨) 50 54 57 13 14 15 15 16 18 18 20 时间 第一年 第二年 第三年 第四年 第五年 投入基础设施建设资金(亿元) 100 160 240 300 180 某城市五年规划要投入基础设施建设资金800亿元, 执行情况如下,计算计划完成程度相对数和提前完成任务的时间。 例 ②累计法长期计划完成程度相对指标的计算 1.计划完成相对指标 (2)长期计划完成程度相对指标的计算 1.计划完成相对指标 (2)长期规划完成程度相对指标的计算 该企业超额22.5%完成规划任务,提前完成任务的时间是一年(100+160+240+300=800)。 用累计法计算五年规划完成程度相对指标时,提前完成任务时间的计算方法是:从规划执行之日起累计实际完成数,如果到某一时间累计数值之和达到或刚好超过规划指标时,剩余的时间就是提前完成任务的时间。 时间 第一年 第二年 第三年 第四年 第五年 投入基础设施建设资金(亿元) 100 160 240 300 180 (3)计划执行进度相对指标的计算 全年计划执行进度相对数=84/310=27% 当计划执行到计划期内的某一时间,用此时的实际完成数与全期计划对比,可计算计划执行进度相对指标。 【例】某工厂某年1月份的产值为10万元,2月份的产值为24万元,3月份的产值为50万元,全年产值计划数为3310万元,则: 1.计划完成相对指标 【例】假设某油田2012年计划产品产量达到1850 万吨,截止到2012年4月底已完成的产品产量为650万吨,则 计划执行进度=(650/1850)×100%=35.14% 说明截止到2009年4月底已完成产品产量全年计划的35.14%。 课堂练习: 2.某企业生产某种产品的资料如下,计算:(1)该产品单位成本计划降低率和实际降低率。(2)该产品单位成本计划完成程度,并说明是否完成计划。 指标 名称 上年单位成本 (元) 本年计划 单位成本(元) 本年实际 单位成本(元) 指标 数值 210 185 196 课堂练习: 1.某企业,2005年某产品的单位成本为800元, 2006年计划规定单位成本要比上年降低4.5%,实际降低5%。 计算:(1)该产品2006年单位成本的计划数与实际数。 (2)该产品2006年降低成本计划完成情况相对指标。 3.某企业生产某种产品,按五年规划规定最后一年产量应达到100万吨,执行情况如下:试计算:(1)该产品计划完成情况相对指标;(2)该企业提前了多长时间完成了五年规划规定的指标。 年份 第一年 第二年 第三年 第四年 第五年 上半年 下半年 一季 二季 三季 四季 一季 二季 三季 四季 产量 78 82 44 45 23.5 24 24.5 25 25 26 26.5 27.5 4.某企业2005-2010年规划基本建设投资总额为2500万元,实际执行情况如下,试计算:(1)2005-2010年基本建设投资总额规划完成情况相对指标;(2)该企业提前多少时间完成了五年规划规定的指标。 年份 2001 2002 2003 2004 2005 一季 二季 三季 四季 基本建设投资额(万元) 480 508 600 612 120 180 250 150 2.结构相对指标 结构相对指标,又称比重指标或结构相对数,是在统计分组的基础上,总体中某一部分的数值与总体数值的比值。 计算公式: 按计划完成程度分组分组(%) 企业数(个) 比重 (%) 营业收入(万元) 比重 (%) 90以下 90-100 100-110 110-120 120以上 2 7 10 5 1 8 28 40 20 4 1000 5000 9100 6000 900 4.5 22.7 41.4 27.3 4.1 合计 25 100 22000 100 2.结构相对指标 2010年全社会固定资产投资278121.9亿元,其中,城镇投资额1241430.9亿元,则 结构相对指标的作用: 1.利用结构相对数可以反映社会经济现象在一定时间、地点条件下总体的内部结构的特征。 “金砖四国”巴西(Brazil)、俄罗斯(Russia)、印度(India)中国(China)的第一个字母BRIC的发音与英文单词的砖相似。目前金砖四国的人口数占全球总人口的42%,GDP占全球的14.6%,贸易额占全球的12.8%。 2.结构相对指标 2.将不同时期的结构相对数比较,反映现象发展变化的过程和发展趋势。 年份 产业增加值在国内生产总值中占的比重(%) 1952 一产业 二产业 三产业 51 20.8 28.2 2008 11.3 48.6 40.1 就业人数占总就业人数的比重(%) 一产业 二产业 三产业 1952 83.5 7.4 9.1 2008 39.6 27.2 33.2 世界上第三产业占GDP比重平均水平是68%,低收入国家是48.5%,中等收入国家是54.2%,高收入国家是71.3%。美国的第三产业占GDP比重占75.3% 3.比例相对指标 也称比例相对数,是在统计分组的基础上,总体内不同部分指标数值的比值。 它可以反映总体中各组成部分之间数量联系程度和比例关系。 比例相对指标 计算公式 某地区某年末人口数为1000万人,其中男性514万人,女性486万人,该地区女性人口数是男性人口数的百分之多少,男女性别比是多少。 3.比例相对指标 该地区女性人口数是男性人口数的94.6%(486/514),男女性别比约等于106:100(514/486)。 比例相对数 比例相对指标可以反映总体各组成部分之间数量联系程度和比例关系。 计算比例相对指标,可以考察现象的发展是否协调、符合客观规律。 例 性别比正常范围应在103-107。陕西出生婴儿性别 比2005年达到130.7,位居全国第二,仅低于安徽;2007为121.28。2009年全国出生人口男女性别比为119.45 。 刘廷兰-统计学原理与实务 * 学习本章的目的在于掌握总量指标、相 对指标、平均指标、变异指标的概念、 特点和它们的计算方法,并能够运用所 学的方法分析具体问题。 难点:时期指标和时点指标的区别、强度相对指标与平均指标的区别、各种平均数的计算及应用场合,变异指标的应用场合。 4-1 总量数 相对数 2008年北京奥运会中国男篮运动员身高次数分布表 总量数 相对数 平均数 数据描述的数值方法 分布的形状 集中趋势 离散程度 众 数 中位数 均 值 离散系数 方差和标准差 峰 度 四分位距 极差 偏 态 4.2、4.3 4.4 4.5 第一模块(4.1、4.2)教学重点 绝对指标的计算 相对指标的六种形式 相对指标的计算 主要概念 绝对指标 相对指标 结构相对指标 比例相对指标 比较相对指标 强度相对指标 动态相对指标 计划完成相对 指标 回顾:什么是指标? 统计指标 统计指标是综合反映统计总体数量特征的概念和数值。 指标名称 指标数值 反映总体某一方面的质的规定性,是对总体本质特征的一种概括。 是总体量的规定性在一定时间、地点、条件下的具体表现。 学生总人数30人 男生人数20人 女生人数10人 关于学生人数的总量指标 江苏沙钢集团有限公司系江苏省重点企业集团,国家特大型企业,国家520家重点工业企业之一,现有总资产116亿元,占地面积7平方公里,职工7500余名。年生产能力为炼铁100万吨,炼钢400万吨,轧材500万吨,不锈钢板14万吨,热镀锌钢板12万吨,是目前国内最大的电炉钢和优质棒、线材材生产基地。 总量指标是计算相对指标和平均指标的基础。 作用 4.1总量指标 4.1.1总量指标意义 是认识总体现象的起点。 作用 总量指标是计算相对指标和平均指标的基础。 2010年中国500强平均营业收入552.5亿元,比去年提高6.27%,平均资产为1833.1亿元,比上年提高22.02%。 2010美国企业500强总就业人数2479万人,人均收入39.4万美元,人均利润1.6万美元;中国企业500 强总就业人数2701万人,人均收入14.8万美元,人均利润0.8万美元。 1.按反映的总体内容不同分为: 总体标志总量 总体单位总量 总体标志总量(标志总量)即总体中各总体单位在某一数量标志上表现的所有标志值之和。 总体单位总量(总体总量、单位总量)是总体所含总体单位的数目。 4.1.2总量指标的种类 总体标志总量即总体中各总体单位在某一数量标志上表现的所有标志值之和 总体单位总量是总体所含总体单位的数目 某市四个企业的有关资料 名称 经济类型 总资产 (万元) 人数 (人) 销售额(万元) 甲 乙 丙 丁 股份制企业集体企业 股份制企业 集体企业 5000 1000 6000 2000 90 60 100 50 1300 100 1000 200 合计 - 14000 300 2600 总体单位总量为4个企业 标志 标志总量 一个总体中单位总量是唯一的,但标志总量有许多。 判断 4.1.2总量指标的种类 某商品房展销会,共有32个楼盘参展。 了解各楼盘的销售量及相关情况,确定总体和总体总量,第一天的销售量3000套是什么总量? 思考回答 了解第一天销售的3000套住房的基本情况,3000套是什么总量? 4.1.2总量指标的种类 结论:总体单位总量和总体标志总量不是固定不变的,统计研究目的发生变化时两者可能发生相互转化。 2.按其所反映的时间状况不同分为: 时期指标 时点指标 说明现象总体在某一时刻(瞬间)状态的总量。 如在某一时点的总人口数、库存额、手机费余额、耕地面积、存款余额。 不具有可加性、数值大小与时点之间间隔长短没有直接关系、由一次性登记调查得到。 4.1.2总量指标的种类 一月份的产量 1月1日产量 1月2日产量 …… 1月31日产量 汇总 连续登记 4.1.2总量指标的种类 出生人数 死亡人数 t1时段 t2时段 t3时段 t 人口总数 时期指标 时点指标 关于一个人口总体的总量指标 1000 5000 20000 1000 合 计 200 500 300 1000 2000 2000 8000 5000 7000 300 250 450 纺织局 化工局 机械局 工业增加值 (万元) 固定资产增加额(万元) 职工人数 (人) 企业数 (个) 行 业 名 称 通过下表:1、区分总体单位总量与总体标志总量 2、区分时期指标与时点指标。 总体标志总量 时点指标 时期指标 总体单位总量 2006年某地区纺织、化工、机械三个行业企业生产基本情况 课堂练习: 1.某年新增人口数是( ) 质量指标 B. 时期指标 C. 相对指标 D. 时点指标 2.下列指标中属于时点指标的有( )。 A.商品库存量 B.机器台数 C. 企业个数 D.新增设备台数 E.产品产量 3.某地区2009年新出生人口数为60万人,这一数值为( )。 A. 时期数 B. 时点数 C.绝对数 D. 数量指标 E.总量指标 课堂练习: 4.某银行年末存款余额是( )。 质量指标 B. 数量指标 C.相对指标 D.绝对数 E. 时期指标 F.时点指标 5.某商场2007年空调销售量为6500台,库存年末比年初减少100台,这两个总量指标是( )。 A.时期指标 B.时点指标 C.前者是时期指标,后者是时点指标 D.前者是时点指标,后者是时期指标 3.按计量单位不同分为: 实物指标 价值指标 劳动量指标 4.1.2总量指标的种类 自然单位:按被研究现象的自然状态单位,作为总量指标的计量单位。 如人口以“人”、汽车以“辆” 、 电视机以“台”、油井以“口”等。 度量衡单位:按照统一的度量衡制度的规定为总量指标的计量单位。 钻井(工作量)进尺以米、输 油管线长度以公里、原油产量以 “吨”、天然 气储量以“立方米”、功率以千瓦等 采用实物单位计量的总量指标。表现总体的使用价值总量 3.按计量单位不同分 实物指标 价值指标 劳动量指标 采用实物单位计量的总量指标。表现总体的使用价值总量 双重单位(复合单位):将两种或两种以上的单位结合使用,作为总量指标的计量单位。2009年我国铁路运输量为25239.2亿吨公里。再如台/千瓦、人/平方公里 标准实物单位:按统一的折算标准,作为同类现象总量的计量单位。2009年化 肥(折100%)6599.7万吨;一次性能源28亿吨标准煤(我国含热7000千卡/公斤的定为标准煤) 4.1.2总量指标的种类 3.按计量单位不同分为: 采用货币单位计量的总量指标。2010年全年国内生产总值40533.6 亿元。 以劳动时间为单位计量的总量指标。 实物指标 价值指标 劳动量指标 4.1.2总量指标的种类 NBA奇观:最高与最矮 相对指标又称相对数,是社会经济现象中两个有联系的统计指标的比值。反映了现象之间数量对比关系和联系程度。 4.2.1相对指标的概念和作用 相对指标 1978年我国经济总量占世界经济总量的比重仅为1.8%,2008年为6.4%。根据世界银行资料,折合成美元,我国2008年国内生产总值为38600亿美元,相当于美国的27.2%,日本的78.6%。 4.2相对指标 1.相对指标的概念和作用 反映社会经济现象之间的相对水平和联系程度。 相对指标的作用: 提供现象之间比较的基础。 4.2相对指标 4.2.1相对指标的概念和作用 平均总资产3000万元 利税总额 总资产 资金利润率 500万元 5000万元 16.7% 12.5% 比较两厂经济效益 不可比 可比 平均总资产40000万元 总人数30人 男生人数20人 女生人数10人 男生比重为2/3 女生比重为1/3 男女比例为2:1 总量指标 相对指标 刘廷兰-统计学原理与实务 Location (Position) Concerned with where values are concentrated. Variation (Dispersion) Concerned with the extent to which values vary. Shape Concerned with extent to which values are symmetrically distributed. 这里需要设计一个问题实例来加深学生对统计指标的直观认识。补充说明一下,指标有什么用,引出指标的种类。 Location (Position) Concerned with where values are concentrated. Variation (Dispersion) Concerned with the extent to which values vary. Shape Concerned with extent to which values are symmetrically distributed. Shape Concerned with extent to which values are symmetrically distributed. Kurtosis The extent to which a distribution is peaked (flatter or taller). For example, a distribution could be more peaked than a normal distribution (still may be 慴ell-shaped). If values are negative, then distribution is less peaked than a normal distribution. Skew The extent to which a distribution is symmetric or has a tail. Values are 0 if normal distribution. If the values are negative, then negative or left-skewed. Location (Position) Concerned with where values are concentrated. Variation (Dispersion) Concerned with the extent to which values vary. Shape Concerned with extent to which values are symmetrically distributed. 调查数据并不一定全部是直接数据,调查数据也可能是间接数据,两种划分方法之间存在交叉。这个地方ppt上没有讲清楚,试验和调查的区别。 书p23页。注意:搜集资料的方法的不同不能作为划分统计调查种类的依据。 * *

  “原创力文档”前称为“文档投稿赚钱网”,本网站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有【成交的100%(原创)】

http://istighcomputing.com/shujupianxie/369.html
锟斤拷锟斤拷锟斤拷QQ微锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷微锟斤拷
关于我们|联系我们|版权声明|网站地图|
Copyright © 2002-2019 现金彩票 版权所有