会计考友 发表于 2012-2-23 12:40:12

2012年初级统计师考试讲义复习(十)

 第三节 次数分布
  一、次数分配的概念
  在统计分组的基础上,将总体中所有单位按组归类整理,形成总体中各单位数在各组间的分配称为次数分配。
  分配在各组的单位数叫次数或频数。
  各组次数与总次数的比率叫频率或比率。各比率之和为100或1即Σ=1。
  将各组组别与次数依次排列而形成的数列叫次数分配数列,简称分配数列。

  二、分配数列的编制
  1.种类
  ①属性分配数列:
  按品质标志分配而形成的数列叫属性分配数列,简称品质数列,如上例内蒙古自治区人口分布。
  ②变量分配数列
  按数量标志分组而形成的数列叫变量分配数列,简称变量数列。
  1)单项式变量分组数列
  是按每个变量值分别列组而形成的数列。
  2)组距式变量数列
  把各变量值按照一定组距进行分组而形成的数列。如:上例某班学生统计考试成绩表。
  在组距数列中,表示各组界限的变量值称为组限,50—60,60—70等。其中较小的变量值称为下限,50,60等,较大的变量值为上限,60,70等,各组上限与下限之差即为组距, 组距=上限-下限,60-50,70-60等,各组上限与下限的中点称为组中值,即组中值=(上限+下限)/2,(50+60)/2=55,(60+70)/2=65,组中值具有一定的假定性,即假定次数在各组内的分布是均匀的,代表了各组内的一般水平。
  a.等距分组
  各组的组距均相等。
  特点:由于各组组距相等,各组次数的分布不受组距大小的影响,它和消除了组距影响,与次数密度的分布是一致的,一般呈正态分布。
  次数密度=次数/组距,其作用 主要用于消除各组组距不相等而造成的现象分布的影响。
  b.不等距分组
  各组组距不相等。
  特点:不等距分组各组的次数多少受组距不同的影响,组距大次数可能多,组距小,则次数可能少,因此必须消除组距对其分布的影响即需计算次数密度。
  在编制组距式变量数列时,常常会遇到这样的情况,如:学生成绩的分布
  60分以下
  60—70
  70—80等
  又如:学生人数的分布
  30人以下
  30—60
  60人以上等
  这种具有不确定组距的组称为“开口组”,包括上开口和下开口,其组中值如何计算?
  下开口的组中值=上限-1/2邻组组距
  上开口的组中值=下限+下限1/2邻组组距
  2.变量数列的编制
  程序:①原始数据②序列化(编制由小到大简单数列)③求出组距等④分组归类合计(形成次数分布)⑤制成统计表(变量数列)
  a.离散型变量
  由于离散型变量各变量值之间以整数断开,变量值之间有明显的界限,上下限都可以用准确的数值表示,组限非常清楚。
  如:某校按学生人数分组,其组限为:
  100人以下
  101—200
  201—300
  301—400
  401人以上
  b.连续型变量
  由于连续型变量各变量值之间可做无限分割,有小数存在,上下限不能用两个确定的值表示,只能用前一组的上限与本组的下限为同一数值表示。如:上例考试成绩
  统计实际工作中,虽然变量区分连续型变量与离散型变量,但为了计算,绘图等的方便,保证整体单位不出现重复、遗漏。可采用连续型变量的形式代替离散型变量。
  对于连续型变量,在确定组限时,有一原则可循,即“上组限不在内”原则:各组只包括本组下限变量值的单位,不包括本组上限变量值的单位。
  3.编制统计表
  如上例40人考试成绩分为5组,组距为10,组限可以为:
  50—60,60—70,…,90—100
页: [1]
查看完整版本: 2012年初级统计师考试讲义复习(十)