《统计学》名词解释及
公式
-CAL-FENGHAI.-(YICAI)-Company One1
第1章 统计与统计数据
一、学习指导
统计学是处理和分析数据的方法和技术,它几乎被应用到所有的学科检验领域。本章首先介绍统计学的含义和应用领域,然后介绍统计数据的类型及其来源,最后介绍统计中常用的一些基本概念。本章各节的主要内容和学习要点如下表所示。
章节 统计及其应用领域 统计的应用领域 统计的其他应用领域。 概念:分类数据,顺序数据,数值型数分类数据、顺序数据、数值据。 型数据 数据的类型 观测数据和实验数据 截面数据和时间序列数据 数据的间接来源 二手数据的特点。 概念:抽样调查,普查。 数据的直接来源 数据来源 调查方案设计 数据质量 统计数据的质量。 总体和样本 统计中的几个基本概念 变量 型变量,连续型变量,离散型变量。 参数和统计量 概念:总体,样本。 概念:参数,统计量。 概念:变量,分类变量,顺序变量,数值 数据的间接来源。 数据的收集方法。 调查方案的内容。 概念。抽样误差,非抽样误差。 不同数据的特点。 概念:观测数据,实验数据。 概念:截面数据,时间序列数据。 统计数据的间接来源。 主要内容 什么是统计学 学习要点 概念:统计学,描述统计,推断统计。 统计在工商管理中的应用。 2
二、主要术语
1. 统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。 2. 描述统计:研究数据收集、处理和描述的统计学分支。
3. 推断统计:研究如何利用样本数据来推断总体特征的统计学分支。 4. 分类数据:只能归于某一类别的非数字型数据。 5. 顺序数据:只能归于某一有序类别的非数字型数据。 6. 数值型数据:按数字尺度测量的观察值。 7. 观测数据:通过调查或观测而收集到的数据。 8. 实验数据:在实验中控制实验对象而收集到的数据。 9. 截面数据:在相同或近似相同的时间点上收集的数据。 10. 时间序列数据:在不同时间上收集到的数据。
11. 抽样调查:从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来
推断总体特征的数据收集方法。
12. 普查:为特定目的而专门组织的全面调查。 13. 总体:包含所研究的全部个体(数据)的集合。 14. 样本:从总体中抽取的一部分元素的集合。 15. 样本容量:也称样本量,是构成样本的元素数目。 16. 参数:用来描述总体特征的概括性数字度量。 17. 统计量:用来描述样本特征的概括性数字度量。 18. 变量:说明现象某种特征的概念。 19. 分类变量:说明事物类别的一个名称。 20. 顺序变量:说明事物有序类别的一个名称。 21. 数值型变量:说明事物数字特征的一个名称。 22. 离散型变量:只能取可数值的变量。
23. 连续型变量:可以在一个或多个区间中取任何值的变量。
3
四、习题答案
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11.
D D A B A D C B A A C、
12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22.
C B A C D C A C D A C
23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33.
C B D C B D A D A B C
34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44.
A A A D B B C C D C D
45. 46. 47. 48. 49. 50. 51. 52. 53. 54. 55.
A B C A C D A C D A B
第2章 数据的图表展示
一、学习指导
数据的图表展示是应用统计的基本技能。本章首先介绍数据的预处理方法,然后介绍不同类型数据的整理与图示方法,最后介绍图表的合理使用问题。本章各节的主要内容和学习要点如下表所示。
章节 数据的预处理 主要内容 数据审核 学习要点 数据审核的目的。 原始数据和二手数据的审核内容。 4
数据排序的目的。 数据排序 分类数据和数值型数据的排序方法。 数据筛选的目的。 数据筛选 用Excel进行数据筛选。 数据透视表的用途。 数据透视表 用Excel进行数据透视。 概念:频数,频数分布,比例,百分比,比率。 分类数据的整理与图示 品质数据的整理与展示 比条形图,饼图。 概念:累积频数,累积频率。 顺序数据的整理与图示 累积频数分布图。 概念:数据分组,单变量值分组,组距分组,等距分组,不等距分组,组距,组中数据分组 值。 频数分布表的制作步骤。 用Excel制作频数分布表。 直方图的绘制。 数值型数据的整理与展示 茎叶图的绘制。 箱线图的绘制。 直方图与条形图的区别。 数值型数据的图示 茎叶图与直方图的区别。 线图的绘制。 散点图的绘制。 气泡图的绘制。 雷达图的绘制。 图形应包括的基本特征。 合理使用图表 鉴别图形优劣的准则 鉴别图形优劣的准则。 用Excel制作分类数据的频数分布表。 分类数据的图示:条形图,帕累托图,对5
统计表的结构。 统计表的设计 统计表的设计。 二、主要术语
24. 频数:落在某一特定类别(或组)中的数据个数。 25. 频数分布:数据在各类别(或组)中的分配。
26. 比例:一个样本(或总体)中各个部分的数据与全部数据之比。 27. 比率:样本(或总体)中各不同类别数值之间的比值。 28. 累积频数:将各有序类别或组的频数逐级累加起来得到的频数。
29. 数据分组:根据统计研究的需要,将原始数据按照某种标准划分成不同的组别。 30. 组距分组:将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。 31. 组距:一个组的上限与下限的差。
32. 组中值:每一组的下限和上限之间的中点值,即组中值=(下限值+上限值)/2。 33. 直方图:用矩形的宽度和高度(即面积)来表示频数分布的图形。 34. 茎叶图:由“茎”和“叶”两部分组成的、反应原始数据分布的图形。
35. 箱线图:由一组数据的最大值、最小值、中位数和两个四分位数5个特征值绘制而成
的、反应原始数据分布的图形。
四、习题答案
1. C 2. A 3. B 4. C 5. D 6. B 7. C
8. B 9. B 10. C 11. A 12. B 13. B 14. C
15. C 16. B 17. D 18. D 19. C 20. B 21. C
22. D 23. D 24. B 25. D 26. B 27. B 28. D
29. D 30. C 31. B 32. C 33. C 34. A 35. B
6
第3章 数据的概括性度量
一、学习指导
数据分布的特征可以从三个方面进行描述:一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布偏斜程度和峰度。本章将从数据的不同类型出发,分别介绍集中趋势测度值的计算方法、特点及其应用场合。本章各节的主要内容和学习要点如下表所示。
章节 众数 众数的特点。 概念:中位数,四分位数。 中位数和分位数 集中趋势的度量 中位数和四分位数的特点。 中位数和四分位数的计算。 概念:平均数,简单平均数,加权平均数,几何平均数。 平均数 简单平均数和加权平均数的计算。 平均数的性质。 几何平均数的计算和应用场合。 主要内容 学习要点 概念:众数。 7
众数、中位数和平均数在分布上的关系。 众数、中位数和平均数 众数、中位数和平均数的特点及应用场的比较 合。 概念:异众比率。 异众比率 异众比率的计算和应用场合。 概念:四分位差。 四分位差 四分位差的计算和应用场合。 概念:极差,平均差,方差,标准差。 极差的计算和特点。 方差和标准差 离散程度的度量 平均差的计算和特点。 样本方差和标准差的计算。 总体方差和标准差的计算。 概念:标准分数。 标准分数的计算和应用。 相对位置的度量 经验法则。 切比雪夫不等式。 概念:离散系数。 离散系数 离散系数的计算。 离散系数的用途。 概念:偏态,偏态系数。 偏态及其测度 偏态系数的计算。 偏态系数数值的意义。 偏态与峰态的度量 峰态及其测度 概念:峰态,峰态系数。 峰态系数的计算。 峰态系数数值的意义。 用Excel计算描述统计量。 Excel统计函数的应用。 二、主要术语和公式
(一)主要术语
8
1. 众数:一组数据中出现频数最多的变量值,用Mo表示。 2. 中位数:一组数据排序后处于中间位置上的变量值,用Me表示。 3. 四分位数:一组数据排序后处于25%和75%位置上的值。 4. 平均数:一组数据相加后除以数据的个数而得到的结果。 5. 几何平均数:n个变量值乘积的n次方根,用Gm表示。 6. 异众比率:非众数组的频数占总频数的比率。
7. 四分位差:也称为内距或四分间距,上四分位数与下四分位数之差。 8. 极差:也称全距,一组数据的最大值与最小值之差。
9. 平均差:也称平均绝对离差,各变量值与其平均数离差绝对值的平均数。 10. 方差:各变量值与其平均数离差平方的平均数。 11. 标准差:方差的平方根。
12. 标准分数:变量值与其平均数的离差除以标准差后的值。
13. 离散系数:也称为变异系数,一组数据的标准差与其相应的平均数之比。 14. 偏态:数据分布的不对称性。
15. 偏态系数:对数据分布不对称性的度量值。 16. 峰态:数据分布的平峰或尖峰程度。 17. 峰态系数:对数据分布峰态的度量值。
(二)主要公式
名称 公式 中位数 xn12Me1xnxn1222n为奇数 n为偶数简单样本平均数 xxi1nin 9
加权样本平均数 xMi1kifi nn几何平均数 Gmnx1x2xnnfffiimxi1i 异众比率 Vr1fm fi四分位差 极差 QdQUQL Rmax(xi)min(xi) 简单平均差 Mdkxi1nix ni加权平均差 MdMi1xfi n简单样本方差 s2(xi1nix)2 n1简单样本标准方差 sk(xi1nix)2 n1加权样本方差 s2(Mi1ix)2fi n1加权样本标准差 s(Mi1kix)2fi n1zixix s标准分数 离散系数 vss x3未分组数据的偏态系数 nxixSK (n1)(n2)s10
分组数据的偏态系数 SKMi1kixfi33ns 2未分组数据的峰态系数 Kn(n1)(xix)43(xix)2(n1)(n1)(n2)(n3)s4 分组数据的峰态系数 K(Mi1kix)4fi4ns3
四、习题答案
1. A 2. C 3. B 4. C 5. D 6. B 7. D 8. A 9. A 10. C 11. B 12. C 13. A 14. B 15. A 16. B 17. A 18. B
19. C 20. A 21. B 22. C 23. C 24. C 25. C 26. D 27. A 28. A 29. B 30. B 31. A 32. A 33. B 34. B 35. A 36. B
37. A 38. C 39. B 40. A 41. A 42. B 43. B 44. A 45. B 46. A 47. C 48. D 49. B 50. A 51. C 52. D 53. B 54. D
55. B 56. A 57. B 58. D 59. A 60. B 61. C 62. D 63. A 64. C 65. D 66. D 67. C 68. B 69. D 70. D 71. A 72. B
73. D 74. C 75. A 76. D 77. D 78. A 79. A 80. C 81. D 82. D 83. A 84. A 85. A 86. D
11
第4章 抽样与参数估计
一、学习指导
参数估计是推断统计的重要内容之一,它是在抽样及抽样分布的基础上,根据样本统计量来推断我们所关心的总体参数。本章首先介绍抽样分布的有关知识,然后讨论参数估计的一般问题,最后介绍一个总体参数估计的基本方法和参数估计中样本容量的确定问题。本章各节的主要内容和学习要点如下表所示。
章节 主要内容 学习要点 概念:简单随机抽样,简单随机样本,重复抽样,不重复抽样,分层抽概率抽样方法 样,系统抽样,整群抽样。 用Excel抽取简单随机样本。 概念:抽样分布,样本均值的抽样分布,样本比例的抽样分布,样本方差 抽样与抽样的抽样分布。 分布 中心极限定理。 抽样分布 样本均值抽样分布的特征。 样本均值的抽样分布与总体分布的关系。 样本比例抽样分布的形式和特征。 样本方差抽样分布的形式。 参数估计的估计量与估计值 概念:估计量,估计值。 12
一般问题 点估计与区间估计 概念:点估计,区间估计,置信区间,置信水平。 置信区间构建的原理。 置信区间的解释。 评价估计量的标准 正态总体、方差已 非正态总体、大样本时的置信区间。 知,或非正态总 用Excel计算给定的正态分布的临体、大样本 界值。 概念:无偏性,有效性,一致性。 正态总体、方差已知时的置信区间。 总体均值的区间估计 正态总体、方差未知、小样本 正态总体、方差已知时的小样本置信区间。 正态总体、方差未知时的小样本置信区间。 用Excel计算给定的t分布的临界值。 总体比例的区间估计 总体方差的区间估计 总体比例的区间估 总体比例的置信区间。 计 总体方差的置信区间。 总体方差的区间估计 值。 估计总体均值时样 样本容量的计算方法。 用Excel计算给定的2分布的临界 样本容量的确定 本容量的确定 估计总体比例时样 样本容量的计算方法。 本容量的确定 13
二、主要术语和公式
(一)主要术语
36. 简单随机抽样:也称纯随机抽样,它是从含有N个元素的总体中,抽取n个元素作为样本,使得总体中的每一个元素都有相同的机会(概率)被抽中。
37. 简单随机样本:从含有N个元素的总体中,抽取n个元素作为样本,使得
总体中每一个样本量为n的样本都有相同的机会(概率)被抽中。 38. 重复抽样:从总体中抽取一个元素后,把这个元素放回到总体中再抽取第
二个元素,直至抽取n个元素为止。
39. 不重复抽样:一个元素被抽中后不再放回总体,而是从所剩元素中抽取第
二个元素,直到抽取n个元素为止。
40. 分层抽样:也称分类抽样,它是在抽样之前先将总体的元素划分为若干层
(类),然后从各个层中抽取一定数量的元素组成一个样本。
41. 系统抽样:也称等距抽样或机械抽样,它是先将总体中的各元素按某种顺
序排列,并按某种规则确定一个随机起点;然后,每隔一定的间隔抽取一个元素,直至抽取n个元素形成一个样本。
42. 整群抽样:先将总体划分成若干群,然后以群作为抽样单位从中抽取部分
群,随后再对抽中的各个群中所包含的所有元素进行观察。
43. 抽样分布:在重复选取样本量为n的样本时,由样本统计量的所有可能取值
形成的相对频数分布。
44. 样本均值的抽样分布:在重复选取样本量为n的样本时,由样本均值的所有
可能取值形成的相对频数分布。
45. 样本比例抽样分布:在重复选取样本量为n的样本时,由样本比例的所有可
能取值形成的相对频数分布。
46. 标准误差:也称为标准误,它是样本统计量的抽样分布的标准差。
14
47. 估计标准误差:若计算标准误时所涉及的总体参数未知,可用样本统计量
代替计算的标准误。
ˆ表示。 48. 估计量:用来估计总体参数的统计量的名称,用符号49. 估计值:用来估计总体参数时计算出来的估计量的具体数值。
ˆ的某个取值直接作为总体参数的估计值。 50. 点估计:用样本统计量51. 区间估计:在点估计的基础上,给出总体参数估计的一个范围。 52. 置信区间:由样本统计量所构造的总体参数的估计区间。
53. 置信水平:也称为置信系数,它是将构造置信区间的步骤重复多次后,置
信区间中包含总体参数真值的次数所占的比率。
(二)主要公式
名称 总体均值的置信区间(正态总体,已知) 公式 xz2xz2nsnsn 总体均值的置信区间(未知,大样本) 总体均值的置信区间(正态总体,未知,小样本) 总体比例的置信区间 xt2 pz2p(1p) n2总体方差的置信区间 (n1)s222(n1)s2122 估计总体均值时的样本容量 n(z2)22E2估计总体比例时的样本容量 n(z2)2(1)E2 15
四、习题答案
87. A 88. B 89. A 90. B 91. B 92. C 93. D 94. C 95. A 96. C 97. A 98. A 99. C 100. A 101. D102. B 103. D104. B 105. B 106. B 107. A 108. A 109. A 110. D111. D112.
B
121. B 122. A 123. B 124. D 125. B 126. A 127. C 128. A 129. B 130. A 131. C 132. D 133. C 134. B 135. D 136. C 137. A 138. A 139. D 140. A 141. B 142. C 143. A 144. C 145. B 146.
A
155. A 156. B 157. C 158. C 159. D 160. B 161. D 162. D 163. C 164. C 165. B 166. C 167. D 168. D 169. A 170. B 171. C 172. A 173. A 174. C 175. C 176. C 177. B 178. A 179. B 180.
B
16
189. C 190. A 191. B 192. C 193. A 194. D 195. A 196. B 197. C 198. A 199. A 200. A 201. A 202. A 203. C 204. B 205. B 206. A 207. C 208. C 209. B 210. C 211. C 212. B 213. C 214.
B
223. B 224. A 225. A 226. D 227. C 228. B 229. A 230. A 231. B 232. B 233. B 234. C 235. B 236. B 237. D 238. A 239. B 240. B 241. C 242.
D
113. 114. 115. 116. 117. 118. 119. 120.
C C B B B D D C
147. 148. 149. 150. 151. 152. 153. 154.
A A A A A A B A
181. 182. 183. 184. 185. 186. 187. 188.
A D C A B B C B
215. 216. 217. 218. 219. 220. 221. 222.
A B A A A C C D
第5章 假设检验
一、学习指导
假设检验是推断统计的另一项重要内容,它是利用样本信息判断假设是否成立的一种统计方法。本章首先介绍有关假设检验的一些基本问题,然后介绍一个总体参数的检验方法。本章各节的主要内容和学习要点如下表所。
章节 主要内容 学习要点 概念:假设,假设检验,原假设,备择假设,单侧检验,双侧检验。 假设的陈述 针对具体的实际问题,建立合理的原假设和备择假 假设检验的基本问题 概念:第Ⅰ类错误,第Ⅱ类错误,显著性水平。 两类错误与显著性水平 两类错误的控制。 两类错误的关系。 设。 17
概念:检验统计量,标准化检验统计量,拒绝域,临界值。 检验统计量与拒绝域 统计量检验的原理。 利用统计量检验的决策准则。 概念:P值。 P值决策的原理,P值的计算。 利用P值进行决策 P值检验与统计量检验的异同。 P值决策的准则。 假设检验的步骤。 小结 假设检验结果的表述。 2 总体方差已知时,均值检验的统计量和程序。 大样本的检验方法 总体均值的检验 小样本的检验方法 总体方差未知时,均值检验的统计量和程序。 用Excel计算P值。 总体方差已知时,均值检验的统计量和程序。 总体方差未知时,均值检验的统计量和程序。 用Excel计算P值。 检验的统计量。 222 总体比例的检验 总体比例的检验 检验的程序。 用Excel计算P值。 检验的统计量。 总体方差的检验 总体方差的检验 检验的程序。 用Excel计算P值。 二、主要术语和公式
(一)主要术语
18. 假设:对总体参数的具体数值所做的陈述。
19. 假设检验:先对总体参数提出某种假设,然后利用样本信息判断假设是否成立的过
程。
18
20. 备择假设:也称研究假设,是研究者想收集证据予以支持的假设,用H1或Ha表示。 21. 原假设:也称零假设,是研究者想收集证据予以反对的假设,用H0表示。 22. 单侧检验:也称单尾检验,是指备择假设具有特定的方向性,并含有符号“>”或
“<”的假设检验。
23. 双侧检验:也称双尾检验,是指备择假设没有特定的方向性,并含有符号“”的假
设检验。
24. 第Ⅰ类错误:当原假设为正确时拒绝原假设,犯第Ⅰ类错误的概率记为。 25. 第Ⅱ类错误:当原假设为错误时没有拒绝原假设,犯第Ⅱ类错误的概率通常记为。 26. 显著性水平:假设检验中发生第Ⅰ类错误的概率,记为。
27. 检验统计量:根据样本观测结果计算得到的,并据以对原假设和备择假设做出决策的
某个样本统计量。
28. 拒绝域:能够拒绝原假设的检验统计量的所有可能取值的集合。 29. 临界值:根据给定的显著性水平确定的拒绝域的边界值。
30. P值:也称观察到的显著性水平,如果原假设H0是正确的,那么所得的样本结果出
现实际观测结果那么极端的概率。
(二)主要公式
名称 总体均值检验的统计量(正态总体,已知) 公式 zx0/nx0s/nx0s/n 总体均值检验的统计量(未知,大样本) 总体均值检验的统计量(正态总体,未知,小样本) z t 总体比例检验的统计量 zp00(10)n 19
总体方差检验的统计量 2(n1)s202 四、习题答案
1. 2. A D 34. A 35. C 66. D 67. D 99. A 100. B 3. C 36. 4. A 37. 5. B 38. 6. C 39. 7. A 40. 8. B 41. 9.
A
42. 10. B 43. 11. A 44. 12. C 45. 13. A 46. 14. C 47. 15. D 48. 16. C 49. 17. A 50. 18. B 51. 19. A 52. 20. B 53. 21. B 54. 22. A 55. 23. B 56. 24. B 57. 25. A 58. 26. D 59. 27. D
60. B 68. A A 69. C D 70. D D 71. A C 72. C C 73. B C 74. A C 75. A A 76. B B 77. C A 78. D B 79. A D 80. C A 81. D A 82. B B 83. A D 84. A C 85. C A 86. B B 87. A C 88. C A 89. A C 90. A D 91. A C
92. A
20
101. D 102. C 103. B 104. D 105. B 106. B 107. A 108. A 109. B 110. A 111. B 112. A 113. A 114. B 115. B 116. B 117. B 118. A 119. B 120. B 121. B 122. D 123. A
28. D 29. A 30. B 31. B 32. C 33. B
61. C 62. A 63. D 64. B 65. A
93. A 94. B 95. C 96. B 97. A 98. A
第6章 方差分析
一、学习指导
本章主要介绍检验多个总体均值是否相等的一种统计方法,即方差分析。它是通过对各观察数据误差来源的分析来判断多个总体均值是否相等。本章首
21
先介绍方差分析中的一些基本问题,包括方差分析中的一些术语、方差分析的基本思想和基本假设,然后介绍单因素方差分析方法,最后介绍方差分析中的多重比较。本章各节的主要内容和学习要点如下表所示。
章节 主要内容 方差分析及有关术 概念:方差分析,因子,处理。 语 概念:组内误差,组间误差,总平方和,组内平方和,组间平方和。 方差分析的基本思 方差分析的基本问题 误差的分解 想和原理 总平方和、组内平方和、组间平方和的关系。 方差分析中的基本 方差分析中的3个基本假定。 假定 问题的一般提法 数据结构 数据结构。 概念:总平方和,组内方差,组间方差。 假设的提法。 单因素方差分析 分析步骤 总平方和、组内方差、组间方差的计算方法。 检验统计量的计算方法。 统计决策。 方差分析表的结构。 用Excel进行方差分析。 关系强度的测量 关系强度的测量方法。 方差分析中假设的提法。 概念:单因素方差分析。 学习要点 22
多重比较的前提。 方差分析中方差分析中的多重 多重比较的作用。 多重比较的方法。 的多重比较 比较 二、主要术语和公式
(一)主要术语
31. 方差分析( ANOVA):检验多个总体均值是否相等的统计方法。 32. 因素:也称因子,是方差分析中所要检验的对象。 33. 水平:也称处理,是因素的不同表现。 34. 组内误差:来自水平内部的数据误差。 35. 组间误差:来自不同水平之间的数据误差。
36. 总平方和:反映全部数据误差大小的平方和,记为SST。 37. 组内平方和:反映组内误差大小的平方和,记为SSE。 38. 组间平方和:反映组间误差大小的平方和,记为SSA。 39. 单因素方差分析:只涉及一个分类型自变量的方差分析。 40. 组内方差:组内平方和除以相应的自由度。 41. 组间方差:组间平方和除以相应的自由度。
(二)主要公式
名称 组间方差 MSA公式 组间平方和SSA 自由度k1组内平方和SSE 自由度nk组内方差 MSE方差分析的检验统计量 FMSA~F(k1,nk) MSER2SSA(组间SS) SST(总SS)关系强度的测量 23
多重比较的LSD 1. C 20. D 2. B 21. B 3. B 22. A 4. D 23. B 5. A 24. C 6. A 25. D 7. C 26. C 8. D 27. A 9. D 28. B 10. C 29. A 11. C 30. C 12. A 31. A 13. A 32. C 14. B 33. B 15. A 34. C 16. A 35. C 17. A 36. B 18. A 37. D 19. D
38. D
LSDt12MSE(n1) inj四、习题答案
39. C 58. A 40. A 59. B 41. A 60. C 42. B 61. D 43. A 62. B 44. A 63. A 45. B
46. A 47. D 48. C 49. B 50. B 51. D 52. B 53. B 54. A 55. D 56. A 57. B
24
第7章 相关与回归分析
一、学习指导
相关与回归是研究变量之间关系的统计方法,该方法广泛应用于自然科学和社会科学的各个领域。本章首先介绍相关分析方法,然后介绍一元线性回归和多元线性回归分析方法。本章各节的主要内容和学习要点如下表所示。
章节 主要内容 变量间的关系 相关关系的特点。 概念:相关系数。 相关分析的内容。 变量间关系的度量 相关系数的计算。 相关系数的性质。 相关系数检验的目的。 相关系数的显著性检验 相关系数检验的程序。 概念:回归模型,回归方程,估计的回归方程。 一元线性回归模型 回归分析的内容。 回归模型的基本假定。 一元线性回归 概念:最小二乘法。 参数的最小二乘估计 相关关系的描述与测度 散点图的绘制和分析。 学习要点 概念:函数关系,相关关系。 ˆ的计算。 ˆ和10ˆ的解释。 1 用Excel进行回归。 25
概念:总平方和,回归平方和,残差平方和,判定系数,估计量的标准误差。 回归直线的拟合优度 判定系数的计算和解释。 判定系数与相关系数的关系。 估计量的标准误差的计算和解释。 线性相关检验的目的。 线性关系显著性检验的程序。 显著性检验 回归系数检验的目的。 回归系数检验的程序。 Excel输出的回归结果的解释和应用。 概念:平均值的点估计,个别值的点估计,平均值的置信区间估计,个别值的预测区间估计。 利用回归方程进行估计和预测 平均值的点估计和个别值的点估计的区别。 平均值的置信区间估计和个别值的预测区间估计的区别。 点估计和区间估计的计算方法。 概念:多元线性回归模型,多元线性回归多元回归模型与回归方方程,估计的多元线性回归方程。 程 偏回归系数的解释。 参数的最小二乘估计方法。 参数的最小二乘估计 用Excel进行回归。 多元线性回归 概念:多重判定系数,修正的多重判定系数,估计标准误差。 回归方程的拟合优度 判定系数的实际意义。 估计标准误差的实际意义。 Excel回归结果的解释。 26
线性关系检验与回归系数检验的区别。 线性关系检验的程序。 显著性检验 回归系数检验的程序。 Excel回归结果的解释和应用。
二、主要术语和公式
(一)主要术语
42. 相关关系:变量之间存在的不确定的数量关系。
43. 相关系数:也称Pearson相关系数,是根据样本数据计算的度量两个变量之间线性关
系强度的统计量。
44. 因变量:被预测或被解释的变量,用y表示。
45. 自变量:用来预测或用来解释因变量的一个或多个变量,用x表示。 46. 回归模型:描述因变量y如何依赖于自变量x和误差项的方程。 47. 回归方程:描述因变量y的期望值如何依赖于自变量x的方程。 48. 估计的回归方程:根据样本数据求出的回归方程的估计。
ˆi之间的离差平方和达49. 最小二乘法:也称最小平方法,使因变量的观察值yi与估计值yˆ的方法。 ˆ和到最小来求得1050. 判定系数:回归平方和占总平方和的比例,记为R。
51. 估计量的标准误差:均方残差(MSE)的平方根,用se来表示。
52. y的平均值的点估计:利用估计的回归方程,对于x的一个特定值x0,求出y的平均
值的一个估计值E(y0)。
53. y的个别值的估计值:利用估计的回归方程,对于x的一个特定值x0,求出y的一个
2ˆ0。 个别值的估计值y54. y的平均值的置信区间估计:对x的一个给定值x0,求出y的平均值的区间估计。
27
55. y的个别值的预测区间估计:对x的一个给定值x0,求出y的一个个别值的区间估
计。
,xk和误差项的方56. 多元线性回归模型:描述因变量y如何依赖于自变量x1,x2,程。
,xk的方程。 57. 多元线性回归方程:描述y的期望值如何依赖于x1,x2,58. 估计的多元线性回归方程:根据样本数据得到的多元线性回归方程的估计。 59. 多重判定系数:在多元回归中,回归平方和占总平方和的比例。
60. 修正的多重判定系数:用模型中自变量的个数和样本量进行调整的多重判定系数,记
为Ra。
(二)主要公式
名称 公式 2相关系数 rnxyxynx(x)ny(y)2222 相关系数检验的统计量 trn2~t(n2) 21r回归方程的截距 ˆyˆx 01nxiyixiyii1i1i1nnn回归方程的斜率(回归系数) ˆ1nxi2xii1i1nn2 判定系数 ˆiy)2SSR(y R2SST(yiy)2估计标准误差 seF(yy)iiˆ2n2SSE n2线性关系检验的统计量 SSR1~F(n2) SSEn228
回归系数检验的统计的统计量 tisˆiˆ~t(n2) y的平均值的置信区间 ˆ0t2sey(x0x)21nn2(xx)ii1 y的个别值的预测区间 ˆ0t2sey(x0x)211n n2(xix)i1修正的多重判定系数 R21(1R2)n1 nk1四、习题答案
36. D 37. D 38. A 39. B 40. B 41. A 42. B 43. C 44. C 45. A 46. A 47. B 48. D 49. C 50. A 51. C
52. C 53. A 54. A 55. D 56. B 57. A 58. B 59. A 60. C 61. C 62. A 63. A 64. B 65. B 66. B 67. C
68. C 69. B 70. D 71. D 72. C 73. B 74. D 75. A 76. B 77. B 78. A 79. B 80. A 81. B 82. A 83. A
84. A 85. C 86. C 87. C 88. B 89. D 90. B 91. C 92. A 93. A 94. C 95. A 96. A 97. B 98. D 99. C
100. B 101. B 102. A 103. C 104. A 105. A 106. C 107. A 108. D 109. B 110. C 111. A 112. D 113. B 114. B 115. D
29
第8章 时间序列分析和预测
一、学习指导
分析时间序列数据的主要目的是对未来的观测值进行预测。本章在给出时间序列概念及分类的基础上,首先介绍了时间序列的描述性分析方法,然后介绍了平稳序列和非平稳序列的一些简单预测方法。本章各节的主要内容和学习要点如下表所示。
章节 时间序列及其分解 时间序列的分解模型。 图形描述 时间序列的图形描述。 概念: 增长率,环比增长率,定基增长率,平均增长率,年度化增长率,增长1%绝对值。 时间序列的描述性分析 增长率分析 平均增长率的计算与分析。 年度化增长率的计算与分析。 增长率分析中应注意的问题。 增长1%绝对值的计算和应用。 时间序列的预测步骤。 时间序列的预测程序 选择预测方法 确定时间序列的成分 趋势成分的确定方法。 季节性成分的确定方法。 时间序列的类型和预测方法的 一般增长率的计算与分析。 主要内容 学习要点 概念:时间序列,平稳序列,非平稳序时间序列及其分解 列,趋势,季节性,周期性,随机性。 30
概念:平均误差,平均绝对误差,均方误差,平均百分比误差和平均绝对百分比误预测方法的评估 差。 各种误差的计算方法。 简单平均法 平稳序列的预测 指数平滑法预测。 指数平滑法 用Excel进行指数平滑预测。 直线趋势方程的求法。 线性趋势预测 直线趋势方程预测。 趋势型序列的预测 非线性趋势预测 二次曲线预测。 指数趋势预测,指数曲线和直线的区别。 修正指数曲线预测。 龚铂茨曲线预测。 Logistic曲线预测 季节指数的计算。 确定并分离季节成分 分离季节成分。 复合型序列的分解预测 测 计算最后的预测值 最终预测值的计算。 建立预测模型并进行预 建立预测模型。 移动平均法 用Excel进行移动平均预测。 简单平均法预测。 移动平均法预测。 二、主要术语和公式
(一)主要术语
61. 时间序列:同一现象在不同时间上的相继观察值排列而成的序列。 62. 平稳序列:基本上不存在趋势的序列。
63. 非平稳序列:包含趋势性、季节性或周期性的序列。
64. 趋势:也称长期趋势,是指时间序列在长时期内呈现出来的某种持续向上或持续下降
的变动。
31
65. 季节性:也称季节变动,是指时间序列在一年内重复出现的周期性波动。
66. 周期性:也称循环波动,是指时间序列中呈现出来的围绕长期趋势的一种波浪形或振
荡式变动。
67. 随机性:也称不规则波动,是指时间序列中除去趋势、周期性和季节性之后的偶然性
波动。
68. 增长率:也称增长速度,是指时间序列中报告期观察值与基期观察值之比减1后的结
果,用%表示。
69. 平均增长率:也称平均发展速度,是指时间序列中各逐期环比值(也称环比发展速
度)的几何平均数减1后的结果。
70. 增长1%绝对值:增长率每增长一个百分点而增加的绝对数量。
71. 简单平均法预测:根据过去已有的t期观察值通过简单平均来预测下一期的数值。 72. 移动平均法预测:通过对时间序列逐期递移求得平均数作为预测值的一种预测方法。 73. 指数平滑法预测:对过去的观察值加权平均进行预测的一种方法,该方法使得第t+1
期的预测值等于t期的实际观察值与第t期指数预测值的加权平均值。
(二)主要公式
名称 环比增长率 公式 GiYi1 Yi1定基增长率 YiY0YiGi1 Y0Y0平均增长率 GnYYY1Y2n1nn1 Y0Y1Yn1Y0GA(Yimn)1 Yi1ni年度化增长率 平均预测误差 ME(Yi1Fi) n32
平均绝对预测误差 MADYniiFin 均方预测误差 MSE(Yi1Fi)2n 平均百分比预测误差 YiFi100Yi MPEnFt111t(Y1Y2Yt)Yi tti1简单平均法预测 移动平均法预测 指数平滑法预测 Ft1YtYtk1Ytk2Yt1Yt kFt1Yt(1)Ft 线性趋势方程的截距和斜率 ntYtYbnt2(t)2 aYbt二次曲线的标准方程组 Ynabtct223 tYatbtctt2Yat2bt3ct4指数曲线的标准方程组 lgYnlgalgbt2 tlgYlgatlgbt1S3S2mbSS21b1 a(S2S1)m2b(b1)1ab(bm1)KS1mb1修正指数曲线的未知数 33
龚铂茨曲线的未知数 1S3S2mbSS21b1lga(SS) 21m2b(b1)1b(bm1)lgKSlga1mb11S3S2mbSS21b1a(S2S1)m2 b(b1)1ab(bm1)KS1mb1Logistic曲线未知数 四、习题答案
116. A 117. D 118. A 119. B 120. C 121. D 122. B 123. A 124. B 125. A 126. C 127. C 128. D
129. D 130. D 131. B 132. D 133. B 134. A 135. A 136. A 137. D 138. D 139. C 140. D 141. B
142. A 143. C 144. B 145. B 146. A 147. C 148. D 149. B 150. C 151. B 152. A 153. B 154. B
155. D 156. C 157. A 158. A 159. C 160. A 161. B 162. C 163. A 164. A 165. C 166. D 167. B
168. B 169. C 170. D 171. C 172. B 173. D 174. D 175. C 176. A 177. A 178. B 179. B
34
第9章 指数
一、学习指导
指数是应用于经济领域的一种特殊统计方法。本章首先介绍指数的概念和分类,然后介绍加权指数的编制方法,最后介绍实际中几种常用的价格指数。本章各节的主要内容和学习要点如下表所示。
章节 主要内容 学习要点 概念:指数,个体指数,综合指数,简单 引言 指数的概念和分类 指数,加权指数,时间性指数,区域性指数。 概念:加权综合指数。 加权综合指数 加权综合指数的编制。 概念:加权平均指数。 加权指数 加权平均指数 加权平均指数的编制。 概念:价值指数,指数体系。 价值指数与指数体系 指数体系的应用。 概念:零售价格指数,居民消费价格指数,生产价格指数,股票价格指数。 几种常用的价格指数 别。 居民消费价格指数的作用。 几种常用的价格指数 零售价格指数和居民消费价格指数的区二、主要术语和公式
(一)主要术语
74. 指数:测定多个项目在不同场合下综合变动的相对数。
75. 加权综合指数:通过加权来测定一组项目的综合变动状况的指数。
76. 加权平均指数:以某一时期的价值总量为权数对个体指数加权平均计算的指数。 77. 价值指数:由两个不同时期的价值总量对比形成的指数。
35
78. 指数体系:由价值指数及其若干个因素指数构成的数量关系式。 79. 零售价格指数:反映城乡商品零售价格变动趋势的一种经济指数。
80. 居民消费价格指数:反映一定时期内城乡居民所购买的生活消费品价格和服务项目价
格的变动趋势和程度的一种相对数。
81. 生产价格指数:测量在初级市场上所售货物(即在非零售市场上首次购买某种商品
时)价格变动的一种价格指数。
82. 股票价格指数:是反映某一股票市场上多种股票价格变动趋势的一种相对数。
(二)主要公式
名称 加权综合价格指数 公式 Ippqpq1101 加权综合销售量指数 Iqpqpq0010 加权平均价格指数 Ippqp1p0111p1q1加权平均销售量指数 q1qp0q00 Iqp0q0价值指数 vpqpq0110 四、习题答案
1. A 2. B 3. C 4. D 5. D
8. C 9. A 10. B 11. A 12. B
15. A 16. A 17. C 18. D 19. A
22. B 23. C 24. C 25. D 26. B
36
6. A 7. C
13. B 14. B
20. B 21. D
27. C
37
因篇幅问题不能全部显示,请点此查看更多更全内容