第二章 随机现象与基础概率
练习题:
1.从一副洗好的扑克牌(共52张,无大小王)中任意抽取3张,求以下事件的概率:
(1) 三张K; (2) 三张黑桃;
(3) 一张黑桃、一张梅花和一张方块; (4) 至少有两张花色相同; (5) 至少一个K。
解:(1)三张K。
设:A1=“第一张为K” A2=“第二张为K” A3=“第三张为K”
则PA1A2A3PA1PA2/A1PA3/A1A2=若题目改为有回置地抽取三张,则答案为
4321 =
5525525150PA1A2A3
(2)三张黑桃。
4441 5252522197设:A1=“第一张为黑桃” A2=“第二张为黑桃” A3=“第三张为黑桃”
则PA1A2A3PA1PA2/A1PA3/A1A2=
13121111 =
525150850(3)一张黑桃、一张梅花和一张方块。
设:A1=“第一张为黑桃” A2=“第二张为梅花” A3=“第三张为方块”
则 PA1A2A3PA1PA2/A1PA3/A1A2=
131313=0.017 525150 1
练习题解答:第二章 随机现象与基础概率
注意,上述结果只是一种排列顺序的结果,若考虑到符合题意的其他排列顺序,则最终的结果为:0.017×6=0.102
(4)至少有两张花色相同。
设:A1=“第一张为任意花色”
A2=“第二张的花色与第一张不同”
A3=“第三张的花色与第一、二张不同”
则PA1=
52521339=1 PA2/A== 15215251522626P(A3/A1A2)==
522503926PA1A2A3=1P(A1A2A3)=11=0.602
5150(5)至少一个K。
设:A1=第一张不为K
A2=第二张不为K A3=第三张不为K
则PA1=
524514504P(A/AA) PA2/A= = 3121525252484746PA1A2A3=1P(A1A2A3)=1=0.217
525150
2.某地区3/10的婚姻以离婚而告终。问下面两种情况的概率各是多少: (1)某对新婚夫妇白头偕老,永不离异; (2)两对在集体婚礼上结婚的夫妻最终都离婚了。
解:(1)某对新婚夫妇白头偕老,永不离异。 P(A)1P(A)13=0.7 1033=0.09 1010(2)两对在集体婚礼上结婚的夫妻最终都离婚了。
P(AB)P(A)P(B)=
3.某班级有45%的学生喜欢打羽毛球,80%学生喜欢打乒乓球;两种运动都喜欢的学生有30%。现从该班随机抽取一名学生,求以下事件的概率: (1)只喜欢打羽毛球;
(2)至少喜欢以上一种运动;
2
练习题解答:第二章 随机现象与基础概率
(3)只喜欢以上一种运动; (4)以上两种运动都不喜欢。
解: 设:A=“喜欢打羽毛球” B=“喜欢打乒乓球”
P(A)0.45 P(B)0.8 P(AB)0.3
(1)只喜欢打羽毛球:
P(A)P(AB)0.450.30.15
(2)至少喜欢以上一种运动:
P(AB)P(A)P(B)P(AB)0.450.80.3=0.95 (3)只喜欢以上一种运动:
P(AB)P(AB)P(AB)=0.450.80.30.30.65 (4)以上两种运动都不喜欢:
P(AB)1P(AB)=1(0.450.80.3)0.05
4.拥有40%命中率的篮球手投球5次,他获得如下结果的概率是多少: (1)恰好两次命中。 (2)少于两次命中
解: 设:
P(X0)q0.6
P(X1)p0.4(1)恰好两次命中。
2C52p2q52=0.40.40.60.60.6C50.346
(2)少于两次命中
1151C5pqC50p0q50=
0.40.60.60.60.6C150.60.60.60.60.60.337
5. 求在某一天相遇的前5个人中,至少有3个人是星期一出生的概率。
解:设:
67 1P(X1)p7P(X0)q33535555C5pqC54p4q54C5pq
3
练习题解答:第二章 随机现象与基础概率
11166111161111135C5C54C50.023 777777777777777
6. 投掷5颗骰子,恰好获得4个面相同的概率是多少?
解:设:
16 5P(X1)p6P(X0)qC54p4q54611115C546=0.019 66666第四章 数据的组织与展示
练习题:
1.有240个贫困家庭接受调查,被问及对政府的廉租房政策是否满意,有180个家庭
表示不满意,40个家庭表示满意,20个家庭不置可否,请计算表示满意的家庭占被
调查家庭的比例和百分比?
解:比例:
400.1667240百分比:
0.1667×100%=16.67%
2.某中学初三数学教研室在课程改革后对初三(一)班的数学成绩做了分析,45名学生的成绩由好到差分为A、B、C与D四种,统计结果如下表所示:
A B A A B
A B C C B
B B B A B
C B B C B
B A C A C
C A C C B
A A A A B
C C A B D
D A A B B
(1)上表的数据属于什么类型的数据?
(2)请用SPSS绘制上表的频数分布表,然后再绘制一个饼形图或条形图。
解:(1)定序数据; (2)频数分布表:
4
练习题解答:第二章 随机现象与基础概率
成绩 A B C D
饼形图:
15 17 11 2
频数
D2C11A15B17 条形图:
2010Count0ABCD
成绩 3.某镇福利院有老人50名,截止2009年9月,其存款数目如下表所示: 18000 3100 6200 5100 920 6000 2500 4850 2450
5
8500
练习题解答:第二章 随机现象与基础概率
9300 6000 3100 4600 3500 2950 4500 1200 3400 1900 2800 5700 2900 4000 650 3150 2200 6100 4100 800 850 6100 650 270 4100 4700 300 10850 980 550 4250 8000 12100 8400 1650 400 (1)根据上表的数据将上面数据分为4组,组距为5000元。
(2)根据分组绘制频数分布表,并且计算出累积频数和累积百分比。
解:
(1)组距为5000元,分成的4组分别为0-5000元、5001-10000元、10001-15000元和
15001-20000元。 (2)频数分布表
存款数目分组 0-5000元 5001-10000元 10001-15000元 15001-20000元 总计
频数 35 12 2 1 50
百分比(%) 70.0 24.0 4.0 2.0 100.0
累积频数
35 47 49 50
累积百分比(%) 70.0 94.0 98.0 100.0
1400 3500 6050 2150
4.根据武汉市初中生日常行为状况调查的数据(data9),绘制饼状图说明武汉市初中生中独生子女和非独生子女(a4)的分布状况。
解:《武汉市初中生日常行为状况调查问卷》:
A4 你是独生子女吗 1)是 2)不是 SPSS操作步骤的如下:
1打开数据data9,点击Graphs→Pie,弹出一个窗口,如图4-1(练习)所示。 ○
图4-1(练习) Pie Charts 对话框
2点击Define按钮,出现如图4-2(练习)所示的对话框,将变量“是否独生子女(a4)”○
放
在Define Slices by一栏中,选择N of cases选项。
6
练习题解答:第二章 随机现象与基础概率
图4-2(练习) Define Pie对话框
3点击OK按钮,提交运行,可以得到独生子女和非独生子女分布状况的饼状图,如图4-3○(练 习)所示。
不是Missing是 图4-3(练习) 独生子女和非独生子女的频数分布图(饼图)
5.根据武汉市初中生日常行为状况调查的数据(data9),绘制武汉市初中生家庭总
体经济状况(a11)的累积频数图。
解:《武汉市初中生日常行为状况调查问卷》:
A11 你觉得你家庭的总体经济状况属于
1)非常困难 2)比较困难 3)一般 4)比较富裕 5)非常富裕 SPSS操作的步骤如下:
1依次点击Graphs→Bar,弹出一个窗口,如图4-4(练习)所示。 ○
7
练习题解答:第二章 随机现象与基础概率
图4-4(练习) Bar Charts 窗口
2 选择Simple,点击Define按钮,弹出一个如图4-5(练习)所示的对话框。将变量“家○庭
的总体经济状况(a11)”放在Category Axis栏中,选择Cum N of cases选项。
图4-5(练习) Define Simple Bar对话框
3点击OK按钮,提交运行,SPSS输入如图4-6(练习)所示的结果。 ○
8
练习题解答:第二章 随机现象与基础概率
600500400300Cumulative Frequency2001000Missing非常困难比较困难一般比较富裕非常富裕你觉得你家庭的总体经济状况属于 图4-6(练习) 初中生家庭总体经济状况累积类频数分布图
6.根据武汉市初中生日常行为状况调查的数据(data9),将节假日初中生与父母聊
天的时间(c11)以半个小时为组距进行分组,并绘制新生成的分组的直方图。
解:《武汉市初中生日常行为状况调查问卷》
C11 请你根据自己的实际情况,估算一天内在下面列出的日常课外活动上所花的时间
大约为(请填写具体时间,没有则填“0”)
节假日:
9)和父母聊天_______小时
SPSS的操作步骤如下: 1依次点击Transform→Recode→Into Different Variables,弹出一个窗口,如图4-7(练 ○
习)所示。将变量“节假日初中生与父母聊天的时间(c11b9)”放置在 Numeiric Variable →Output栏中,分组之后生成的新变量命名为“c11b9fz”,标签Label命名为“节假日与 父母聊天时间分组”。
图4-7(练习) Recode Into Same Variables对话框
9
练习题解答:第二章 随机现象与基础概率
2单击Old and New values按钮出现如图4-8(练习)所示的对话框,进行分组区间的设 ○
置。“0-0.5小时”是一组,“0.5-1”小时是一组,“1-1.5”小时是一组,“1.5-2”小时是 一组,“2个小时以上”是一组。
图4-8(练习) Old and New values对话框
3点击Continue按钮,返回到如图4-7(练习)所示的对话框。点击OK按钮,完成新变○
量“节假日与父母聊天时间分组(c11b9fz)”的设置。
4依次点击Analyze→Graphs→Histogram,出现如图4-9(练习)所示的对话框,将新生○
成的变量“节假日与父母聊天时间分组(c11b9fz)”放在Variable(s)栏中。
图4-9(练习) Histogram 对话框 5点击OK按钮,提交运行,输出如图4-10(练习)所示的结果。 ○
图4-10(练习) 初中生节假日与父母聊天时间分组的直方图
10
练习题解答:第二章 随机现象与基础概率
300200100Std. Dev = 1.31 Mean = 2.001.02.03.04.05.0N = 526.00节假日与父母聊天时间分组 上表中,“1.0”指示的是“0-0.5小时”,“2.0”指示的是“0.50-1小时”,“3.0”指示的是“1-1.5小时”,“4.0”指示的是“1.5-2小时”,“5.0”指示的是“2个小时以上”。从上表可以看到各个分组的频数及其相对应的百分比。
第五章 集中趋势与离散趋势
练习题:
1. 17名体重超重者参加了一项减肥计划,项目结束后,体重下降的重量分别为: (单位:千克)
12 10 15 8 2 6 14 12 10 12 10 10 11 10 5 10 16 (1)计算体重下降重量的中位数、众数和均值。 (2)计算体重下降重量的全距和四分位差。 (3)计算体重下降重量的方差和标准差。
解:
(1)○1中位数:
对上面的数据进行从小到大的排序: 序号 数据 Md的位置= ○2众数:
绘制各个数的频数分布表:
数据
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 2 5 6 8 10 10 10 10 10 10 11 12 12 12 14 15 16 171=9,数列中从左到右第9个是10,即Md=10。 2
2 5 6 8 11
10 11 12 14 15 16 练习题解答:第二章 随机现象与基础概率
频数 1 1 1 1 6 1 3 1 1 1 “10”的频数是6,大于其他数据的频数,因此众数MO=“10” ○3均值:
Xxi1nin251610.18
n(2)○1全距:R=max(xi)-min(xi)=16-2=14 ○2四分位差:
根据题意,首先求出Q1和Q3的位置: Q1的位置=
n1171==4.5,则Q1=8+0.5×(10-8)=9 443(n1)3(171)Q3的位置===13.5,则Q3=12+0.5×(12-12)=12
44Q= Q3- Q1=12-9=3
(3)○1方差:
n1(210.18)2(510.18)2+?+(1610.18)2
171 =12.404 ○2标准差:S
S2(xx)ii1n2S212.403.52
2.下表是武汉市一家公司60名员工的省(市)籍的频数分布:
省(市)籍
湖北 河南 湖南 四川 浙江 安徽
12
频数(个)
28 12 6 6 5 3
练习题解答:第二章 随机现象与基础概率
(1)根据上表找出众值。
(2)根据上表计算出异众比率。
解: (1)“湖北”的频数是28,大于其他省(市)籍的频数,因此众数MO=“湖北” (2)异众比率的计算公式为: Vrnfmo( n代表总频数,fmo代表众数的频数) n 其中n=60,fmo=28,则: Vr
60280.53 603.某个高校男生体重的平均值为58千克,标准差为6千克,女生体重的平均值 为48千克,标准差为5千克。请计算男生体重和女生体重的离散系数,比较男 生和女生的体重差异的程度。
解:计算离散系数的公式:
CVS100% XCV6100%10.34% 58男生体重的离散系数:
女生体重的离散系数: CV5100%10.42% 48男生体重的离散系数为10.34%,女生体重的离散系数为10.42%,男生体重的差异程度比女生要稍微小一些。
4.在某地区抽取的120家企业按利润额进行分组,结果如下:
按利润额分组(万元)
200——299 300——399 400——499 500——599 600——699 合计
(2)计算120家企业利润额的均值和标准差。
解:
(1) ○1 中位数Md的位置=
企业数 19 30 42 18 11 120
(1)计算120家企业利润额的中位数和四分位差。
n1120160.5,Md位于“400—499”组, 2213
练习题解答:第二章 随机现象与基础概率
L=399.5,U=499.5,cf(m-1)=49,fm=42,n=120,代入公式得
n120cf(m1)4922MdL(UL)=399.5(499.5399.5)425.69
fm42职工收入的中位数为425.69元。
n120cf119(U1L1)299.54(399.5299.5)336.17 2Q1L14○f1303n3120cf34944(U3L3)399.5(499.5399.5)497.12 Q3L3f342四分位差QQ3Q1497.12336.17160.95 (2)○1均值:
n51140 =120 =426.17XMi1kiif199.5299.5299.5399.5399.5499.5499.5599.5599.5699.5193042181122222120 2标准差: ○
s(Mi1nix)2fn1(249.5426.17)219(349.5426.17)230(449.5426.17)242(549.5426.17)218(649.5426.17)21112011614666.67116.48119
5.根据武汉市初中生日常行为状况调查的数据(data9),运用SPSS统计被调查的初中生平时一天做作业时间(c11)的众数、中位数和四分位差。
解:《武汉市初中生日常行为状况调查问卷》:
C11 请你根据自己的实际情况,估算一天内在下面列出的日常课外活动上所花的时间
大约为(请填写具体时间,没有则填“0”) 平时(非节假日): 1)做作业_______小时 SPSS操作步骤如下:
14
练习题解答:第二章 随机现象与基础概率
1依次点击Analyze→Descriptive Statistics→frequencies,打开如图5-1(练习)所○
示的对话框。将变量“平时一天做作业时间(c11a1)”,放置在Variables栏中。
图5-1(练习) Frequencies对话框
2单击图5-1(练习)中Frequencies对话框中下方的Statistics(统计量)按钮,打开如○
图5-2(练习)所示的对话框。选择Quartiles(四分位数)选项,Median(中位数)选项和Mode(众数)选项。点击Continue按钮,返回到上一级对话框。
图5-2(练习) Frequencies:Statistics统计分析对话框 3点击OK按钮,SPSS将输出如表5-1(练习)所示的结果。 ○
表5-1 平时初中生一天做作业时间的中位数、众值和四分位差
N Median Mode Percentiles 50 25 Valid Missing 517 9 2.500 2.0 2.000 2.500 15
练习题解答:第二章 随机现象与基础概率
75 3.000
从上表可以看出,平时初中生一天做作业时间的中位数是2.5小时,众数是2小时,四分位差是1(即3.000-2.000)个小时。
6.根据武汉市初中生日常行为状况调查的数据(data9),运用SPSS分别统计初 中生月零花钱的均值和标准差,并进一步解释统计结果。
解:《武汉市初中生日常行为状况调查问卷》: F1 你每个月的零用钱大致为___________元。 SPSS操作的步骤如下:
1依次点击Analyze→Descriptive Statistics→frequencies,打开如图5-3(练习)所○
示的对话框。将变量“每个月的零花钱(f1)”,放置在Variables栏中。
图5-3(练习) Frequencies对话框
2单击图5-3(练习)Frequencies对话框中下方的Statistics(统计量)按钮,打开如图○
5-4(练习)所示的对话框。选择Mean(均值)选项和Std.deviation(标准差)选项。点击Continue按钮,返回到如图5-3(练习)所示的对话框。
16
练习题解答:第二章 随机现象与基础概率
图5-4(练习) Frequencies:Statistics统计分析对话框 3点击OK按钮,SPSS将输出如表5-2(练习)所示的结果。 ○
表5-2(练习) 初中生月零用钱的均值和标准差
Statistics你每个月的零用钱大致为_NValidMissingMeanStd. Deviation49828109.80114.200 从表5-2(练习)可以看出,“初中生月零用钱”的均值为109.80元,标准差为114.2元。
第六章 正态分布
练习题:
1.一个正态分布N(120,302)中,有300个变量值在130至150之间,求有多少 变量值在130至145之间。
解:该题目的求解分为以下4个步骤:
1130至150之间的300个变量值占总体的变量值的个数的比例: ○
130120150120)P(Z)3030 P(0.33Z1.00) 0.34130.1293P(Z =0.21202总体的变量值的个数为: ○
17
ab练习题解答:第二章 随机现象与基础概率
3001415.091415
0.21203130至145之间的变量值的个数占总体变量值个数的比例: ○
130120145120)P(Z)3030 P(0.33Z0.83)
0.29670.1293P(Z =0.16744总体中130至145之间的变量值的个数: ○
14150.1674=236.871237
ab2.已知一个正态分布的标准差为6.0,随机抽取一个变量值超过45.0的概率是0.02,求:
(1)该分布的均值;
(2)某一变量值,使95%的变量值都比它大。
解:设该正态分布为N(,),则其均值为,标准差为6.0。
(1)随机抽取一个变量值超过45.0的概率是0.02,即:
245Z)0.02 645即:P(0Z)0.48
6P(查标准正态分布表可知:
45=2.05 6 可得:32.7 (2)设该变量值为a,则:
a32.7Z)0.95 6a32.7即:P(Z0)(0Z)0.95
6a32.7Z0)0.50000.95 即:P(6a32.7Z0)0.45 即:P(6a32.7)0.45 也即:P(0Z6a32.71.64 查标准正态分布表可得:6 可得:a22.86
P(
18
练习题解答:第二章 随机现象与基础概率
3. 对某大学的学生进行调查发现,平均缺课天数为3.5,标准差为1.2。假设 该大学的缺课情况服从正态分布,求: (1)一名学生缺课3.5到5天的概率; (2)一名学生缺课5天及以上的概率; (3)三名学生都缺课5天及以上的概率。
解:该总体服从的正态分布为N(3.5,1.2)
(1)P((2)
23.53.553.5Z)P(0Z1.25)0.39440.0000.3944 1.21.253.5Z)P(1.25Z)1.2 0.5000P(0Z1.25) 0.50000.3944P( =0.1056(3)0.10560.10560.1056=0.0012
4.某社区10000名居民的体重服从正态分布,均值为80千克,标准差为12千克。求:
(1)有多少人的体重在80千克至93千克之间; (2)有多少人的体重在90千克至105千克之间; (3)有多少人的体重在70千克至105千克之间; (4)有多少人的体重低于68千克。
解:该社区10000名居民的体重服从的正态分布为N(80,12)。
(1)○1体重在80千克至93千克之间居民占该社区全部居民人数的比例:
280809380Z)1212P(0Z1.08) P(=0.3599○2体重在80千克至93千克之间的居民的人数: 100000.35993599
(2)○1体重在90千克至105千克之间居民占该社区全部居民人数的比例:
908010580Z)1212P(0.83Z2.08)P(P(0Z2.08)P(0Z0.83) 0.4812-0.2967=0.1845○2体重在80千克至93千克之间的居民的人数:
19
练习题解答:第二章 随机现象与基础概率
100000.18451845 (3)○1体重在70千克至105千克之间居民占该社区全部居民人数的比例:
708010580Z)1212P(0.83Z2.08)P(P(0.83Z0)P(0Z2.08) P(0Z0.83)P(0Z2.08)0.4812+0.2967=0.7779 ○2体重在70千克至105千克之间的居民的人数: 100000.77797779 (4)○1低于68千克的居民占该社区全部居民人数的比例:
6880)12P(Z1)P(ZP(1Z) P(0Z)P(0Z1)0.50000.3413=0.1587 ○2低于68千克的居民的人数: 100000.15871587
5.若入学考试中各个考生的总分数服从正态分布N(400,1002),总共有2000人参加考试,问欲进入被录取的前300名内,其总分至少应该有多少?
解:○1被录取的前300名的考生人数占总参考人数的比例: P3000.1500 2000 ○2假设分数至少为a时才能进入前300名,则:
a400Z)0.1500 100a400)0.1500 即:P(0Z)P(0Z100a400)0.1500 即:0.5P(0Z100a400)0.50.15000.3500 即:P(0Z100a4001.04 可得:
100 可得:a504
P(
20
练习题解答:第二章 随机现象与基础概率
6.根据武汉市初中生日常行为状况调查的数据(data9),绘制初中生节假日做 作业时间的P-P图,判断该变量是否服从正态分布?
解:《武汉市初中生日常行为状况调查问卷》:
C11 请你根据自己的实际情况,估算一天内在下面列出的日常课外活动上所花的时间
大约为(请填写具体时间,没有则填“0”) 节假日:1)做作业_______小时
SPSS操作步骤如下:
1选择Graphs中的P-P Plots,弹出如图6-1(练习)所示的对话框。 ○
图6-1(练习) P-P Plots对话框
2将要分析的变量“节假日做作业的时间(c11b1)”放置在Variables栏中,如图6-1(练○
习)所示,在Test Distritution框中设定Normal(正态分布)。 3点击OK按钮,就可以输出如图6-2(练习)所示的P-P图。 ○
21
练习题解答:第二章 随机现象与基础概率
Normal P-P Plot of 节假日一天做作业时间1.00Detrended Normal P-P Plot of 节假日一天做作业时间.10.08.06.04.020.00-.02-.04-.060.0.2.4.6.81.01.2.75Expected Cum Prob.250.000.00.25.50.751.00Deviation from Normal.50Observed Cum Prob Observed Cum Prob (a) (b)
图6-2(练习) 节假日做作业时间的P-P图
上图中的(a)、(b)两图分别是P-P图和去势P-P图,图(a)中的横轴和纵轴分别是实际累积概率和理论累积概率,如果研究数据呈正态分布,则图中数据点应当与理论直线(对角线)基本重合,可以看出“节假日做作业的时间”的实际分布基本上与理论直线分布相差比较小。(b)去势P-P图反映的是按正态分布计算的理论值与实际值之差的分布情况,如果研究数据呈现正态分布,则数据点将均匀地分布在y=0这条直线上下两边。图(b)数据点比较均匀地分布在y=0这条直线上下两边,其残差绝对值不超过0.05,因此可以判断中生节假日做作业时间基本上服从正态分布。
第七章 参数估计
练习题:
1. 假设一个总体有3、6、9、12、15共5个元素,抽取样本容量为2的样本,绘制总
体分布与样本均值的抽样分布,并比较两个分布的异同?
解:○1总体分布:
总体中5个元素3、6、9、12和15在总体中都各自仅仅出现一次,其分布为均匀分布,如下图所示:
22
练习题解答:第二章 随机现象与基础概率
1.11.0.9 均匀分布
○2若重复抽取(抽取后放回)样本容量为2的样本,则可以抽取的样本有5=25个,样
2
本以及样本的均值如下表所示: 样第一个 第二个 样本本 观察值 观察值 均值 1 2 3 4 5 6 7 8 9 3 3 3 3 3 6 6 6 6 3 6 9 12 15 3 6 9 12 3 4.5 6 7.5 9 4.5 6 7.5 9 样 本 10 11 12 13 14 15 16 17 18 第一个 观察值 6 9 9 9 9 9 12 12 12 第二个 样本样第一个 第二个 样本观察值 均值 本 观察值 观察值 均值 根据上表可以绘制出25个样本均值的相对频数分布,如下图所示:
频次.8.7.6.53691215 15 3 6 9 12 15 3 6 9 10.5 19 12 6 7.5 9 20 12 21 15 22 15 12 15 3 6 9 12 15 12 13.5 9 10.5 12 13.5 15 10.5 23 15 12 7.5 9 24 15 25 15 10.5 23
练习题解答:第二章 随机现象与基础概率
654频次3210
3.04.56.07.59.010.512.013.515.0 样本均值的抽样分布
2. 某报刊为了对某市交通的便利情况进行调查,在全市随机抽取了56名市民,调
查其每天上下班大约在公交车上花费的时间,下表是56名市民做出的回答:(单位:分钟)
80 75 120 100 50 60
80 70 90 40 70 80
68 210 60 78 90 50
48 60 80 50 40 60
60 50 70 80 60 80
50 60 80 50 30 120
110 200 190 30 60
50 70 45 55 60
85 40 60 80 70
95 35 120 110 60
(1)请计算这56名市民上下班在公交车上花费的时间的平均数x和标准差S。 (2)求该市市民上下班在公交车上花费的平均时间的置信区间,置信度为95%。
解:(1)均值:x 标准差:
Xi1nin808068…+120422475.43
5656SS2
(xx)ii1n2n1(8075.43)2(8075.43)2(6875.43)2…(12075.43)2
561 =1377.304 =37.11(2)大样本单总体均值的区间估计:
24
练习题解答:第二章 随机现象与基础概率
在1的置信度下,总体均值的置信区间为xZn,xZ22, n该题目中:=0.05,x75.43,=37.11,Z=Z0.05=1.96 ,n56
22 则:Z2n1.9637.119.72 56 可得:xZ2n75.439.7265.71
xZ2n75.439.7285.15
可得总体均值的置信区间为65.71,85.15。
3.某大学为了了解本校学生每天上网的时间,在全校6000名学生中随机抽取了20
名学生进行调查,得到下面的数据:(单位:小时)
2.5 2.8
3 3.5
4 6
2 2
1.6 4
2.5 1
4 2
2 3.8
3 1
1 5
(1)请计算这20学生每天上网的时间的平均数x和方差S。
(2)求该校20名学生每天上网的平均时间的置信区间,置信度为99%。
解:(1)均值:x 标准差:
Xi1nin2.534…+556.72.84
2020ss2
(xx)ii1n2n1(2.52.84)2(32.84)2…+(52.84)2 201 =1.834 =1.35 (2)小样本单总体均值的区间估计:
在1的置信度下,总体均值的置信区间为xt2ss,xt,该题 nn2 25
练习题解答:第二章 随机现象与基础概率
目中:=0.05,x2.84,s=1.35,tt0.052.093(自由度为19),n20
22 则:t2s1.352.0930.63 n20s2.840.632.21 ns2.840.633.47 n 可得:xt2 xt2 可得总体均值的置信区间为2.21,3.47。
4.中华人民共和国建国60周年阅兵式通过电视和网络直播传递到了世界的每一个
角落,阅兵式结束的当天下午,某国的中文报纸随机抽取了200名华人对之进行电话调查,结果显示有180名华人对阅兵式印象深刻,请计算该国对于阅兵式印象深刻的华侨的比例的置信区间,置信度为95%。
解:大样本单总体比例的区间估计:
样本中对阅兵式印象深刻的华侨占200名华人的比例:p=1800.9 200p(1p)),本题n在置信度为1下P的置信区间为(pZ/2p(1p),pZ/2n目中:0.05,Z=Z0.05=1.96 ,p0.9,n200
22 则:Z/2p(1p)0.9(10.9)1.960.0416 n200p(1p)0.90.04160.8584 np(1p)0.90.04160.9416 n 可得:pZ/2 pZ/2 可得总体比例P的置信区间为85.84%,94.16%。
5.某购物中心准备在甲乙两个城区选出一个建立一个新的购物中心,策划人员分别在甲城区随机抽取了200名居民,在乙城区随机抽取了240名居民,对其月消费额度进行了调查,下表是调查的结果:(单位:元)
26
练习题解答:第二章 随机现象与基础概率
来自甲城区的样本 来自乙城区的样本
n1=200 x1=720 s1=120
(1)求12的95%的置信区间。 (2)求12的99%的置信区间。 解:(1)大样本两总体均值差的区间估计:
在置信度为1下两总体均值差12的置信区间为
n2=240 x2=640 s2=88
22S12S2S12S2,x1x2Z/2x1x2Z/2
nnnn1212x1x272064080,n1=200,n2=240,s1=120,s2=88,Z0.05/21.96
Z/22S12S212028821.9620.01 n1n22002402S12S28020.0159.99 n1n22S12S28020.01100.01 n1n2可得:x1x2Z/2 x1x2Z/2可得12的95%的置信区间为(59.99,100.01)。 (2)Z0.01/22.58 Z/22S12S212028822.5826.34 n1n22002402S12S28026.3453.66 n1n22S12S28026.34106.34 n1n2可得:x1x2Z/2x1x2Z/2可得12的99%的置信区间为(53.66,106.34)。
27
练习题解答:第二章 随机现象与基础概率
6.在旅游开发过程中将旅游地社区居民的意见考虑进来已经是一种比较通行的做
法,某地要新开发一个旅游项目,在附近的甲社区随机抽取60名居民,在乙社区随
机抽取了64名居民,调查其是否同意该旅游项目开工建设,表示同意开工建设的居
民的百分比如下表所示:
来自甲社区的样本
来自乙社区的样本
n1=60 p1=86%
n2=64 p2=72%
(1)构造P1P2的90%的置信区间。 (2)构造P1P2的95%的置信区间。
解:(1)在置信度为1下两总体比例差P1P2的置信区间为:
PP2(1P2)PP2(1P2)1(1P1)1(1P1)ppZ,ppZ2/212/21nnnn1212
该题目中:p1p20.14,n1=60,n2=64,Z/21.65
Z/2PP(1P2)0.86(10.86)0.72(10.72)1(1P1)21.650.1185
n1n26064PP(1P2)1(1P1)20.140.1185=0.0215
n1n2PP(1P2)1(1P1)20.140.1185=0.2585 n1n2可得:p1p2Z/2 p1p2Z/2P1P2的90%的置信区间为(0.0215,0.2585)。
(2)Z/21.96 Z/2PP(1P2)0.86(10.86)0.72(10.72)1(1P1)21.960.1407
n1n26064PP(1P2)1(1P1)20.140.1407=-0.0007
n1n228
可得:p1p2Z/2
练习题解答:第二章 随机现象与基础概率
p1p2Z/2PP(1P2)1(1P1)20.140.1407=0.2807 n1n2P1P2的95%的置信区间为(-0.0007,0.2807)。
7.现今有大量的中小学生参加各种培优项目,某教育研究机构在某中学初二年
级
中随机抽取了30名学生,上一学期参加过培优的有12名学生,没有参加过培优
的
有18名学生,这两类学生期末考试各科的平均成绩如下: 参加 90 80 没有80 参加 80 78 82 87 90 87 76 68 78 69 94 89 89 89 90 90 90 92 86 76 93 89 87 89 67 86 78 x1= s1= x2= s2= (1)请计算x1、x2、s1与s2并填入上表。 (2)求12的95%的置信区间。
解:(1)x1xi1nin9078…+82103486.17
1212x2xi1nin8087…+87148582.50
1818S1S12
(xx)ii1n2n1222 (90-86.17)(78-86.17)+?+(82-86.17) =121 =28.697 5.36S2S
22(xx)ii1n2n1222 (80-82.50)(87-82.50)+?+(87-82.50) =181 =72.382 8.51 29
练习题解答:第二章 随机现象与基础概率
(2)小样本总体均值差12的区间估计,12≠2且n1≠n2: 在置信度为1下两总体均值差12的置信区间为:
2x1x2t22S12S2,x1x2tn1n222S12S2 n1n2 其中t分布的自由度df:
2S12S2n1n22 dfS21/n12n11S22/n22
n21 该题目中,x1x286.1782.503.67
2S12S2nn122dfS21/n12n11S22/n22n212 =5.3628.51218125.362/12212141.178 =1.473 =27.96 288.512/182181
则在自由度为28,置信度为10.05时tt0.052.048,
22 可得: t22S12S25.3628.5122.0482.0486.4175.19 n1n212182S12S23.675.19-1.52 n1n22S12S23.675.198.86 n1n2 可得:x1x2t2 x1x2t2 可得12的95%的置信区间为(-1.52,8.86)。
30
练习题解答:第二章 随机现象与基础概率
8.根据武汉市初中生日常行为状况调查的数据(data9),试以95%的置信度求武
汉市初中生平时一天睡觉时间(C11)的置信区间?
解:《武汉市初中生日常行为状况调查问卷》:
C11 请你根据自己的实际情况,估算一天内在下面列出的日常课外活动上所花的时间大约为(请填
写具体时间,没有则填“0”)
平时(非节假日):8)睡觉_______小时
SPSS的操作步骤如下:
1选择“Aanalyze Descriptive Statistics Explore”,打开如图7-1(练习)所○示的对话框。
图7-1(练习) Explore的对话框
2将变量“初中生平时一天睡觉时间(c11a8)”放在Dependent List栏中,Display选○
项中选择Both。
3点击Statitics按钮,出现如图7-2(练习)所示的对话框。设置置信水平为95%,点击○
Continue按钮,返回到上一级对话框。
图7-2(练习) Explore:Statistics分析对话框 4点击OK按钮,输出如表7-1(练习)所示的结果。 ○
31
练习题解答:第二章 随机现象与基础概率
表7-1(练习) 变量描述表
Descriptives非节假日一天睡觉时间Mean95% ConfidenceInterval for Mean5% Trimmed MeanMedianVarianceStd. DeviationMinimumMaximumRangeInterquartile RangeSkewnessKurtosisStatistic7.7727.6267.9187.8938.0002.8691.6939.013.013.01.625-1.9078.142Std. Error.0744Lower BoundUpper Bound.107.214 从表7-1(练习)可以看出,初中生平时每天睡觉的平均时间为7.772小时,我们有95%的
把握认为初中生平时每天平均睡觉时间在7.626-7.918小时之间。
9.根据武汉市初中生日常行为状况调查的数据(data9),试以95%的置信度求武
汉市不与父母双亲住在一起(A7)的初中生的比例的置信区间?
解:《武汉市初中生日常行为状况调查问卷》:
A7 你的居住情形是
1)与父母亲住在一起 2)仅与其他亲戚住 3)只与父亲住在一起
4)只与母亲住在一起 5)单独居住 6)和父母及其他亲戚一起
居住
SPSS的操作步骤如下:
1《武汉市初中生日常行为状况调查问卷》“A7你的居住情形”这个题目有1)到6)六○
个选项,其中只有1)和6)是与父母亲双亲住在一起,其余的2)到5)都不是与双亲住在一起。
2 将变量“居住情形(a7)”进行变换,生成新变量“是否与父母双亲住在一起(a7fz)”,○
其中1)与父母双亲住在一起,2)不与父母双亲住在一起。该步骤的操作步骤如下:
A. 依次点击Transform→Recode→Into Different Variables,打开如图7-3(练习)所示的对话框。
32
练习题解答:第二章 随机现象与基础概率
图7-3(练习) Transform对话框
B.再将“你的居住情形(a7)”这个变量放置在Numeric Vavriable→output对话框中,如图7-3(练习)所示,并在Output Variable框中给要生成的新变量命名为“a7fz”,点击Change按钮后,新变量名字将出现在Numeric Vavriable→output中,Label是新变量的标签,将之标示为“是否与父母双亲住在一起”。
C.点击如图7-3(练习)的Old and New Values按钮,得到如图7-4(练习)所示的对话框,将“你的居住情形(a7)”这个变量转换成两种类别。Old Value选项Value中输入1,在New Value一栏Value中输入0,再点击Add按钮,使之出现在Old→New栏中;同样Old Value选项Value中输入6,在New Value一栏Value中输入0,再点击Add按钮,使之出现在Old→New栏中;Old Value选项的Range栏的through左侧框中输入2,through右侧框中输入5,在New Value一栏Value中输入1,再点击Add按钮,也使之出现在Old→New栏中。
图7-4(练习) Old and New Values对话框
D.点击Continue按钮,返回到上一级对话框,再点击图7-3(练习)中的OK按钮,完成设置。则生成新变量“是否与父母双亲住在一起(a7fz)”,该变量在SPSS数据中有0和1两个取值,其中“与父母双亲住在一起”取值为0,“不与父母双亲住在一起”取值为1。则变量“是否与父母双亲住在一起(a7fz)”
33
练习题解答:第二章 随机现象与基础概率
的平均值就是“不与父母双亲住在一起的初中生”的比例。
3选择“Aanalyze Descriptive Statistics Explore”,打开如图7-5(练习)所○示的对话框。
图7-5(练习) Explore的对话框
4将变量“是否与父母双亲住在一起(a7fz)”放在Dependent List栏中,Display选项○中选择Both。
5点击Statitics按钮,出现如图7-6(练习)所示的对话框。设置置信水平为95%,点击○
Continue按钮,返回到上一级对话框。
图7-6(练习) Explore:Statistics分析对话框 6点击OK按钮,输出如表7-2(练习)所示的结果。 ○
表7-2(练习) 变量描述表
34
练习题解答:第二章 随机现象与基础概率
Descriptives是否与父母双亲住在一起Mean95% ConfidenceInterval for Mean5% Trimmed MeanMedianVarianceStd. DeviationMinimumMaximumRangeInterquartile RangeSkewnessKurtosisStatistic.1206.0921.1490.0784.0000.106.32593.001.001.00.00002.3383.478Std. Error.01449Lower BoundUpper Bound.109.217 从上表可以看出,有12.06%的初中生没有与父母双亲住在一起,我们有95%的把握认为没有与父母双亲住在一起的初中生的比例在9.21%—14.90%之间。
第八章 单总体假设检验
练习题:
1. 某市去年进行的调查显示该市市民上下班花费的平均时间为75.45分钟。今年 有两条地铁线路开通,今年某报社在全市随机抽取了60名市民对其上下班时间进行调查,调查结果如下表所示:(单位:分钟)
60 75 90 80 50 58
60 65 58 40 48 58
56 120 36 45 62 50
48 60 80 58 64 38
48 54 60 54 55 68
70 54 68 50 36 100
80 20 90 40 80 80
70 50 58 58 40 90
55 60 64 70 48 88
70 60 64 58 66 65
(1)请计算这60名市民今年每天上下班在公交车上花费的时间的平均数x和标准差S。
(2)请陈述研究假设H1和虚无假设H0。
(3)若显著性水平为0.05,能否认为该市市民上下班变得更加便利了。
60+60++88+653700解: (1) x == 61.67,
6060SS2(xx)ii1n2n1292.3317.10
(2)研究假设H1:75.45
虚无假设H0:75.45
35
练习题解答:第二章 随机现象与基础概率
(3)采用Z检验:,
ZxSn61.6775.4517.10606.24,
假设方向明确,采用一端(左)检定,显著性水平为0.05时,否定域Z1.65,检验统计值(Z=-6.24<-1.65)落在否定域中,因此可以否定虚无假设,接受研究假设,也就是说在0.05的显著性水平上,该市居民上下班变得更加便利了。
2.某大学去年的调查显示,该校学生每周体育锻炼平均时间为5.2个小时,今 年在全校6000名学生中随机抽取了20名学生进行调查,得到下面的数据:(单 位:小时)
5.5 4
4 2
3 8
3 12
3.5 7
2.5 6
5 8
9 9
6 2
4 4
(1)请计算这20学生每天体育锻炼时间的平均数和标准差S。 (2)请陈述研究假设H1和虚无假设H0。
(3)若显著性水平为0.05,能否认为该校学生体育锻炼的时间有所增加?
5.5426107.5解:(1)x5.38;
220SS2(xx)ii1n2n17.422.72
(2)研究假设H1:5.2
虚无假设H0: 5.2 (3)采用小样本t检验:
df=20-1=19
txx5.385.20.288 SESn12.72201假设方向明确,采用一端(右端)检验,显著性水平为0.05时否定域为t1.729, 检验统计值(t=0.028<1.729)没有落在否定域中,因此不能否定虚无假设,即在0.05的显著性水平下,不能认为该校学生体育锻炼的时间有所增加。
3.2007年某市抽烟的成年人的比例为41%,今年在该市随机调查了500名成年 人,发现抽烟的有180名,若显著性水平为0.05,能否认为该市抽烟的成年人的 比例有所下降?
36
练习题解答:第二章 随机现象与基础概率
解:研究假设H1:P41%
虚无假设H0:P41% 样本中抽烟的成年人的比例:
p18036% 500pPSEpPP(1P)n0.360.412.27
0.41(10.41)500 采用Z检验:
Z假设方向明确,采用一端(左)检验,显著性水平为0.05时,否定域Z1.65,统计检验值(Z=-2.27<-1.65)落在否定域中,因此可以否定虚无假设,接受研究假设,即在0.05的显著性水平下,该市抽烟的成年人的比例有所下降。(注:本题原来的解答过程有误)
4.某产粮大县去年的小麦亩产是400千克,今年小麦播种采用了新的品种,该 县农业部门在夏粮收获后,随机抽取了120亩进行调查,调查发现平均亩产为 420千克,标准差为30千克,能否认为新品种的产量比老品种有所增加?(显 著性水平为0.05)
解: 研究假设H1:400,
虚无假设H0:400. 采用Z检验:
ZxSn420400301207.303
假设方向明确,采用一端(右)检定,显著性水平为0.05时否定域Z1.65,检验统计值(Z=7.303>1.65)落在否定域中,因此可以否定虚无假设,接受研究假设,即在0.05的显著性水平下,认为新品种的产量比老品种有所增加。
5. 武汉某学校一次家长会上,大多数家长认为在节假日自己的孩子每天看电视 的时间(C11)都大于两个半小时,武汉市初中生日常行为状况调查的数据 (data9)是否支持这样的说法?(显著性水平0.05)
解:《武汉市初中生日常行为状况调查问卷》:
C11 请你根据自己的实际情况,估算一天内在下面列出的日常课外活动上所花的时间
大约为(请填写具体时间,没有则填“0”)
节假日:2)看电视_______小时 SPSS的操作步骤如下:
37
练习题解答:第二章 随机现象与基础概率
1依次点击Analyze→Compare Means→One-Sample T Test,打开如图8-1(练习)所示的T 检○
验对话框。将变量“节假日一天看电视时间(c11b2)”放在Test Variable(s)栏中。
图8-1(练习) One-Sample T Test检验对话框 2在 Test Value 窗口中输入2.5。 ○
3 Options各项取默认值,即显著度是95%和只剔除分析变量为缺失值的个案。如图8-2(练○习)所示。
图8-2(练习) t检验的置信度和缺失值选项框
4单击 OK 提交运行。可以在输出结果窗口看到表8-1(练习)和表8-2(练习)。 ○
表8-1(练习) 单一样本T检验的基本描述统计量
One-Sample StatisticsN节假日一天看电视时间516Mean2.322Std. Deviation1.8221Std. ErrorMean.0802 表8-2(练习) 单一样本T检验的结果
One-Sample TestTest Value = 2.595% ConfidenceInterval of theDifferenceLowerUpper-.336-.021节假日一天看电视时间t-2.225df515Sig. (2-tailed).027MeanDifference-.178 表8-1(练习)是简单描述统计结果,即调查了516人,初中生节假日一天看电视的平
38
练习题解答:第二章 随机现象与基础概率
均时间为2.322小时,标准差为1.8221。表8-2(练习)是t检验的结果,由表8-1(练习)可知,初中生每天看电视的平均时间为2.322小时,那么这一结果在总体中是否真实存在?可以通过假设检验来说明,研究假设(H1)为节假日中学生每天看电视的时间小于2.5小时,原假设(H0)为学生看电视的时间大于2.5小时。通过表8-2(练习) 可知,在假设初中生节假日一天看电视的平均时间为2.5小时的情况下,t值为-2.225,自由度df为515,表8-2(练习)给出的是双尾t检验的P值0.027,但是因为该题目考察的是初中生节假日一天看电视的时间是否大于2.5小时,因此采用的是右端检验,右端检验的P值为双尾检验的一半,即0.027/2,等于0.0135,小于0.05,所以在0.05的显著性水平下通过了显著性检验,否定原假设,接受研究假设,即初中生每天看电视的时间低于2.5小时。
也可以根据t值的结果进行判断,在0.05的显著性水平下,自由度是515时,单尾检验时否定域为t<-1.65或t>1.65,这里的结果t=-2.225<-1.65,落在了否定域中,也就是说在0.05的显著性水平下通过了显著性检验,否定原假设,接受研究假设,即初中生每天看电视的时间低于2.5小时。
6.某报刊宣称现今初中男生女生比例失调,并认为女生比例小于一半,武汉市 初中生日常行为状况调查的数据(data9)是否支持这样的看法?(显著性水平
0.05)
解:《武汉市初中生日常行为状况调查问卷》: A1 你的性别 1)女 2)男 SPSS的操作步骤如下:
1data9数据中,“女”的取值是“1”,“男”的取值是“2”,需要将之变换成0-1取值的变○
量。运用Transform→Recode→Into Different Variables生成新变量“是否为女生(a1bh)”,其中“女”取值为“1”,“男”取值为“0”。
2依次点击Analyze→Compare Means→One-Sample T Test,打开如图8-3(练习)所示的T 检○
验对话框。将变量“是否为女生(a1bh)”放置在Test Variable(s)栏中。
图8-3(练习) One-Sample T Test检验对话框 3在 Test Value 窗口中输入0.5。 ○
4Options各项取默认值,即显著度是95%和只剔除分析变量为缺失值的个案。 ○
39
练习题解答:第二章 随机现象与基础概率
5单击 OK 按钮,提交运行。可以在SPSS输出结果窗口看到表8-3(练习)和表8-4(练 ○习)。
表8-3(练习) 单一样本T检验的基本描述统计量
One-Sample StatisticsN是否为女生
526Mean.4753Std. Deviation.49986Std. ErrorMean.02180 表8-4(练习) 单一样本T检验的结果
One-Sample TestTest Value = 0.595% ConfidenceInterval of theDifferenceLowerUpper-.0675.0181是否为女生t-1.134df525Sig. (2-tailed).257MeanDifference-.0247 表8-3(练习)是简单描述统计结果,即调查了526人,女生的比例为47.53%。研究假设H1为男女比例失调,女生少于男生,原假设(虚无假设)H0则为男女比例不失调,两者比例相当。表8-4(练习)是t检验的结果,即在假设总体的女生比例为50%的情况下,计算t值为-1.134,自由度df为525,表中给出的是双尾t检验的P值,但是因为该题目考察的是初中生中女生的比例是否小于50%,也就是说研究假设(H1)为女生的比例小于50%,虚无假设(H0)则为女性比例不低于50%,因此要采用的是左端检验, 左端检验的P值等于双尾检验的一半,即0.257/2,等于0.1285,大于0.05,不能排除H0,也就说,在0.05的显著性水平下,没有通过显著性检验,因此不能支持武汉市初中生性别比例失调的说法。
同样,也可以根据计算的t值,与自由度是525显著性水平为0.05的单尾检验的t值进行比较,t=-1.134> -1.65结果落在了接受域中,因此在0.05的显著性水平上,不能拒绝虚无假设,也就是说不能支持武汉市初中生性别比例失调的说法。
第九章 双总体假设检验
练习题:
1. 某电信运营商对某市居民的电话费进行了调查,随机抽取了180名男性和 200名女性,其月电话费的平均值、标准差如下表所示:(单位:元)
男性
女性
n1=180 x1=140 s1=30
n2=200 x2=160 s2=48
40
练习题解答:第二章 随机现象与基础概率
(1)为了分析男性和女性的月电话费是否有显著差异,请陈述研究假设H1和虚无假设H0。
(2)若显著性水平为0.05,请判断该市男性和女性居民的月电话费是否有显著差异?
解:(1)研究假设H1:12
虚无假设H0:2 (2)大样本采用Z检验:
Z(X1X2)SS2n1n22121401603048180200224.92
研究假设方向不明,采用二端检验,否定域Z0≥1.96或Z0≤-1.96,检验统计值Z=-4.92<-1.96,落在否定域中,因此可以否定虚无假设,接受研究假设,即在0.05的显著性水平下,男性与女性居民的电话费有显著差异。
2. 某旅游景区随机抽取了40名游客进行调查,其中散客有24人,跟团游客有 16人,他们在景区消费的金额如下表所示:
散客
跟团游客
x1=360 s1=80
x2=310 s2=48
(1)为了分析散客和跟团游客的消费额是否有显著差异,请陈述研究假设H1和 虚无假设H0。
(2) 若显著性水平为0.05,请判断散客和跟团游客在该景区的消费额是否有显 著差异。
(3)若是要分析散客的消费额是否高于跟团游客,该如何构造研究假设H1和虚 无假设H0。
(4)若显著性水平为0.05,请判断散客的消费额是否高于跟团游客?
解:(1)研究假设H1:12
虚无假设H0:2
(2)小样本(独立样本),采用t检验: n124,n216
41
练习题解答:第二章 随机现象与基础概率
df(n11)(n21)n1n22=24+16-2=38
tx1x2nsn2s2n1n222112n1n2n1n2360310248016482416241622416222.19
研究假设方向不明,采用二端检验,否定域t02.021或t02.021(按自由度为40查表得到的结果),可见检验统计值落在否定域中,因此否定虚无假设,接受
研究假设,即在0.05的显著性水平下,散客的消费额不同于跟团游客。 (3)研究假设H1:12
虚无假设H0:2
(4)采用t检验:
tx1x2nsn2s2n1n222112n1n2n1n2360310248016482416241622416222.19
研究假设方向明确,采用一端检验,t01.684(按自由度为40查表得到的结果),可见检验统计值落在否定域中,因此否定虚无假设,接受研究假设,即在0.05
的显著性水平下,散客的消费额高于跟团游客。
3. 某市最近开展了综合治安整治行动,为了对东西两个城区进行比较,随机在 东城区抽取了100名市民,在西城区抽取了90名市民,认为城区治安明显好转的市民的百分比如下表所示:
来自东城区的样本
来自西城区的样本
n1=100 p1=76%
n2=90 p2=65%
(1)为了分析两个城区治安好转的状况是否有所差异,请陈述研究假设H1和虚 无假设H0。
(2)若显著性水平为0.05,请判断两个城区治安好转的状况是否有所差异? (3)若是要分析东城区的治安好转的状况是否明显于西城区,该如何构造研究 假设H1和虚无假设H0。
42
练习题解答:第二章 随机现象与基础概率
(4)若显著性水平为0.05,请判断东城区的治安好转的状况是否好于西城区?
解:(1)研究假设H1:P1P2
虚无假设H0:P1P2 (2)采用Z检验:
Zp1p2p1(1p1)p2(1p2)n1n20.760.651.67
0.76(10.76)0.65(10.65)10090研究假设方向不明,采用二端检验,显著性水平为0.05,否定域Z0≥1.96或Z0≤-1.96,由Z=1.67可知,检验统计值没有落在否定域中,因此不能否定虚无假设,
也就是说在0.05的显著性水平下,两个城区的治安状况没有显著差异。 (3)研究假设H1:P1P2
虚无假设H0:P1P2 (4)采用Z检验:
Zp1p2p1(1p1)p2(1p2)n1n20.760.651.67
0.76(10.76)0.65(10.65)10090研究假设方向明确,采用一端(右)检验,显著性水平为0.05,否定域Z0≥1.65
或Z0≤-1.65,统计值Z=1.67>1.65,检验统计值落在否定域中,因此可以否定虚无假设,接受研究假设,即在0.05的显著性水平下,东城区的治安好转的状况好于西城区。
4. 某学校采用两种方法对青年教师进行培训,采用方法1对14名青年教师进行培训,采用方法2对12名青年教师进行培训,培训后的测试分数如下表所示: 方法1 方法2 76 82 75 62 69 83 68 64 77 76 80 80 74 78 86 79 85 82 76 80 79 75 67 64 75 72 x1= x2= s1= s2= (1)请计算x1、x2、s1与s2并填入上表。
(2)为了比较方法1是否优于方法2,该如何构造研究假设H1和虚无假设H0。 (3)若显著性水平为0.05,能否认为方法1优于方法2?
解:(1)由数据计算得知,x1=77.50,x2=73.25,s1=5.52,s2=7.11
43
练习题解答:第二章 随机现象与基础概率
(2)研究假设H1:12
虚无假设H0:12
(3)小样本(独立样本),采用t检验, dfn1n221412224
tx1x2nsn2s2n1n222112n1n2n1n277.5073.25145.52127.11141214122141222=1.65
研究假设方明确,采用一端(右)检验,显著性水平为0.05,否定域为t0≥1.711,这里t=1.65<1.711,检验统计值没有落在否定域中,因此不能否定虚无假设,也就是
说在0.05的显著性水平下,不能认为方法1优于方法2。
5. 某公司有很多业务经常需要员工加班,但是有不少员工不愿意加班,于是公 司考虑改变员工激励的方式,为了对该激励方式是否有效进行评估,公司人力资源部门在激励实施前后同样调查了相同的12名员工,下表是新激励方式实施前后这12名员工每周愿意加班的时间:(单位:小时)
员工编号 实施前 实施后
1 10 12
2 12 14
3 11 11
4 5 8
5 8 8
6 11 10
7 9 12
8 20 20
9 15 15
10 6 9
11 8 10
12 9 11
(1) 请计算出新激励方式实施前后这12名员工每周愿意加班的时间差的平均
值和标准差。
(2) 新激励方式对员工愿意加班的时间是否有显著性影响?(显著性水平
0.05)
解:(1)员工编号1到12,激励方式个案数值差异(d=x2x1)分别是:
2;2;0;3;0;-1;3;0; 0;3;2;2;
xd=1.33;Sd=1.44
(2)小样本(相关样本)采用t检验:
研究假设H1:12 虚无假设H0:12
dfm1=12-1=11
tSdXd1.333.06 m11.44121研究方向不确定,所以采用二端检验,显著性水平为0.05时,否定域t0>2.201或t0<
44
练习题解答:第二章 随机现象与基础概率
-2.201,这里t=3.06>2.201,结果落在否定域中,因此可以否定虚无假设,接受研究假设,即在0.05的显著性水平下,激励方式对员工愿意加班的时间有显著影响。
6.根据武汉市初中生日常行为状况调查的数据(data9),运用SPSS检验男同 学和女同学(A1)平时做作业的时间(C11)有无显著差异?(显著性水平0.05)
解:《武汉市初中生日常行为状况调查问卷》:
A1 你的性别 1)女 2)男
C11 请你根据自己的实际情况,估算一天内在下面列出的日常课外活动上所花的时
间大约为(请填写具体时间,没有则填“0”) 平时(非节假日):1)做作业_______小时
(1)先采用Means过程计算女生和男生平时一天做作业的平均时间,SPSS的操作步骤如下: 1点击Analyze→Compare Means→Means,打开如图9-1(练习)所示的对话框。 ○
图9-1(练习) Means分析对话框
2将要分析的变量“平时一天做作业时间(c11a1)”放置在Dependent List窗口(分析○
变量窗口),将分组变量“性别(a1)” 放置在Independent List窗口(分组变量窗口)。 3Options按钮选择默认值,即选择均值,个案数目和标准差。 ○
4单击 OK 提交运行。得到如表9-1(练习)与表9-2(练习)所示的结果。 ○
表9-1(练习) 统计概要
Case Processing SummaryIncludedNPercent平时一天做作业时间 * 你的性别51798.3%CasesExcludedNPercent91.7%TotalPercent526100.0%N 表9-2(练习) 均值分析的结果
45
练习题解答:第二章 随机现象与基础概率
Report平时一天做作业时间你的性别女男TotalMean2.7552.5392.642N246271517Std. Deviation1.54491.86371.7211 表9-1(练习)是对参与统计样本的简要概述,说明517个初中生全部对“性别”和“平时一天做作业时间”两个变量做了回答。表9-2(练习)是均值分析的结果,列出了不同性别初中生平时一天做作业时间的均值、个案数和标准差,可以看出,调查样本中男生平时一天做作业的平均时间为2.539个小时,女生平时一天做作业的平均时间为2.755个小时。 (2)用独立样本的T检验来检验男同学和女同学平时做作业的时间有无显著差异
○1依次点击Analyze→Compare Means→Independent-Samples T Test,打开如图 9-2(练
习)所示的对话框。
图9-2(练习) 独立样本T检验对话框
2从左边的源变量框中选择要分析的变量“平时一天做作业时间(c11a1)”放置在○
Test Variable(s)窗口(分析变量窗口 )。
3左边的源变量框中选择变量“您的性别(a1)”作为分组依据进入 Grouping Variable ○
窗口,同时激活 Define Groups 按钮。
4单击Define Groups 按钮,打开分组设置对话框,如图9-3(练习)所示。在Group1○
中填入“1”,指示的是“女生”,在Group2中填入“2”,指示的是“男生”。然后点击Continue按钮,返回到上一级对话框。
图9-3(练习) 分组对话框
46
练习题解答:第二章 随机现象与基础概率
5Options按钮选择默认值,点击OK按钮,SPSS输出如表9-3(练习)和表9-4(练○
习)所示的结果。
表9-3(练习) 分析变量的简单描述统计量
Group Statistics你的性别女男N246271Mean2.7552.539Std. Deviation1.54491.8637Std. ErrorMean.0985.1132平时一天做作业时间 表9-4(练习) 独立样本t检验的结果
Independent Samples TestLevene's Test forEquality of Variancest-test for Equality of Means95% ConfidenceInterval of theDifferenceLowerUpper-.0817.5133-.0790.5106平时一天做作业时间Equal variances assumedEqual variances notassumedF3.049Sig..081t1.4251.438df515510.872Sig. (2-tailed).155.151MeanDifference.216.216Std. ErrorDifference.1514.1501 表9-3(练习)与Means过程的结果相差不大。表9-4(练习)是“女”“男”两组初
中生平均数差异的t检验结果。上表方差齐性检验(Levene’s Test for Equality of
Variances)显示,两者的方差是相同的(sig.=0.081>0.05),因此应该看Equal variances assumed一行对应的t值,t检验结果的p值为0.155,大于0.05。也就是说,在0.05的显著性水平下,女生和男生平时一天做作业的时间不存在显著差异。
7.大众普遍持有的看法是,与女同学相比男同学与好朋友打架的比例要大一些, 武汉市初中生日常行为状况调查的数据(data9)是否支持这样的看法?(显著 性水平0.05)
解:《武汉市初中生日常行为状况调查问卷》: A1 你的性别 1)女 2)男
E8 你和好朋友之间有没有打过架 1)有 2)没有 SPSS的操作步骤如下:
1该题目要分析的是女生和男生与好朋友之间打过架的比例,因此要将变量“与好朋友有○
没有打过架(e8)”变换成0-1取值的变量。运用Transform→Recode→Into Different Variables生成新变量“是否与好朋友打过架(e8bh)”,其中“打过架”取值为“1”,“没有打过架”取值为“0”。这样,均值就是同好朋友打过架的学生的比例。
2依次点击Analyze→Compare Means→Independent-Samples T Test,打开如图 9-4(练习)○
所示的对话框。
47
练习题解答:第二章 随机现象与基础概率
图9-4(练习) 独立样本T检验对话框
3从左边的源变量框中选择变量“您的性别(a1)”作为分组依据进入 Grouping Variable 窗○
口,同时激活 Define Groups 按钮。
4单击Define Groups 按钮,打开分组设置对话框,如图9-5(练习)所示。在Group1中○
填入“1”,指示的是“女生”,在Group2中填入“2”,指示的是“男生”。然后点击Continue按钮,返回上一级对话框。
图9-5(练习) 分组对话框
○5Options按钮选择默认值,点击OK按钮,SPSS输出分析结果,如表9-5(练习)和表9-6(练习)所示。
表9-5(练习) 分析变量的简单描述统计量
Group Statistics你的性别女男N247273Mean.0648.2857Std. Deviation.24663.45258Std. ErrorMean.01569.02739是否与好朋友打过架 表9-6(练习) 独立样本t检验的结果
48
练习题解答:第二章 随机现象与基础概率
Independent Samples TestLevene's Test forEquality of Variancest-test for Equality of Means95% ConfidenceInterval of theDifferenceLowerUpper-.28466-.15721-.28299-.15889是否与好朋友打过架Equal variances assumedEqual variances notassumedF256.500Sig..000t-6.811-6.999df518428.781Sig. (2-tailed).000.000MeanDifference-.2209-.2209Std. ErrorDifference.03244.03157 表9-5(练习)对女生和男生两组的情况进行了简单的描述,从表中可以看出,女生与好朋友打过架的比例为6.48%,男生与好朋友打过架的比例为28.57%。表9-6(练习)是“女生”“男生”两组初中生是否与好朋友打过架的比例的t检验结果。表9-6(练习)方差齐性检验显示,两者的方差是不相同的(sig.=0.000<0.05),因此应该看Equal variances not assumed一行对应的t值。t检验结果的P值为0.000,远远小于0.05,通过了0.05的显著性水平检验。因此可以说,在0.05的显著性水平上,女生和男生与好朋友打过架的比例是有显著差异的。
第十章 交互分类与2检验
练习题:
1. 为了研究婆媳分居对于婆媳关系的影响,在某地随机抽取了180个家庭,调查结果如下表所示:
表10-26 婆媳 关系 (Y) 状况 紧张 一般 和睦 居住方式 (X) 分居 15 20 80 不分居 35 10 20 N:180 FY FX (1) 计算变量X与Y的边际和(即边缘和)FX和FY并填入上表。 (2) 请根据表10-26的数据完成下面的联合分布的交互分类表。 表10-27 婆媳 关系 (Y) 状况 和睦 紧张 一般 居住方式 (X) 分居 P11: P12: P13: 不分居 P21: P22: P23: FY1N: FY FY2N: FY3N: FX FX1N: FX2 N: P1 49
练习题解答:第二章 随机现象与基础概率
(3) 根据表10-27指出关于X的边缘分布和关于Y的边缘分布。 (4) 根据表10-27指出关于X的条件分布和关于Y的条件分布。
解:(1)FY(从上到下):50;30;100.
FX(从左到右):115;65.
(2)P11=15/180;P21=35/180;N=50/180;
P12=20/180;P22=10/180;N=30/180; P13=80/180;P23=20/180;N=100/180;
FY3FY2FY1FX1N=115/180;N=65/180.
(3)关于X的边缘分布:
x P(x)
分居 115/180
不分居 65/180
FX2
关于Y的边缘分布:
y P(y)
紧张 50/180
一般 30/180
和睦 100/180
(4)关于X的条件分布有三个:
y=“紧张”
x P(x) y=“一般” x P(x) y=“和睦” x P(x)
分居 80/100
不分居 20/100
分居 20/30
不分居 10/30
分居 15/50
不分居 35/50
关于y的条件分布有两个: X=“分居”
y
P(y) X=“不分居”
紧张 15/115
一般 20/115
和睦 80/115
y
紧张 一般 和睦
50
练习题解答:第二章 随机现象与基础概率
P(y)
35/65 10/65 20/65
2. 一名社会学家关于“利他主义”的研究中,对被调查者的宗教信仰情况进行 了分析,得到的结果如下表所示: 表10-28 利他主义的程度 (Y) 高 中 低 宗教信仰情况(X) 信教 90 60 35 185 不信教 29 65 78 172 119 125 113 357 FY FX (1)根据表10-28的观察频次,计算每一个单元格的期望频次并填入表10-29。 表10-29 利他主义的程度 (Y) 高 中 低 宗教信仰情况(X) 信教 不信教 (2)根据表10-28和表10-29计算2,计算公式为
2(fofe)2。 fe(3)若要对有无宗教信仰的人的利他主义程度有无显著性差异进行检验,请陈 述研究假设H1和虚无假设H0。
(4)本题目中的自由度为多少?若显著性水平为0.05,请查附录的2分布表, 找出相对应的临界值。并判断有无宗教信仰的人的利他主义程度有无显著性差
异。
(5)若变量“宗教信仰”和“利他主义程度”存在相关关系,请计算C系数。
解:(1)“信教”一列(从上到下):
11918561.67;
35712518564.78;
35711318558.56.
357“不信教”一列(从上到下):
51
练习题解答:第二章 随机现象与基础概率
11917257.33;
35712517260.22;
35711317254.44.
357(2)
2(fofe)2fe = (9061.67)261.67(6064.78)264.78(3558.56)258.56(2957.33)257.33(6560.22)260.22(7854.44)254.44 =47.42 (3)H1:总体中有无宗教信仰的人的利他主义程度有显著性差异。
H0:总体中有无宗教信仰的人的利他主义程度没有显著性差异。
(4)df=(r-1)(c-1)=(3-1)(2-1)=2;显著性水平为0.05时的临界值
22是5.991。因为05.99<47.42,检验统计值落在否定域中,可以拒绝虚
无假设,接受研究假设,即认为总体中有无宗教信仰的人的利他主义程度是有显著性差异的。
(5)C22N0.342
C值要利用表“部分交互分类表C值的上限”中的数值进行修正,本题的表格是32,
对应的C值上限是0.685,因此:
0.342C=0.685=0.4993新
3. 某英语培训学校为了研究英语四级考试试卷客观选择题正确答案的设置在
A、B、C与D的某一个选项上是否有偏好,对最近三年英语四级考试试卷做了分 析,258个单选题的正确答案在A、B、C与D四个选项上的分布情况如下表所示:
答案选项 A
B C D 合计
频次 48 74 50 86 258
52
练习题解答:第二章 随机现象与基础概率
(1)请陈述研究假设H1和虚无假设H0。
(2)A、B、C与D四个选项上的期望频次是多少。 (3)根据上表计算2值。
(4)若显著性水平为0.05,请判断英语四级考试试卷选择题的正确答案在A、B、C与D四个选项上的分配是否有显著的倾向。
解:(1)研究假设H1:正确答案在A、B、C与D四个选项中的设置有偏好。
虚无假设H0:正确答案在A、B、C与D四个选项中的设置没有偏好。 (2) A、B、C与D四个选项上的期望频次都是258/4=64.5 (3)
2(fofe)2fe (4864.5)264.5(7464.5)264.5(5064.5)264.52(8664.5)264.5
=16.05 (4) df=4-1=3,显著性水平为0.05时,查分布表可知临界值是7.815,统计量落
在否定域内,因此,拒绝虚无假设,接受研究假设,即认为正确答案在A、B、C与D四个选项上的分配是有偏好的。
4.某个电视节目收视率的商业调查,涉及到了儿童、少年、青年、中年、老年5个群体的收视习惯,调查结果如下表所示: 儿童 89 12 少年 78 34 群体分类(X) 青年 56 45 中年 67 89 老年 78 56 FY 368 236 604 收视习惯 几乎天天看 (Y) 偶尔看 FX 101 112 101 156 134 (1)为了分析5个群体的收视习惯是否有显著差异,请陈述研究假设H1和虚无
假设H0。
(2)根据上表计算2值。
(3)若显著性水平为0.05,请判断不同群体的收视习惯是否有显著性差异。
解:(1) 研究假设H1:5个群体的收视习惯有显著差异。
虚无假设H0:5个群体的收视习惯没有显著差异。
(2)
53
练习题解答:第二章 随机现象与基础概率
2(fofe)2fe(8961.5)261.5(68.278)268.2(61.556)261.5(9567)295(81.678)281.6(39.512)239.5(43.834)243.8(4589)245(8989)289(52.456)252.457.81 (3) df=(r-1)(c-1)=(2-1)(5-1)=4,显著性水平0.05下的临界值为 9.448,很明显,检验统计值落在否定域内,因此,拒绝虚无假设,接受研究假设,
即认为5个群体的收视习惯有显著差异。
5. 根据武汉市初中生日常行为状况调查的数据(data9),运用SPSS检验是否 有自己的房间(C3)以供学习对学生在本班的学习层次(C2)有无显著影响,并计算 关系强度系数C系数、V系数和φ系数。(显著性水平0.05)
解:《武汉市初中生日常行为状况调查问卷》:
C2 你的成绩目前在本班大致属于
1)上等 2)中上等 3)中等 4)中下等 5)下等 C3 你是否有自己的房间以供学习不被打扰
1)有 2)没有
SPSS的操作步骤如下:
1点击Analyze→Descriptive Statistics→Crosstabs,打开Crosstabs对话框,如图10-1 ○
(练习)所示。将变量“是否有自己的房间以供学习不被打扰(c3)”放置在Column(s)框 中,将变量“成绩目前在本班的大致层次(c2)”放置在Row(s)框中,如图10-1(练习) 所示。
图10-1(练习) Crosstabs对话框
2点击Statistics按钮,分别点击Chi-square、Contingency coefficient、Phi and Cram○
ér’s V复选框,如图10-2(练习)所示。
54
练习题解答:第二章 随机现象与基础概率
图10-2(练习) Crosstabs:statistics对话框
3点击Cells按钮,对单元格进行设置,如图10-3(练习)所示,选择Column选项,选○
择的是在单元格中计算列百分比。
图10-3(练习) Crosstabs:Cell Display对话框 ○4 Format采取系统默认格式,点击OK,提交运行,可得到如下的结果。 表10-1(练习) 是否拥有房间与在班上学习层次的交互分类表
你的成绩目前在本班大致属于 * 你是否有自己 的房间以供学习不被打扰 Crosstabulation % within 你是否有自己的房间以供学习不被打扰 你是否有自己的房间以供学习不被打扰 有没有Total你的上等 10.6%8.2%10.0%成绩中上等30.6%23.0%28.8% 目前在本中等33.8%36.1%34.4% 班大中下等20.7%21.3%20.8%致属 于下等4.3%11.5%6.0% Total100.0%100.0%100.0% 表10-2(练习) 卡
方检验表 Chi-Square Tests
Pearson Chi-SquareLikelihood RatioLinear-by-LinearAssociationN of Valid CasesValue10.605a9.6226.285518df44Asymp. Sig.(2-sided).031.047.012155 a. 0 cells (.0%) have expected count less than 5. Theminimum expected count is 7.30.练习题解答:第二章 随机现象与基础概率
表10-3(练习) 各相关关系表
Symmetric MeasuresValue.143.143.142518Approx. Sig..031.031.031Nominal byNominalN of Valid CasesPhiCramer's VContingency Coefficienta. Not assuming the null hypothesis.b. Using the asymptotic standard error assuming the nullhypothesis. 从表10-2(练习)可以看出卡方值为10.605,自由度为4,卡方检验的P值为0.031,小于0.05,即通过了卡方检验,这意味着是否有自己的房间(C3)以供学习对学生在本班的学习层次(C2)有显著影响。从表10-1(练习)可以看出“有”和“没有”自己房间的两组初中生各个成绩层次的学生在各组所占的比例,在有自己房间的学生中,学习成绩为上等和中上等的比例均高于没有自己房间的学生。
从表10-3(练习)可以看出,列联系数(Contingency coefficient)为0.142,Cramer’s V系数为0.143,φ系数(Phi系数)为0.143。
6. 根据武汉市初中生日常行为状况调查的数据(data9),运用SPSS检验在本 班的学习层次(C2)对自己与母亲关系的好坏(D2)有无显著影响,并计算关系强 度系数C系数、V系数和φ系数。(显著性水平0.05)
解:初中生学习成绩的层次与自己同母亲的关系存在着相互影响,这个题目假定学习层次(C2)为自变量,自己与母亲关系的好坏(D2)为因变量。 《武汉市初中生日常行为状况调查问卷》:
C2 你的成绩目前在本班大致属于
1)上等 2)中上等 3)中等 4)中下等 5)下等
D2 你对自己与母亲的关系
1)非常满意 2)比较满意 3)一般 4)不太满意 5)很不满意
SPSS的操作步骤如下:
1点击Analyze→Descriptive Statistics→Crosstabs,打开Crosstabs对话框,如图10-4○
(练习)所示。将变量“成绩目前在本班的大致层次(c2)”放置在column(s)框中,将变量“自己与母亲的关系(d2)”放置在row(s)框中,如图10-4(练习)所示。
56
练习题解答:第二章 随机现象与基础概率
图10-4(练习) Crosstabs对话框 ○2点击Statistics按钮,分别点击Chi-square、Contingency coefficient、 Phi and Cramr’V复选框,如图10-5(练习)所示。
图10-5(练习) Crosstabs:statistics对话框
3点击Cells按钮,对单元格进行设置,如下图所示,选择Column,设置的是在单元格中○
计算列百分比。
图10-6(练习) Crosstabs:Cell Display对话框
4 Format采取系统默认格式,点击OK,提交运行,SPSS输出如下的结果。 ○
表10-4(练习) 成绩在班上的层次与自己同母亲的关系的交互分类表
57
练习题解答:第二章 随机现象与基础概率
你对自己与母亲的关系 * 你的成绩目前在本班大致属于 Crosstabulation% within 你的成绩目前在本班大致属于上等46.2%32.7%17.3%3.8%100.0%你的成绩目前在本班大致属于中上等中等中下等50.3%46.3%33.9%36.2%31.1%38.5%10.7%15.8%19.3%2.7%3.4%3.7%3.4%4.6%100.0%100.0%100.0%下等26.7%23.3%30.0%10.0%10.0%100.0%Total43.7%33.8%16.1%3.7%2.7%100.0%你对自己与母亲的关系Total非常满意比较满意一般不太满意很不满意
表10-5(练习) 卡方检验表
Chi-Square TestsValue32.358a34.19518.549517df16161Asymp. Sig.(2-sided).009.005.000Pearson Chi-SquareLikelihood RatioLinear-by-LinearAssociationN of Valid Casesa. 9 cells (36.0%) have expected count less than 5. Theminimum expected count is .81. 表10-6(练习) 各相关关系表 Symmetric MeasuresValue.250.125.243517Approx. Sig..009.009.009Nominal byNominalN of Valid CasesPhiCramer's VContingency Coefficienta. Not assuming the null hypothesis.b. Using the asymptotic standard error assuming the nullhypothesis. 从表10-5(练习)可以看出卡方值为32.358,自由度为16,卡方检验的P值为0.009,小于0.05,即通过了卡方检验。这意味着学生学习成绩的层次对自己与母亲的关系的满意程度有显著影响。从表10-4(练习)可以看出“上等”、“中上等”、“中等”、“中下等”与“下等”5组中与父母不同关系水平的初中生占各组的比例,其表现出的总体趋势为:学生的学习成绩的层次越高,其对自己与母亲的关系越满意。
从表10-3(练习)可以看出,列联系数(Contingency coefficient)为0.243,Cramer’s V系数为0.125,φ系数(Phi)为0.250。
第十一章 相关分析
58
练习题解答:第二章 随机现象与基础概率
练习题:
1.某大型公司为了了解公司员工对于公司福利的满意程度,做了一个抽样调查,结果如下:
满意 一般 不满意 合计
老员工 90 50 42 182
新员工 35 40 61 136
合计 125 90 103 318
(1)新老员工对于公司福利的满意程度是否有差异?(显著性水平为0.05) (2)如果有显著性差异,请计算Lambda系数和tau-y系数。
(3)请用第十章讲到的内容,计算C系数,比较一下C系数与Lambda系数、
tau-y系数有多大差异。
解:
(1)研究假设H1:两者有显著差异 无假设H0:两者没有显著差异
df=(r-1)(c-1)=(3-1)(2-1)=2 2(fofe)2fe22.64
显著性水平为0.05,查卡方分布表可得,当自由度为2时,0.05的显著性水平下的临界值为5.991,检验统计值22.64>5.991,落在否定域内,因此否定虚无假设,接受研究假设,即在0.05的显著性水平下,新老员工对于公司福利的满意程度有显著差异。 (2)非对称形式:
Lambda系数=yx tau-y测量法: E1myMynMy90611250.135
318125(nFy)Fyn(318125)125(31890)90(318103)103=210.03 318318318E2
(Fxf)fFx(18290)90(18250)50(18242)42 182(13635)35(13640)40(13661)61136201.93E1E2210.03201.930.04 E1210.0359
tauy
练习题解答:第二章 随机现象与基础概率
(3)C2N222.6422.643180.25780.26
由上面的三个系数结果可以看出,同样是计算两个变量之间的相关关系,选用不同的方法进行计算时,结果存在很大的差异。因此,我们在进行相关系数的计算时,要根据变量的测量层次和变量的对称性等因素选择最恰当的方法进行分析。
2. 一项社区研究涉及到了邻里关系的状况,以抽样调查的方法得到了社区居民 教育程度和邻里关系状况的列联表:
不和睦 一般 和睦
初中及以下 39 40 57
高中或中专 23 38 60
大专 21 40 58
本科及以上 15 36 80
(1)请跟根据上表计算Gamma系数、dy系数和rho系数。
(2)总体中教育程度对于邻里关系的好坏是否有显著性影响?(显著性水平为0.05)
解: (1)
Ns=39(38+40+36+60+58+80)+23(40+36+58+80) +21(36+80)+40(60+58+80)+38(58+80)+4080 =35890Nd=15(40+38+40+57+60+58)+21(40+38+57+60) +23(40+57)+36(57+60+58)+40(57+60)+3857 =23867TX39(40+57)+4057+23(38+60)+3860 +21(40+58)+4058+15(36+80)+3680 =19595TY=39(23+21+15)+23(21+15)+2115 +40(38+40+36)+38(40+36)+4036 +57(60+58+80)+60(58+80)+5880 =36538
NsNd3589023867G0.201
NsNd35890+23867dy
60
NsNd35890238670.1249
NsNdTy35890+23867+ 36538练习题解答:第二章 随机现象与基础概率
rho系数:
16D2n(n21)23(12)221(13)215(14)2 =16[507(50721)40(21)240(23)236(24)2 507(50721)57(31)260(32)280(34)2 +]507(50721)6834 =1507(50721) =0.999962(2)采用Z检验(也可采用t检验):
H1:总体中Gamma≠0 H0:总体中Gamma=0
ZGNsNd35890238670.2012.228 22n(1G)507(10.201)查Z检验表,二端检验,在显著性水平0.05下的临界值是1.96,检验统计值2.228>
1.96,检验统计值落在否定域,否定虚无假设,接受研究假设,即在0.05的显著性水平下,总体中教育程度对于邻里关系的好坏是有显著影响的。
3.一名中学数学教师为了了解课外练习对于数学成绩的作用,特意统计了本班 20名学生每周用于课外练习的时间和期末考试的成绩,结果如下表所示:(单位: 小时)
学生编号 课外练习时间
期末考试成绩 学生编号 课外练习时间 期末考试成绩
1 3 78 11 2 68
2 4 89 12 4 70
3 1 76 13 4 81
4 2 70 14 5 88
5 4 89 15 8 79
6 2 68 16 12 95
7 5 87 17 4 90
8 6 89 18 2 76
9 3 72 19 3 80
10 8 90 20 6 87
(1)令“课外练习时间”为X变量,“期末考试成绩”Y变量,请绘制出这两个变量的散点图。
(2)用最小二乘法计算出回归直线的斜率b和截距a。 (3)根据上表计算积矩相关系数r。
解:
(1)“课外练习时间”与“期末考试成绩”两个变量的散点图
61
练习题解答:第二章 随机现象与基础概率
10090(2)由统计数据可得:
(3)积距相关系数:
r 期末考试成绩80706002468101214课外练习时间 2X88,Y1622,XY7429,X则回归直线的斜率b和截距a为:
518,Y2132940
bn(XY)(X)(Y)n(X2)(X)2207429881622=2.23
20518882aYbXYb(X)16222.238871.29
n20nXY(X)(Y)n(X2)(X)2n(Y2)(Y)2207429881622205188820132940162258440.688546.1422
4.题目3中的数学老师后来将这20名学生,按照这个学期是否请过家教进行了 分类,两类学生数学期末考试的成绩如下表所示: 请过家教 78 89
没有请过家教 89 76
95 88
(1)请计算相关比率E2。
68 70
87 89
72 90
81 68
79 70
76 90
80
87
(2)请过家教和没有请过家教的学生的数学成绩是否有显著差异?(0.05)
解:
62
练习题解答:第二章 随机现象与基础概率
(1)根据上表计算可得:
请过家教的学生的平均成绩Y1= 78.75 没有请过家教的学生的平均成绩Y2= 82.67 所有学生的平均成绩Y= 81.1 n1=8,n2=12,n=20 则:
E2nYnYYnY2ii222878.7521282.6722081.12=0.057 21329402081.1
EE20.0570.239(2)用F检验法推断总体中两个变量的关系:
研究假设H1:1≠2 虚无假设H0:1=2
E2nk0.057202F()1.088 21Ek110.05721df1=k-1=2-1=1 df2=n-k=20-2=18
显著性水平0.05下,查附录F分布表得临界值为4.41,求得F值为1.088<4.41,不在否定域内,因此在0.05的显著性水平下,我们不能否定虚无假设,也就是说,在0.05的显著性水平下,请没请过家教与学生的成绩没有显著关系。
5.为了研究外出打工是否会对村庄邻里关系产生影响,某位研究者在一个村庄 调查之后得到了如下数据:
非常不和睦 不和睦 一般 和睦 非常和睦
外出打过工
30 24 24 15 12
没有打过工
25 13 14 25 41
(1)外出打工对邻里关系是否有显著性影响?(显著性水平为0.05) (2)请计算λyx和tau-y系数。
解:
63
练习题解答:第二章 随机现象与基础概率
(1)研究假设H1:外出打工对邻里关系有影响 虚无假设H0:外出打工对邻里关系没有影响 由上表进一步可得:
非常不和睦 不和睦
外出打过工
30 24
没有打过工
25 13 14 25 41 118 合计 55 37 38 40 53 223
一般 24
和睦 15 非常和睦 12
合计 105
进一步计算期望频次可得:
外出打过工
非常不和睦 e:25.90
11没有打过工
e12:29.10 e22:19.58 e32:20.11 e42:21.17 e52:28.04
不和睦 一般 和睦 非常和睦
e21:17.42 e31:17.89 e41:18.83 e51:24.96
(fafe)2fe2(3025.90)2(2417.42)2(2417.89)2(1518.83)2(1224.96)2 25.9017.4217.8918.8324.96(2529.10)2(1319.58)2(1420.11)2(2521.17)2(4128.04)2 + 29.1019.5820.1121.1728.04 =24.06df=(r-1)(c-1)=(2-1)(5-1)=4;
自由度为4,显著性水平为0.05时,临界值是9.448。检验统计值24.06>9.488,落在否定域中,可以否定虚无假设,接受研究假设,即认为在0.05的显著性水平下,是否外出打工对邻里关系是有显著影响的。
(2) ○1根据上表统计结果可知,My=55,my=30,41,n=223。
2 64
练习题解答:第二章 随机现象与基础概率
那么,yx2○
myMynMy(3041)550.095
22355n(22355)55(22337)37(22338)38(22340)40(22353)53 =223223223223223 =41.43+30.86+31.52+32.83+40.4 =177.04E1(nFy)FyE2 =(Fxf)fFx(10530)30(10524)24(10524)24(10515)15(10512)12105(11825)25(11813)13(11814)14(11825)25(11841)41 118 =81.94+90.07 =172.01tauyE1E2177.04172.010.0284 E1177.04
6.根据武汉市初中生日常行为状况调查的数据(data9)分析中学生母亲的文化程度与中学生学习成绩之间(成绩目前在本班属于的层次C2)的关系。
解:《武汉市初中生日常行为状况调查问卷》:
A8 父母受教育程度(此题需分别填写父母亲的情况,将适合的答案序号写在横线上)
父亲的受教育程度:___________ 母亲的受教育程度:___________
1)初中及以下 2)高中,中专及职业学校 3)大专,本科 4)硕士、博士研究生及以上
C2 你的成绩目前在本班大致属于
1)上等 2)中上等 3)中等 4)中下等 5)下等
变量“母亲的文化程度(a82)”与“成绩目前在本班的大致层次(c2)”都属于定序变量,因此可以选用定序-定序测量层次的检验方法和相关测量方法。 SPSS的操作步骤如下:
1点击Analyze→Descriptive Statistics→Crosstabs,打开如图11-1(练习)所示的对话框。○
分别将“母亲的文化程度(a82)”变量放入Column(s)框中,将“成绩目前在本班的大致层次(c2)”变量放入Row(s)框中。
65
练习题解答:第二章 随机现象与基础概率
c
图11-1(练习) Crosstabs对话框
2单击Statistics按钮,打开如图10-2(练习)所示的对话框,选择Chi-square。因为“母亲○
的文化程度(a82)”与“成绩目前在本班的大致层次(c2)”都属于定序变量,所以也选择Correlations命令和Gamma系数。单击Continue,返回到图11-1(练习)的对话框。
图11-2(练习) Crosstabs:Stastics对话框
3点击Cells按钮,如图11-3(练习)所示,选择Percentages选项下的Column选项,Format ○
选项选择默认。点击Continue按钮,返回到上一级对话框。
66
练习题解答:第二章 随机现象与基础概率
图11-3(练习) Crosstabs:Cell Display对话框
4点击OK按钮,SPSS输出如下的结果。 ○
表11-1(练习) 母亲受教育程度与初中生在班级成绩层次的交互分类表
Crosstab% within 母亲的受教育程度母亲的受教育程度高中,中专及职业学校6.3%28.6%33.0%26.7%5.3%100.0%硕士、博士研究生及以上12.5%37.5%25.0%20.8%4.2%100.0%初中及以下你的成绩目前在本班大致属于Total上等中上等中等中下等下等8.9%28.5%36.7%19.0%7.0%100.0%大专,本科18.0%27.0%35.2%13.9%5.7%100.0%Total10.2%28.6%34.3%21.0%5.9%100.0% 表11-2(练习) 卡方检验结果
Chi-Square TestsValue19.509a18.7613.640510df12121Asymp. Sig.(2-sided).077.094.056Pearson Chi-SquareLikelihood RatioLinear-by-LinearAssociationN of Valid Casesa. 2 cells (10.0%) have expected count less than 5. Theminimum expected count is 1.41. 表11-3(练习) 相关系数结果
Symmetric MeasuresValue-.093-.079-.085510Asymp.aStd. Error.053.045.045Approx. T-1.744-1.776-1.913bOrdinal by OrdinalGammaSpearman CorrelationInterval by IntervalPearson's RN of Valid Casesa. Not assuming the null hypothesis.Approx. Sig..081.076c.056cb. Using the asymptotic standard error assuming the null hypothesis.c. Based on normal approximation. 从表11-1(练习)可以看出母亲不同受教育程度的初中生其学习成绩在班级所处层次的分布状况。从表11-2(练习)可以看出卡方值为19.509,自由度为12,卡方检验的P值为0.077,
67
练习题解答:第二章 随机现象与基础概率
大于0.05,没有通过了卡方检验。也就是说,在0.05的显著性水平下,母亲受教育程度与孩子的成绩水平的关系不显著。从表11-3(练习)可以看出,Gamma系数和斯皮尔曼(Spearman)的rho系数都比较小,p值都大于0.05,不能否定虚无假设(两个变量间没有显著性关系),即在0.05的显著性水平下,母亲受教育程度与孩子的成绩水平没有显著性关系。
7.根据武汉市初中生日常行为状况调查的数据(data9),分析初中生性别与平时每天用于休闲的总时间(C11)(包括看电视时间,上网打游戏时间,看课外书时间和逛街时间)的相关关系。
解:《武汉市初中生日常行为状况调查问卷》:
A1 你的性别 1)女 2)男
C11 请你根据自己的实际情况,估算一天内在下面列出的日常课外活动上所花的时间
大约为(请填具体时间,没有则填“0”) 平时(非节假日): 2)看电视_______小时 3)上网打游戏_______小时
6)看课外书_______小时 7)逛街_______小时
“性别(a1)”属于定类变量,“休闲总时间”属于定距变量,因此要选择定类-定距层
次的检验方法和相关关系测量方法。定类-定距层次变量相关关系的检验方法要用到方 差分析(书中第十二章),本章还没有讲到方差分析的内容,这里将定距变量下降为定
2类变量进行处理,选择检验。具体的方差分析的检验方法,可参考第十二章正文的 例题和练习题的解答。 SPSS操作步骤如下:
1将看电视时间(c11a2),上网打游戏时间(c11a3),看课外书时间(c11a6)和逛街时○
间(c11a7)三个变量变换成新变量“休闲总时间(xxzsj)”操作步骤如下: A. 点击Transform-Compute,出现如图11-4(练习)所示的对话框。
图11-4(练习) Compute Variable对话框
B.在Target Variable栏中输入新变量“xxzsj”,同时激活Type&Label按钮,点击Type&Label按钮,出现如图11-5(练习)所示的对话框,在Label栏中输入标签名字“休闲总时间”,点击Continue返回到图11-4(练习)中的对话框。
68
练习题解答:第二章 随机现象与基础概率
图11-5(练习) Compute Variable:Type and Label对话框
C. 从左侧源变量框中选择变量“看电视时间(c11a2),上网打游戏时间(c11a3),看课外书时间(c11a6)和逛街时间(c11a7)”,将之放置在Numeric Expression框中,并将这几个变量用“+”号连接。
D.点击OK按钮,完成设置,就生成了新变量“休闲总时间(xxzsj)”。
2依次点击Analyze→Descriptive Statistics→Crosstabs,打开如图11-6(练习)所示的对话○
框。将“性别(a1)”和“休闲总时间(xxzsj)”放置在Column(s)和Row(s)框中。
图11-6(练习) Crosstabs对话框
3单击Statistics按钮,如图11-7(练习)所示打开对话框。因为“性别(a1)”属于定类变○
量,“休闲总时间(xxzsj)”属于定距变量,所以选择Nominal by Interval下的Eta选项。点击Continue按钮,返回如图11-6(练习)所示的对话框。
69
练习题解答:第二章 随机现象与基础概率
图11-7(练习) Crosstabs:Statistics对话框
4Cells和Format按钮选择默认选项,点击OK按钮,SPSS输出如下的结果。 ○
表11-4(练习) 卡方检验结果
Chi-Square TestsValue57.288a71.3335.942518df36361Asymp. Sig.(2-sided).013.000.015Pearson Chi-SquareLikelihood RatioLinear-by-LinearAssociationN of Valid Casesa. 55 cells (74.3%) have expected count less than 5.The minimum expected count is .47. 表11-5(练习) 相关测量结果 Directional MeasuresValue.107.333Nominal by IntervalEta休闲总时间 Dependent你的性别 Dependent 表11-4(练习)是卡方检验的结果,从表中可以看出,卡方值为57.288,自由度为36,P值为0.013,小于0.05,通过了显著性检验,即说明在0.05的显著性水平下,男性和女性的休闲总时间存在差异。表11-5(练习)是相关测量的结果,这里休闲总时间为因变量(Dependent),Eta系数为0.107。
8.根据武汉市初中生日常行为状况调查的数据(data9),统计初中生每天用于休闲的总时间(包括看电视时间,上网打游戏时间,看课外书时间和逛街时间)与成绩目前在本班的大致层次(视为定距变量)的积距相关系数(Pearson相关系数)。
70
练习题解答:第二章 随机现象与基础概率
解:《武汉市初中生日常行为状况调查》: C2 你的成绩目前在本班大致属于
1)上等 2)中上等 3)中等 4)中下等 5)下等
C11 请你根据自己的实际情况,估算一天内在下面列出的日常课外活动上所花的时间
大约为(请填具体时间,没有则填“0”) 平时(非节假日): 2)看电视_______小时 3)上网打游戏_______小时
6)看课外书_______小时 7)逛街_______小时
“C2 你的成绩目前在本班大致属于?”这个题目的选项在data9中,“上等”赋值为“1”,
“中上等”赋值为“2”,“中等”赋值为“3”,“中下等”赋值为“4”,“下等” 赋 值为“5”,为了便于分析通过Transform-Recode into Different Variables命令将“下等”赋值为“1”,“中下等”赋值为“2”,“中等”赋值为“3”,“中上等”赋值为“4”,“上等”赋值为“5”,生成新变量“成绩层次(cjcc)”。 SPSS的操作步骤如下:
1点击Analyze→Correlate→Bivariate,打开如图11-6(练习)所示的对话框。分别将变量○
“休闲总时间(xxzsj)”和“成绩层次(cjcc)”放入“Variables”窗口。
图11-6(练习) Bivariate:Correlations相关分析对话框
2因为“休闲总时间(xxzsj)”和“成绩层次(cjcc)”都是定距变量,所以选择Pearson○
相关系数,选择双尾检验。
3点击OK,提交运行,SPSS输出如表11-5(练习)所示的结果。 ○
表11-5(练习)相关分析结果
Correlations休闲总时间Pearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)N休闲总时间成绩层次1-.154**..000518512-.154**1.000.512520成绩层次**. Correlation is significant at the 0.01 level (2-tailed). 表11-5(练习)是相关分析矩阵表。“休闲总时间(xxzsj)”和“成绩层次(cjcc)”
的积距相关系数为-0.154,显著性水平为0.001时,通过显著性检验,也就是说在总体中两者之间的关系也是存在的。积距相关系数为负值,表明休闲时间越多,成绩在班级的层次就越低。
第十二章 方差分析
71
练习题解答:第二章 随机现象与基础概率
练习题:
1. 现今越来越多的外国人学习汉语,某孔子学院设计了3种汉字的讲授方法, 随机抽取了28名汉语基础相近的学生进行试验,试验后对每一个学生汉字理解记忆水平进行打分,满分为10分,28名学生的分数如下:
表12-3 三种汉字讲授方法下的学生得分
汉字讲授方法
讲授方法一 8.7 9.1 8.6 9.0 8.1 9.4 9.2 8.8 9.4
讲授方法二 8.1 6.6 7.0 8.0 7.4 7.6 8.1 7.4 7.9
讲授方法三 7.1 6.2 7.4 7.8 7.9 8.2 8.1 6.7 6.9 7.5
y1=
y2= y3=
y= (1) 请分别计算3种汉字讲授方法下学生相应分数的平均值y1、y2与
y3以及所有参加试验的学生的平均得分y,并填入上表。
(2)请根据上表计算总平方和(TSS),组间平方和(BSS),组内平方和(WSS), 组间均方(MSSB ),组内均方(MSSW),以及各自对应的自由度并填入下表。
表12-4 方差分析的结果 误差来源 组间 组内 总和
平方和 SS BSS: WSS: TSS:
自由度 df k-1: n-k: n-1:
均方 MSS MSSB: MSSW: ————
F值 P值 F临界值 ———— ————
MSSB / MSSW : —— —————— —— —————— ——
(3)根据上表计算出F值,并查附录中的F分布表,看P是否小于0.05。
(4)若显著性水平为0.05,请查附录中的F分布表找出F临界值,并填入上表。 (5)若显著性水平为0.05,请根据P值或F临界值判断三种汉字的讲授方法对 学生汉字的理解和记忆水平是否有显著性影响。
解:
(1)y1=8.9222≈8.92,y2=7.5667≈7.57,y3=7.3800≈7.38,y=7.9357≈7.94. (2)BSS =
2 n(yy)ii=9×(y1-y)2+9×(y2-y)+10×(y3-y)
72
练习题解答:第二章 随机现象与基础概率
=9×(8.92-7.94)2+9×(7.57-7.94) 2+10×(7.38-7.94) 2
=13.0117≈13.01 WSS=
(yy)i2=[(8.7-y1)2+(9.1-y1)2+…+(9.4-y1)2]+[(8.1-y2)2+(6.6-y2)2+…
+(7.9-y2)2]+ [(7.1-y3)2+(6.2-y3)2+……+(7.5-y3)2]
=7.4117≈7.41
TSS =
(yy)2=(8.7-7.94)+(9.1-7.94)+ ……+(7.5-7.94)=20.4848≈20.48
222k-1=2,n-k=25,n-1=27
MSSBBSS/(k1)=13.01/2=6.505=6.51
MSSwWSS/(nk)=7.41/25=0.2964=0.30
F= MSSB / MSSW =6.51/0.30=21.7
(3)df1=k-1=3-1=2;df2=n-k=28-3=25,在显著性水平0.05下的F值的临界值
是3.38,而21.7远大于3.38,因此可以看出P值小于0.05。
(4)df1=k-1=3-1=2;df2=n-k=28-3=25;显著性水平0.05下的F值的临界值是
3.38,即,F临界值=3.38。
(5)根据(2)可知F=21.7>3.38,检验统计值落在否定域,可以认为三种汉字的讲授方
法对学生汉字的理解和记忆水平有显著影响。
2.某大学设置有经管类、法学类和统计类三大门类的专业,2009年该校就业服 务指导部门随机抽取了300名该校2006届的本科毕业生并对其月薪情况进行了 调查,而且用方差分析的方法分析专业门类对毕业生的薪酬是否有显著性影响, 研究中得到下面的方差分析表。 误差来源 组间 组内 总和
平方和 SS 自由度 df 均方 MS F值 P值 F临界值 —— ——
BSS:2216800 k-1: WSS: n-k: TSS: n-1: MSSB: MSSB / MSSW: ——
MSSW:2410 —————— —— —————— ——
(1)请完成上面的方差分析表(显著性水平为0.05)。
(2)请判断该大学的毕业生专业门类对薪酬是否有显著性影响。
解:
(1) 由k=3,n=300可得:
k-1=2;n-k=297;n-1=299
MSSB= BSS/ k-1=2216800/2=1108400
WSS= MSSW×(n-k)= 2410×297=715770 TSS= BSS+ WSS=2216800+715770=2932570
F= MSSB / MSSW=1108400/2410=459.917
当df1=k-1=3-1=2;df2=n-k=300-3=297时,查F分布表可得,F临界值=2.99。 (2)根据(1)可知F=459.917>2.99,检验统计值落在否定域,可以认为该校毕业生专
业门类对毕业生薪酬有显著影响。
73
练习题解答:第二章 随机现象与基础概率
3.根据武汉市初中生日常行为状况调查的数据(data9),运用SPSS检验老师上 课的效果(C8)对于初中生平时上网打游戏的时间(C11)是否有显著影响?(显著性水平0.05)
解:《武汉市初中生日常行为状况调查问卷》:
C8 你觉得目前老师上课
1)普遍枯燥无味,听不进去 2)有的课上的好,有的不好 3)都很好,很易接受
C11 请你根据自己的实际情况,估算一天内在下面列出的日常课外活动上所花的时
间大约为(请填写具体时间,没有则填“0”) 平时(非节假日):3)上网打游戏_______小时
SPSS的操作步骤如下:
1该题目属于单因方差分析,依次点击Analyze→Compare Means→One-Way ○
ANOVA 打开如图12-1(练习)所示的对话框。
图12-1(练习) One-Way ANOVA 对话框
2单击Options 按钮,打开选项对话框。选择Descriptive、 Homogeneity-of-variance、○
Brown-Forsythe 、Welch 与Means plot 选项。如图12-2(练习)所示。选择之后点击Continue按钮返回到上一级对话框。
图12-2(练习) One-Way ANOVA:Options 对话框
3单击OK 按钮,提交运行。可以得到如表12-1(练习)、表12-2(练习)、表12-3(练习)、○
74
练习题解答:第二章 随机现象与基础概率
表12-4(练习)与图12-3(练习)所示的结果。
表12-1(练习) 方差分析中因变量的描述统计结果
Descriptives平时一天上网打游戏时间95% Confidence Interval forMeanLower BoundUpper Bound.202.173.051.1941.165.334.319.336N普遍枯燥无味,听不进去有的课上的好,有的不好都很好,很易接受Total30371104505Mean.683.254.185.265Std. Deviation1.2898.7886.6896.8132Std. Error.2355.0409.0676.0362Minimum.0.0.0.0Maximum5.06.05.06.0 表12-2(练习)是方差分析中对因变量的描述统计结果,三种教学水平(“普遍枯燥无味,听不进去”、“有的课上的好,有的不好”和“都很好,很易接受”)下初中生的样本数N,收入平均值Mean、标准差Sta.Deviation、标准误Std.Error、95%的置信区间、最小值和最大值。从表中数据结果可看出,505位初中生平时一天上网打游戏时间的平均数为0.265个小时,其中教师授课“普遍枯燥无味,听不进去”下的初中生一天上网打游戏的时间明显高于其他两种授课水平下的初中生上网打游戏的时间。
表12-2(练习) 方差齐次性检验结果
Test of Homogeneity of Variances平时一天上网打游戏时间LeveneStatistic9.448df12df2502Sig..000
表12-3(练习) Brown-Forsythe 检验与Welch 检验的结果
Robust Tests of Equality of Means平时一天上网打游戏时间WelchBrown-ForsytheStatistic2.1342.832adf122df269.25451.707Sig..126.068a. Asymptotically F distributed. 表12-3(练习)是方差齐性检验结果,这是对方差分析前提的检验。从表12-3(练习)中可以看出,显著性水平为0.000,由于显著性水平小于0.05,因此不能认为不同教师授课水平下各总体方差无显著性差异(这个地方的原假设H0:各组的方差相等,研究假设H1:各组的方差不相等),即没有通过方差齐次性检验。表12-3(练习)的Brown-Forsythe 检验与Welch 检验是没有通过方差齐次性检验时采用的两种检验,从表12-3(练习)可以看出两种检验的显著性水平都大于0.05,因此可以认为不同教师授课水平下各总体的均值是相等的,即也没有通过Brown-Forsythe 检验与Welch 检验。
75
练习题解答:第二章 随机现象与基础概率
表12-4(练习) 方差分析结果
ANOVAC11A3Sum ofSquares5.968327.319333.287df2502504Mean Square2.984.652F4.576Sig..011Between GroupsWithin GroupsTotal 表12-4(练习)是方差分析的结果,总变差是333.287,组间变差是5.968,组内变差是323.319;组间自由度为2,组内自由度为502,总自由度为504;组间均方差为2.984,组内均方差为0.652;F值为4.576;显著性水平为0.011,小于0.05,可以认为不同的教师授课水平下的初中生平时每天上网打游戏的时间有显著差异。注意,由于没有通过方差齐次性检验,也没有通过Brown-Forsythe 检验与Welch 检验,这里的方差分析实际上是没有意义的。
.8普遍枯燥无味,听不进图12-3(练习) 均值分布图
图12-3(练习)是不同的教师授课水平(“普遍枯燥无味,听不进去”,、“有的课上的好,有的不好”和“都很好,很易接受”)下初中生平时一天上网打游戏的平均时间的分布图,从图中可以明显看出授课“都很好,很易接受”下的初中生一天上网打游戏的平均时间明显少于其他两种授课水平下的初中生上网打游戏的平均时间
4.根据武汉市初中生日常行为状况调查的数据(data9),运用SPSS检验初一、 初二和初三学生(A3)节假日看课外书的时间(C11)有无显著差异?(显著性水平0.05)
解:《武汉市初中生日常行为状况调查问卷》:
A3 你的年级
76
Mean of 平时一天上网打游戏时间.7.6.5.4.3.2.1有的课上的好,有的不都很好,很易接受你觉得目前老师上课 练习题解答:第二章 随机现象与基础概率
1)初一 2)初二 3)初三 C11 请你根据自己的实际情况,估算一天内在下面列出的日常课外活动上所花的时间
大约为(请填写具体时间,没有则填“0”)
节假日:6)看课外书_______小时
SPSS的操作步骤如下:
1该题目属于单因方差分析,点击Analyze→Compare Means→One-Way ANOVA 打开如图○
12-4(练习)所示的对话框。
图12-4(练习) One-Way ANOVA 对话框
2单击Options 按钮,打开选项对话框。选择Descriptive、 Homogeneity-of-variance、○
与Means plot 选项。如图12-5(练习)所示。选择之后点击Continue按钮返回到上一级对话框。
图12-5(练习) One-Way ANOVA:Options 对话框
3单击OK 按钮,提交运行。可以得到表12-5(练习)、表12-6(练习)、表12-7(练习)、○
与图12-6(练习)。
77
练习题解答:第二章 随机现象与基础概率
表12-5(练习) 方差分析中因变量的描述统计结果
Descriptives节假日一天看课外书时间95% Confidence Interval forMeanLower BoundUpper Bound1.4611.8041.1971.6441.0341.4241.3621.591N初一初二初三Total244151120515Mean1.6331.4211.2291.477Std. Deviation1.35941.39181.07861.3172Std. Error.0870.1133.0985.0580Minimum.0.0.0.0Maximum9.09.06.09.0 表12-5(练习)是方差分析中对于因变量的描述统计结果,三个年级(“初一”、“初二”和“初三”)初中生的样本数N,收入平均值Mean、标准差Sta.Deviation、标准误Std.Error、95%的置信区间、最小值和最大值。从表中数据结果可看出,515位初中生节假日平均一天看课外书的平均时间为1.477小时。
表12-6(练习) 方差齐次性检验结果
Test of Homogeneity of Variances节假日一天看课外书时间LeveneStatistic2.536df12df2512Sig..080 表12-6(练习)是方差齐性检验结果,这是对方差分析前提的检验。从表12-6(练习)中可以看出,F值(levene Statistic)为2.536,显著性水平为0.080,两个自由度分别为2和512。由于显著性水平大于0.05,可以认为不同年级下各总体的方差无显著性差异,所以可以接受分析变量在自变量的各个不同影响因素上的分布是等方差的假设,这样下面的方差分析的结果才是有意义的。
表12-7(练习)方差分析结果
ANOVA节假日一天看课外书时间Sum ofSquares13.774878.052891.826df2512514Mean Square6.8871.715F4.016Sig..019Between GroupsWithin GroupsTotal 表12-7(练习)是方差分析的结果,总变差是891.826,组间变差是13.774,组内变差
是878.052;组间自由度为2,组内自由度为512,总自由度为514;组间均方差为6.887,组内均方差为1.715;F值为4.016;显著性水平为0.019,小于0.05,可以认为不同年级的初中生节假日每天看课外书的时间有显著差异。
78
练习题解答:第二章 随机现象与基础概率
1.7 图12-6(练习) 均值分布图
图12-3(练习)是不同年级(“初一”、“初二”和“初三”)的初中生节假日平均一
天看课外书的平均时间的分布图,从图中可以明显看出初一学生每天读课外书的平均时间明显高于初二和初三学生。
练习题:
1.一学者研究了青年人的文化程度与社区参与的关系,获得下表13-4的数据, 为了进一步分析两者之间的关系,研究者引进了性别变量,获得表13-5的数据。
表13-4 文化程度与社区参与的关系
社区参与 高 中 低 合计
高 145 97 58 300
文化程度
低 78 80 102 260
合计 223 177 160 560
Mean of 节假日一天看课外书时间
1.61.51.41.31.2初一初二初三你的年级 第十三章 详析分析与偏相关
表13-5 控制性别后文化程度与社区参与的关系 社区参与 高 中 高 80 40 男
低 45 25 高 65 57 女
低 33 55 合计 223 177 79
练习题解答:第二章 随机现象与基础概率
低 合计 28 148 70 140 30 152 32 120 160 560 根据上面两表计算:
(1)根据表13-4计算青年人的受教育程度与社区参与的相关系数Gamma。 (2)计算表13-5各分表的Gamma值,并与表13-1的结果进行比较。 (3)计算偏相关系数。
(4)根据所得到的结果作出研究结论。 解:
(1)同序对:Ns=145×(80+102)+97×102=36284
异序对:Nd=78×(97+58)+80×58=16730
GNsNd36284167300.368
NsNd3628416730这一结果说明青年人文化程度越高,其社区参与程度越高,或者说,根据青年人的文化程度来预测社区参与程度时可以减少36.8%的误差。 (2)根据计算同序对与异序对的方法,可得:
男:同序对:Ns1=80×(25+70)+40×70=10400
异序对:Nd1=45×(40+28)+25×28=3760 G1Ns1Nd11040037600.469
Ns1Nd1104003760 女:同序对:Ns2=65×(55+32)+57×32=7479
异序对:Nd2=33×(57+30)+55×30=4521
G2Ns2Nd2747945210.247
Ns2Nd274794521与(1)的计算结果相比可知:
1在男性青年人中,依据文化程度来预测其社区参与程度可以减少○
47%的误差,在女性青
年人中,依据文化程度来预测其社区参与程度可以减少25%的误差。
2相比女性青年而言,男性青年的文化程度与其社区参与程度的相关性更强,也就是说,○
性别对青年人的社区参与程度是有影响的。 (3)通过计算可知:
Gp(N(NssNd)Nd)(Ns1Nd1)(Ns2Nd2)
(Ns1Nd1)(Ns2Nd2) (104003760)(74794521)0.367
(104003760)(74794521)(4)控制性别变量之后计算的偏相关系数与原相关系数相近,说明青年人的文化程度与其社区参与程度之间的关系可能是真实存在的。
80
练习题解答:第二章 随机现象与基础概率
2.某地15名13岁男童身高(x1,cm),体重(x2,kg)及肺活量(y,L)的实测数据文件如下表。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 x1 135.10 139.90 163.60 146.50 156.20 156.40 167.80 149.70 145.00 148.50 165.50 135.00 153.30 152.00 160.50 x2 32.00 30.40 46.20 33.50 37.10 35.50 41.50 31.00 33.00 37.20 49.50 27.60 41.00 32.00 47.20 y 1750 2000 2750 2500 2750 2000 2750 1500 2500 2250 3000 1250 2750 1750 2250 (1)试计算变量间的积矩相关系数。
(2)当体重(x2)被控制时,计算身高(x1)与肺活量(y)的偏相关系数,并
作假设检验(α=0.05)。
解: (1)
22= 2275,= 554.7,= 33750,= 346535.2,xxyxx1212= 21142.45,
y2= 79812500,
xx= 84946.2,xy= 5171300,xy= 1285400
1212根据积距系数的计算公式:
r可得:
nXY(X)(Y)n(X2)(X)2n(Y2)(Y)2
rx1x2=0.842 rx1y=0.691 rx2y=0.756
(2)○1偏相关系数rp(简写为rxy·1或rp)计算公式为:
81
练习题解答:第二章 随机现象与基础概率
rprxy(rx1)(ry1)1(rx1)21(ry1)2
将(1)所得相关系数结果代入rp公式可得:
rx1yx2=0.154
2假设检验: ○
研究假设H1:总体中的rx1y虚无假设H0:总体中的rx1yx2≠0 =0
x2由于样本中rp=0.154,n=15,k=1,那么,
由Frp2/df1(1rp)/df22rp2(nk2)1rp2
df1=1
df2=n-k-2
可得 :
df1=1
df2=n-k-2=12
F= 0.29
当显著性水平α=0.05时,从附录F分布中可以查到,df1=1,df2=12时的临界值 为F=4.75,检验统计值F=0.29<4.75,在接受域内,所以接受虚无假设,拒绝研究假设,即在0.05的显著性水平下,控制了体重后,身高与肺活量的相关关系在总体中不存在。
3.第十一章练习第1题新老员工对公司福利满意程度的研究中,研究人员认为新老员工对公司福利的满意度可能是通过文化程度影响的,也就是文化程度越高,对公司的福利要求越高,因而对公司的福利就越不满意,因此控制了文化程度之后分析新老员工对公司福利的满意度,发现偏相关系数λp=0.112,该相关系数是否达到了0.05的显著性水平?
解: 控制文化程度(高、低)之后新老员工满意度情况如下表所示:
满意 一般 不满意 合计
老员工 高 60 30 3 93
低 30 20 39 89
新员工 高 25 10 41 76
82
低 10 30 20 60
合计 125 90 103
318
练习题解答:第二章 随机现象与基础概率
下表可转化为:
满意 一般 不满意 合计 高 60 30 3 93 老员工 低 30 20 39 89 合计 90 50 42 182 高 25 10 41 76 新员工 低 10 30 20 60 合计 35 40 61 136
在控制文化程度时测量新老员工满意度的偏相关分析中涉及到的变量都是定类或定序
1
变量,根据详析分析的特点,可以通过计算每一个分表的结果来反映总体的情况。
先来计算老员工满意度的相关系数:
yxmmyMynMyMy6039900.10
18290新员工满意度的相关系数
yxynMy4130610.13
13661偏相关系数:
pn()1820.101360.130.112
iin182136下面来对这一结果进行检验。首先分别来计算每一个分表的值。
22=42.79,2新=22.06
老2总=64.85
自由度df=df总+df新=4
自由度为4,>18.465时,得到这一结果的概率小于0.001,所以可以判断此题中的偏相关系数达到了0.05的显著性水平。
24.根据武汉市初中生日常行为状况调查的数据(data9),运用SPSS分析初中生的学习成绩(目前在班级中的水平C2)与参加课外活动时间状况(C4)的关系。在0.05的显著性水平下,这种关系在总体中是否真实存在?控制年级(A3)因素之后,两者之间的关系是否还存在?
解:《武汉市初中生日常行为状况调查问卷》:
C2 你的成绩目前在本班大致属于 1
可参考李沛良.社会研究的统计应用.社会科学文献出版社.2002年版. P240-241
83
练习题解答:第二章 随机现象与基础概率
1)上等 2)中上等 3)中等 4)中下等 5)下等 C4 你有充足的时间进行自己喜欢的课外活动吗
1)非常充足 2)比较充足 3)一般 4)不太充足 5)很不充足 A3 你的年级
1)初一 2)初二 3)初三 (1)SPSS操作的步骤如下:
1点击Analyze→Correlate→Bivariate打开如图13-1(练习)所示的对话框。分别将“成○
2
绩目前在本班的大致层次(c2)”和“参加课外活动的时间状况(c4)”变量放在Variables框中。选择皮尔逊相关系数r和斯皮尔曼的rho系数。选择单尾检验。
图13-1(练习) Bivariate Correlations对话框
2单点OK按钮,提交运行,输出如表13-1(练习)和表13-2(练习)所示的结果。 ○
表13-1(练习) Person 相关结果
表13-2(练习) Spearman 相关结果
2
因为后面要计算偏相关系数,SPSS给出的偏相关系数的结果主要针对的是数值型变量的结果,为了统计结果的统一,这里也采用r系数进行计算,把定序变量看作定距变量。如果只是简单的进行相关计算,最好采用Gamma系数。
84
练习题解答:第二章 随机现象与基础概率
、
表13-1(练习)是皮尔逊相关系数的结果,从中可以看出,目前成绩(c2))和参加课外活动的时间(c4)情况的相关系数是0.092, P值为0.018,小于0.05,通过了显著性检验。从表13-2(练习)可以看出目前成绩和参加课外活动时间状况的Spearman系数是0.087,p值为0.024,小于0.05,因此可以得出结论,在0.05的显著性水平下,目前成绩和课外活动参加时间的关系在总体中可能也存在。
(2)控制年级(a3)变量计算“成绩目前在本班的大致层次(c2)”和“参加课外活动的 时间状况(C4)”的相关系数,SPSS的操作步骤如下:
○1依次点击Analyze→Correlate→Partial,打开如图13-3(练习)所示的对话框。将年
级(a3)放置在Controlling for栏中,将“成绩目前在本班的大致层次(c2)”和“参
加课外活动的时间状况(C4)”放置在Variables栏中,选择单尾检验(假定两变量呈正相关)。
图13-2(练习) Partial Correlation对话框 2点击OK按钮,输出如表13-3(练习)所示的结果。 ○
表13-3(练习) 相关测测量结果
从表13-3(练习)中可以看出,控制年级(a3)后“成绩目前在本班的大致层次(c2)”
85
练习题解答:第二章 随机现象与基础概率
和“参加课外活动的时间状况(c4)”的相关系数为0.085,P=0.026<0.05,偏相关系数也通过0.05的显著性检验,这说明目前成绩和参加课外活动时间的关系不受年级因素的影响。
5.根据武汉市初中生日常行为状况调查的数据(data9),运用SPSS分析母亲的文化程度(A8)与中学生是否独生子女(A4)之间的关系。在0.05的显著性水平下,这种关系在总体中是否真实存在?这种关系是否会受到初中生性别(A1)的影响?
解:《武汉市初中生日常行为状况调查问卷》:
A1 你的性别 1)女 2)男 A4 你是独生子女吗 1)是 2)不是
A8 父母受教育程度(此题需分别填写父母亲的情况,将适合的答案序号写在横线上)
父亲的受教育程度:___________ 母亲的受教育程度:___________ 1)初中及以下 2)高中,中专及职业学校 3)大专,本科 4)硕士、博士研究生及以上
(1)分析“母亲的文化程度(A8)”与“初中生是否独生子女(A4)”两个变量的相关关系的操作步骤如下:
1首先对是否独生子女变量取值作虚拟变量处理:1=独生子女,0=非独生子女。点○
击Analyze→Correlate→Bivariate打开如图13-3(练习)所示的对话框。分别将“母亲的文化程度(a82)”和“是否独生子女(a4)”变量放入Variables框中。选择皮尔逊相关系数r,选择单尾检验。
3
图13-3(练习) Correlate对话框
2单点OK,提交运行,SPSS输出如表13-4的结果。 ○
表13-4(练习) 相关分析结果
3
原理同第2题。
86
练习题解答:第二章 随机现象与基础概率
Correlations母亲的受教育程度1你是独生子女吗?.356**.000512511.356**1.000511525母亲的受教育程度你是独生子女吗?Pearson CorrelationSig. (1-tailed)NPearson CorrelationSig. (1-tailed)N**. Correlation is significant at the 0.01 level (1-tailed). 从表13-4(练习)的结果可以看出,相关系数是0.356,说明母亲的文化程度与是否是独生子女存在相关关系,母亲文化程度越高,孩子越可能是独生子女。P值为0.000,小于0.05,这说明调查样本中的相关关系,在总体中可能也存在。 (2)控制“性别(a1)”计算“母亲的文化程度(a82)”和“是否独生子女(a4)”的相关系数,SPSS的操作步骤如下:
○1依次点击Analyze→Correlate→Partial,打开如图13-3(练习)所示的对话框。
将“性别(a1)”放置在Controlling for栏中,将“母亲的文化程度(a82)”
和“是否独生子女(a4)”放置在Variables栏中,选择单尾检验(One-tailed)。
图13-5(练习) Partial Correlation对话框 2点击OK按钮,输出如表13-5(练习)所示的结果。 ○
表13-5(练习) 相关测量结果
Correlations你是独生子女吗?1.000.0.356.000508母亲的受教育程度.356.0005081.000.0Control Variables你的性别你是独生子女吗?母亲的受教育程度CorrelationSignificance (1-tailed)dfCorrelationSignificance (1-tailed)df 从表13-5(练习)中可以看出,控制“性别(a1)”后“母亲的文化程度(a82)”
87
练习题解答:第二章 随机现象与基础概率
和“是否独生子女(a4)”的偏相关系数为0.3560,与没有控制“性别(a1)”时,“母亲的文化程度(a82)”和“是否独生子女(a4)”的相关系数一样,因此可以认为,“母亲的文化程度(a82)”和“是否独生子女(a4)”的相关关系不会因孩子的性别而不同。
第十四章 多元回归分析
练习题:
1.为了研究某社区1500名居民的受教育年数(X)与收入(Y)的关系,随机抽取了20人进行调查,得到下表的结果。
个案编号 1 2 9 3 12 4 15 5 14 6 9 7 16 8 5 9 6 10 13 受教育年数(X) 10 收入(Y) 个案编号 1000 1000 1300 2000 1900 900 11 12 12 13 18 14 7 15 5 500 16 10 2100 600 17 20 18 11 800 1400 19 8 20 12 受教育年数(X) 19 收入(Y) 3200 1500 3000 800 1100 3500 1300 950 1100 根据统计结果, (1)画出散点图;
(2)X与Y之间是否呈直线关系?求出回归方程。 (3)计算X与Y的决定系数。
(4)在0.05的显著性水平下,作回归系数的显著性检验。
解:
(1)散点图:
40003000(2)从散点图可以看出,受教育年数与收入呈现出线性相关的关系; 根据上表数据计算可得:
收入20001000046810121416182022受教育年数 88
练习题解答:第二章 随机现象与基础概率
n20,X231,Y29950,XY415900,XY6918450,
X23045, (X)253361,Y259122500,(Y)2897002500
根据一元线性回归方程YabX回归直线的斜率b和截距a的计算公式可知:
(XX)(YY)n(XY)(X)(Y)185.64n(X)(X)(XX)
Yb(X)-646.66 aYbXb222n所以,回归方程是YabX=-646.66+185.64X
22(3)rnXY(X)(Y)n(X)(X)22n(Y)(Y)0.954
决定系数Rr20.910
(4)回归系数的检验:
研究假设H1:b0(即B0) 虚无假设H0:b0(即B0) 用F检验法:
r2/df1r2(n2) F22(1r)/df21rdf1=k=1
df2=n-k-1=20-1-1=18
其中,k表示自变量的个数,将 r20.910代入上式可得:F182
在0.05的显著性水平下,从F分布表可知df1=1,df2=18时。否定域是:F≥4.41。因为F=182在否定域内,所以可否定虚无假设,接受研究假设。研究结论是:在0.05的显著性水平下,该社区居民的受教育年数(X)与收入(Y)呈线性相关的,且教育年数每增加一年,收入增加185.64元。
2.子女的受教育水平(Y)往往受到父母的受教育水平(X1,X2)以及家庭经济条件(X3)的影响,我们对某单位10个人进行了调查,得到如下表格:
被调查者受教育年数(Y) 1 2
父亲受教育年数 母亲受教育年数 家庭经济条件 (X1) 9 8 89
(X2) 8 9 (X3) 中 中 15 12 练习题解答:第二章 随机现象与基础概率
3 4 5 6 7 8 9 10 15 19 9 10 9 14 16 18 12 15 7 8 6 9 10 14 11 12 5 8 7 9 12 12 上 上 中 下 中 下 中 上 根据数据统计:
(1)求出各X变量的回归系数,写出回归方程。 (2)计算X与Y的决定系数。
解:
(1)变量X3为定序变量,对其重新赋值:“上”=3,“中”=2,“下”=1。 计算各个变量之间的积距相关系数为:
ry1=0.920,ry2=0.886,ry3=0.600,r11=1,r12=r21=0.848,r13=r31=0.719,r23=r32=0.545
将之代入下列方程组:
ry1B1B2r21B3r31 ry2B1r12B2B3r32
ry3B1r13B2r23B3
计算可得:
B1=0.672, B2=0.360, B3=-0.079
根据上表计算可得:
Y=13.70,Sy=3.59;X1=9.80,S1=2.97;
X2=9.30,S2=2.41;X3=2.10,S3=0.74。
将之代入公式:
b1B1(SyS1)
b2B2(SyS2)
90
练习题解答:第二章 随机现象与基础概率
b3B3(SyS3)
aYb1X1b2X2b3X3
可得: a=1.54,b1=0.81, b2=0.54, b3=-0.38
(2)决定系数:
R2y123B1ry1B2ry2B3ry30.6720.920+0.3600.886-0.0790.600=0.88980.90
3.根据武汉市初中生日常行为状况调查的数据(data9),用SPSS分析初中生平时每天做作业时间(x1),看电视时间(x2),睡觉时间(x3)对其目前学习成绩的影响(目前成绩在班级中的大致水平y),并对结果进行解释。
解:《武汉市初中生日常行为状况调查问卷》: C2 你的成绩目前在本班大致属于
1)上等 2)中上等 3)中等 4)中下等 5)下等
C11 请你根据自己的实际情况,估算一天内在下面列出的日常课外活动上所花的时间
大约为(请填写具体时间,没有则填“0”) 平时(非节假日):
1)做作业_______小时 2)看电视_______小时 8)睡觉_______小时
“C2 你的成绩目前在本班大致属于?”这个题目的选项在data9中,“上等”赋值为“1”,“中上等”赋值为“2”,“中等”赋值为“3”,“中下等”赋值为“4”,“下等” 赋值为“5”,为了便于分析,通过Transform-Recode into Different Variables命令将“下等”赋值为“1”,“中下等”赋值为“2”,“中等”赋值为“3”,“中上等”赋值为“4”,“上等”赋值为“5”,生成新变量“成绩层次(cjcc)”。 SPSS的操作步骤如下:
1打开武汉市初中生日常行为状况调查的数据data9。 ○
2依次点击Analyze→Regression→Linear,打开如图14-1(练习)所示的对话框。 ○
91
练习题解答:第二章 随机现象与基础概率
图14-1(练习) Linear回归主对话框
3将自变量“做作业时间○
c11a1”、“看电视时间c11a2”和“睡觉时间c11a8”放在
Independent(s)框口,将因变量“成绩层次(cjcc)”放置在Dependent框中。Method栏中选择强制进入法Enter。
4点击按钮OK,SPSS依次输出下列结果。 ○
表14-1(练习) 纳入线性回归模型的变量
Variables Entered/RemovebdModel1VariablesEntered平时一天睡觉时间, 平时一天看电视时间, 平时一天做作业时a间VariablesRemovedMethod.Entera. All requested variables entered.b. Dependent Variable: 成绩层次 表14-2(练习) 模型概况
Model SummaryModel1R.143aR Square.020AdjustedR Square.015Std. Error ofthe Estimate1.05142a. Predictors: (Constant), 平时一天睡觉时间, 平时一天看电视时间, 平时一天做作业时间
92
练习题解答:第二章 随机现象与基础概率
表14-3(练习) 方差分析表
ANOVAbModel1Sum ofSquares9.629563.916573.545df1510511Mean Square9.6291.106F8.708Sig..003aRegressionResidualTotala. Predictors: (Constant), 平时一天看电视时间b. Dependent Variable: 成绩层次 表14-4(练习) 回归系数结果
aCoefficientsModel1(Constant)平时一天做作业时间平时一天看电视时间平时一天睡觉时间UnstandardizedCoefficientsBStd. Error2.921.260.032.031-.156.055.034.029StandardizedCoefficientsBeta.048-.129.055t11.2441.041-2.8581.183Sig..000.298.004.238a. Dependent Variable: 成绩层次 从表14-1(练习)可以看出,变量进入分析选择的是强制进入法(Enter),“做作业时间c11a1”、“看电视时间c11a2”和“睡觉时间c11a8”三个变量都进入了模型。表14-2(练习)显示的是模型概况。结果显示,相关系数为0.143,决定系数为0.02,调整后的决定系数为0.015,也就是说这三个变量可以解释学生成绩层次的1.5%,模型的拟合度不高。表14-3(练习)显示的是模型的方差检验结果。表14-4(练习)是回归系数的结果,可以看出,引进的三个自变量中对因变量成绩层次有影响的只有平时看电视的时间
(p=0.004<0.05),其他两个变量对成绩层次的影响不显著。因此,线性回归模型可表示为
y'=2.921-0.156x2或y'=-0.129x2。
4. 以下是对青年白领工作/家庭冲突(WFC)的影响因素进行多元线形回归分析的结果,请根据所学知识对其进行分析说明。
93
练习题解答:第二章 随机现象与基础概率
表1 模型概况 hModel SummaryChange StatisticsModel1234567R.485a.521bR Square.235.272.294.309.326.349.361Adjusted RSquare.232.265.285.297.312.332.341Std. Error ofthe Estimate.65358.63922.63067.62516.61876.60941.60543R SquareChange.235.036.022.015.017.023.011F Change72.03511.6327.3635.1025.8068.1104.026df11111111df2234233232231230229228Sig. F Change.000.001.007.025.017.005.046.542c.556d.571e.591f.601ga. Predictors: (Constant), 加班情况b. Predictors: (Constant), 加班情况, 文化程度c. Predictors: (Constant), 加班情况, 文化程度, 每天工作时间d. Predictors: (Constant), 加班情况, 文化程度, 每天工作时间, 性别(1=男)e. Predictors: (Constant), 加班情况, 文化程度,每天工作时间, 性别(1=男), 婚姻观f. Predictors: (Constant), 加班情况, 文化程度, 每天工作时间, 性别(1=男), 婚姻观, 单位支持g. Predictors: (Constant), 加班情况, 文化程度, 每天工作时间, 性别(1=男), 婚姻观, 单位支持, 工作自主性h. Dependent Variable: WFC 表2 回归系数表 Coefficients(a)
Model 7
(Constant) 加班情况 文化程度 每天工作时间 性别(1=男)* 婚姻观:孩子会影响工作 单位支持 工作自主性
-.202 .083
.061 .042
-.194 .112
-3.321 2.006
.001 .046
Unstandardized Coefficients
B 2.673 .147 -.109 .071 -.253 .123
Std. Error .467 .023 .029 .035 .084 .040
Standardized Coefficients
Beta .396 -.208 .123 -.166 .168
t 5.727 6.548 -3.810 2.063 -3.025 3.087
Sig. .000 .000 .000 .040 .003 .002
a Dependent Variable: 工作/家庭冲突 *参照对象:0=女
解:这两个表反映的是线性回归分析的结果。
表1是回归分析模型的概况,因为采用的是逐步回归的方法,所以出现了7个模型,每个模型对引进一个变量后模型的解释力等信息进行了说明。从表1下面的注解可以看出因变量为青年白领工作/家庭冲突(WFC),还可以看出每一个模型中自变量的个数。R Square Change反映了每引进一个自变量,模型解释力的变化情况,从这个表中可以看出,加班情况、文化程度、每天工作时间等7个变量可以解释青年白领工作/家庭冲突的34.1%(决定系数R Square 为0.361,调整后的决定系数为0.341)。
表2显示的是第7个模型中各自变量对因变量的影响情况,因为采用的是逐步回归的方
94
练习题解答:第二章 随机现象与基础概率
法,所以只把对因变量有影响的变量引进了模型(sig小于0.05)。从各自变量影响力的大小来看,加班对青年白领工作家庭冲突的影响最大(标准回归系数为0.396),表示每多加班一天工作/家庭冲突程度就可能会增加0.396。根据标准回归系数的大小可以看出各自变量影响力的大小。
再者,从各变量影响的方向来看,加班情况,每天工作时间和孩子会影响工作的婚姻观都会加大青年白领的工作/家庭冲突,而文化程度每提高一个等级,青年白领的工作/家庭冲突可以降低0.208,单位为青年白领的工作和家庭问题提供支持(比如请假方便程度,允许员工工作时适当处理家庭事务等)都会减轻青年白领的工作/家庭冲突。从性别角度来看,男性的工作/家庭冲突程度比女性要低0.166。
95
因篇幅问题不能全部显示,请点此查看更多更全内容