正态分布
正态曲线呈钟形,两头低,中间高,左右对称,曲线与横轴间的面积总和等于1. 服从正态分布的变量的频数分布由均值和标准差完全决定。均值是正态分布的位置参数,描述正态分布的集中趋势位置。正态分布以x = miu 为对称轴,左右完全对称,正态分布的均数,中位数,众数相同,均等于Miu.
xigema描述正态分布资料数据分布的离散程度,xigema 越大,数据分布越分散,xigema 越小,数据分布越集中。越大越扁平,越小越瘦高。标准正态分布就是均值为0, 标准差为1.
可信区间的确切含义: 总体参数是固定的,可信区间包含了总体参数的可能性是1-alafa,而不是总体参数落在CI 范围内的可能性为1-alafa。
对P = 0.05 的解释, 当P = 0.05时,拒绝H0时,我们是依据alafa 这一小概率来下结论的。而当P >0.05时,我们对两总体均数无差别这一结论无任何概率保证,因此不能贸然下无差别的结论。正确的说法是,按所取检验水准alafa,接受H1 的统计证据不足。
简述可信区间在假设检验问题中的作用
可信区间不仅能回答差别有无统计学意义,而且还能提示差别有无实际意义。可信区间只能在预先规定的概率即检验水准alafa 的前提下进行计算,而假设检验能够获得一较为确切的概率P值。故二者结合起来,才是对假设检验问题的完整分析。
假设检验中P 的含义: 指从H0 规定的总体随机抽得等于及大于(或等于及小于)现有样本获得的检验统计量值的概率。
I型和II型错误:I型为弃真,II型为存伪
检验效能:1-beta 为检验效能,它是指当两总体确有差别,按规定的检验水准alafa 所能发现该差异的能力。
检验水准: 是预先设定的,当假设检验结果拒绝H0, 接受H1, 下“有差别” 的结论是犯错误的概率成为检验水准, 记为alafa。
方差分析:
方差分析的应用条件:
1) 各样本是相互独立的随机样本,且来自正态分布总体。
2) 各样本的总体方差分析,即方差齐性。
不同设计资料的方差分析
1) 完全随机设计的单因素方差分析: 将受试对象完全随机地分配到各个处理组。设计因素中只考虑一个处理因素,目的是比较各组平均值之间的差别是否由处理因素造成。
2) 随机区组设计的两因素方差分析: 随机区组设计是将受试对象按自然属性(如实验动物的窝别,体重,病人的性别,年龄及病情等)相同或相近者组成单位组(区组),然后把每个组中的受试对象随机地分配给不同出理。设计中有两个因素,一个是处理因素,另一个是按自然属性形成的单位组。单位组的选择原则是“单位组间差别越大越好,单位组内差别越小越好”。
3 ) 多个样本均数的多重统计: 如果方差分析结果表明各组间有显著差别,则需进一步进行两两比较,也称均数间的多重比较,进行两两比较的方法主要有:
a. LSD-t 检验: 称为最小显著差异t 检验, 适用于k组中某一对或某几对在专业上有特殊意义的均数间差异的比较。 b. Dunnett-t 检验:它适用于k-1个试验组与一个对照组均数差别的多重比较。 c. SNK-q 检验:在方差分析结果拒绝H0时采用,适用于所有组均数的两两比较。
4) 当各组标准差相差较大(如1.5倍)时,需检验资料是否满足方差齐性的条件。 5) 变量变换 当资料不能满足方法分析的条件时,如果进行方差分析,可能造成错误的判断。因此对于明显偏离上述应用条件的资料,可以同过变量变换的方法来加以改善。常用的变量变换方法有: 1\) 对数变换:对数变换不仅可以将对数正态分布的数据正态化,还能使数据方差达到齐性,特别是各样本的标准差与均数成比例或变异系数接近于一个常数时。 2)平方根变换:常使用于服从Possion 分布的计数资料或轻度偏态的资料正态化,当各样本的方差与均数呈正相关时,可使资料达到方差齐性。 3) 倒数变换:常用于数据两端波动较大的资料,可使极端值的影响减小。 4)平方根反正弦变换:常用于服从二项分布的率或百分比资料。一般,当总体率较小(<30%\) 或较大(>70%\),同过平方根反正弦变换,可使资料接近正态,且达到方差齐性的要求。 5) 秩转换后,采用秩和检验比较组间差别。