选择检验统计量并说明其抽样分布是什么样的

2020-11-23 16:48:37 字数 5325 阅读 8585

1楼:爱我家菜菜

抽样分布:从已知的总体中以一定的样本容量进行随机抽样,由样本的统计数所对应的概率分布称为抽样分布。抽样分布是统计推断的理论基础。

如果从容量为n的有限总体抽样,若每次抽取容量为n的样本,那么一共可以得到n取n的组合个样本(所有可能的样本个数)。抽样所得到的每一个样本可以计算一个平均数,全部可能的样本都被抽取后可以得到许多平均数。如果将抽样所得到的所有可能的样本平均数集合起来便构成一个新的总体,平均数就成为这个新总体的变量。

由平均数构成的新总体的分布,称为平均数的抽样分布。随机样本的任何一种统计数都可以是一个变量,这种变量的分布称为统计数的抽样分布。

什么是统计检验?怎么选择统计检验方法?

2楼:匿名用户

统计检验亦称“假设检验”。根据抽样结果,在一定可靠性程度上对一个或多个总体分布的原假设作出拒绝还是不拒绝(予以接受)结论的程序。决定常取决于样本统计量的数值与所假设的总体参数是否有显著差异。

这时称差异显著性检验。检验的推理逻辑为具有概率性质的反证法。

选择显著性水平和否定域

有了与问题相关的抽样分布,我们便可以把所有可能的结果分成两类:一类是不大可能的结果;另一类人们预料这些结果很可能发生。既然如此,如果我们在一次实际抽样中得到的结果恰好属于第一类,我们就有理由对概率分布的前提假设产生怀疑。

在统计检验中,这些不大可能的结果称为否定域。如果这类结果真的发生了,我们将否定假设;反之就不否定假设。概率分布的具体形式是由假设决定的,假设肯定不止一个。

在统计检验中,通常把被检验的那个假设称为零假设(或称原假设,用符号h0表示),并用它和其他备择假设(用符号h1表示)相对比。

值得注意的是,假设只能被检验,从来不能加以证明。统计检验可以帮助我们否定一个假设,却不能帮助我们肯定一个假设。为了使检验更严格、更科学,还需要更多的东西。

首先,我们必须确定冒犯第一类和第二类错误的风险的程度;其次,要确定否定域是否要包含抽样分布的两端。

第一类错误是,零假设h0实际上是正确的,却被否定了。第二类错误则是,h0实际上是错的,却没有被否定。第二类错误是,零假设h0实际上是错误的,却没有被否定。

遗憾的是,不管我们如何选择否定域,都不可能完全避免第一类错误和第二类错误,也不可能同时把犯两类错误的危险压缩到最小。

对任何一个给定的检验而言,第一类错误的危险越小,第二类错误的概率就越大;反之亦然。一般来讲,不可能具体估计出第二类错误的概率值。第一类错误则不然,犯第一类错误的概率是否定域内各种结果的概率之和。

由于犯第一类错误的危险和犯第二类错误的危险呈相背趋向,所以统计检验时,我们必须事先在冒多大第一类错误的风险和多大第二类错误的风险之间作出权衡。被我们事先选定的可以犯第一类错误的概率,叫做检验的显著性水平(用α表示),它决定了否定域的大小。

如果抽样分布是连续的,否定域可以建立在想要建立的任何水平上,否定域的大小可以和显著性水平的要求一致起来(后面的正态检验就如此)。如果抽样分布是非连续的,就要用累计概率的方法找出一组构成否定域的结果。

即在已知概率分布表上,从两端可能性最小的概率开始向中心累计,直至概率之和略小于选定的显著性水平为止。在许多场合,我们能**偏差的方向,或只对一个方向的偏差感兴趣。每当方向能被**的时候,在同样显著性水平的条件下,单侧检验比双侧检验更合适。

因为否定域被集中到抽样分布更合适的一侧,可以得到一个比较大的尾端。这样做,可以在犯第一类错误的危险不变的情况下,减少了犯第二类错误的危险。

扩展资料

选择统计检验程序的方法时需考虑以下条件:

1、看总体分布是否已知。如果已知,看是不是正态分布。如果已知样本分布为常态分布就可以选择参数检验法,如果总体分布未知就用非参数检验法。

2、在参数检验中,如果总体分布为正态,总体方差已知,两样本独立或相关都可以采用z检验;如果总体方差未知,根据样本方差,采取不同的t检验。如果总体分布非正态,总体方差已知,根据样本独立或相关采取z’检验;如果总体方差未知,根据独立和相关采取不同的z‘检验。

3、根据题目考虑用单侧还是双侧检验。

4、在非参数检验中,按照两个样本相关和不相关、精度与容量等,可以采用符号检验、秩和检验等方法。

3楼:瀛洲烟雨

统计检验是将抽样结果和抽样分布相对照而作出判断的工作。统计检验是将抽样结果和抽样分布相对照而作出判断的工作。取得抽样结果,依据描述性统计的方法就足够了。

抽样分布则不然,它无法从资料中得到,非利用概率论不可。而不对待概括的总体和使用的抽样程序做某种必要的假设,这项工作将无法进行。

统计中经常会用到各种检验:

t检验有单样本t检验,配对t检验和两样本t检验。

单样本t检验:是用样本均数代表的未知总体均数和已知总体均数进行比较,来观察此组样本与总体的差异性。

配对t检验:是采用配对设计方法观察以下几种情形,1,两个同质受试对象分别接受两种不同的处理;2,同一受试对象接受两种不同的处理;3,同一受试对象处理前后。

u检验:t检验和就是统计量为t,u的假设检验,两者均是常见的假设检验方法。当样本含量n较大时,样本均数符合正态分布,故可用u检验进行分析。

当样本含量n小时,若观察值x符合正态分布,则用t检验(因此时样本均数符合t分布),当x为未知分布时应采用秩和检验。

f检验又叫方差齐性检验。在两样本t检验中要用到f检验。

从两研究总体中随机抽取样本,要对这两个样本进行比较的时候,首先要判断两总体方差是否相同,即方差齐性。若两总体方差相等,则直接用t检验,若不等,可采用t'检验或变量变换或秩和检验等方法。

其中要判断两总体方差是否相等,就可以用f检验。

简单的说就是 检验两个样本的 方差是否有显著性差异 这是选择何种t检验(等方差双样本检验,异方差双样本检验)的前提条件。

在t检验中,如果是比较大于小于之类的就用单侧检验,等于之类的问题就用双侧检验。

卡方检验

是对两个或两个以上率(构成比)进行比较的统计方法,在临床和医学实验中应用十分广泛,特别是临床科研中许多资料是记数资料,就需要用到卡方检验。

方差分析

用方差分析比较多个样本均数,可有效地控制第一类错误。方差分析(analysis of variance,anova)由英国统计学家r.a.

fisher首先提出,以f命名其统计量,故方差分析又称f检验。其目的是推断两组或多组资料的总体均数是否相同,检验两个或多个样本均数的差异是否有统计学意义。

4楼:匿名用户

通过样本统计量得出的差异判断总体参数之间是否存在差异.对于平均数的显著性检验,总体正态,总体方差已知时,用z检验.总体方差未知时用t检验,对于平均数差异的显著性检验,总体正态,总体方差已知时,用z检验.

总体方差未知时用t检验,但在总体方差非齐性,且样本独立,样本数不同时,用t'检验.对于非正态分布,且样本数大于30的用z'检验.对于样本方差与总体差异检验用卡方分布,对于两样本方差间的差异显著性用f检验.

对于多个统计量的差异检验如果满足方差分析条件的用方差分析.其它对于不满足参数检验的用非参检验.卡方检验一般都是处理实际观察频数与理论频数分布是否一致

5楼:匿名用户

统计检验的真核应该就是选取有代表性的样本,然后去节省人力、物力的前提下,去推断总体的一些性质、是否有差异的等。其余别的什么分布的,楼上回答的不错。其实重难点基础备考统计这部分写的很好。

注意是正态分布,而不是z分布。

6楼:匿名用户

你的问题太大了。。看书吧。。

关于“统计量”“抽样分布”和“x2分布、t分布、f分布”的关系~!

7楼:匿名用户

^以x^2分布为例子吧

x1,x2..xn都遵守n(0,1)的正态分布,则x1^2+x2^2+...遵守x^2(n)分布相当于形成了一个新统计量y=x1^2+x2^2+...

是新的统计量!

而t分布,f分布也都是新统计量的分布

只不过他们都是正态总体中的抽样x1,x2,x3...组成的函数就好象你知道x,y独立,且其分布你也知道,让你求x^2+y^2的分布一个道理,只不过抽样都是独立同分布而已

8楼:匿名用户

统计量是样本的函数,样本具有二重性,正是由于样本本身就可以看作一个随机变量,所以统计量可以看作是随机变量的函数,也就是说,统计量是个随机变量,随机变量的性质就可以出概率分布来描述。

如上所说的,这三大统计量可以对就出三大抽样分布。比如,你从标准正态总体中抽出简单随机样本x1,x2,x3……,构造卡方统计量x1^2+x2^2+x3^2……,这个统计量对应的分布就是卡方分布。

这三种分布是统计中最常用的三种分布,它们各自用的场合不同,卡方分布最常用的是拟合优度检验,而t分布是在小样本场合下的正态分布(大样本场合下可以用正态分布来近似),有时候在信息不足的情况下,只能用t分布,比如在整体方差不知的情况下,对总体均值的估计和检验通常要用t统计量,这里自由度要比方差已知情况上构造的正态统计量少了一个自由度(这是可以理解的,因为损失信息肯定要损失自由度的),而f分布多用于比例的估计和检验。

这三种分布是有联系的,在有时可以相互转换并且是等价的。比如在多元回归的显著性检验中,f检验和t检验在一元的情况下是等价的。

什么是抽样分布?样本统计量的分布与总体分布的关系是什么

9楼:匿名用户

所谓抽样分布,就是指样本统计量的分布。

所有的样本均值形成的分布就是

如何确定样本量

10楼:河传杨颖

具体确定样本量还有相应的统计学公式,不同的抽样方法对应不同的公式。

根据样本量计算公式,不难知道,样本量的大小不取决于总体的多少,而取决于:

(1) 研究对象的变化程度;

(2) 所要求或允许的误差大小(即精度要求);

(3) 要求推断的置信程度。

样本量n=cσ/p

p — 精度(precision),也称精确度,由审计师设定,代表样本与总体之间的可接受误差范围。在属性抽样中,精度以百分比表示,在变量抽样中,精度用一个数值表示。

精度值越大,样本量越小,总体误差值就越大;反之,精度值越小,样本量越大,总体误差值就越小,但增加了抽样工作量。

样本量是指总体中抽取的样本元素的总个数,应用于统计学、数学、物理学等学科。样本量大小是选择检验统计量的一个要素。由抽样分布理论可知,在大样本条件下,如果总体为正态分布,样本统计量服从正态分布;如果总体为非正态分布,样本统计量渐近服从正态分布。

合理确定样本容量的意义:

1.样本容量过大,会增加调查工作量,造**力、物力、财力、时间的浪费;

2.样本容量过小,则样本对总体缺乏足够的代表性,从而难以保证推算结果的精确度和可靠性;

3.样本容量确定的科学合理,一方面,可以在既定的调查费用下,使抽样误差尽可能小,以保证推算的精确度和可靠性;另一方面,可以在既定的精确度和可靠性下,使调查费用尽可能少,保证抽样推断的最大效果。