采用组距分组时,需要遵循什么原则

2020-11-18 05:56:14 字数 5885 阅读 3566

1楼:柒月黑瞳

采用组距分组时,需要遵循“不重不漏”的原则。“不重”是指一项数据只能分在其中的某一组,不能在其他组中重复出现;“不漏”是指组别能够穷尽,即在所分的全部组别中每项数据都能分在其中的某一组,不能遗漏。

为解决“不重”的问题,统计分组时习惯上规定“上组限不在内”,即当相邻两组的上下限重叠时,恰好等于某一组上限的变量值不算在本组内,而计算在下一组内。例如,在表的分组中,120这一数值不计算在“115-120”这一组内,而计算在“120-125”组中,其余类推。当然,对于离散变量,可以采用相邻两组组限间断的办法解决“不重”的问题。

如何确定“组距”和“组数”

2楼:禾鸟

1、组数和组距只能确定一个,没有限制,只要一个定了下来,另一个也就相应的可以按照书上的公式算出来。

组数(通常组数在5-12之间), 用组距去除最大值和最小值之差,求出组数,需要再确定一下组距是否合适, 以保证使数据不落在相邻两组的边界值上,造成统计的错误。

2、组距5至12都可以;组数为8。

(最大值-最小值)÷组距=组数所以,(99-60)÷5=七又五分之四(也就是八),所以组数是8。

最大值减最小值除以组距的商的范围一定要在5至12组之间。

扩展资料

组距分组的原则

采用组距分组时,需要遵循“不重不漏”的原则。“不重”是指一项数据只能分在其中的某一组,不能在其他组中重复出现;“不漏”是指组别能够穷尽,即在所分的全部组别中每项数据都能分在其中的某一组,不能遗漏。

为解决“不重”的问题,统计分组时习惯上规定“上组限不在内”,即当相邻两组的上下限重叠时,恰好等于某一组上限的变量值不算在本组内,而计算在下一组内。

组距不一定是整数,但通常情况下为了分组的方便而取整数。组数一定是整数。

3楼:嗳衲

这题是这样算出来的:

(最大值-最小值)÷组距=组数

(99-60)÷5=七又五分之四(也就是八) 所以它的组数是8那个组距是自己定的,那就要假设了,最大值减最小值除以组距的商的范围一定要在5至12组之间,这样就可以啦~~

这些都是书本上有的,只要你认真点去看看的话,就一定会的~~

4楼:北极雪

组距分组是将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。组距分组是数值型数据分组的基本形式。在组距分组中,各组之间的取值界限称为组限,一个组的最小值称为下限,最大值称为上限;上限与下限的差值称为组距;上限与下限值的平均数称为组中值,它是一组变量值的代表值。

5楼:匿名用户

1、先看极值(数据中最大值与最小值之差);

2、适当调整(有时不需要调整),便于分组;

3、分组:一般情况下分组在6~12组。

6楼:快乐方程式

(最大值-最小值)÷组距=组数

(99-60)÷5=七又五分之四(也就是八) 所以它的组数是8那个组距是自己定的,那就要假设了,最大值减最小值除以组距的商的范围一定要在5至12组之间

由于分组的目的之一是为了观察数据分布的特征,因此组数的多少应适中。 如组数太少,数据的分布就会过于集中,组数太多,数据的分布就会过于分散,这都不便于观察数据分布的特征和规律。组数的确定应以能够显示数据的分布特征和规律为目的。

组距是一个组的上限与下限的差,可根据全部数据的最大值和最小值及所分的组数来确定,即组距=(最大值-最小值)÷组数。 采用组距分组时,需要遵循“不重不漏”的原则。“不重”是指一项数据只能分在其中的某一组,不能在其他组中重复出现;“不漏”是指组别能够穷尽,即在所分的全部组别中每项数据都能分在其中的某一组,不能遗漏。

为解决“不重”的问题,统计分组时习惯上规定“上组限不在内”,即当相邻两组的上下限重叠时,恰好等于某一组上限的变量值不算在本组内,而计算在下一组内。根据分组整理成频数分布表。 所以统计关键是分组,然后数据整理就方便了。

什么是组距

7楼:我你李哥

这是我查到的,不知道能不能帮到你:

每组的最高数值与最低数值之间的距离。在分组整理统计量数时,组的大小可因系列内量数的全距及所要划分的组数的不同而有所不同。每一组的最小限度叫做下限,最大限度叫做上限。

下限和上限之间的距离, 即为组距。

什么是组距分组

组距分组是将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。组距分组是数值型数据分组的基本形式。

在组距分组中,各组之间的取值界限称为组限,一个组的最小值称为下限,最大值称为上限;上限与下限的差值称为组距;上限与下限值的平均数称为组中值,它是一组变量值的代表值。

组距分组的步骤

例如,某生产车间50名工人日加工零件数如下(单位:个)。试对数据进行组距分组。

117108

110112

137 122

131118

134114 124

125123

127120 129

117126

123128 139

122133

119124 107

133134

113115 117

126127

120139 130

122123

123128 122

118118

127124 125

108112

135121

采用组距分组需要经过以下几个步骤:

第一步:确定组数。一组数据分多少组合适呢?

一般与数据本身的特点及数据的多少有关。由于分组的目的之一是为了观察数据分布的特征,因此组数的多少应适中。如组数太少,数据的分布就会过于集中,组数太多,数据的分布就会过于分散,这都不便于观察数据分布的特征和规律。

组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,可以按sturges提出的经验公式来确定组数k:

其中n为数据的个数,对结果用四舍五入的办法取整数即为组数。例如,对前例的数据有:,即应分为7组。

当然,这只是一个经验公式,实际应用时,可根据数据的多少和特点及分析的要求,参考这一标准灵活确定组数。

第二步:确定各组的组距。组距是一个组的上限与下限的差,可根据全部数据的最大值和最小值及所分的组数来确定,即组距=(最大值-最小值)÷组数。

例如,对于前例的数据,最大值为139,最小值为107,则组距=(139-107)÷7=4.6。为便于计算,组距宜取5或10的倍数,而且第一组的下限应低于最小变量值,最后一组的上限应高于最大变量值,因此组距可取5。

第三步:根据分组整理成频数分布表。比如对上面的数据进行分组,可得到下面的频数分布表,见表:

某车间50名工作日加工零件数分组表

按零件数分组 频数(人) 频率(%)

105-110

110-115

115-120

120-125

125-130

130-135

135-140 358

1410

64 6

1016

2820

128合计 50 100

采用组距分组时,需要遵循“不重不漏”的原则。“不重”是指一项数据只能分在其中的某一组,不能在其他组中重复出现;“不漏”是指组别能够穷尽,即在所分的全部组别中每项数据都能分在其中的某一组,不能遗漏。

为解决“不重”的问题,统计分组时习惯上规定“上组限不在内”,即当相邻两组的上下限重叠时,恰好等于某一组上限的变量值不算在本组内,而计算在下一组内。例如,在表的分组中,120这一数值不计算在“115-120”这一组内,而计算在“120-125”组中,其余类推。当然,对于离散变量,可以采用相邻两组组限间断的办法解决“不重”的问题。

例如,可对上面的数据做如下的分组,如表:

某车间50名工人日加工零件数分组表

按零件数分组 频数(人) 频率(%)

105-109

110-114

115-119

120-124

125-129

130-134

135-139 358

1410

64 6

1016

2820

128合计 50 100

而对于连续变量,可以采取相邻两组组限重叠的方法,根据“上组限不在内”的规定解决不重的问题,也可以对一个组的上限值采用小数点的形式,小数点的位数根据所要求的精度具体确定。例如,对零件尺寸可以分组为10-11.99、12-13.

99、14-15.99,等等。

在组距分组中,如果全部数据中的最大值和最小值与其他数据相差悬殊,为避免出现空白组(即没有变量值的组)或个别极端值被漏掉,第一组和最后一组可以采取“××以下”及“××以上”这样的开口组。开口组通常以相邻组的组距作为其组距。例如,在上面的50个数据中,假定将最小值改为94,最大值改为160,采用上面的分组就会出现“空白组”,这时可采用“开口组”,如表:

某车间50名工人日加工零件数分组表

按零件数分组 频数(人) 频率(%)

110以下

110-115

115-120

120-125

125-130

130-135

135以上 358

1410

64 6

1016

2820

128合计 50 100

为了统计分析的需要,有时需要观察某一数值以下或某一数值以上的频数或频率之和,还可以计算出累积频数或累积频率。

数学中什么叫等距分组?

8楼:松茸人

组距分组是将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。组距分组是数值型数据分组的基本形式。离散变量的整数值如果变动幅度较大,而且总体单位数n又很大,则也要进行组距分组。

在组距分组中,各组之间的取值界限称为组限,一个组的最小值称为下限,最大值称为上限;上限与下限的差值称为组距;上限与下限值的平均数称为组中值,它是一组变量值的代表值。

组距分组是将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。组距分组是数值型数据分组的基本形式。

在组距分组中,各组之间的取值界限称为组限,一个组的最小值称为下限,最大值称为上限;上限与下限的差值称为组距;上限与下限值的平均数称为组中值,它是一组变量值的代表值。

把所有数据分成若干组,每个小组的两个端点之间的距离(组内数据的取值范围)称为组距。

1. 确定组数。一组数据的组数一般与数据本身的特点及数据的多少有关。

由于分组的目的之一是为了观察数据分布的特征,因此组数的多少应适中。如组数太少,数据的分布就会过于集中,组数太多,数据的分布就会过于分散,这都不便于观察数据分布的特征和规律。组数的确定应以能够显示数据的分布特征和规律为目的。

2.确定各组的组距。组距是一个组的上限与下限的差,可根据全部数据的最大值和最小值(即极差)及所分的组数来确定,即组距=(最大值-最小值)/组数。

3.根据分组整理成频数分布表。

采用组距分组时,需要遵循“不重不漏”的原则。“不重”是指一项数据只能分在其中的某一组,不能在其他组中重复出现;“不漏”是指组别能够穷尽,即在所分的全部组别中每项数据都能分在其中的某一组,不能遗漏。

为解决“不重”的问题,统计分组时习惯上规定“上组限不在内”,即当相邻两组的上下限重叠时,恰好等于某一组上限的变量值不算在本组内,而计算在下一组内。而对于连续变量,可以采取相邻两组组限重叠的方法,根据“上组限不在内”的规定解决不重的问题,也可以对一个组的上限值采用小数点的形式,小数点的位数根据所要求的精度具体确定。例如,对零件尺寸可以分组为10-11.

99、12-13.99、14-15.99,等等。

在组距分组中,如果全部数据中的最大值和最小值与其他数据相差悬殊,为避免出现空白组(即没有变量值的组)或个别极端值被漏掉,第一组和最后一组可以采取“××以下”及“××以上”这样的开口组。开口组通常以相邻组的组距作为其组距。为了统计分析的需要,有时需要观察某一数值以下或某一数值以上的频数或频率之和,还可以计算出累积频数或累积频率。

希望我能帮助你解疑释惑。