1楼:匿名用户
数据分布的特征可以从三个方面进行测度和描述
: 一是:分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度; 二是:分布的离散程度,反映各数据远离其中心值的趋势; 三是:分布的形状,反映数据分布的偏态和峰态。
描述一组偏态分布资料的变异度,以什么指标较好
2楼:莫彷徨
描述一组偏态分布资料的变异度,以四分位数间距指标较好
四分位数间距:由p25、p50、p75将一组变量值等分为四部分,p25称下四分位数,p75称上四分位数,将p75与p25之差定义为四分位数间距。是上四分位数与下四分位数之差,用四分位数间距可反映变异程度的大小.
即:q3 --q1
频数分布表可以表示一组数据的什么?
3楼:匿名用户
统计描述是用统计指标、统计图或统计表描述资料的分布规律及其数量特征。
频数表是统计描述中经常使用的基本工具之一。
1.频数表(frequency table)的编制
在观察值个数较多时,为了解一组同质观察值的分布规律和便于指标的计算,可编制频数分布表,简称频数表。
(1)求全距(range):找出观察值中的最大值与最小值,其差值即为全距(或极差),用r表示。
(2)确定组段和组距:根据样本含量的大小确定“组段”数,一般设8-15个组段,观察单位较少时组段数可相对少些,观察单位较多时组段数可相对多些,常用全距的1/10取整做组距,以便于汇总和计算。第一组段应包括全部观察值中的最小值,最末组段应包括全部观察值中的最大值,并且同时写出其下限与上限。
各组段的起点和终点分别称为下限和上限,某组段包含下限,但不包含上限,其组中值为该组段的(下限+上限)/2。相邻两组段的下限之差称为组距。
(3)列表划记:确定组段界限,列成表2.1的形式,采用计算机或用划记法将原始数据汇总,得出各组段的观察例数,即频数,表中的第(1)、(3)栏即所需的频数表。
频数表2.频数分布的特征
由频数表可看出频数分布的两个重要特征:集中趋势(central tendency)和离散程度(dispersion)。身高有高有矮,但多数人身高集中在中间部分组段,以中等身高居多,此为集中趋势;由中等身高到较矮或较高的频数分布逐渐减少,反映了离散程度。
对于数值变量资料,可从集中趋势和离散程度两个侧面去分析其规律性。
3.频数分布的类型
频数分布有对称分布和偏态分布之分。对称分布是指多数频数集中在**位置,两端的频数分布大致对称。偏态分布是指频数分布不对称,集中位置偏向一侧,若集中位置偏向数值小的一侧,称为正偏态分布;集中位置偏向数值大的一侧,称为负偏态分布,如冠心病、大多数恶性肿瘤等慢性病患者的年龄分布为负偏态分布。
临床上正偏态分布资料较多见。不同的分布类型应选用不同的统计分析方法。
4.频数表的用途
可以揭示资料分布类型和分布特征,以便选取适当的统计方法;便于进一步计算指标和统计处理;便于发现某些特大或特小的可疑值。
4楼:匿名用户
一组数据中某数据或某数据段内数据的出现频率
正态分布的变量用哪些描述统计量描述
5楼:匿名用户
(一)正态分布
1.正态分布
若 的密度函数(频率曲线)为正态函数(曲线)
(3-1)
则称 服从正态分布,记号 ~ 。其中 、 是两个不确定常数,是正态分布的参数,不同的 、不同的 对应不同的正态分布。
正态曲线呈钟型,两头低,中间高,左右对称,曲线与横轴间的面积总等于1。
2.正态分布的特征
服从正态分布的变量的频数分布由 、 完全决定。
(1) 是正态分布的位置参数,描述正态分布的集中趋势位置。正态分布以 为对称轴,左右完全对称。正态分布的均数、中位数、众数相同,均等于 。
(2) 描述正态分布资料数据分布的离散程度, 越大,数据分布越分散, 越小,数据分布越集中。 也称为是正态分布的形状参数, 越大,曲线越扁平,反之, 越小,曲线越瘦高。
(二)标准正态分布
1.标准正态分布是一种特殊的正态分布,标准正态分布的μ和σ2为0和1,通常用 (或z)表示服从标准正态分布的变量,记为 z~n(0,1)。
2.标准化变换:此变换有特性:若原分布服从正态分布 ,则z=(x-μ)/σ ~ n(0,1) 就服从标准正态分布,通过查标准正态分布表就可以直接计算出原正态分布的概率值。
故该变换被称为标准化变换。
3. 标准正态分布表
标准正态分布表中列出了标准正态曲线下从-∞到x(当前值)范围内的面积比例 。
偏态分布资料的中位数能做meta分析吗
6楼:匿名用户
只能描述性分析吗?作meta分析,比较难,
可能用stata可以.中位数和四分位数是用来描述分布未知或不满足正态分布的数据的集中趋势和离散趋势的,对于这种数据除了进行统计描述外,也可以进行统计推断.
只是采用什么方法需要根据数据分布特征来决定.通过绘制频数分布图、pp图或进行正态性检验可以分析数据的分布特征.
如果数据分布满足正态性,就可以通过t检验(两组比较)或方差分析(多组比较)进行比较,如果数据不满足正态性,就可以采用秩和检验的方法进行比较.
当然,也可以将原始数据通过变量变换后,再采用t检验和方差分析的方法进行比较.以上的分析可以借助stata、spss、sas等统计软件实现.
具体方法在医学统计论坛版上有许多的讨论,也可以去看看统计学教材.meta分析不是所有的都可以合并.
如何生成偏态分布数据
7楼:
偏度系数和峰度系数是描述统计数据分布偏斜和陡峭程度的统计量。
我也只有一点信息,参考的是何晓群编著的《实用回归分析》第3页。
计量资料中常用的集中趋势指标及适用条件各是什么?
8楼:匿名用户
描述集中趋势的常用指标有算术平均值、几何平均值和中位数。
算术平均值,简称平均值,反映一组观测值在数量上的平均水平,适用于对称分布,尤其是正态分布数据。
几何平均数,用g表示,也称为多重平均数,反映了变量值平均增减的倍数。适用于轴测数据和对数正态分布数据。
中位数,以m表示,是一组观测按大小排列后中间的观测值。它可以用于任何分布类型的数据,但主要用于倾斜分布数据、未知分布数据或开放数据。
9楼:匿名用户
常用的描述集中趋势的指标有:算术均数、几何均数及中位数。
①算术均数,简称均数,反映一组观察值在数量上的平均水平,适用于对称分布,尤其是正态分布资料;
②几何均数:用g表示,也称倍数均数,反映变量值平均增减的倍数,适用于等比资料,对数正态分布资料;
③中位数:用m表示,中位数是一组观察值按大小顺序排列后,位置居中的那个观察值。它可用于任何分布类型的资料,但主要应用于偏态分布资料、分布不明资料或开口资料。
用什么描述正态分布计量资料的分布特征
10楼:苗红燕
一 正态分布的概念
1定义如果随机变量x的概率密度函数有如下形式:
则称x服从参数为μ,σ2的正态分布。
记作x~n(μ,σ2)。
当 时,正态分布称为标准正态分布,记为 ,它的密度函数用 表示,分布函数用 表示。
2 正态分布的密度函数图像
我们把正态分布的密度函数图像叫做正态曲线。
由于密度函数总是大于0的,所以密度函数的函数图像位于x轴的上方。而且由正态分布的表达式,可以发现,它的函数图像关于 对称,它的函数图像是对称的钟形曲线。因为p(x)的最大值为 ,所以正态曲线的最高点的纵坐标为 ;
(注:根据连续型随机变量密度函数的定义,钟形曲线下的面积为1。)
3参数的意义
正态分布 中,含有两个参数 与 。其中 为正态分布的均值,它是正态分布的中心,表明质量特性x在u附近取值的机会最大; 是正态分布的方差, 是正态分布的标准差。 愈大,分布愈分散,曲线低而平坦; 愈小,分布愈集中,曲线高而陡。
固定标准差 ,对不同的均值,如 ,对应的正态曲线的形状完全相同,仅位置不同。
固定均值 ,不同的标准差,如 ,对应的正态曲线的位置相同,但形状(高低与胖瘦)不同。
4正态分布的应用
正态分布是概率论中最重要的分布,在应用及理论研究中占有头等重要的地位,它与二项分布是概率论中最重要的两种分布。正态分布的重要性是多方面的,主要有以下几点:
1 许多分布可用正态分布来近似。正态分布正是法国数学家德莫佛为了近似二项分布,于1733年首先引进的,1812年拉普拉斯改进了德莫佛的结果。后来,其他一些人推广了这一结果,现已包含在概率论著名的中心极限定理中。
根据这个定理,许多独立、任意分布的随机变量之和具有近似正态分布。因此,在实际中遇到的许多随机现象都服从或近似地服从正态分布。
2 由正态分布可以导出其它许多重要分布。例如,在数理统计的理论和应用中占极重要地位的2-分布、t-分布和f-分布,都是正态随机变量函数的分布。
3 正态分布具有各种良好的性质。在概率论与数理统计的研究和应用中,每当涉及正态分布时,一般都可以得到完满而简单的结果。
同一组数据两种方法计算出来的结果怎么用统计学方法
11楼:匿名用户
统计学方法的正确抉择
一.统计方法抉择的条件