1楼:吕秀才
spss做中介分析 直接在多元回归分析里面 有个 block 那个分层就可以了,将自变量一层一层的移入到那个对话框,就会一次性出来一个整合的**,而不应该你这样你一步一步地回归。
spss中回归分析结果解释,不懂怎么看
2楼:中子
首先来说明各个符号,b也就是beta,代表回归系数,标准化的回归系数代表自变量也就是**变量和因变量的相关,为什么要标准化,因为标准化的时候各个自变量以及因变量的单位才能统一,使结果更精确,减少因为单位不同而造成的误差。t值就是对回归系数的t检验的结果,绝对值越大,sig就越小,sig代表t检验的显著性,在统计学上,sig<0.05一般被认为是系数检验显著,显著的意思就是你的回归系数的绝对值显著大于0,表明自变量可以有效**因变量的变异,做出这个结论你有5%的可能会犯错误,即有95%的把握结论正确。
回归的检验首先看anova那个表,也就是f检验,那个表代表的是对你进行回归的所有自变量的回归系数的一个总体检验,如果sig<0.05,说明至少有一个自变量能够有效**因变量,这个在写数据分析结果时一般可以不报告
然后看系数表,看标准化的回归系数是否显著,每个自变量都有一个对应的回归系数以及显著性检验
最后看模型汇总那个表,r方叫做决定系数,他是自变量可以解释的变异量占因变量总变异量的比例,代表回归方程对因变量的解释程度,报告的时候报告调整后的r方,这个值是针对自变量的增多会不断增强**力的一个矫正(因为即使没什么用的自变量,只要多增几个,r方也会变大,调整后的r方是对较多自变量的惩罚),r可以不用管,标准化的情况下r也是自变量和因变量的相关
希望对您有用
3楼:匿名用户
看coeffuenthesig即可,
spss回归分析结果怎么得出回归结果
4楼:匿名用户
首先要f检验,如果f值右上角有*号,说明回归分析通过f检验,即说明这个回归分析有意义可以做。然后通常需要看以下几个指标:
r2代表回归方程模型拟合的好坏。同时vif值代表多重共线性,所有的vif值均需要小于10,相对严格的标准是小于5。
接着分析具体x对y的影响关系,在说明已经有影响关系的前提下,具体是正向或是负向影响关系,则是通过“非标准化系数”或者“标准化系数”进行判断。
5楼:匿名用户
如何报告回归分析的结果
回归分析的结果可以分为以下几部分:1)回归模型;2)回归系数;3)因变量和自变量的特征;4)自变量之间的关系。其中,1和2是必须详细报告的基本信息;而3和4则可以根据具体情况而详略各异的辅助信息。
以下分别讨论之。
如何描述回归模型和回归系数
先简单讲一下一元回归。一元回归,即只涉及一个自变量(如x)。这种模型在社会科学中既很少见(一个常见的例外是时间序列分析中以时间为自变量分析因变量的长期趋势),也很容易报告。
一般不需用**,只须写一句话(如“自变量x的b = ?,std = ?, beta = ?
”)或给一个公式(如“y = ? + ?b, where std = ?
, beta = ?”)就足够了。如果一项研究中有多个一元回归分析,那么就应该也可以用一个**来报告(参加?
),以便于读者对各模型之间作比较。
接下来专门讲多元回归。由于其涉及诸多参数,有的必须报告、有的酌情而定、有完全不必,为了便于说明,我按spss回归分析的输出结果(其它统计软件大同小异),做了一个如何报告回归模型和回归系数的一览表(表一)。如表所示,我将各种参数分成“必须报告”、“建议报告”、“一般不必”和“完全不必”四类。
我的分类标准来自于公认的假设检验所涉及的四个方面,即变量之间关系的显著性、强度、方向和形式(详见“解释变量关系时必须考虑的四个问题”一文)。也就是说,每个参数的取舍,应该而且可以由其是否提供了不重复的显著性(即sig)、强度(b或beta的值)、方向(b或beta的符号)和形式(自变量的转换)信息而定的。
表一、如何报告回归模型和回归系数之一览表
注释 spss结果出处 是否报告 如何报告
回归模型部分
r 因变量与所有自变量的复合相关系数 model summary表 完全不必
r square r的平方值 model summary表 一般不必
adjusted r square r平方的修正值 model summary表 必须报告 见表二
std error of the estimate 因变量**值的标准误差(注1) model summary表 建议报告 见表二
sum of squares 总离差 anova表 完全不必
df 自由度 anova表 完全不必
mean square 平均离差 anova表 完全不必
f 模型f值 anova表 一般不必
sig. f值的显著水平 anova表 必须报告 见表二
n 模型的个案数(注2) anova表 必须报告 见表二
回归系数部分
unstandardized coefficients (b) 非标准化系数 coefficients表 必须报告 见表二
unstandardized coefficients (std. error) b的标准误差 coefficients表 必须报告 见表二
standardized coefficients (beta) 标准化系数 coefficients表 必须报告 见表二
t = b / std. error coefficients表
sig. t值的显著水平 coefficients表 必须报告 见表二
95% confidence interval for b (lower bound) b的置信区间(下限) coefficients表(注3) 建议报告 见表二
95% confidence interval for b (upper bound) b的置信区间(上限) coefficients表(注3) 建议报告 见表二
注1:因变量**值的标准误差描述了该模型的精确度(precision),如表二中的因变量是当前年薪,其**误差为?,即如果用该模型(包括起薪、工龄和性别三个自变量)去**条件相同的企业中的员工年薪,则可以知道?。
这种信息无法从模型的其它参数(如r平方或其修正值、显著水平、各自变量的b或beta)中得知。
注2:如果因变量和所有自变量都没有缺省值,那么模型的个案数就等于样本数。但变量常有缺省值,这时模型的个案数就会小于样本数、有时两者相差很大(当然是个严重问题),所以一定要报告前者。
spss并不直接显示该信息,但很容易计算,等于 anova表中的total df + 1就是了。regressionstatistics
注3:b的置信区间,是用来检验b的显著水平的另一工具(如果上、下限之间包含了0,说明b在95%的水平上不显著),以弥补t检验及其sig值的不足。这是一个经典又有复杂的问题,叫做null hypothesis significance test (nhst),本文不做详谈。
有兴趣的读者可以参见有关网页(r. c. fraley; d.
j. denis)。spss不直接给出b的置信区间,需要在“statistics”一项中要求添加。
如右图所示,spss回归分析的输出结果中,内定只显示“estimates" 和"model fit"两项(即会产生表一中除了置信区间之外的其它各项参数)。建议加选“confidence intervals”。
现在用一个实例来演示如何报告回归分析结果。为了便于大家重复这个实例,我使用的数据是spss自带的world95.sav。
这是联合国教科文组织(或世界银行之类机构)发表的1995年全球109个国家或地区的“国情”数据,其中含有人口、地理、经济、社会、文化等26个指标。我以其中的birth_rt(每1000人的出生率)为因变量,gpd_car(人均国内生成总值)、urban(城市化,即人口中城市人口比例)、literacy(识字率、即人口中能阅读者比例)和calories(每天卡路里摄入量)等四项为自变量。按表一的原则,我将该回归分析的结果报告在表二中:
[**]如何报告回归分析的结果
限于篇幅和本文目的,我不对表二的各参数作解读。但想对表中的有关格式做些补充说明。
如何描述变量(包括因变量和自变量):我先给出每个变量的理论概念名(如必要,可以用英文)、然后在括号中注明其对应的spss变量名(这并非必须、而是为了便于大家对照手头的spss数据)和操作定义(很有必要、强烈推荐,从中读者可以看到变量是否做过转换、从而得知有关关系的形式、即线性还是非线性)。为何要如何详细地描述变量?
apa手册对如何制作各种定量分析结果的**或图形有一条“独立信息”的基本原则,即每个图表要包含基本信息、以致读者不需参照正文而能够独立读懂该图表。因此,简单地将spss输出结果黏贴过来,虽是最常见的做法、但是很坏的习惯。
是否需要报告常数(constant):一定要。常数对解读回归模型的实际社会意义,有十分重要的作用。
如本表中的常数 = 65.444,意即全球(74个国家或地区)的平均出生率(即在控制了四项自变量的影响之后)为千分之65.4,等等。
有一点须注意的是在spss的输出结果中,常数是放在第一行的。应该搬到其它自变量之后。
报告哪个回归系数(即标准化还是非标准化系数):这是最常见问题。以前曾有过“**派”和“解释派”之争,前者主张只要报告b就够了、而后者则认为只要报告beta就行了。
其实两者反映的是不同的信息,b不受因变量变异程度(variability)的影响、所以同一自变量在各回归模型中的b是可以比较的(很多理论假设需要检验的就是这一问题);而beta受因变量变异程度的影响而无法跨越本模型、但是却因其标准化而可以与同一模型中的其它beta相比(也有很多理论假设希望解决的是这个问题)。因此,apa手册建议同时报告两者(英文第五版pp. 160-161)。
小数点之后取几位:apa手册认为,一般的定量分析结果只须保留两位小数足够。对回归结果来说,beta、r2值、显著水平等标准化参数(即其取值均在0与1之间)取两位小数最合适。
b及其相关指标(标准误差、置信区间)是非标准化的(即取值可以是任意大或任意小),所以要酌情而定,根据变量的量表(scale,即取值范围)大小而多取、少取甚至不取小数点。一般而言,当自变量的量表大于因变量时,其b会取小值、所以需要多取一至数位小数;相反,自变量的量表小于因变量时,其b会取大值、所以可以少取甚至不取小数。在本例中,gdp和卡路里的量表都远大于出生率,所以它们的b值看上去很小(但不一定意味着影响小)。
因此,我就没有机械地只取两位小数。大家如果仔细看一下表二,就会发现我的“酌情”规则是“最后一位0之后取两位”,如-0.00042、0.
033、-0.034、-0.0041,这与apa手册的“取两位小数”原则的基本精神是一致的。
我们日常见到的问题,主要是保留过多的小数点,往往是是直接黏贴spss的结果(其内定是6位小数)而不加编辑而造成。
**内是否有横竖分割线:按apa的规定,除了**顶部、底部和列标题底部有三条横线外,其余一概不用。很多人简单照搬word**的内定线条,不做任何修饰。
审稿专家一看就知是“菜鸟”或懒汉所为。
p是什么东东?就是spss输出中的sig。p是所有统计学教科书中通用的符号,sig则只是spss的专用。前者更广为认知。
表三与表二的主要区别在于表二是横向的(每列为同一类参数)、而表三是纵向(每列为同一模型)。表二中横排的六类参数改成竖立的四行(其中的p值被星号代替、置信区间的上下限合在一行),以便读者做横向比较(这是所有定量分析结果的**制作的一个基本原则)。如果是英文报告,去掉中文后,表三会变得简洁明了很多。
如何报告变量特征和自变量关系
变量的操作定义(问卷原文)
取值范围(如0-100、0-1、0或1、1-5、1-7等等;好雪问的,如果数据做过对数、平方、开方、倒数等转换,就应该而且最适合在这里报告)
描述性统计值(均值、标准差、偏度skewness、峰度kurtosis等)
------------------------
关于spss回归结果分析
写**的这个回归结果怎么说明
解答:一看判定系数r方,本例中,r方=0.202,拟合优度很差.一般要在0.6以上为好.至少也在0.4以上.
二看系数估计量的sig值,其中,独董规模的sig=0.007,小于0.05,说明该变量对因变量有显著的影响.而总经理持股量则不显著.因为sig值大于0.05.
之所以,模型不好,是因为你忽略了重要的影响因素.
但如果你只关注这两个自变量对因变量的影响,那么,结论已经出来了.目的达到了,所以,也说得过去.
统计人刘得意
追答:可以的,若作自变量,就是虚拟变量模型。 只要有一个sig小于0.05,模型就可以说是有效的。
追问:像董事长是否兼任总经理,是则为1,否则为0,这样的数据能进行回归分析吗?从哪个值能看出这个模型是有效的?ps. r方好像是0.041吧?
追答:一般来说是这样的。线性相关时,才能做线性回归模型。
相关因素logistic回归分析结果怎么看
1楼 logistic回归与多重线性回归一样,在应用之前也是需要分析一下资料是否可以采用logistic回归模型。并不是说因变量是分类变量我就可以直接采用logistic回归,有些条件仍然是需要考虑的。 首要的条件应该是需要看一下自变量与因变量之间是什么样的一种关系。多重线性回归中,要求自变量与因变...
回归分析中为什么要有截距项,如何理解回归截距的实际意义
1楼 海盗的 因为是线性回归模型,有了截距项的话,才能完成模型方程以及作图。 例如 y 1 2x 那么截距项就是1 当x 0时,y 1 其中的含义再结合情况分析 如何理解回归截距的实际意义 2楼 匿名用户 在回归方程中,回归系数的意义比较明显,表示解释变量x每变动一单位,因变量y平均将变动的数量。 ...