不好意思,用新软件就是问题多多。
上课时,老师让我们比较poisson D A2 A3 NI NW, exposure(E)和
poisson D A1 A2 A3 NI NW, exposure(E) noconstant
的不同,我后来又尝试了poisson D A1 A2 A3 NI NW, exposure(E)
程序会默认A3位参照类,输出的结果同样是差别截距
我想问问老师(抱歉,不知道怎么用Stata做对数线性模型),我们如果用Stata做对数线性模型时,是否也可以用上述方法避免计算差别截距呢?如果不行是因为发生率和发生比的定义不同吗?已经糊涂了,自己有点想不清楚,特此请教老师。 当用
poisson D A2 A3 NI NW, exposure(E)
Poisson regression Number of obs = 12
LR chi2(4) = 829.67
Prob > chi2 = 0.0000
Log likelihood = -38.06429 Pseudo R2 = 0.9160
而用
poisson D A1 A2 A3 NI NW, exposure(E) noconstant
Poisson regression Number of obs = 12
Wald chi2(5) = 15039.10
Log likelihood = -38.06429 Prob > chi2 = 0.0000
两个给出的指标是不一样的,为什么呢?
答
第一个问题:你最后试验的命令实际上是既要求将年龄组虚拟变量饱和纳入模型、又要求模型还得有截距。这在统计上是不可解的。至于仍能输出差距模型,是因为Stata与SPSS一样会自动地删除一个年龄组虚拟变量使之可解。如果你仔细一点便能看到Stata输出中会有排除一个自变量的提示。至于对数线性模型的问题已经出圈了,这不是本课程内容。并且我也还不会,我只是在5月份才开始试用Stata的。我只是听说,Stata做对数线性模型还是沿用我们教材上那种内部编码和系数解释。如果你急需做这种模型,请直接参看Stata手册或参考书。我已经为系资料室复印了好几本用Stata统计的参考书了。答
第二个问题:当然不一样。因为两个模型中的自变量数不一样多,所以整体检验的内容不同。你可以自己从似然比卡方的自由度上看出来。但是它们是等价的,也就是说计算到显著概率时就一样了。我这里说等价,就好比对一个简单回归来说,整体检验和自变量检验也是等价的,F值和t值虽然不同,但到了显著度结果上却是一样的。再谈第一个问题
其实在多数实际研究中,我们关心的并不是发生比或发生率,而的确是在关心差异,如性别差异、城乡差异。这时直接输出差异更省事。只有在我们主要关心绝对水平时,才设法直接输出绝对水平,否则我们就得通过与参照组水平的差异手工计算其他组的水平。
不过发生比(odds)与发生率(incidence rate or rate)在方法论层次上的确是不同的。严格地说发生比不涉及暴露和事件(代表一种时间上的转变)这种概念,比如性别比涉及的性别是先天的,后天不会有什么转变。但是生育、迁移、犯罪等却是事件。事件与暴露的比,并不是两类人数之比,它们的单位是不同的。所以,“比”只是个同单位的两个数之间的倍数,而率则将是速度这样的物理指标。所谓暴露,不过是一种时间单位。所以,率是可比性更强的概念。一般来说,除以暴露期代表着一种增加可比性的标准化统计控制。比如,如果在计算生育率时将男人也算在分母中并不是荒谬的概念,出生率就是这样的概念(严格地说,出生率不是研究生育的指标,而是研究人口发展的指标)。但是要比较生育水平时,对暴露就十分计较了,不仅男性要排除在外,女性的很大一部分也要排除在外。另外,用社会学的例子而言,我估计监狱里的犯人犯罪率可能很低,虽然他们有较强倾向犯罪,但他们并未暴露在犯罪环境中。
这些都是很深层次的方法论概念问题,必须要从简单的计算公式背后去仔细理解和品味。
另外,用一个新软件,总会出问题,不要着急。我假期备课时花的时间、走的弯路肯定比你多多了。我没有机会去听课,就靠自己看书摸索,其实也可以进步。
并且,越接近前沿,就越需要自己摸索。这是通向成功的必由之路。 非常感谢老师,您的解释能帮助我更好的理解Powers的那篇文献,注意到您回帖的时间了,望您注意休息。这学期听到新内容,就不自觉地会跟上学期学的联系起来,呵呵,自己手懒,没有去查资料,麻烦您了。
页:
[1]