三校社会学论坛·中国网社会论坛's Archiver

cuihao 发表于 2005-9-29 20:31

做作业过程中想到的几个问题

我在做这次作业过程中,遇到了不少问题,查了一些书,仍然有些无法解决,想在这里向郭老师和大家请教:
1/ 郭老师到现在为止讲的几种技术都是基于迭代法求解的,各种算法中的二阶条件是否能够自动满足?如果不满足,那么用STATA软件是否可以回归之后按照回归的结果计算二阶条件?如何计算?因为假如二阶条件不被满足,迭代的结果就可能仅仅是驻点而不是最大值,换言之,两次迭代的结果可能大不相同。

2/ 关于四种计数回归的模型选择问题。作业的结果NB模型拟合的整体取值的概率是最接近观测的,但是残差平方和显示四种模型中NB模型最大,换言之,NB模型拟合出来的期望值和真实值相差最大。因此就提出关于模型选择的判断标准问题。是否就应该严格按照alpha和vuong检验来决定模型选择呢?除去残差的问题以外,在两个零膨胀模型中logit回归的对数似然值都极低,而且解释变量均极不显著,p-value大部分是1,但是vuong检验又都极为显著,这里好象是在同一个模型的两套数字在说着相反的故事。不知道这种情况下应该如何判断?

3/ 同样和模型选择相关,就是如果模型选择错误会出现什么后果?比如,不存在过离散的情况下使用了NB模型,那么估计的系数是否无偏呢?或者,不存在零膨胀的情况下,使用零膨胀模型会有什么后果?这些问题是否有结论性的推断,我在Long (1997)的书里面没有找到答案。

4/ 最后一个问题是有关技术上的,就是做了零膨胀模型后,能否将模型预测肯定为零和可能不为零的两个子集区分出来呢?因为作业给的数据是轻微过离散的,在确定使用零膨胀模型后,应该是仅仅对可能不为零的子集做poisson或者nb回归,因为均值是大于1的数,那么有可能是排除了肯定为零的子集后,可能不为零的子集并不存在过离散现象。我在STATA里找了一下,还没有找到关于这个问题的说明。

mgxzh2005 发表于 2005-9-30 01:15

关于模型选择的个人想法

我一直在想的问题和你模型选择的问题差不多。也就是,在看了四种预测结果与观测值的图形以后,尽管能够判断NB的结果最好。但是这个最好,在上课时,郭老师只是说前几个点(0,1,2)上的拟合最好。那么,我的问题是,就赁这几个点拟合得好,就说这个模型好吗?
为此,我又计算这四种方法的估计值与观测值的差。并用SUM描述了一下这种差异的均值、方差等。结果是,NB得到的离差均值和方差都是最小。从均值来看,NB的离差的均值仅为Poisson 和ZIP的七分之一,仅为ZNB的三分之一,标准差也仅为1/4倍、1/3倍和1/1.2倍。所以,从这一点来说,可以认为NB是比较好的拟合方法。

我想针对第三个问题,我尽管不是很确认,但是我认为,你可以试着将两个模型同时做,然后,再来比较这两者之间是否有显著的差异,如系数及SD。

对第四个问题,我想是可以的。在ZNB所列的结果表的第一个部分就是在做这件事情。根据这些系数可以重新计算得到预测值,并确定哪些是组~A的。

不知道是否正确。只是我自己的想法。呵呵。

另外,我想针对第一个问题,尽管已经超出了我们的范围,但这种迭代方法应该不只是一阶的。具体的在谢宇那本书后面有对最大似然估计方法的介绍。你可以看看这个吧。呵呵。

[[i] Last edited by mgxzh2005 on 2005-9-30 at 01:17 [/i]]

页: [1]

Powered by Discuz! Archiver 6.1.0  © 2001-2007 Comsenz Inc.