🧭空间计量模型的一套完整写作路线:从权重矩阵到稳健性检验
type
Post
status
Published
date
Apr 30, 2026
slug
spatial-econometrics-notes-20260430
summary
根据 2026-04-30 课堂文字稿整理:空间计量模型不是多跑一个高级回归,而是一整套从空间权重矩阵、空间相关性检验、模型选择、效应分解到稳健性论证的研究设计链条。
tags
思考
复盘
category
知行合一
icon
🧭
password
地点
这份录音讲的核心问题
这份文字稿的中心不是“空间计量模型怎么按命令跑出来”,而是一个更重要的问题:一篇使用空间计量方法的论文,怎样证明自己有必要使用空间模型,并且怎样让审稿人相信结果可靠。
如果只看最终回归表,空间计量似乎只是比传统计量模型多了几个空间项。但真正决定论文质量的,是回归表之前和之后的一整套论证链条:先构造空间权重矩阵,再证明空间相关性存在,再选择合适模型,最后做诊断、效应分解和稳健性检验。
1. 空间权重矩阵是模型的起点
空间计量模型和传统计量模型的根本差别,在于它承认地区之间并不是彼此孤立的。一个城市的收入、消费、创新、污染或产业结构,可能会影响周边城市,也可能受到周边城市影响。这个“周边”关系不能只停留在语言描述中,必须被转化为可计算的空间权重矩阵 W。
常见的权重矩阵有三类。
第一类是邻接矩阵。两个地区相邻则记为 1,不相邻则记为 0。它简单直观,适合捕捉地理接壤带来的扩散效应,但缺点也明显:相邻的长度、接触面积和实际联系强度都被压缩成了同一个 1。
第二类是地理距离矩阵。通常用两地距离的倒数或平方倒数表示影响强度,距离越近,权重越大;距离越远,权重越小。城市经纬度可以通过 Stata 或 GIS 软件换算为球面距离,因此这种方法在实证中很常用。
第三类是经济距离矩阵,或经济距离与地理距离的复合矩阵。它强调地区经济体量和经济差异也会影响空间联系。例如上海和普通城市即便距离相近,对周边的经济辐射能力也不会相同。经济距离可以用 GDP、人均 GDP、人力资本、物质资本等指标构造。
构造完矩阵后,还要做行标准化。原因是一个地区的空间影响通常会分摊给多个相邻地区。如果一个城市有三个邻居,不能简单让每个邻居都获得完整的 1,而应当将影响按权重分配出去。
2. 先证明空间相关性存在
空间模型不能为了“高级”而使用。使用空间计量模型的前提,是研究对象确实存在空间相关性。
全局空间相关性通常用 Moran's I 指数检验。它回答的是:样本整体上是否存在空间集聚或空间排斥。Moran's I 大于 0,通常表示正向空间相关,即高值地区周边也更可能是高值地区;小于 0,则可能表示负向空间相关或虹吸效应。
局部空间相关性则用于识别每个地区与周边地区之间的关系。课堂中提到的 LISA 图很适合在论文中呈现,因为它能把城市放入四类空间格局:高-高集聚、低-低集聚、高-低分异、低-高分异。相比直接列一张长表,图形表达更适合展示区域差异。
这一部分在论文中的功能很明确:告诉读者,空间相关性确实存在,所以不能只用传统 OLS 或普通面板模型。
3. 模型选择不能跳步
常见空间计量模型主要包括三类:空间滞后模型 SAR、空间误差模型 SEM、空间杜宾模型 SDM。
SAR 强调被解释变量本身存在空间滞后,即本地 Y 会受到邻近地区 Y 的影响。SEM 强调误差项存在空间相关,意味着一些未观测因素在空间上具有扩散性。SDM 则进一步加入解释变量的空间滞后项,既考虑邻近地区 Y 的影响,也考虑邻近地区 X 的影响。
模型选择的第一步通常是 LM 检验。课堂中把四个统计量概括为普通 LM 滞后检验、普通 LM 误差检验、稳健 LM 滞后检验、稳健 LM 误差检验。基本判断逻辑是:
- 两个普通 LM 都不显著,可考虑普通模型。
- 只有 LM 滞后显著,倾向 SAR。
- 只有 LM 误差显著,倾向 SEM。
- 两个普通 LM 都显著时,再看稳健 LM 检验。
- 四个统计量都显著时,通常才更有理由转向 SDM。
但这还不是终点。SDM 本身可能退化为 SAR 或 SEM,所以还需要进一步做 LR 检验或 Wald 检验。若无法拒绝相关约束,模型可能应退化;只有两个约束都被拒绝时,使用 SDM 才更稳妥。
这部分的启发是:论文不能只写“本文采用空间杜宾模型”。更严谨的写法应当交代模型选择依据,至少报告关键检验结果。
4. 面板数据还要处理效应设定
如果使用面板数据,还要判断个体效应、时间效应是否存在,以及应当采用固定效应还是随机效应。
个体效应和时间效应可以通过相应检验判断。若个体效应显著,就应在模型中控制地区不可观测异质性;若时间效应显著,就应控制共同时间冲击。随后还要做 Hausman 检验,用来判断固定效应还是随机效应更合适。课堂中特别强调,不能默认使用双固定效应而完全不给检验依据。
因此,一句“本文采用双固定效应空间杜宾模型”背后,实际上应当有一套完整的选择过程:空间相关性检验、LM 检验、LR/Wald 检验、效应存在性检验和 Hausman 检验。
5. 回归结果不能只看显著性
空间模型结果出来后,至少要看几类诊断指标。
第一,看空间系数。rho、lambda、theta 分别对应被解释变量空间滞后、误差项空间相关、解释变量空间滞后。它们的方向、大小和显著性,决定了空间效应是否存在以及如何解释。
第二,看残差是否仍有空间相关。如果模型已经充分吸收了空间效应,那么残差的 Moran's I 应当接近于零或不显著。若残差仍有显著空间相关,说明模型可能遗漏了某些具有空间属性的变量或机制。
第三,看传统诊断,包括异方差、多重共线性、拟合优度、对数似然值和 AIC/BIC 等信息准则。多个模型之间比较时,不能只看某一个系数显著,还要看整体模型质量。
6. 空间模型的解释重点是效应分解
传统回归通常直接解释系数:X 增加多少,Y 变化多少。但空间模型不同,因为 X 对 Y 的影响可以拆分为直接效应、间接效应和总效应。
直接效应是本地 X 对本地 Y 的影响。间接效应是邻近地区 X 对本地 Y 的影响,也就是空间溢出效应。总效应则是二者之和。
这意味着,空间计量论文真正值得展开的地方,往往不是“核心解释变量显著”,而是它是否存在跨地区溢出:一个城市的政策、收入、创新或污染变化,是否会影响周边地区。
7. 稳健性检验是说服审稿人的最后一层
课堂最后强调,模型跑通并不等于论文完成。要让结果更能经受审稿,需要设计稳健性检验。
空间计量中最典型的稳健性检验是更换空间权重矩阵。例如主回归使用地理距离矩阵,稳健性中改用经济距离矩阵或经济-地理复合矩阵。如果结果方向和显著性基本保持一致,说明结论不依赖某一种主观矩阵设定。
第二类是替换核心解释变量。若一个概念可以由多个指标度量,就应使用替代指标检验结论是否稳定。
第三类是子样本回归。可以按地区、时期或特殊事件进行切分,例如剔除疫情期间、区分东中西部、区分政策实施前后等。但子样本划分必须有研究问题支撑,不能为了稳健性而机械切分。
第四类是处理内生性。常见方法包括工具变量法和动态面板中的 GMM。工具变量要同时满足相关性和外生性,即既能解释核心解释变量,又不能直接影响被解释变量。
第五类是安慰剂检验。空间计量中的安慰剂检验可以通过随机打乱空间权重矩阵来完成。如果真实空间关系被打乱后,空间系数大多不再显著,而真实估计值位于随机分布尾部,就能更有力地说明结论来自真实空间联系,而不是历史数据中的偶然巧合。
一句话总结
这堂课最有价值的地方,是把空间计量模型还原成了一条完整的论文写作路线:不是先决定用 SDM,再去找结果,而是先证明空间关系存在,再通过检验选择模型,接着诊断模型质量,最后用效应分解和稳健性检验完成论证。
对写论文的人来说,空间计量真正提升文章层次的地方,不在于模型名字更复杂,而在于它能回答传统计量模型回答不了的问题:一个地区的变化,是否会通过空间联系影响另一个地区。
Loading...