空间计量模型的一套完整写作路线：从权重矩阵到稳健性检验

type

Post

status

Published

date

Apr 30, 2026

slug

spatial-econometrics-notes-20260430

summary

根据 2026-04-30 课堂文字稿整理：空间计量模型不是多跑一个高级回归，而是一整套从空间权重矩阵、空间相关性检验、模型选择、效应分解到稳健性论证的研究设计链条。

这份录音讲的核心问题

这份文字稿的中心不是“空间计量模型怎么按命令跑出来”，而是一个更重要的问题：一篇使用空间计量方法的论文，怎样证明自己有必要使用空间模型，并且怎样让审稿人相信结果可靠。

如果只看最终回归表，空间计量似乎只是比传统计量模型多了几个空间项。但真正决定论文质量的，是回归表之前和之后的一整套论证链条：先构造空间权重矩阵，再证明空间相关性存在，再选择合适模型，最后做诊断、效应分解和稳健性检验。

1. 空间权重矩阵是模型的起点

空间计量模型和传统计量模型的根本差别，在于它承认地区之间并不是彼此孤立的。一个城市的收入、消费、创新、污染或产业结构，可能会影响周边城市，也可能受到周边城市影响。这个“周边”关系不能只停留在语言描述中，必须被转化为可计算的空间权重矩阵 W。

常见的权重矩阵有三类。

第一类是邻接矩阵。两个地区相邻则记为 1，不相邻则记为 0。它简单直观，适合捕捉地理接壤带来的扩散效应，但缺点也明显：相邻的长度、接触面积和实际联系强度都被压缩成了同一个 1。

第二类是地理距离矩阵。通常用两地距离的倒数或平方倒数表示影响强度，距离越近，权重越大；距离越远，权重越小。城市经纬度可以通过 Stata 或 GIS 软件换算为球面距离，因此这种方法在实证中很常用。

第三类是经济距离矩阵，或经济距离与地理距离的复合矩阵。它强调地区经济体量和经济差异也会影响空间联系。例如上海和普通城市即便距离相近，对周边的经济辐射能力也不会相同。经济距离可以用 GDP、人均 GDP、人力资本、物质资本等指标构造。

构造完矩阵后，还要做行标准化。原因是一个地区的空间影响通常会分摊给多个相邻地区。如果一个城市有三个邻居，不能简单让每个邻居都获得完整的 1，而应当将影响按权重分配出去。

2. 先证明空间相关性存在

空间模型不能为了“高级”而使用。使用空间计量模型的前提，是研究对象确实存在空间相关性。

全局空间相关性通常用 Moran's I 指数检验。它回答的是：样本整体上是否存在空间集聚或空间排斥。Moran's I 大于 0，通常表示正向空间相关，即高值地区周边也更可能是高值地区；小于 0，则可能表示负向空间相关或虹吸效应。

局部空间相关性则用于识别每个地区与周边地区之间的关系。课堂中提到的 LISA 图很适合在论文中呈现，因为它能把城市放入四类空间格局：高-高集聚、低-低集聚、高-低分异、低-高分异。相比直接列一张长表，图形表达更适合展示区域差异。

这一部分在论文中的功能很明确：告诉读者，空间相关性确实存在，所以不能只用传统 OLS 或普通面板模型。

3. 模型选择不能跳步

常见空间计量模型主要包括三类：空间滞后模型 SAR、空间误差模型 SEM、空间杜宾模型 SDM。

SAR 强调被解释变量本身存在空间滞后，即本地 Y 会受到邻近地区 Y 的影响。SEM 强调误差项存在空间相关，意味着一些未观测因素在空间上具有扩散性。SDM 则进一步加入解释变量的空间滞后项，既考虑邻近地区 Y 的影响，也考虑邻近地区 X 的影响。

模型选择的第一步通常是 LM 检验。课堂中把四个统计量概括为普通 LM 滞后检验、普通 LM 误差检验、稳健 LM 滞后检验、稳健 LM 误差检验。基本判断逻辑是：

两个普通 LM 都不显著，可考虑普通模型。

只有 LM 滞后显著，倾向 SAR。

只有 LM 误差显著，倾向 SEM。

两个普通 LM 都显著时，再看稳健 LM 检验。

四个统计量都显著时，通常才更有理由转向 SDM。

但这还不是终点。SDM 本身可能退化为 SAR 或 SEM，所以还需要进一步做 LR 检验或 Wald 检验。若无法拒绝相关约束，模型可能应退化；只有两个约束都被拒绝时，使用 SDM 才更稳妥。

这部分的启发是：论文不能只写“本文采用空间杜宾模型”。更严谨的写法应当交代模型选择依据，至少报告关键检验结果。

4. 面板数据还要处理效应设定

如果使用面板数据，还要判断个体效应、时间效应是否存在，以及应当采用固定效应还是随机效应。

个体效应和时间效应可以通过相应检验判断。若个体效应显著，就应在模型中控制地区不可观测异质性；若时间效应显著，就应控制共同时间冲击。随后还要做 Hausman 检验，用来判断固定效应还是随机效应更合适。课堂中特别强调，不能默认使用双固定效应而完全不给检验依据。

因此，一句“本文采用双固定效应空间杜宾模型”背后，实际上应当有一套完整的选择过程：空间相关性检验、LM 检验、LR/Wald 检验、效应存在性检验和 Hausman 检验。

5. 回归结果不能只看显著性

空间模型结果出来后，至少要看几类诊断指标。

第一，看空间系数。rho、lambda、theta 分别对应被解释变量空间滞后、误差项空间相关、解释变量空间滞后。它们的方向、大小和显著性，决定了空间效应是否存在以及如何解释。

第二，看残差是否仍有空间相关。如果模型已经充分吸收了空间效应，那么残差的 Moran's I 应当接近于零或不显著。若残差仍有显著空间相关，说明模型可能遗漏了某些具有空间属性的变量或机制。

第三，看传统诊断，包括异方差、多重共线性、拟合优度、对数似然值和 AIC/BIC 等信息准则。多个模型之间比较时，不能只看某一个系数显著，还要看整体模型质量。

6. 空间模型的解释重点是效应分解

传统回归通常直接解释系数：X 增加多少，Y 变化多少。但空间模型不同，因为 X 对 Y 的影响可以拆分为直接效应、间接效应和总效应。

直接效应是本地 X 对本地 Y 的影响。间接效应是邻近地区 X 对本地 Y 的影响，也就是空间溢出效应。总效应则是二者之和。

这意味着，空间计量论文真正值得展开的地方，往往不是“核心解释变量显著”，而是它是否存在跨地区溢出：一个城市的政策、收入、创新或污染变化，是否会影响周边地区。

7. 稳健性检验是说服审稿人的最后一层

课堂最后强调，模型跑通并不等于论文完成。要让结果更能经受审稿，需要设计稳健性检验。

空间计量中最典型的稳健性检验是更换空间权重矩阵。例如主回归使用地理距离矩阵，稳健性中改用经济距离矩阵或经济-地理复合矩阵。如果结果方向和显著性基本保持一致，说明结论不依赖某一种主观矩阵设定。

第二类是替换核心解释变量。若一个概念可以由多个指标度量，就应使用替代指标检验结论是否稳定。

第三类是子样本回归。可以按地区、时期或特殊事件进行切分，例如剔除疫情期间、区分东中西部、区分政策实施前后等。但子样本划分必须有研究问题支撑，不能为了稳健性而机械切分。

第四类是处理内生性。常见方法包括工具变量法和动态面板中的 GMM。工具变量要同时满足相关性和外生性，即既能解释核心解释变量，又不能直接影响被解释变量。

第五类是安慰剂检验。空间计量中的安慰剂检验可以通过随机打乱空间权重矩阵来完成。如果真实空间关系被打乱后，空间系数大多不再显著，而真实估计值位于随机分布尾部，就能更有力地说明结论来自真实空间联系，而不是历史数据中的偶然巧合。

一句话总结

这堂课最有价值的地方，是把空间计量模型还原成了一条完整的论文写作路线：不是先决定用 SDM，再去找结果，而是先证明空间关系存在，再通过检验选择模型，接着诊断模型质量，最后用效应分解和稳健性检验完成论证。

对写论文的人来说，空间计量真正提升文章层次的地方，不在于模型名字更复杂，而在于它能回答传统计量模型回答不了的问题：一个地区的变化，是否会通过空间联系影响另一个地区。

🧭空间计量模型的一套完整写作路线：从权重矩阵到稳健性检验