pysal.model.spreg.GM_Lag¶

class pysal.model.spreg.GM_Lag(y, x, yend=None, q=None, w=None, w_lags=1, lag_q=True, robust=None, gwk=None, sig2n_k=False, spat_diag=False, vm=False, name_y=None, name_x=None, name_yend=None, name_q=None, name_w=None, name_gwk=None, name_ds=None)[源代码]¶

空间两阶段最小二乘法（s2sls），结果和诊断；Anselin（1988年）【Anselin1988年】_

参数:

参数:	y : 数组因变量nx1数组 x : 数组二维数组，n行，每个独立（外生）变量一列，不包括常量 yend : 数组二维数组，n行，每个内生变量一列 q : 数组二维数组，n行，每个外部外部变量一列，用作仪器（注意：这不应包含x中的任何变量）；不能与h组合使用 w : Pysal W对象空间权重对象 w_lags : 整数 w的阶数作为空间滞后相关变量的工具。例如，w_lags=1，则仪器为wx；如果w_lags=2，则为wx、w wx；依此类推。 lag_q : 布尔如果为真，则包括附加仪器的空间滞后（q）。 robust : 一串如果“白色”，则给出方差协方差矩阵的白色一致估计。如果“hac”，则给出方差协方差矩阵的hac一致估计。默认设置为无。 gwk : Pysal W对象 HAC估计所需的内核空间权重。注：矩阵必须沿着主对角线。 sig2n_k : 布尔如果为真，则使用n-k估计Sigma^2。如果为假，则使用n。 spat_diag : 布尔如果为真，则计算Anselin-Kelejian检验 vm : 布尔如果为真，则在汇总结果中包含方差-协方差矩阵 name_y : 一串输出中使用的从属变量的名称 name_x : 字符串表输出中使用的自变量的名称 name_yend : 字符串表输出中使用的内生变量的名称 name_q : 字符串表输出用仪器名称 name_w : 一串输出中使用的权重矩阵的名称 name_gwk : 一串用于输出的内核权重矩阵的名称 name_ds : 一串用于输出的数据集名称

y : 数组: 因变量nx1数组
x : 数组: 二维数组，n行，每个独立（外生）变量一列，不包括常量
yend : 数组: 二维数组，n行，每个内生变量一列
q : 数组: 二维数组，n行，每个外部外部变量一列，用作仪器（注意：这不应包含x中的任何变量）；不能与h组合使用
w : Pysal W对象: 空间权重对象
w_lags : 整数: w的阶数作为空间滞后相关变量的工具。例如，w_lags=1，则仪器为wx；如果w_lags=2，则为wx、w wx；依此类推。
lag_q : 布尔: 如果为真，则包括附加仪器的空间滞后（q）。
robust : 一串: 如果“白色”，则给出方差协方差矩阵的白色一致估计。如果“hac”，则给出方差协方差矩阵的hac一致估计。默认设置为无。
gwk : Pysal W对象: HAC估计所需的内核空间权重。注：矩阵必须沿着主对角线。
sig2n_k : 布尔: 如果为真，则使用n-k估计Sigma^2。如果为假，则使用n。
spat_diag : 布尔: 如果为真，则计算Anselin-Kelejian检验
vm : 布尔: 如果为真，则在汇总结果中包含方差-协方差矩阵
name_y : 一串: 输出中使用的从属变量的名称
name_x : 字符串表: 输出中使用的自变量的名称
name_yend : 字符串表: 输出中使用的内生变量的名称
name_q : 字符串表: 输出用仪器名称
name_w : 一串: 输出中使用的权重矩阵的名称
name_gwk : 一串: 用于输出的内核权重矩阵的名称
name_ds : 一串: 用于输出的数据集名称

实例

我们首先需要导入所需的模块，即numpy来将我们读取的数据转换为 spreg 理解和 pysal 执行所有分析。因为我们需要对模型进行一些测试，所以我们还导入了诊断模块。

>>> import numpy as np
>>> import pysal.lib
>>> import pysal.model.spreg.diagnostics as D

使用pysal.lib.io.open（）打开关于哥伦布社区犯罪（49个地区）的数据。这是与Columbus形状文件关联的DBF。注意pysal.lib.io.open（）也以csv格式读取数据；由于实际类需要以numpy数组的形式传入数据，因此用户可以使用任何方法读取其数据。

>>> db = pysal.lib.io.open(pysal.lib.examples.get_path("columbus.dbf"),'r')

从dbf文件中提取hoval列（home value），并使其成为回归的因变量。请注意，pysal要求这是一个形状（n，1）的numpy数组，而不是其他包接受的（n，1）的常见形状。

>>> y = np.array(db.by_col("HOVAL"))
>>> y = np.reshape(y, (49,1))

从dbf中提取inc（收入）和crime（犯罪率）向量，作为回归中的独立变量。注意，pysal要求这是一个nxj numpy数组，其中j是独立变量的数量（不包括常量）。默认情况下，该模型向传入的独立变量添加一个1的向量，但可以通过传递常量=false来覆盖该向量。

>>> X = []
>>> X.append(db.by_col("INC"))
>>> X.append(db.by_col("CRIME"))
>>> X = np.array(X).T

由于我们想要运行一个空间误差模型，我们需要指定空间权重矩阵，该矩阵将观测的空间配置包含到模型的误差分量中。为此，我们可以打开一个已经存在的gal文件或创建一个新的gal文件。在这种情况下，我们将从 columbus.shp .

>>> w = pysal.lib.weights.Rook.from_shapefile(pysal.lib.examples.get_path("columbus.shp"))

除非有充分的理由不这样做，否则必须对权重行进行标准化，以便矩阵的每一行合计为一。除此之外，这允许将变量的空间滞后解释为相邻观测值的平均值。在Pysal中，可以通过以下方式轻松执行：

>>> w.transform = 'r'

这个类运行一个滞后模型，这意味着在方程的右侧包含因变量的空间滞后。如果我们希望在输出摘要中打印变量的名称，那么我们也必须将它们传入，尽管这是可选的。要运行的默认最基本模型是：

>>> reg=GM_Lag(y, X, w=w, w_lags=2, name_x=['inc', 'crime'], name_y='hoval', name_ds='columbus')
>>> reg.betas
array([[ 45.30170561],
       [  0.62088862],
       [ -0.48072345],
       [  0.02836221]])

一旦模型运行，我们可以通过调用诊断模块获得系数估计的标准误差：

>>> D.se_betas(reg)
array([ 17.91278862,   0.52486082,   0.1822815 ,   0.31740089])

但是，我们也可以运行模型，其中包含了遵循白色过程纠正的标准错误。为此，我们必须包含可选参数 robust='white' ：

>>> reg=GM_Lag(y, X, w=w, w_lags=2, robust='white', name_x=['inc', 'crime'], name_y='hoval', name_ds='columbus')
>>> reg.betas
array([[ 45.30170561],
       [  0.62088862],
       [ -0.48072345],
       [  0.02836221]])

我们可以从模型对象访问标准错误：

>>> reg.std_err
array([ 20.47077481,   0.50613931,   0.20138425,   0.38028295])

该类具有足够的灵活性，能够适应空间滞后模型，该模型除因变量的空间滞后外，还包括其他非空间内生回归量。作为一个例子，我们假设犯罪实际上是内生的，我们决定用discbd（到cbd的距离）作为工具。我们只重新加载x inc，并将犯罪定义为内生的，将discbd定义为工具：

>>> X = np.array(db.by_col("INC"))
>>> X = np.reshape(X, (49,1))
>>> yd = np.array(db.by_col("CRIME"))
>>> yd = np.reshape(yd, (49,1))
>>> q = np.array(db.by_col("DISCBD"))
>>> q = np.reshape(q, (49,1))

我们可以再次运行模型：

>>> reg=GM_Lag(y, X, w=w, yend=yd, q=q, w_lags=2, name_x=['inc'], name_y='hoval', name_yend=['crime'], name_q=['discbd'], name_ds='columbus')
>>> reg.betas
array([[ 100.79359082],
       [  -0.50215501],
       [  -1.14881711],
       [  -0.38235022]])

一旦模型运行，我们可以通过调用诊断模块获得系数估计的标准误差：

>>> D.se_betas(reg)
array([ 53.0829123 ,   1.02511494,   0.57589064,   0.59891744])

属性:

属性:	summary : 一串回归结果和诊断摘要（注：与print命令一起使用） betas : 数组 Kx1估计系数数组 u : 数组 nx1残差数组 e_pred : 数组 nx1残差数组（使用简化形式） predy : 数组 nx1预测Y值数组 predy_e : 数组 nx1预测Y值数组（使用缩减形式） n : 整数观测次数 k : 整数估计系数的变量数（包括常数） kstar : 整数内生变量的数目。 y : 数组因变量nx1数组 x : 数组二维数组，n行，每个独立（外生）变量一列，包括常量 yend : 数组二维数组，n行，每个内生变量一列 q : 数组二维数组，n行，每个外部变量一列，用作仪器 z : 数组 nxx变量数组（x和yend的组合） h : 数组 NXL仪器阵列（X和Q组合） robust : 一串稳健标准误差调整 mean_y : 浮动因变量均值 std_y : 浮动因变量标准差 vm : 数组方差协方差矩阵（kxk） pr2 : 浮动伪r平方（y和ypred之间的平方相关） pr2_e : 浮动伪r平方（y与ypred_e之间的平方相关（使用约简形式））。 utu : 浮动残差平方和 sig2 : 浮动计算中使用的sigma平方 std_err : 数组 1×k阵列的betas标准误差 z_stat : 元组列表 z statistic；每个元组包含一对（statistic，p-value），其中每个都是一个浮点 ak_test : 元组 Anselin-Kelejian检验；元组包含对（统计，p值） name_y : 一串输出中使用的从属变量的名称 name_x : 字符串表输出中使用的自变量的名称 name_yend : 字符串表输出中使用的内生变量的名称 name_z : 字符串表用于输出的外生变量和内生变量的名称 name_q : 字符串表外部仪表名称 name_h : 字符串表输出中使用的所有仪器的名称 name_w : 一串输出中使用的权重矩阵的名称 name_gwk : 一串用于输出的内核权重矩阵的名称 name_ds : 一串用于输出的数据集名称 title : 一串所用回归方法的名称 sig2n : 浮动 sigma平方（用分母中的n计算） sig2n_k : 浮动 sigma平方（用分母中的n-k计算） hth : 浮动 HH hthi : 浮动 (H'H)^-1 varb : 数组 (Z'H (H'H)^-1 H'Z)^-1 zthhthi : 数组 Z'H(H'H)^-1 pfora1a2 : 数组 n（ZthHthi）'VARB

summary : 一串: 回归结果和诊断摘要（注：与print命令一起使用）
betas : 数组: Kx1估计系数数组
u : 数组: nx1残差数组
e_pred : 数组: nx1残差数组（使用简化形式）
predy : 数组: nx1预测Y值数组
predy_e : 数组: nx1预测Y值数组（使用缩减形式）
n : 整数: 观测次数
k : 整数: 估计系数的变量数（包括常数）
kstar : 整数: 内生变量的数目。
y : 数组: 因变量nx1数组
x : 数组: 二维数组，n行，每个独立（外生）变量一列，包括常量
yend : 数组: 二维数组，n行，每个内生变量一列
q : 数组: 二维数组，n行，每个外部变量一列，用作仪器
z : 数组: nxx变量数组（x和yend的组合）
h : 数组: NXL仪器阵列（X和Q组合）
robust : 一串: 稳健标准误差调整
mean_y : 浮动: 因变量均值
std_y : 浮动: 因变量标准差
vm : 数组: 方差协方差矩阵（kxk）
pr2 : 浮动: 伪r平方（y和ypred之间的平方相关）
pr2_e : 浮动: 伪r平方（y与ypred_e之间的平方相关（使用约简形式））。
utu : 浮动: 残差平方和
sig2 : 浮动: 计算中使用的sigma平方
std_err : 数组: 1×k阵列的betas标准误差
z_stat : 元组列表: z statistic；每个元组包含一对（statistic，p-value），其中每个都是一个浮点
ak_test : 元组: Anselin-Kelejian检验；元组包含对（统计，p值）
name_y : 一串: 输出中使用的从属变量的名称
name_x : 字符串表: 输出中使用的自变量的名称
name_yend : 字符串表: 输出中使用的内生变量的名称
name_z : 字符串表: 用于输出的外生变量和内生变量的名称
name_q : 字符串表: 外部仪表名称
name_h : 字符串表: 输出中使用的所有仪器的名称
name_w : 一串: 输出中使用的权重矩阵的名称
name_gwk : 一串: 用于输出的内核权重矩阵的名称
name_ds : 一串: 用于输出的数据集名称
title : 一串: 所用回归方法的名称
sig2n : 浮动: sigma平方（用分母中的n计算）
sig2n_k : 浮动: sigma平方（用分母中的n-k计算）
hth : 浮动: HH
hthi : 浮动: (H'H)^-1
varb : 数组: (Z'H (H'H)^-1 H'Z)^-1
zthhthi : 数组: Z'H(H'H)^-1
pfora1a2 : 数组: n（ZthHthi）'VARB

__init__(y, x, yend=None, q=None, w=None, w_lags=1, lag_q=True, robust=None, gwk=None, sig2n_k=False, spat_diag=False, vm=False, name_y=None, name_x=None, name_yend=None, name_q=None, name_w=None, name_gwk=None, name_ds=None)[源代码]¶: 初始化自身。请参阅帮助（键入（self））以获得准确的签名。

方法

__init__ \（Y、X、Yend、Q、W、W、Lags、Lag、Q、…]）初始化自身。

属性

`mean_y`
`pfora1a2`
`sig2n`
`sig2n_k`
`std_y`
`utu`
`vm`