pysal.model.spreg.GM_Endog_Error_Hom¶

class pysal.model.spreg.GM_Endog_Error_Hom(y, x, yend, q, w, max_iter=1, epsilon=1e-05, A1='hom_sc', vm=False, name_y=None, name_x=None, name_yend=None, name_q=None, name_w=None, name_ds=None)[源代码]¶

基于Drukker等人的空间误差模型的GMM方法，具有同构性和内生变量、结果和诊断。（2013年）【Drukker2013年】uu，继Anselin（2011年）【Anselin2011年】u之后。

参数:

参数:	y : 数组因变量nx1数组 x : 数组二维数组，n行，每个独立（外生）变量一列，不包括常量 yend : 数组二维数组，n行，每个内生变量一列 q : 数组二维数组，n行，每个外部外部变量一列，用作工具（注意：这不应包含x中的任何变量） w : Pysal W对象空间权重对象 max_iter : 利息 arraiz等人的步骤2a和2b的最大迭代次数。注意：epsilon提供了一个额外的停止条件。 ε : 浮动为了停止arraiz等人的步骤2a和2b的迭代，所需lambda的最小变化。注：Max-Iter提供了额外的停止条件。 A1 : 一串如果a1='het'，那么矩阵a1的定义如arraiz等人所述。如果a1='hom'，则如Anselin（2011）所述。如果a1='hom_sc'（默认），则如Drukker、Egger和Prucha（2010）以及Drukker、Prucha和Raciborski（2010）中所述。 vm : 布尔如果为真，则在汇总结果中包含方差-协方差矩阵 name_y : 一串输出中使用的从属变量的名称 name_x : 字符串表输出中使用的自变量的名称 name_yend : 字符串表输出中使用的内生变量的名称 name_q : 字符串表输出用仪器名称 name_w : 一串输出中使用的权重矩阵的名称 name_ds : 一串用于输出的数据集名称

y : 数组: 因变量nx1数组
x : 数组: 二维数组，n行，每个独立（外生）变量一列，不包括常量
yend : 数组: 二维数组，n行，每个内生变量一列
q : 数组: 二维数组，n行，每个外部外部变量一列，用作工具（注意：这不应包含x中的任何变量）
w : Pysal W对象: 空间权重对象
max_iter : 利息: arraiz等人的步骤2a和2b的最大迭代次数。注意：epsilon提供了一个额外的停止条件。
ε : 浮动: 为了停止arraiz等人的步骤2a和2b的迭代，所需lambda的最小变化。注：Max-Iter提供了额外的停止条件。
A1 : 一串: 如果a1='het'，那么矩阵a1的定义如arraiz等人所述。如果a1='hom'，则如Anselin（2011）所述。如果a1='hom_sc'（默认），则如Drukker、Egger和Prucha（2010）以及Drukker、Prucha和Raciborski（2010）中所述。
vm : 布尔: 如果为真，则在汇总结果中包含方差-协方差矩阵
name_y : 一串: 输出中使用的从属变量的名称
name_x : 字符串表: 输出中使用的自变量的名称
name_yend : 字符串表: 输出中使用的内生变量的名称
name_q : 字符串表: 输出用仪器名称
name_w : 一串: 输出中使用的权重矩阵的名称
name_ds : 一串: 用于输出的数据集名称

实例

我们首先需要导入所需的模块，即numpy来将我们读取的数据转换为 spreg 理解和 pysal 执行所有分析。

>>> import numpy as np
>>> import pysal.lib

使用pysal.lib.io.open（）打开关于哥伦布社区犯罪（49个地区）的数据。这是与Columbus形状文件关联的DBF。注意pysal.lib.io.open（）也以csv格式读取数据；由于实际类需要以numpy数组的形式传入数据，因此用户可以使用任何方法读取其数据。

>>> db = pysal.lib.io.open(pysal.lib.examples.get_path('columbus.dbf'),'r')

从dbf文件中提取hoval列（主值），并使其成为回归的因变量。请注意，pysal要求这是一个形状（n，1）的numpy数组，而不是其他包接受的（n，1）的常见形状。

>>> y = np.array(db.by_col("HOVAL"))
>>> y = np.reshape(y, (49,1))

从dbf中提取inc（收入）向量，作为回归中的独立变量。注意，pysal要求这是一个nxj numpy数组，其中j是独立变量的数量（不包括常量）。默认情况下，这个类向传入的自变量添加一个1的向量。

>>> X = []
>>> X.append(db.by_col("INC"))
>>> X = np.array(X).T

在这种情况下，我们认为犯罪率是一个内生回归量。我们告诉模型，这是通过传递一个不同于外生变量（x）的参数来实现的。

>>> yd = []
>>> yd.append(db.by_col("CRIME"))
>>> yd = np.array(yd).T

由于我们有内生变量，为了得到正确的估计模型，我们需要为犯罪工具。为此，我们使用discbd（到cbd的距离），并将其放入仪器参数“q”。

>>> q = []
>>> q.append(db.by_col("DISCBD"))
>>> q = np.array(q).T

由于我们想要运行一个空间误差模型，我们需要指定空间权重矩阵，该矩阵将观测的空间配置包含到模型的误差分量中。为此，我们可以打开一个已经存在的gal文件或创建一个新的gal文件。在这种情况下，我们将从 columbus.shp .

>>> w = pysal.lib.weights.Rook.from_shapefile(pysal.lib.examples.get_path("columbus.shp"))

除非有充分的理由不这样做，否则必须对权重行进行标准化，以便矩阵的每一行合计为一。除其他外，HIS允许将变量的空间滞后解释为相邻观测的平均值。在Pysal中，可以通过以下方式轻松执行：

>>> w.transform = 'r'

我们都准备好了初步设计，我们很好地运行模型。在这种情况下，我们需要变量（外生和内生）、工具和权重矩阵。如果我们希望在输出摘要中打印变量的名称，那么我们也必须将它们传入，尽管这是可选的。

>>> reg = GM_Endog_Error_Hom(y, X, yd, q, w=w, A1='hom_sc', name_x=['inc'], name_y='hoval', name_yend=['crime'], name_q=['discbd'], name_ds='columbus')

一旦我们运行了模型，我们就可以对输出进行一点探索。我们创建的回归对象有许多属性，因此请花点时间来发现它们。这个类提供了一个错误模型，它假定同构性，但与 spreg.error_sp ，允许对空间参数进行推断。因此，我们发现与标准误差相同的β数，我们用方差协方差矩阵对角线的平方根计算：

>>> print reg.name_z
['CONSTANT', 'inc', 'crime', 'lambda']
>>> print np.around(np.hstack((reg.betas,np.sqrt(reg.vm.diagonal()).reshape(4,1))),4)
[[ 55.3658  23.496 ]
 [  0.4643   0.7382]
 [ -0.669    0.3943]
 [  0.4321   0.1927]]

属性:

属性:	summary : 一串回归结果和诊断摘要（注：与print命令一起使用） betas : 数组 Kx1估计系数数组 u : 数组 nx1残差数组 e_filtered : 数组 nx1空间滤波残差数组 predy : 数组 nx1预测Y值数组 n : 整数观测次数 k : 整数估计系数的变量数（包括常数） y : 数组因变量nx1数组 x : 数组二维数组，n行，每个独立（外生）变量一列，包括常量 yend : 数组二维数组，n行，每个内生变量一列 q : 数组二维数组，n行，每个外部变量一列，用作仪器 z : 数组 nxx变量数组（x和yend的组合） h : 数组 NXL仪器阵列（X和Q组合） iter_stop : 一串在迭代arraiz等人的步骤2a和2b期间达到停止标准。 iteration : 整数 arraiz等人的步骤2a和2b的迭代次数。 mean_y : 浮动因变量均值 std_y : 浮动因变量标准差 vm : 数组方差协方差矩阵（kxk） pr2 : 浮动伪r平方（y和ypred之间的平方相关） sig2 : 浮动计算中使用的sigma平方 std_err : 数组 1×k阵列的betas标准误差 z_stat : 元组列表 z statistic；每个元组包含一对（statistic，p-value），其中每个都是一个浮点 name_y : 一串输出中使用的从属变量的名称 name_x : 字符串表输出中使用的自变量的名称 name_yend : 字符串表输出中使用的内生变量的名称 name_z : 字符串表用于输出的外生变量和内生变量的名称 name_q : 字符串表外部仪表名称 name_h : 字符串表输出中使用的所有仪器的名称 name_w : 一串输出中使用的权重矩阵的名称 name_ds : 一串用于输出的数据集名称 title : 一串所用回归方法的名称 hth : 浮动 HH

summary : 一串: 回归结果和诊断摘要（注：与print命令一起使用）
betas : 数组: Kx1估计系数数组
u : 数组: nx1残差数组
e_filtered : 数组: nx1空间滤波残差数组
predy : 数组: nx1预测Y值数组
n : 整数: 观测次数
k : 整数: 估计系数的变量数（包括常数）
y : 数组: 因变量nx1数组
x : 数组: 二维数组，n行，每个独立（外生）变量一列，包括常量
yend : 数组: 二维数组，n行，每个内生变量一列
q : 数组: 二维数组，n行，每个外部变量一列，用作仪器
z : 数组: nxx变量数组（x和yend的组合）
h : 数组: NXL仪器阵列（X和Q组合）
iter_stop : 一串: 在迭代arraiz等人的步骤2a和2b期间达到停止标准。
iteration : 整数: arraiz等人的步骤2a和2b的迭代次数。
mean_y : 浮动: 因变量均值
std_y : 浮动: 因变量标准差
vm : 数组: 方差协方差矩阵（kxk）
pr2 : 浮动: 伪r平方（y和ypred之间的平方相关）
sig2 : 浮动: 计算中使用的sigma平方
std_err : 数组: 1×k阵列的betas标准误差
z_stat : 元组列表: z statistic；每个元组包含一对（statistic，p-value），其中每个都是一个浮点
name_y : 一串: 输出中使用的从属变量的名称
name_x : 字符串表: 输出中使用的自变量的名称
name_yend : 字符串表: 输出中使用的内生变量的名称
name_z : 字符串表: 用于输出的外生变量和内生变量的名称
name_q : 字符串表: 外部仪表名称
name_h : 字符串表: 输出中使用的所有仪器的名称
name_w : 一串: 输出中使用的权重矩阵的名称
name_ds : 一串: 用于输出的数据集名称
title : 一串: 所用回归方法的名称
hth : 浮动: HH

__init__(y, x, yend, q, w, max_iter=1, epsilon=1e-05, A1='hom_sc', vm=False, name_y=None, name_x=None, name_yend=None, name_q=None, name_w=None, name_ds=None)[源代码]¶: 初始化自身。请参阅帮助（键入（self））以获得准确的签名。

方法

__init__ \（Y、X、Yend、Q、W[、MaxIter、…]）初始化自身。

属性

`mean_y`
`std_y`