pysal.model.spreg.GM_Error_Het

class pysal.model.spreg.GM_Error_Het(y, x, w, max_iter=1, epsilon=1e-05, step1c=False, vm=False, name_y=None, name_x=None, name_w=None, name_ds=None)[源代码]

具有异方差性的空间误差模型的GMM方法,包括结果和诊断;基于arraiz等人[arraiz2010]uuu,遵循anselin[anselin2011]u。

参数:
y : 数组

因变量nx1数组

x : 数组

二维数组,n行,每个独立(外生)变量一列,不包括常量

w : Pysal W对象

空间权重对象

max_iter : 利息

arraiz等人的步骤2a和2b的最大迭代次数。注意:epsilon提供了一个额外的停止条件。

ε : 浮动

为了停止arraiz等人的步骤2a和2b的迭代,所需lambda的最小变化。注:Max-Iter提供了额外的停止条件。

step1c : 布尔

如果为真,则包括arraiz等人的步骤1c。

vm : 布尔

如果为真,则在汇总结果中包含方差-协方差矩阵

name_y : 一串

输出中使用的从属变量的名称

name_x : 字符串表

输出中使用的自变量的名称

name_w : 一串

输出中使用的权重矩阵的名称

name_ds : 一串

用于输出的数据集名称

实例

我们首先需要导入所需的模块,即numpy来将我们读取的数据转换为 spreg 理解和 pysal 执行所有分析。

>>> import numpy as np
>>> import pysal.lib

使用pysal.lib.io.open()打开关于哥伦布社区犯罪(49个地区)的数据。这是与Columbus形状文件关联的DBF。注意pysal.lib.io.open()也以csv格式读取数据;由于实际类需要以numpy数组的形式传入数据,因此用户可以使用任何方法读取其数据。

>>> db = pysal.lib.io.open(pysal.lib.examples.get_path('columbus.dbf'),'r')

从dbf文件中提取hoval列(主值),并使其成为回归的因变量。请注意,pysal要求这是一个形状(n,1)的numpy数组,而不是其他包接受的(n,1)的常见形状。

>>> y = np.array(db.by_col("HOVAL"))
>>> y = np.reshape(y, (49,1))

从dbf中提取inc(收入)和crime(犯罪)向量作为回归中的独立变量。注意,pysal要求这是一个nxj numpy数组,其中j是独立变量的数量(不包括常量)。默认情况下,这个类向传入的自变量添加一个1的向量。

>>> X = []
>>> X.append(db.by_col("INC"))
>>> X.append(db.by_col("CRIME"))
>>> X = np.array(X).T

由于我们想要运行一个空间误差模型,我们需要指定空间权重矩阵,该矩阵将观测的空间配置包含到模型的误差分量中。为此,我们可以打开一个已经存在的gal文件或创建一个新的gal文件。在这种情况下,我们将从 columbus.shp .

>>> w = pysal.lib.weights.Rook.from_shapefile(pysal.lib.examples.get_path("columbus.shp"))

除非有充分的理由不这样做,否则必须对权重行进行标准化,以便矩阵的每一行合计为一。除其他外,HIS允许将变量的空间滞后解释为相邻观测的平均值。在Pysal中,可以通过以下方式轻松执行:

>>> w.transform = 'r'

我们都准备好了预赛,我们很好地运行模型。在这种情况下,我们需要变量和权重矩阵。如果我们希望在输出摘要中打印变量的名称,那么我们也必须将它们传入,尽管这是可选的。

>>> reg = GM_Error_Het(y, X, w=w, step1c=True, name_y='home value', name_x=['income', 'crime'], name_ds='columbus')

一旦我们运行了模型,我们就可以对输出进行一点探索。我们创建的回归对象有许多属性,因此请花点时间来发现它们。这个类提供了一个错误模型,它显式地说明了异方差性,并且与来自的模型不同 spreg.error_sp ,允许对空间参数进行推断。

>>> print reg.name_x
['CONSTANT', 'income', 'crime', 'lambda']

因此,我们发现与标准误差相同的β数,我们用方差协方差矩阵对角线的平方根计算:

>>> print np.around(np.hstack((reg.betas,np.sqrt(reg.vm.diagonal()).reshape(4,1))),4)
[[ 47.9963  11.479 ]
 [  0.7105   0.3681]
 [ -0.5588   0.1616]
 [  0.4118   0.168 ]]
属性:
summary : 一串

回归结果和诊断摘要(注:与print命令一起使用)

betas : 数组

Kx1估计系数数组

u : 数组

nx1残差数组

e_filtered : 数组

nx1空间滤波残差数组

predy : 数组

nx1预测Y值数组

n : 整数

观测次数

k : 整数

估计系数的变量数(包括常数)

y : 数组

因变量nx1数组

x : 数组

二维数组,n行,每个独立(外生)变量一列,包括常量

iter_stop : 一串

在迭代arraiz等人的步骤2a和2b期间达到停止标准。

iteration : 整数

arraiz等人的步骤2a和2b的迭代次数。

mean_y : 浮动

因变量均值

std_y : 浮动

因变量标准差

pr2 : 浮动

伪r平方(y和ypred之间的平方相关)

vm : 数组

方差协方差矩阵(kxk)

std_err : 数组

1×k阵列的betas标准误差

z_stat : 元组列表

z statistic;每个元组包含一对(statistic,p-value),其中每个都是一个浮点

xtx : 浮动

XX

name_y : 一串

输出中使用的从属变量的名称

name_x : 字符串表

输出中使用的自变量的名称

name_w : 一串

输出中使用的权重矩阵的名称

name_ds : 一串

用于输出的数据集名称

title : 一串

所用回归方法的名称

__init__(y, x, w, max_iter=1, epsilon=1e-05, step1c=False, vm=False, name_y=None, name_x=None, name_w=None, name_ds=None)[源代码]

初始化自身。请参阅帮助(键入(self))以获得准确的签名。

方法

__init__ \(Y,X,W[,Maxu Iter,Epsilon,…]) 初始化自身。

属性

mean_y 
std_y