pysal.model.spreg.SUR

class pysal.model.spreg.SUR(bigy, bigX, w=None, regimes=None, nonspat_diag=True, spat_diag=False, vm=False, iter=False, maxiter=5, epsilon=1e-05, verbose=False, name_bigy=None, name_bigX=None, name_ds=None, name_w=None, name_regimes=None)[源代码]

用于SUR估计的用户类,包括两步和迭代

参数:
bigy : 因式变量矢量字典
bigX : 用方程表示的解释变量矩阵字典

(注,已包含常量项)

w : 空间权重对象,默认值=无
regimes : 列表;默认值=无

n值列表,并将每个观测值映射到一个区域。假定与“x”对齐。

nonspat_diag : 布尔值;非空间诊断的标志,默认值为真
spat_diag : 布尔值;空间诊断标志,默认值为假
iter : 布尔值;是否使用迭代估计

默认=假

马克塞特 : 整数;最大迭代次数;默认值=5
ε : 浮点;结束迭代的精度标准

默认值=0.00001

冗长的 : 布尔值;用于打印迭代次数和值的标志

迭代开始和结束时的日志det(sig)

name_bigy : 每个方程的因变量名称字典

默认值为“无”,但应指定在使用sur-stackxy时完成。

name_bigX : 字典,每个字典都有解释变量的名称

公式默认值=无,但当使用sur-stackxy时应指定。

name_ds : 字符串;数据集的名称
name_w : 字符串;权重文件的名称
name_regimes : 字符串;输出中使用的状态变量的名称

实例

首先导入pysal.lib以加载空间分析工具。

>>> import pysal.lib

使用pysal.lib.io.open()打开有关NCOVR美国县凶杀案(3085个地区)的数据。这是与nat形状文件关联的dbf。注意pysal.lib.io.open()也可以读取csv格式的数据。

>>> db = pysal.lib.io.open(pysal.lib.examples.get_path("NAT.dbf"),'r')

待估算模型的规格可作为列表提供。每个方程应单独列出。在这个例子中,方程式1的因变量是hr80,而ps80和ue80是外生回归量。对于方程2,hr90是因变量,ps90和ue90是外生回归量。

>>> y_var = ['HR80','HR90']
>>> x_var = [['PS80','UE80'],['PS90','UE90']]

虽然此方法不需要,但我们可以加载一个权重矩阵文件,以便进行空间诊断。

>>> w = pysal.lib.weights.Queen.from_shapefile(pysal.lib.examples.get_path("NAT.shp"))
>>> w.transform='r'

SUR方法要求将数据作为字典提供。Pysal提供了工具sur_dictxy,从变量列表中创建这些字典。下面的一行将创建四个字典,分别包含因变量(bigy)、回归量(bigx)、因变量名(bigyvars)和回归量名(bigxvars)。所有这些都将从数据库(db)和上面创建的变量列表(y_var和x_var)中创建。

>>> bigy,bigX,bigyvars,bigXvars = pysal.model.spreg.sur_utils.sur_dictxy(db,y_var,x_var)

现在我们可以运行回归,然后通过键入“print(reg.summary)”来获得输出摘要。

>>> reg = SUR(bigy,bigX,w=w,name_bigy=bigyvars,name_bigX=bigXvars,spat_diag=True,name_ds="nat")
>>> print(reg.summary)
REGRESSION
----------
SUMMARY OF OUTPUT: SEEMINGLY UNRELATED REGRESSIONS (SUR)
--------------------------------------------------------
Data set            :         nat
Weights matrix      :     unknown
Number of Equations :           2                Number of Observations:        3085
Log likelihood (SUR):  -19902.966                Number of Iterations  :           1
----------
<BLANKLINE>
SUMMARY OF EQUATION 1
---------------------
Dependent Variable  :        HR80                Number of Variables   :           3
Mean dependent var  :      6.9276                Degrees of Freedom    :        3082
S.D. dependent var  :      6.8251
<BLANKLINE>
------------------------------------------------------------------------------------
            Variable     Coefficient       Std.Error     z-Statistic     Probability
------------------------------------------------------------------------------------
          Constant_1       5.1390718       0.2624673      19.5798587       0.0000000
                PS80       0.6776481       0.1219578       5.5564132       0.0000000
                UE80       0.2637240       0.0343184       7.6846277       0.0000000
------------------------------------------------------------------------------------
<BLANKLINE>
SUMMARY OF EQUATION 2
---------------------
Dependent Variable  :        HR90                Number of Variables   :           3
Mean dependent var  :      6.1829                Degrees of Freedom    :        3082
S.D. dependent var  :      6.6403
<BLANKLINE>
------------------------------------------------------------------------------------
            Variable     Coefficient       Std.Error     z-Statistic     Probability
------------------------------------------------------------------------------------
          Constant_2       3.6139403       0.2534996      14.2561949       0.0000000
                PS90       1.0260715       0.1121662       9.1477755       0.0000000
                UE90       0.3865499       0.0341996      11.3027760       0.0000000
------------------------------------------------------------------------------------
<BLANKLINE>
<BLANKLINE>
REGRESSION DIAGNOSTICS
                                     TEST         DF       VALUE           PROB
                         LM test on Sigma         1      680.168           0.0000
                         LR test on Sigma         1      768.385           0.0000
<BLANKLINE>
OTHER DIAGNOSTICS - CHOW TEST BETWEEN EQUATIONS
                                VARIABLES         DF       VALUE           PROB
                   Constant_1, Constant_2         1       26.729           0.0000
                               PS80, PS90         1        8.241           0.0041
                               UE80, UE90         1        9.384           0.0022
<BLANKLINE>
DIAGNOSTICS FOR SPATIAL DEPENDENCE
TEST                              DF       VALUE           PROB
Lagrange Multiplier (error)       2        1333.586        0.0000
Lagrange Multiplier (lag)         2        1275.821        0.0000
<BLANKLINE>
ERROR CORRELATION MATRIX
  EQUATION 1  EQUATION 2
    1.000000    0.469548
    0.469548    1.000000
================================ END OF REPORT =====================================
属性:
bigy : Y值字典
bigX : 带x值的字典
bigXX : 带x-t'x-r交叉产品的字典
bigXy : 带x'u t'y'u r交叉产品的字典
n_eq : 方程个数
n : 各断面观测数
bigK : 具有解释变量数量的向量(包括常量)

对于每个方程

bOLS : 每个方程的OLS回归系数字典
olsE : n x n_eq数组,每个方程有ols残差
bSUR : 每个方程的SUR回归系数字典
varb : 方差协方差矩阵
sig : 方程间误差协方差的西格玛矩阵
ldetS1 : SUR模型的对数det(sigma)
bigE : n x n_eq残差数组
sig_ols : OLS残差的西格玛矩阵(对角线)
ldetS0 : 零模型的对数det(sigma)(OLS按公式)
niter : 迭代次数(=0,对于iter=false)
corr : 方程间误差相关矩阵
llik : 对数似然(包括常数pi)
sur_inf : 标准误差渐近t和p值字典,

每个方程一个

lrtest : 西格玛非对角元素的似然比检验

(带测试、df、p值的元组)

lmtest : 西格玛非对角元素的拉格朗日乘数检验

(带测试、df、p值的元组)

lmEtest : SUR误差空间自相关的拉格朗日乘子检验

(带测试、df、p值的元组)

lmlagtest : SUR空间滞后自相关的拉格朗日乘子检验

(带测试、df、p值的元组)

surchow : 回归系数Chow检验的元组列表

每个元组包含测试值、自由度、p值

name_bigy : 每个方程的因变量名称字典
name_bigX : 字典,每个字典都有解释变量的名称

方程式

name_ds : 字符串;数据集的名称
name_w : 字符串;权重文件的名称
name_regimes : 字符串;输出中使用的状态变量的名称
__init__(bigy, bigX, w=None, regimes=None, nonspat_diag=True, spat_diag=False, vm=False, iter=False, maxiter=5, epsilon=1e-05, verbose=False, name_bigy=None, name_bigX=None, name_ds=None, name_w=None, name_regimes=None)[源代码]

初始化自身。请参阅帮助(键入(self))以获得准确的签名。

方法

__init__ \(bigy,bigx[,w,状态,…]) 初始化自身。