pysal.viz.mapclassify.Jenks_Caspall_Sampled

class pysal.viz.mapclassify.Jenks_Caspall_Sampled(y, k=5, pct=0.1)[源代码]

使用随机样本的Jenks Caspall地图分类

参数:
y : 数组

(n,1),要分类的值

k : 利息

需要的类数

pct : 浮动

如果指定了pct,则应构成样本的n的百分比,其中n*pct>1000,则pct=1000。

笔记

这是为了解决大的n个问题。逻辑是将jenks-caspall应用于y空间的随机子集,然后在从该子集获得的bin上对完整的向量y进行bin。这会牺牲一些“准确性”来获得速度。

实例

>>> import pysal.viz.mapclassify as mc
>>> cal = mc.load_example()
>>> x = np.random.random(100000)
>>> jc = mc.Jenks_Caspall(x)
>>> jcs = mc.Jenks_Caspall_Sampled(x)
>>> jc.bins
array([0.1988721 , 0.39624334, 0.59441487, 0.79624357, 0.99999251])
>>> jcs.bins
array([0.20998558, 0.42112792, 0.62752937, 0.80543819, 0.99999251])
>>> jc.counts
array([19943, 19510, 19547, 20297, 20703])
>>> jcs.counts
array([21039, 20908, 20425, 17813, 19815])

#不用于测试,因为我们在不同的硬件上获得不同的时间只是包含在可能的速度增益文档中>>>T1=Time.Time();JC=Jenks诳Caspall(X);T2=Time.Time()诳>>>T1S=Time.Time();JCS=Jenks诳Caspall_采样(X);T2S=Time.Time()诳>>>T2-T1;T2S-T1S 0.061631917953491211

属性:
yb : 数组

(n,1),用于观察的肥料箱ID,

bins : 数组

(k,1),每个类的上界

k : 利息

班级数量

counts : 数组

(k,1),属于每一类的观察数

方法

__call__ \(*args,*kwargs) 这将允许像调用函数一样调用分类器。
find_bin [(x)] 根据当前仓位估计对输入或输入进行排序
get_adcm () 班级中位数(adcm)周围的绝对偏差。
get_gadf () 拟合绝对偏差的优度
get_tss () 类均值的平方和
make \(*args,*kwargs) 根据此函数指定的配置选项,配置并创建将使用数据并生成分类的分类器。
update \([Y,就地]) 添加数据或更改分类参数。
__init__(y, k=5, pct=0.1)[源代码]

初始化自身。请参阅帮助(键入(self))以获得准确的签名。

方法

__init__ \(Y [,K ,PCT ]) 初始化自身。
find_bin [(x)] 根据当前仓位估计对输入或输入进行排序
get_adcm () 班级中位数(adcm)周围的绝对偏差。
get_gadf () 拟合绝对偏差的优度
get_tss () 类均值的平方和
make \(*args,*kwargs) 根据此函数指定的配置选项,配置并创建将使用数据并生成分类的分类器。
update \([Y,就地]) 添加数据或更改分类参数。