numpy.char.chararray

class numpy.char.chararray(shape, itemsize=1, unicode=False, buffer=None, offset=0, strides=None, order=None)[源代码]

提供字符串和Unicode值数组的方便视图。

注解

这个 chararray 类的存在是为了与NumArray向后兼容,不建议用于新开发。从numpy 1.4开始,如果需要字符串数组,建议使用 dtype object_string_unicode_ ,并使用 numpy.char 用于快速矢量化字符串操作的模块。

与常规的numpy类型数组相比 strunicode ,此类添加了以下功能:

  1. 索引时,值的结尾处会自动删除空白

  2. 比较运算符在比较值时自动从结尾删除空白

  3. 矢量化字符串操作作为方法提供(例如 endswith )和中缀运算符(例如 "+", "*", "%"

应使用 numpy.char.arraynumpy.char.asarray ,而不是直接使用此构造函数。

此构造函数创建数组,使用 buffer (与 offsetstrides 如果不是 None .如果 bufferNone ,然后使用 strides 按“C”顺序,除非两者都有 len(shape) >= 2order='F' ,在这种情况下 strides 在“Fortran命令”中。

参数
shape元组

数组的形状。

itemsize可选的

每个数组元素的长度(字符数)。默认值为1。

unicode可选的布尔

是unicode(true)或string(false)类型的数组元素。默认值为假。

buffer对象公开缓冲区接口或str,可选

数组数据起始的内存地址。默认值为“无”,在这种情况下,将创建一个新数组。

offset可选的

从一个轴开始的固定跨距位移?默认值为0。需要大于等于0。

strides类似整数的数组,可选

阵列的步幅(请参见 ndarray.strides 完整描述)。默认值为无。

order'C'、'F',可选

数组数据存储在内存中的顺序:“c”->“row major”顺序(默认),“f”->“column major”(fortran)顺序。

实例

>>> charar = np.chararray((3, 3))
>>> charar[:] = 'a'
>>> charar
chararray([[b'a', b'a', b'a'],
           [b'a', b'a', b'a'],
           [b'a', b'a', b'a']], dtype='|S1')
>>> charar = np.chararray(charar.shape, itemsize=5)
>>> charar[:] = 'abc'
>>> charar
chararray([[b'abc', b'abc', b'abc'],
           [b'abc', b'abc', b'abc'],
           [b'abc', b'abc', b'abc']], dtype='|S5')
属性
T

换位数组。

base

如果内存来自其他对象,则为基对象。

ctypes

简化数组与CTypes模块交互的对象。

data

python缓冲区对象指向数组数据的开头。

dtype

数组元素的数据类型。

flags

有关数组内存布局的信息。

flat

数组上的一维迭代器。

imag

数组的虚部。

itemsize

一个数组元素的长度(字节)。

nbytes

数组元素消耗的总字节数。

ndim

数组维数。

real

数组的实际部分。

shape

数组维度的元组。

size

数组中的元素数。

strides

遍历数组时要在每个维度中单步执行的字节元组。

方法

astype (dType) [, order, casting, subok, copy] )

数组的副本,强制转换为指定类型。

argsort \ [axis, kind, order] )

返回将对此数组进行排序的索引。

copy \ [order] )

返回数组的副本。

count (子) [, start, end] )

返回具有子字符串不重叠出现次数的数组 sub 在射程内 [start, end] .

decode \ [encoding, errors] )

调用 str.decode 元素的。

dump \(文件)

将数组的pickle转储到指定的文件。

dumps ()

以字符串形式返回数组的pickle。

encode \ [encoding, errors] )

调用 str.encode 元素的。

endswith [后缀] [, start, end] )

返回一个布尔数组,该数组是 True 其中的字符串元素 self 以结束 suffix ,否则 False .

expandtabs \ [tabsize] )

返回每个字符串元素的副本,其中所有制表符都由一个或多个空格替换。

fill 值(值)

用标量值填充数组。

find (子) [, start, end] )

对于每个元素,返回字符串中的最低索引,其中子字符串 sub 被发现。

flatten \ [order] )

返回折叠为一维的数组的副本。

getfield (dType) [, offset] )

以特定类型返回给定数组的字段。

index (子) [, start, end] )

喜欢 find 但提高 ValueError 当找不到子字符串时。

isalnum ()

如果字符串中的所有字符都是字母数字且至少有一个字符,则为每个元素返回true,否则返回false。

isalpha ()

如果字符串中的所有字符都是字母,并且至少有一个字符,则为每个元素返回true,否则返回false。

isdecimal ()

对于中的每个元素 self ,如果元素中只有十进制字符,则返回true。

isdigit ()

如果字符串中的所有字符都是数字并且至少有一个字符,则为每个元素返回true,否则返回false。

islower ()

如果字符串中的所有大小写字符都是小写,并且至少有一个大小写字符,则为每个元素返回true,否则返回false。

isnumeric ()

对于中的每个元素 self ,如果元素中只有数字字符,则返回true。

isspace ()

如果字符串中只有空白字符并且至少有一个字符,则为每个元素返回true,否则返回false。

istitle ()

如果元素是基于标题的字符串并且至少有一个字符,则为每个元素返回true,否则返回false。

isupper ()

如果字符串中的所有大小写字符都为大写并且至少有一个字符,则为每个元素返回true,否则返回false。

item * ARGs)

将数组的元素复制到标准的python标量并返回它。

join (SEQ)

返回一个字符串,该字符串是序列中字符串的串联 seq .

ljust (宽度) [, fillchar] )

返回包含以下元素的数组 self 在长度字符串中左对齐 width .

lower ()

返回包含以下元素的数组 self 已转换为小写。

lstrip \ [chars] )

对于中的每个元素 self ,返回删除了前导字符的副本。

nonzero ()

返回非零元素的索引。

put \(索引,值[, mode] )

集合 a.flat[n] = values[n] 为了所有 n 在索引中。

ravel \ [order] )

返回扁平数组。

repeat [重复] [, axis] )

重复数组元素。

replace (旧的,新的) [, count] )

对于中的每个元素 self ,返回包含所有子字符串的字符串副本 old 替换为 new .

reshape [形状] [, order] )

返回包含具有新形状的相同数据的数组。

resize \新的形状 [, refcheck] )

就地更改数组的形状和大小。

rfind (子) [, start, end] )

对于中的每个元素 self ,返回字符串中的最高索引,其中子字符串 sub 被发现,这样 sub 包含在 [start, end] .

rindex (子) [, start, end] )

喜欢 rfind 但提高 ValueError 当子字符串 sub 找不到。

rjust (宽度) [, fillchar] )

返回包含以下元素的数组 self 在字符串中右对齐 width .

rsplit \ [sep, maxsplit] )

对于中的每个元素 self ,返回字符串中的单词列表,使用 sep 作为分隔符字符串。

rstrip \ [chars] )

对于中的每个元素 self ,返回删除了尾随字符的副本。

searchsorted (V) [, side, sorter] )

查找应在a中插入v元素以保持顺序的索引。

setfield \(VAL,数据类型[, offset] )

将值放入由数据类型定义的字段中的指定位置。

setflags \ [write, align, uic] )

分别设置数组标志可写、对齐(writebackifcopy和updateifcopy)。

sort \ [axis, kind, order] )

对数组进行就地排序。

split \ [sep, maxsplit] )

对于中的每个元素 self ,返回字符串中的单词列表,使用 sep 作为分隔符字符串。

splitlines \ [keepends] )

对于中的每个元素 self ,返回元素中的行列表,在行边界处中断。

squeeze \ [axis] )

从中删除长度为1的轴 a .

startswith (前缀) [, start, end] )

返回一个布尔数组,该数组是 True 其中的字符串元素 self 从开始 prefix ,否则 False .

strip \ [chars] )

对于中的每个元素 self ,返回删除了前导和尾随字符的副本。

swapaxes \(轴1、轴2)

返回数组的视图 axis1axis2 互换的

swapcase ()

对于中的每个元素 self ,返回字符串的副本,其中大写字符转换为小写,反之亦然。

take [指数] [, axis, out, mode] )

返回由以下元素组成的数组 a 在给定的指数上。

title ()

对于中的每个元素 self ,返回字符串的基于标题的版本:单词以大写字符开头,其余的大小写字符均为小写。

tofile (FID) [, sep, format] )

将数组以文本或二进制形式写入文件(默认)。

tolist ()

作为数组返回 a.ndim -Python标量的深度嵌套列表。

tostring \ [order] )

的兼容性别名 tobytes ,行为完全相同。

translate [表] [, deletechars] )

对于中的每个元素 self ,返回一个字符串的副本,其中所有字符都出现在可选参数中 deletechars 已删除,其余字符已通过给定的翻译表映射。

transpose * 轴)

返回转置轴的数组视图。

upper ()

返回包含以下元素的数组 self 已转换为大写。

view \ [dtype] [, type] )

具有相同数据的数组的新视图。

zfill (宽度)

返回长度为零的左数字字符串 width .