numpy.char.chararray¶

class numpy.char.chararray(shape, itemsize=1, unicode=False, buffer=None, offset=0, strides=None, order=None)[源代码]¶

提供字符串和Unicode值数组的方便视图。

注解

这个 chararray 类的存在是为了与NumArray向后兼容，不建议用于新开发。从numpy 1.4开始，如果需要字符串数组，建议使用 dtype object_ ， string_ 或 unicode_ ，并使用 numpy.char 用于快速矢量化字符串操作的模块。

与常规的numpy类型数组相比 str 或 unicode ，此类添加了以下功能：

索引时，值的结尾处会自动删除空白

比较运算符在比较值时自动从结尾删除空白

矢量化字符串操作作为方法提供（例如 endswith ）和中缀运算符（例如 "+", "*", "%" ）

应使用 numpy.char.array 或 numpy.char.asarray ，而不是直接使用此构造函数。

此构造函数创建数组，使用 buffer （与 offset 和 strides 如果不是 None .如果 buffer 是 None ，然后使用 strides 按“C”顺序，除非两者都有 len(shape) >= 2 和 order='F' ，在这种情况下 strides 在“Fortran命令”中。

参数

shape元组: 数组的形状。
itemsize可选的: 每个数组元素的长度（字符数）。默认值为1。
unicode可选的布尔: 是unicode（true）或string（false）类型的数组元素。默认值为假。
buffer对象公开缓冲区接口或str，可选: 数组数据起始的内存地址。默认值为“无”，在这种情况下，将创建一个新数组。
offset可选的: 从一个轴开始的固定跨距位移？默认值为0。需要大于等于0。
strides类似整数的数组，可选: 阵列的步幅（请参见 ndarray.strides 完整描述）。默认值为无。
order'C'、'F'，可选: 数组数据存储在内存中的顺序：“c”->“row major”顺序（默认），“f”->“column major”（fortran）顺序。

实例

>>> charar = np.chararray((3, 3))
>>> charar[:] = 'a'
>>> charar
chararray([[b'a', b'a', b'a'],
           [b'a', b'a', b'a'],
           [b'a', b'a', b'a']], dtype='|S1')

>>> charar = np.chararray(charar.shape, itemsize=5)
>>> charar[:] = 'abc'
>>> charar
chararray([[b'abc', b'abc', b'abc'],
           [b'abc', b'abc', b'abc'],
           [b'abc', b'abc', b'abc']], dtype='|S5')

属性

T: 换位数组。
base: 如果内存来自其他对象，则为基对象。
ctypes: 简化数组与CTypes模块交互的对象。
data: python缓冲区对象指向数组数据的开头。
dtype: 数组元素的数据类型。
flags: 有关数组内存布局的信息。
flat: 数组上的一维迭代器。
imag: 数组的虚部。
itemsize: 一个数组元素的长度（字节）。
nbytes: 数组元素消耗的总字节数。
ndim: 数组维数。
real: 数组的实际部分。
shape: 数组维度的元组。
size: 数组中的元素数。
strides: 遍历数组时要在每个维度中单步执行的字节元组。

方法

`astype` （dType） [, order, casting, subok, copy] ）	数组的副本，强制转换为指定类型。
`argsort` \ [axis, kind, order] ）	返回将对此数组进行排序的索引。
`copy` \ [order] ）	返回数组的副本。
`count` （子） [, start, end] ）	返回具有子字符串不重叠出现次数的数组 sub 在射程内 [start, end] .
`decode` \ [encoding, errors] ）	调用 str.decode 元素的。
`dump` \（文件）	将数组的pickle转储到指定的文件。
`dumps` （）	以字符串形式返回数组的pickle。
`encode` \ [encoding, errors] ）	调用 str.encode 元素的。
`endswith` [后缀] [, start, end] ）	返回一个布尔数组，该数组是 True 其中的字符串元素 self 以结束 suffix ，否则 False .
`expandtabs` \ [tabsize] ）	返回每个字符串元素的副本，其中所有制表符都由一个或多个空格替换。
`fill` 值（值）	用标量值填充数组。
`find` （子） [, start, end] ）	对于每个元素，返回字符串中的最低索引，其中子字符串 sub 被发现。
`flatten` \ [order] ）	返回折叠为一维的数组的副本。
`getfield` （dType） [, offset] ）	以特定类型返回给定数组的字段。
`index` （子） [, start, end] ）	喜欢 `find` 但提高 ValueError 当找不到子字符串时。
`isalnum` （）	如果字符串中的所有字符都是字母数字且至少有一个字符，则为每个元素返回true，否则返回false。
`isalpha` （）	如果字符串中的所有字符都是字母，并且至少有一个字符，则为每个元素返回true，否则返回false。
`isdecimal` （）	对于中的每个元素 self ，如果元素中只有十进制字符，则返回true。
`isdigit` （）	如果字符串中的所有字符都是数字并且至少有一个字符，则为每个元素返回true，否则返回false。
`islower` （）	如果字符串中的所有大小写字符都是小写，并且至少有一个大小写字符，则为每个元素返回true，否则返回false。
`isnumeric` （）	对于中的每个元素 self ，如果元素中只有数字字符，则返回true。
`isspace` （）	如果字符串中只有空白字符并且至少有一个字符，则为每个元素返回true，否则返回false。
`istitle` （）	如果元素是基于标题的字符串并且至少有一个字符，则为每个元素返回true，否则返回false。
`isupper` （）	如果字符串中的所有大小写字符都为大写并且至少有一个字符，则为每个元素返回true，否则返回false。
`item` * ARGs）	将数组的元素复制到标准的python标量并返回它。
`join` （SEQ）	返回一个字符串，该字符串是序列中字符串的串联 seq .
`ljust` （宽度） [, fillchar] ）	返回包含以下元素的数组 self 在长度字符串中左对齐 width .
`lower` （）	返回包含以下元素的数组 self 已转换为小写。
`lstrip` \ [chars] ）	对于中的每个元素 self ，返回删除了前导字符的副本。
`nonzero` （）	返回非零元素的索引。
`put` \（索引，值[, mode] ）	集合 `a.flat[n] = values[n]` 为了所有 n 在索引中。
`ravel` \ [order] ）	返回扁平数组。
`repeat` [重复] [, axis] ）	重复数组元素。
`replace` （旧的，新的） [, count] ）	对于中的每个元素 self ，返回包含所有子字符串的字符串副本 old 替换为 new .
`reshape` [形状] [, order] ）	返回包含具有新形状的相同数据的数组。
`resize` \新的形状 [, refcheck] ）	就地更改数组的形状和大小。
`rfind` （子） [, start, end] ）	对于中的每个元素 self ，返回字符串中的最高索引，其中子字符串 sub 被发现，这样 sub 包含在 [start, end] .
`rindex` （子） [, start, end] ）	喜欢 `rfind` 但提高 ValueError 当子字符串 sub 找不到。
`rjust` （宽度） [, fillchar] ）	返回包含以下元素的数组 self 在字符串中右对齐 width .
`rsplit` \ [sep, maxsplit] ）	对于中的每个元素 self ，返回字符串中的单词列表，使用 sep 作为分隔符字符串。
`rstrip` \ [chars] ）	对于中的每个元素 self ，返回删除了尾随字符的副本。
`searchsorted` （V） [, side, sorter] ）	查找应在a中插入v元素以保持顺序的索引。
`setfield` \（VAL，数据类型[, offset] ）	将值放入由数据类型定义的字段中的指定位置。
`setflags` \ [write, align, uic] ）	分别设置数组标志可写、对齐（writebackifcopy和updateifcopy）。
`sort` \ [axis, kind, order] ）	对数组进行就地排序。
`split` \ [sep, maxsplit] ）	对于中的每个元素 self ，返回字符串中的单词列表，使用 sep 作为分隔符字符串。
`splitlines` \ [keepends] ）	对于中的每个元素 self ，返回元素中的行列表，在行边界处中断。
`squeeze` \ [axis] ）	从中删除长度为1的轴 a .
`startswith` （前缀） [, start, end] ）	返回一个布尔数组，该数组是 True 其中的字符串元素 self 从开始 prefix ，否则 False .
`strip` \ [chars] ）	对于中的每个元素 self ，返回删除了前导和尾随字符的副本。
`swapaxes` \（轴1、轴2）	返回数组的视图 axis1 和 axis2 互换的
`swapcase` （）	对于中的每个元素 self ，返回字符串的副本，其中大写字符转换为小写，反之亦然。
`take` [指数] [, axis, out, mode] ）	返回由以下元素组成的数组 a 在给定的指数上。
`title` （）	对于中的每个元素 self ，返回字符串的基于标题的版本：单词以大写字符开头，其余的大小写字符均为小写。
`tofile` （FID） [, sep, format] ）	将数组以文本或二进制形式写入文件（默认）。
`tolist` （）	作为数组返回 `a.ndim` -Python标量的深度嵌套列表。
`tostring` \ [order] ）	的兼容性别名 tobytes ，行为完全相同。
`translate` [表] [, deletechars] ）	对于中的每个元素 self ，返回一个字符串的副本，其中所有字符都出现在可选参数中 deletechars 已删除，其余字符已通过给定的翻译表映射。
`transpose` * 轴）	返回转置轴的数组视图。
`upper` （）	返回包含以下元素的数组 self 已转换为大写。
`view` \ [dtype] [, type] ）	具有相同数据的数组的新视图。
`zfill` （宽度）	返回长度为零的左数字字符串 width .

numpy.char.asarray numpy.char.chararray.astype