utf8 模块

此文件是Web2py Web框架的一部分
版权所有:Massimo di Pierro<mdipierro@cs.depaul.edu>
由Vladyslav Kozlovsky(乌克兰)创建<dbdevelop©gmail.com>
对于web2py项目

utf8字符串管理的实用程序和类

class gluon.utf8.Utf8(content='', codepage='utf-8')[源代码]

基类:str

用于utf8字符串存储和操作的类

此类用法的基本前提是:“应用程序中的所有字符串都是UTF-8或Unicode类型,即使使用简单的str类型也是如此。UTF-8只是Unicode的“打包”版本,因此UTF-8和Unicode字符串可以互换。

小心!这个类比str/unicode慢!不要在密集的循环中使用它。只需在循环之前将字符串解码为Unicode,并在密集计算后将其编码回utf-8字符串。

您可以在下面的doctests()中看到这个类的好处。

capitalize()[源代码]

返回字符串的大写版本。

更具体地说,使第一个字符大写,其余字符小写。

center(length)[源代码]

返回长宽居中的字符串。

填充使用指定的填充字符完成(默认为空格)。

count(sub[, start[, end]]) → int[源代码]

返回字符串s中子字符串sub string的不重叠出现次数 [开始:结束] . 可选参数start和end在切片表示法中解释为。

decode(encoding='utf-8', errors='strict')[源代码]
encode(encoding, errors='strict')[源代码]

使用注册用于编码的编解码器对字符串进行编码。

编码

对字符串进行编码的编码。

错误

用于编码错误的错误处理方案。默认值为“strict”,表示编码错误会引发UnicodeEncodeError。其他可能的值是“ignore”、“replace”和“xmlcharrefreplace”,以及注册的任何其他名称codecs.registeru错误可以处理UnicodeEncodeError。

endswith(suffix[, start[, end]]) → bool[源代码]

如果s以指定后缀结尾,则返回true,否则返回false。选择启动时,测试S从该位置开始。选择结束时,停止在该位置比较s。后缀也可以是要尝试的字符串的元组。

expandtabs(tabsize=8)[源代码]

返回所有制表符都使用空格展开的副本。

如果未指定tabsize,则假定选项卡大小为8个字符。

find(sub[, start[, end]]) → int[源代码]

返回s中找到子字符串sub的最低索引,以便sub包含在s中 [开始:结束] . 可选参数start和end在切片表示法中解释为。

失败时返回-1。

format(*args, **kwargs) → str[源代码]

使用args和kwargs中的替换返回s的格式化版本。替换由大括号(“”和“”)标识。

index(sub[, start[, end]]) → int[源代码]

返回s中找到子字符串sub的最低索引,以便sub包含在s中 [开始:结束] . 可选参数start和end在切片表示法中解释为。

找不到子字符串时引发ValueError。

isalnum()[源代码]

如果字符串是字母数字字符串,则返回True,否则返回False。

如果字符串中的所有字符都是字母数字,并且字符串中至少有一个字符,则该字符串为字母数字。

isalpha()[源代码]

如果字符串是字母字符串,则返回True,否则返回False。

如果字符串中的所有字符都是字母,并且字符串中至少有一个字符,则字符串是字母的。

isdigit()[源代码]

如果字符串是数字字符串,则返回True,否则返回False。

如果字符串中的所有字符都是数字,并且字符串中至少有一个字符,则字符串就是数字字符串。

islower()[源代码]

如果字符串是小写字符串,则返回True,否则返回False。

如果字符串中的所有大小写字符都是小写的,并且字符串中至少有一个大小写字符,则字符串为小写。

isspace()[源代码]

如果字符串是空白字符串,则返回True,否则返回False。

如果字符串中的所有字符都是空白并且字符串中至少有一个字符,则该字符串为空白。

istitle()[源代码]

如果字符串的大小写为True,则返回False。

在标题大小写字符串中,大小写字符只能跟在无大小写字符后面,小写字符只能跟在大小写字符后面。

isupper()[源代码]

如果字符串是大写字符串,则返回True,否则返回False。

如果字符串中的所有大小写字符都是大写的,并且字符串中至少有一个大小写字符,则字符串为大写。

join(iter)[源代码]

连接任意数量的字符串。

调用其方法的字符串插入到每个给定字符串之间。结果将作为新字符串返回。

示例:'.'.join( [“ab”、“pq”、“rs”] ) -> 'ab.pq.rs公司'

ljust(width, fillchar=' ')[源代码]

返回一个左对齐的长宽字符串。

填充使用指定的填充字符完成(默认为空格)。

lower()[源代码]

返回转换为小写的字符串副本。

lstrip(chars=None)[源代码]

返回删除前导空格的字符串副本。

如果指定了字符而不是没有,则删除字符中的字符。

partition(sep)[源代码]

把给定的字符串用分隔符分成三部分。

这将搜索字符串中的分隔符。如果找到分隔符,则返回一个3元组,其中包含分隔符之前的部分、分隔符本身以及分隔符之后的部分。

如果找不到分隔符,则返回包含原始字符串和两个空字符串的3元组。

replace(old, new, count=- 1)[源代码]

返回一个副本,子字符串old替换为new。

计数

要替换的最大引用数。-1(默认值)表示替换所有引用。

如果给定可选参数count,则只替换出现的第一个count。

rfind(sub[, start[, end]]) → int[源代码]

返回在s中找到子字符串sub的最高索引,以便sub包含在s中 [开始:结束] . 可选参数start和end在切片表示法中解释为。

失败时返回-1。

rindex(sub[, start[, end]]) → int[源代码]

返回在s中找到子字符串sub的最高索引,以便sub包含在s中 [开始:结束] . 可选参数start和end在切片表示法中解释为。

找不到子字符串时引发ValueError。

rjust(width, fillchar=' ')[源代码]

返回一个长宽右对齐的字符串。

填充使用指定的填充字符完成(默认为空格)。

rpartition(sep)[源代码]

把给定的字符串用分隔符分成三部分。

这将搜索字符串中从末尾开始的分隔符。如果找到分隔符,则返回一个3元组,其中包含分隔符之前的部分、分隔符本身以及分隔符之后的部分。

如果找不到分隔符,则返回包含两个空字符串和原始字符串的3元组。

rsplit(sep=None, maxsplit=- 1)[源代码]

返回字符串中单词的列表,使用sep作为分隔符字符串。

九月

用于拆分字符串的分隔符。None(默认值)表示根据任何空格拆分,并从结果中丢弃空字符串。

最大分割

要执行的最大拆分数。-1(默认值)表示无限制。

分割从字符串的末尾开始,一直到前面。

rstrip(chars=None)[源代码]

返回删除尾随空格的字符串副本。

如果指定了字符而不是没有,则删除字符中的字符。

split(sep=None, maxsplit=- 1)[源代码]

返回字符串中单词的列表,使用sep作为分隔符字符串。

九月

用于拆分字符串的分隔符。None(默认值)表示根据任何空格拆分,并从结果中丢弃空字符串。

最大分割

要执行的最大拆分数。-1(默认值)表示无限制。

splitlines(keepends=False)[源代码]

返回字符串中的行列表,在行边界处断开。

除非给出keepends且为true,否则换行符不包括在结果列表中。

startswith(prefix[, start[, end]]) → bool[源代码]

如果s以指定前缀开头,则返回true,否则返回false。选择启动时,测试S从该位置开始。选择结束时,停止在该位置比较s。前缀也可以是要尝试的字符串的元组。

strip(chars=None)[源代码]

返回包含前导空格和尾随空格的字符串副本。

如果指定了字符而不是没有,则删除字符中的字符。

swapcase()[源代码]

将大写字符转换为小写,将小写字符转换为大写。

title()[源代码]

返回字符串的一个版本,其中每个单词的标题为。

更具体地说,单词以大写字符开头,所有剩余的大小写字符都是小写字符。

translate(table, deletechars='')[源代码]

使用给定的转换表替换字符串中的每个字符。

桌子

转换表,它必须是Unicode序号到Unicode序号、字符串或无的映射。

表必须通过实现查找/索引 __getitem__, 例如字典或列表。如果此操作引发LookupError,则字符保持不变。映射到“无”的字符将被删除。

upper()[源代码]

返回转换为大写的字符串副本。

zfill(length)[源代码]

在左边填充一个带零的数字字符串,以填充给定宽度的字段。

字符串不会被截断。