utf8
模块¶
utf8字符串管理的实用程序和类¶
-
class
gluon.utf8.
Utf8
(content='', codepage='utf-8')[源代码]¶ 基类:
str
用于utf8字符串存储和操作的类
此类用法的基本前提是:“应用程序中的所有字符串都是UTF-8或Unicode类型,即使使用简单的str类型也是如此。UTF-8只是Unicode的“打包”版本,因此UTF-8和Unicode字符串可以互换。
小心!这个类比str/unicode慢!不要在密集的循环中使用它。只需在循环之前将字符串解码为Unicode,并在密集计算后将其编码回utf-8字符串。
您可以在下面的doctests()中看到这个类的好处。
-
count
(sub[, start[, end]]) → int[源代码]¶ 返回字符串s中子字符串sub string的不重叠出现次数 [开始:结束] . 可选参数start和end在切片表示法中解释为。
-
encode
(encoding, errors='strict')[源代码]¶ 使用注册用于编码的编解码器对字符串进行编码。
- 编码
对字符串进行编码的编码。
- 错误
用于编码错误的错误处理方案。默认值为“strict”,表示编码错误会引发UnicodeEncodeError。其他可能的值是“ignore”、“replace”和“xmlcharrefreplace”,以及注册的任何其他名称codecs.registeru错误可以处理UnicodeEncodeError。
-
endswith
(suffix[, start[, end]]) → bool[源代码]¶ 如果s以指定后缀结尾,则返回true,否则返回false。选择启动时,测试S从该位置开始。选择结束时,停止在该位置比较s。后缀也可以是要尝试的字符串的元组。
-
find
(sub[, start[, end]]) → int[源代码]¶ 返回s中找到子字符串sub的最低索引,以便sub包含在s中 [开始:结束] . 可选参数start和end在切片表示法中解释为。
失败时返回-1。
-
index
(sub[, start[, end]]) → int[源代码]¶ 返回s中找到子字符串sub的最低索引,以便sub包含在s中 [开始:结束] . 可选参数start和end在切片表示法中解释为。
找不到子字符串时引发ValueError。
-
join
(iter)[源代码]¶ 连接任意数量的字符串。
调用其方法的字符串插入到每个给定字符串之间。结果将作为新字符串返回。
示例:'.'.join( [“ab”、“pq”、“rs”] ) -> 'ab.pq.rs公司'
-
partition
(sep)[源代码]¶ 把给定的字符串用分隔符分成三部分。
这将搜索字符串中的分隔符。如果找到分隔符,则返回一个3元组,其中包含分隔符之前的部分、分隔符本身以及分隔符之后的部分。
如果找不到分隔符,则返回包含原始字符串和两个空字符串的3元组。
-
replace
(old, new, count=- 1)[源代码]¶ 返回一个副本,子字符串old替换为new。
- 计数
要替换的最大引用数。-1(默认值)表示替换所有引用。
如果给定可选参数count,则只替换出现的第一个count。
-
rfind
(sub[, start[, end]]) → int[源代码]¶ 返回在s中找到子字符串sub的最高索引,以便sub包含在s中 [开始:结束] . 可选参数start和end在切片表示法中解释为。
失败时返回-1。
-
rindex
(sub[, start[, end]]) → int[源代码]¶ 返回在s中找到子字符串sub的最高索引,以便sub包含在s中 [开始:结束] . 可选参数start和end在切片表示法中解释为。
找不到子字符串时引发ValueError。
-
rpartition
(sep)[源代码]¶ 把给定的字符串用分隔符分成三部分。
这将搜索字符串中从末尾开始的分隔符。如果找到分隔符,则返回一个3元组,其中包含分隔符之前的部分、分隔符本身以及分隔符之后的部分。
如果找不到分隔符,则返回包含两个空字符串和原始字符串的3元组。
-
rsplit
(sep=None, maxsplit=- 1)[源代码]¶ 返回字符串中单词的列表,使用sep作为分隔符字符串。
- 九月
用于拆分字符串的分隔符。None(默认值)表示根据任何空格拆分,并从结果中丢弃空字符串。
- 最大分割
要执行的最大拆分数。-1(默认值)表示无限制。
分割从字符串的末尾开始,一直到前面。
-
split
(sep=None, maxsplit=- 1)[源代码]¶ 返回字符串中单词的列表,使用sep作为分隔符字符串。
- 九月
用于拆分字符串的分隔符。None(默认值)表示根据任何空格拆分,并从结果中丢弃空字符串。
- 最大分割
要执行的最大拆分数。-1(默认值)表示无限制。
-
startswith
(prefix[, start[, end]]) → bool[源代码]¶ 如果s以指定前缀开头,则返回true,否则返回false。选择启动时,测试S从该位置开始。选择结束时,停止在该位置比较s。前缀也可以是要尝试的字符串的元组。
-