导入现有站点¶
描述¶
pelican-import
是一个命令行工具,用于将其他软件中的项目转换为reStructuredText或Markdown。支持的导入格式包括:
Blogger XML导出
Dotclear导出
后期API
Tumblr API公司
WordPress XML导出
RSS/Atom源
从HTML到restructedText或Markdown的转换依赖于 Pandoc . 对于Dotclear,如果源帖子是用Markdown语法编写的,它们将不会被转换(因为Pelican也支持Markdown)。
注解
与鹈鹕不同,Wordpress支持每篇文章多个类别。它们作为逗号分隔的字符串导入。您必须手动解决这些问题,或者使用如下插件 More Categories 这使得每篇文章可以有多个类别。
依赖关系¶
pelican-import
有一些其他Pelican不需要的依赖性:
美丽之旅4 和 lxml ,用于WordPress和Dotclear导入。可以像其他Python包一样安装 (
pip install BeautifulSoup4 lxml
)提要分析器 源,用于导入 (
pip install feedparser
)潘多克 见 Pandoc site 有关操作系统的安装说明。
使用¶
pelican-import [-h] [--blogger] [--dotclear] [--posterous] [--tumblr] [--wpfile] [--feed]
[-o OUTPUT] [-m MARKUP] [--dir-cat] [--dir-page] [--strip-raw] [--wp-custpost]
[--wp-attach] [--disable-slugs] [-e EMAIL] [-p PASSWORD] [-b BLOGNAME]
input|api_token|api_key
位置参数¶
input
要读取的输入文件
api_token
(仅限Posterous)api_令牌可从http://posterous.com/api/
api_key
(仅限Tumblr)api密钥可从https://www.tumblr.com/oauth/apps
可选参数¶
- -h, --help
显示此帮助消息并退出
- --blogger
Blogger XML导出(默认值:False)
- --dotclear
Dotclear导出(默认值:False)
- --posterous
Posterous API(默认值:False)
- --tumblr
Tumblr API(默认值:False)
- --wpfile
WordPress XML导出(默认值:False)
- --feed
要分析的源(默认值:False)
- -o OUTPUT, --output OUTPUT
输出路径(默认:内容)
- -m MARKUP, --markup MARKUP
输出标记格式:
rst
,markdown
或asciidoc
(默认:rst
)- --dir-cat
将文件放入类别名称为的目录中(默认值:False)
- --dir-page
将识别为页面的文件放入“pages/”子目录(blogger和wordpress仅导入)(默认值:False)
- --filter-author
只从指定作者导入文章
- --strip-raw
剥离无法转换为标记(如flash嵌入或iframes)的原始HTML代码(仅限wordpress导入)(默认值:False)
- --wp-custpost
将wordpress自定义文章类型放入目录中。如果与--dir cat选项一起使用,目录将创建为“/post_type/category/”(仅限wordpress import)
- --wp-attach
下载作为附件上传到wordpress的文件。文件将作为一个列表添加到文章标题中,并且到文章中文件的链接将被更新。所有文件都将被下载,即使它们与文章没有关联。文件将以其原始路径下载到输出目录中,例如“output/wp uploads/date/postname”/文件.jpg". (仅限wordpress导入)(需要internet连接)
- --disable-slugs
禁止在输出中存储来自导入的post的slug。禁用此功能后,您的Pelican网址可能与您的原始帖子不一致。(默认值:False)
- -e EMAIL, --email=EMAIL
用于验证Posterous API的电子邮件
- -p PASSWORD, --password=PASSWORD
用于验证Posterous API的密码
- -b BLOGNAME, --blogname=BLOGNAME
Tumblr API中使用的博客名称
实例¶
博客写手:
$ pelican-import --blogger -o ~/output ~/posts.xml
对于Dotclear::
$ pelican-import --dotclear -o ~/output ~/backup.txt
对于波斯特罗斯:
$ pelican-import --posterous -o ~/output --email=<email_address> --password=<password> <api_token>
对于Tumblr::
$ pelican-import --tumblr -o ~/output --blogname=<blogname> <api_token>
对于WordPress::
$ pelican-import --wpfile -o ~/output ~/posts.xml
测验¶
要测试模块,可以使用示例文件: