导入现有站点

描述

pelican-import 是一个命令行工具,用于将其他软件中的项目转换为reStructuredText或Markdown。支持的导入格式包括:

  • Blogger XML导出

  • Dotclear导出

  • 后期API

  • Tumblr API公司

  • WordPress XML导出

  • RSS/Atom源

从HTML到restructedText或Markdown的转换依赖于 Pandoc . 对于Dotclear,如果源帖子是用Markdown语法编写的,它们将不会被转换(因为Pelican也支持Markdown)。

注解

与鹈鹕不同,Wordpress支持每篇文章多个类别。它们作为逗号分隔的字符串导入。您必须手动解决这些问题,或者使用如下插件 More Categories 这使得每篇文章可以有多个类别。

依赖关系

pelican-import 有一些其他Pelican不需要的依赖性:

  • 美丽之旅4lxml ,用于WordPress和Dotclear导入。可以像其他Python包一样安装 (pip install BeautifulSoup4 lxml

  • 提要分析器 源,用于导入 (pip install feedparser

  • 潘多克Pandoc site 有关操作系统的安装说明。

使用

pelican-import [-h] [--blogger] [--dotclear] [--posterous] [--tumblr] [--wpfile] [--feed]
               [-o OUTPUT] [-m MARKUP] [--dir-cat] [--dir-page] [--strip-raw] [--wp-custpost]
               [--wp-attach] [--disable-slugs] [-e EMAIL] [-p PASSWORD] [-b BLOGNAME]
               input|api_token|api_key

位置参数

input

要读取的输入文件

api_token

(仅限Posterous)api_令牌可从http://posterous.com/api/

api_key

(仅限Tumblr)api密钥可从https://www.tumblr.com/oauth/apps

可选参数

-h, --help

显示此帮助消息并退出

--blogger

Blogger XML导出(默认值:False)

--dotclear

Dotclear导出(默认值:False)

--posterous

Posterous API(默认值:False)

--tumblr

Tumblr API(默认值:False)

--wpfile

WordPress XML导出(默认值:False)

--feed

要分析的源(默认值:False)

-o OUTPUT, --output OUTPUT

输出路径(默认:内容)

-m MARKUP, --markup MARKUP

输出标记格式: rstmarkdownasciidoc (默认: rst

--dir-cat

将文件放入类别名称为的目录中(默认值:False)

--dir-page

将识别为页面的文件放入“pages/”子目录(blogger和wordpress仅导入)(默认值:False)

--filter-author

只从指定作者导入文章

--strip-raw

剥离无法转换为标记(如flash嵌入或iframes)的原始HTML代码(仅限wordpress导入)(默认值:False)

--wp-custpost

将wordpress自定义文章类型放入目录中。如果与--dir cat选项一起使用,目录将创建为“/post_type/category/”(仅限wordpress import)

--wp-attach

下载作为附件上传到wordpress的文件。文件将作为一个列表添加到文章标题中,并且到文章中文件的链接将被更新。所有文件都将被下载,即使它们与文章没有关联。文件将以其原始路径下载到输出目录中,例如“output/wp uploads/date/postname”/文件.jpg". (仅限wordpress导入)(需要internet连接)

--disable-slugs

禁止在输出中存储来自导入的post的slug。禁用此功能后,您的Pelican网址可能与您的原始帖子不一致。(默认值:False)

-e EMAIL, --email=EMAIL

用于验证Posterous API的电子邮件

-p PASSWORD, --password=PASSWORD

用于验证Posterous API的密码

-b BLOGNAME, --blogname=BLOGNAME

Tumblr API中使用的博客名称

实例

博客写手:

$ pelican-import --blogger -o ~/output ~/posts.xml

对于Dotclear::

$ pelican-import --dotclear -o ~/output ~/backup.txt

对于波斯特罗斯:

$ pelican-import --posterous -o ~/output --email=<email_address> --password=<password> <api_token>

对于Tumblr::

$ pelican-import --tumblr -o ~/output --blogname=<blogname> <api_token>

对于WordPress::

$ pelican-import --wpfile -o ~/output ~/posts.xml

测验

要测试模块,可以使用示例文件: