运行和部署

由于Tornado提供了自己的httpserver,因此运行和部署它与其他PythonWeb框架有点不同。不是配置一个wsgi容器来查找应用程序,而是编写一个 main() 启动服务器的函数:

import asyncio

async def amain():
    app = make_app()
    app.listen(8888)
    await asyncio.Event().wait()


def main():
    asyncio.run(amain())

if __name__ == '__main__':
    main()

配置操作系统或进程管理器以运行此程序以启动服务器。请注意,可能需要增加每个进程打开的文件数(以避免“打开的文件太多”-错误)。要提高此限制(例如将其设置为50000),可以使用 ulimit 命令修改 /etc/security/limits.conf 或设置 minfds 在你 supervisord 配置。

进程和端口

由于python gil(全局解释器锁),需要运行多个python进程以充分利用多CPU机器。通常,最好每个CPU运行一个进程。

Tornado包含一个内置的多进程模式,可以一次启动多个进程(请注意,多进程模式不适用于Windows)。这需要对标准的主要功能进行细微的修改:

def main():
    app = make_app()
    server = tornado.httpserver.HTTPServer(app)
    server.bind(8888)
    server.start(0)  # forks one process per cpu
    IOLoop.current().start()

这是启动多个进程并让它们共享同一端口的最简单方法,尽管它有一些限制。首先,每个子进程都有自己的 IOLoop 因此,任何事情都不能触及全球是很重要的 IOLoop 实例(甚至间接地)在分叉之前。其次,在这个模型中很难实现零停机时间更新。最后,由于所有进程共享同一个端口,因此更难单独监视它们。

对于更复杂的部署,建议独立启动进程,并让每个进程侦听不同的端口。的“过程组”特征 supervisord 这是一个很好的安排方式。当每个进程使用不同的端口时,通常需要一个外部负载均衡器(如haproxy或nginx)向外部访问者提供一个地址。

在负载平衡器后面运行

在负载均衡器后面运行时 nginx ,建议通过 xheaders=TrueHTTPServer 构造函数。这将告诉Tornado使用 X-Real-IP 获取用户的IP地址,而不是将所有流量归因于平衡器的IP地址。

这是一个准nginx配置文件,其结构类似于我们在friendfeed中使用的文件。假设nginx和tornado服务器在同一台机器上运行,四台tornado服务器在端口8000-8003上运行:

user nginx;
worker_processes 1;

error_log /var/log/nginx/error.log;
pid /var/run/nginx.pid;

events {
    worker_connections 1024;
    use epoll;
}

http {
    # Enumerate all the Tornado servers here
    upstream frontends {
        server 127.0.0.1:8000;
        server 127.0.0.1:8001;
        server 127.0.0.1:8002;
        server 127.0.0.1:8003;
    }

    include /etc/nginx/mime.types;
    default_type application/octet-stream;

    access_log /var/log/nginx/access.log;

    keepalive_timeout 65;
    proxy_read_timeout 200;
    sendfile on;
    tcp_nopush on;
    tcp_nodelay on;
    gzip on;
    gzip_min_length 1000;
    gzip_proxied any;
    gzip_types text/plain text/html text/css text/xml
               application/x-javascript application/xml
               application/atom+xml text/javascript;

    # Only retry if there was a communication error, not a timeout
    # on the Tornado server (to avoid propagating "queries of death"
    # to all frontends)
    proxy_next_upstream error;

    server {
        listen 80;

        # Allow file uploads
        client_max_body_size 50M;

        location ^~ /static/ {
            root /var/www;
            if ($query_string) {
                expires max;
            }
        }
        location = /favicon.ico {
            rewrite (.*) /static/favicon.ico;
        }
        location = /robots.txt {
            rewrite (.*) /static/robots.txt;
        }

        location / {
            proxy_pass_header Server;
            proxy_set_header Host $http_host;
            proxy_redirect off;
            proxy_set_header X-Real-IP $remote_addr;
            proxy_set_header X-Scheme $scheme;
            proxy_pass http://frontends;
        }
    }
}

静态文件和积极的文件缓存

您可以通过指定 static_path 应用程序中的设置:

settings = {
    "static_path": os.path.join(os.path.dirname(__file__), "static"),
    "cookie_secret": "__TODO:_GENERATE_YOUR_OWN_RANDOM_VALUE_HERE__",
    "login_url": "/login",
    "xsrf_cookies": True,
}
application = tornado.web.Application([
    (r"/", MainHandler),
    (r"/login", LoginHandler),
    (r"/(apple-touch-icon\.png)", tornado.web.StaticFileHandler,
     dict(path=settings['static_path'])),
], **settings)

此设置将自动发出所有以 /static/ 从静态目录服务,例如 http://localhost:8888/static/foo.png 将提供文件 foo.png 从指定的静态目录。我们也会自动服务 /robots.txt/favicon.ico 从静态目录(即使它们不是以 /static/ 前缀)。

在上述设置中,我们已经明确配置了Tornado apple-touch-icon.png 从根开始 StaticFileHandler 尽管它在静态文件目录中。(正则表达式中的捕获组 StaticFileHandler 请求的文件名;请记住,捕获组作为方法参数传递给处理程序。)您可以执行相同的操作,例如。 sitemap.xml 从站点根目录。当然,你也可以避免假根。 apple-touch-icon.png 通过使用适当的 <link /> 在HTML中标记。

为了提高性能,浏览器最好积极地缓存静态资源,这样浏览器就不会发送不必要的信息。 If-Modified-SinceEtag 可能阻止页面呈现的请求。龙卷风用 静态内容版本控制 .

要使用此功能,请使用 static_url 方法,而不是直接在HTML中键入静态文件的URL::

<html>
   <head>
      <title>FriendFeed - {{ _("Home") }}</title>
   </head>
   <body>
     <div><img src="{{ static_url("images/logo.png") }}"/></div>
   </body>
 </html>

这个 static_url() 函数将把该相对路径转换为一个类似于 /static/images/logo.png?v=aae54 . 这个 v 参数是中内容的哈希值 logo.png ,它的存在使Tornado服务器向用户的浏览器发送缓存头,从而使浏览器无限期地缓存内容。

自从 v 参数基于文件的内容,如果更新文件并重新启动服务器,它将开始发送新的 v 值,因此用户的浏览器将自动获取新文件。如果文件内容不变,浏览器将继续使用本地缓存副本,而不必检查服务器上的更新,从而显著提高渲染性能。

在生产环境中,您可能希望从更优化的静态文件服务器(如 nginx . 您可以配置几乎任何Web服务器来识别 static_url() 并相应地设置缓存头。以下是我们在FriendFeed中使用的nginx配置的相关部分:

location /static/ {
    root /var/friendfeed/static;
    if ($query_string) {
        expires max;
    }
 }

调试模式和自动重新加载

如果你通过 debug=TrueApplication 构造函数,应用程序将以调试/开发模式运行。在此模式下,将启用开发时为方便而设计的几个功能(每个功能也作为单个标志提供;如果同时指定了这两个功能,则以单个标志为准):

  • autoreload=True :应用程序将监视对其源文件的更改,并在任何更改时重新加载自身。这减少了在开发期间手动重新启动服务器的需要。但是,某些故障(例如导入时的语法错误)仍然会以调试模式当前无法恢复的方式使服务器停机。

  • compiled_template_cache=False :不会缓存模板。

  • static_hash_cache=False :静态文件哈希(由 static_url 函数)不会被缓存。

  • serve_traceback=True :当 RequestHandler 未捕获,将生成包含堆栈跟踪的错误页。

自动加载模式与的多进程模式不兼容 HTTPServer . 你不能给 HTTPServer.start 除1(或调用)以外的参数 tornado.process.fork_processes )如果使用自动加载模式。

调试模式的自动重新加载功能作为中的独立模块提供。 tornado.autoreload . 这两种方法可以结合使用,以增强对语法错误的鲁棒性:set autoreload=True 在应用程序中检测运行中的更改,并使用 python -m tornado.autoreload myserver.py 在启动时捕获任何语法错误或其他错误。

重新加载会丢失任何python解释器命令行参数(例如 -u )因为它使用 sys.executablesys.argv . 此外,修改这些变量将导致重新加载行为不正确。

在某些平台上(包括10.6之前的Windows和Mac OSX),进程无法“就地”更新,因此当检测到代码更改时,旧服务器退出,新服务器启动。众所周知,这会混淆一些IDE。