抓取

PyQuery能够从以下URL加载HTML文档:

>>> pq(your_url)
[<html>]

默认情况下,它使用python的urllib。

如果 requests 安装后将使用它。这使您可以使用 requests 参数::

>>> pq(your_url, headers={'user-agent': 'pyquery'})
[<html>]

>>> pq(your_url, {'q': 'foo'}, method='post', verify=True)
[<html>]

超时

默认超时为60秒,您可以通过设置转发到基础URLLIB或请求库的超时参数来更改它。

会话

使用请求库时,可以实例化会话对象,该对象在HTTP调用之间保持状态(例如,保留cookie)。可以设置session参数以使用此session对象。