pyppeteer是puppeteer的Python版本,puppeteer是谷歌基于node.js开发的一个工具,它可以使我们通过JavaScript来控制Chrome执行一些操作,功能非常强大,下面简单跟大家讲解一下pyppeteer的安装使用。
pyppeteer代码如下:
import asyncio
from pyppeteer import launch
from lxml import etree
async def main():
browser = await launch()
page = await browser.newPage()
await page.goto('https://movie.douban.com/chart')
await page.waitForXPath('//table//a[@title]')
doc = etree.HTML(await page.content())
names = [element.attrib['title'] for element in doc.xpath('//table//a[@title]')]
print('Names: ', names)
await browser.close()
asyncio.get_event_loop().run_until_complete(main())
运行结果如下:
Names:['想哭的我带上来猫的面具','午夜0时的吻','侵入者','默片解说员']
代码的大致意思了懂点程序的这里应该都看得懂,我就不多说了。通过上面的这个示例,我们看到pyppeteer比selenium要简洁的多,而且环境配置也方便,直接自动帮我们实现了环境配置。本来还有一些详细的讲解,由于篇幅长度限制,本篇先简单介绍下基础的,后面再跟大家分享下其它的功能。