Helium是基于Selenium的Python自动化库,通过自然语言风格的语法简化浏览器操作。1. 安装命令为pip install helium,导入后可用start_chrome()启动浏览器,支持headless模式。2. 支持click('登录')、write('内容', into='输入框')等直观操作,无需编写XPath或CSS选择器。3. 可用Text、Link等类提取文本或属性,结合exists和wait_until实现断言与等待。4. 任务结束调用kill_browser()关闭浏览器。适用于表单填写、简单爬虫等场景,代码简洁但灵活性较Selenium低。

安装与启动浏览器
先通过 pip 安装 Helium:
pip install helium然后导入并启动浏览器。Helium 支持 Chrome 和 Firefox,最常用的是 Chrome:
from helium import *browser = start_chrome('https://example.com', headless=False)
headless=True 可在无界面模式下运行,适合后台任务。
常用操作:定位与交互
Helium 最大的优势是无需手动写 XPath 或 CSS 选择器,直接通过文本或标签识别元素:
立即学习“Python免费学习笔记(深入)”;
- 点击按钮或链接: click('登录') —— 直接点文字为“登录”的元素
- 输入内容: write('用户名', into='邮箱') —— 向占位符或标签为“邮箱”的输入框输入
- 选择下拉框: select('性别', '男')
- 等待元素出现: wait_until(Text('加载完成').exists)
支持的定位方式包括:链接文字、按钮文字、输入框标签、图片 alt 文本等,语义清晰。
页面提取与断言
除了操作,Helium 还能轻松提取页面内容:
- 获取文本: text = Text('欢迎用户').value
- 判断是否存在: if Link('退出').exists(): click('退出')
- 获取链接或属性: href = Link('帮助').web_element.get_attribute('href')
这些方法结合 exists 或 wait_until,可用于流程控制和结果验证。
关闭与清理
任务完成后记得关闭浏览器:
kill_browser()这个函数会关闭所有 Helium 打开的浏览器实例,释放资源。
基本上就这些。Helium 适合表单填写、简单爬虫、自动化测试等场景,代码干净,学习成本低。虽然灵活性不如原生 Selenium,但对大多数常规任务来说,效率更高,写起来也更顺手。











