
本文详解selenium中`invalidselectorexception`异常的成因与修复方法,重点说明选择器类型(如`css_selector`)与查找方法(`find_elements`)的正确搭配,避免因混用`class_name`与复合css语法导致的报错。
在使用Selenium进行网页元素定位时,一个常见错误是混淆定位策略(By.xxx)与实际CSS/HTML语法的语义匹配。例如,代码中试图用 By.CLASS_NAME 传入 .event-widget time 这一复合CSS选择器:
driver.find_element(By.CLASS_NAME, ".event-widget time") # ❌ 错误!
这会直接抛出 selenium.common.exceptions.InvalidSelectorException 异常,原因有二:
- 定位策略不匹配:By.CLASS_NAME 仅接受单一类名字符串(如 "event-widget"),不支持点号(.)、空格、标签名等CSS语法;而 .event-widget time 是标准CSS选择器,必须配合 By.CSS_SELECTOR 使用;
- 单复数方法误用:.event-widget time 在页面中匹配多个
✅ 正确写法如下:
from selenium import webdriver
from selenium.webdriver.common.by import By
chrome_driver_path = r"C:\development\chromedriver.exe" # 注意:路径建议加 r 前缀或双反斜杠
driver = webdriver.Chrome(executable_path=chrome_driver_path)
driver.get("https://python.org")
# ✅ 使用 By.CSS_SELECTOR + find_elements()
event_times = driver.find_elements(By.CSS_SELECTOR, ".event-widget time")
for elem in event_times:
print(elem.text)
driver.quit() # 建议显式关闭浏览器,释放资源? 输出示例(以当前Python官网事件日历为准):
立即学习“前端免费学习笔记(深入)”;
2023-02-05 2023-02-16 2023-02-21 2023-02-25 2023-03-06
⚠️ 注意事项:
- By.CLASS_NAME("event-widget") 可用于定位父容器,再链式调用 find_elements(By.TAG_NAME, "time"),但直接使用 CSS_SELECTOR 更简洁高效;
- Windows路径中的反斜杠 \ 易被误解析为转义字符,推荐使用原始字符串 r"C:\..." 或正斜杠 "C:/development/chromedriver.exe";
- 现代Selenium 4+ 推荐使用 webdriver.Chrome() 无参初始化(通过 webdriver-manager 自动管理驱动),避免硬编码路径;
- 若元素动态加载,需添加显式等待(如 WebDriverWait(driver, 10).until(...)),防止 NoSuchElementException。
掌握定位策略与选择器语法的严格对应关系,是编写健壮自动化脚本的基础。务必根据目标表达式结构,选择正确的 By 枚举值,并匹配单/多元素查找方法。










