Python selenium 使用说明

发表于 2023-09-13 上层目录 Python 阅读次数：

环境信息

Selenium > 4.0

Selenium 是一个用于自动化 Web 浏览器操作的工具，可以用于模拟用户与网站的交互。

使用 pip 安装 Selenium 库

pip install selenium

Selenium 需要一个 WebDriver 来控制不同的浏览器。可以根据要使用的浏览器下载相应的 WebDriver。以下是一些常见的浏览器和对应的WebDriver下载链接：

下载 WebDriver 并确保它在系统路径中可用。WebDriver 和浏览器具有版本对应关系，要确保版本匹配

selenium 常见用法总结

本示例中以 Chrome 浏览器为例。

创建一个浏览器实例，并请求指定的页面

from selenium import webdriver
from selenium.webdriver.common.by import By

driver = webdriver.Chrome()

driver.get("https://www.example.com")

关闭当前浏览器窗口
driver.close()
最大化浏览器窗口
driver.maximize_window()
后退
driver.back()
前进
driver.forward()
刷新页面
driver.refresh()
关闭浏览器
driver.quit()

查找元素并进行操作

通过元素 ID 查找元素并输入文本

element = driver.find_element(By.ID, "element_id")

element.send_keys("Hello, Selenium!")

通过元素名称查找元素并点击

element = driver.find_element(by.NAME, "element_name")
element.click()

通过链接文本查找元素并点击

element = driver.find_element(By.LINK_TEXT, "Click Here")
element.click()

根据元素的 class 属性查找元素。如果有多个具有相同 class 属性的元素
element = driver.find_element(By.CLASS_NAME, "your_class_name")

element.click()

查找网页源代码。driver.page_source 包含了网页源代码 ^[1]

from selenium import webdriver

driver.implicitly_wait(10)
driver.get("https://the-internet.herokuapp.com/upload");
driver.find_element(By.ID,"file-upload").send_keys("selenium-snapshot.jpg")
driver.find_element(By.ID,"file-submit").submit()
if(driver.page_source.find("File Uploaded!")):
    print("file upload success")
else:
    print("file upload not successful")
driver.quit()

通过 XPath 定位元素

使用绝对 XPath 定位元素（不推荐，因为它对页面结构的变化敏感）
element = driver.find_element(By.XPATH, "/html/body/div[1]/div/div[3]/p/a")
使用相对XPath定位元素（更具灵活性，建议使用）
element = driver.find_element_by_xpath("//div[@class='example']/p/a")
在上面的示例中，我们使用 XPath 定位元素。以下是 XPath 定位的一些常见语法：
- // ：从文档的根节点开始搜索
- / ：从当前节点的子节点中搜索。
- [] ：用于筛选元素，可以包含属性名和值。
- @ ：用于引用元素的属性。

示例:

language_button = driver.find_element(By.XPATH, "//button[contains(@class, 'btn-lang') and contains(@class, 'btn-dropdown')]")

language_button.click()

实际使用中，自己分析 HTML 结构很难找到对的 XPath。这时候需要使用浏览器的开发者工具，在浏览器的开发者工具中，定位到目标元素，可以选择复制 XPath 获得完整的 XPath 路径

如果要获取 XPath 列表中的最后一个元素，可以参考以下方法

(//*[@id="section-event-round"]/div/div[1]/div[3]/div[2]/div[2])[last()]

element = driver.find_element(By.XPATH, "(//*[@id='section-event-round']/div/div[1]/div[3]/div[2]/div[2])[last()]")

这个 XPath 将选择位于 //*[@id="section-event-round"]/div/div[1]/div[3]/div[2]/div[2] 位置的最后一个 <div> 元素。

处理表单

查找表单元素并填写表单字段

username = driver.find_element(By.ID, "username")
password = driver.find_element(By.ID, "password")
username.send_keys("your_username")
password.send_keys("your_password")

提交表单

login_button = driver.find_element(By.ID, "login_button")
login_button.click()

处理下拉框或选择框

通过标签名查找下拉框元素

from selenium.webdriver.support.ui import Select

select = Select(driver.find_element(By.TAG_NAME, "select"))

通过文本选择选某一个选择项

select.select_by_visible_text("Option 1")

通过值选择选某一个选择项
select.select_by_value("option_value")
过索引选择选某一个选择项
select.select_by_index(2)

等待元素加载

使用 WebDriverWait 来等待特定元素出现或满足特定条件

from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC


element = WebDriverWait(driver, 10).until(
    EC.presence_of_element_located((By.ID, "element_id"))
)

切换窗口

切换窗口要使用窗口句柄来操作

获取当前窗口句柄

current_window_handle = driver.current_window_handle

获取所有窗口句柄

all_window_handles = driver.window_handles

切换到新窗口

driver.switch_to.window(new_window_handle)

截图

截取整个页面的屏幕截图

driver.save_screenshot("screenshot.png")

截取特定元素的屏幕截图

element = driver.find_element(By.ID, "element_id")
element.screenshot("element_screenshot.png")

配置浏览器启动选项

要自定义浏览器的启动选项，可以使用 Options

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.options import Options

from selenium.webdriver.chrome.service import Service as ChromeService

# 设置Chrome浏览器的选项
chrome_options = Options()
chrome_options.add_argument("--disable-infobars")  # 禁用信息栏
chrome_options.add_argument("--disable-extensions")  # 禁用扩展
chrome_options.add_argument("--start-maximized")  # 最大化窗口
chrome_options.add_argument("--disable-notifications")  # 禁用通知

# 设置字体显示比例为10%
chrome_options.add_argument("--force-device-scale-factor=0.1")

# 页面加载策略.
## normal	complete	默认值, 等待所有资源下载
## eager	interactive	DOM 访问已准备就绪, 但诸如图像的其他资源可能仍在加载
## none	Any	完全不会阻塞 WebDriver
chrome_options.page_load_strategy = 'normal'

# 如果 chromedriver 在系统 Path 中，无需指定路径
driver = webdriver.Chrome(service=ChromeService("path/to/chromedriver"), options=chrome_options)

如果要为 Selenium 指定 Chrome 浏览器的路径，使用 binary_location 属性 ^[2]

from selenium.webdriver.chrome.options import Options

chrome_options = Options()
chrome_options.binary_location = "D:\Tools\chrome-win64\chrome.exe"

等待元素出现

在使用 Selenium 和浏览器交互的过程中，经常会遇到元素未加载完成而与元素交互导致的失败。这种情况可以使用 time.sleep() 方法等待一段时间。但是这种等待时间无法确定多少合适。 ^[3]

Implicit waits

Seleniu 也提供了 Implicit waits 机制。这是一个全局配置。默认值为 0。表示元素如果未出现，立即返回错误；如果配置了等待时间， driver 将会等待设置的时间，如果在配置的时间内元素依然未出现，则报错，如果在等待的时间内元素出现，程序立即执行，因此使用 Implicit waits 不会增加额外的等待时间。

driver.implicitly_wait(2)
driver.get('https://www.selenium.dev/selenium/web/dynamic.html')
driver.find_element(By.ID, "adder").click()

added = driver.find_element(By.ID, "box0")

Implicit waits 和 Explicit waits 不要混用，否则会使等待时间变长

Explicit waits

Explicit waits 是添加到代码中的循环，用于轮询应用程序以获取特点条件。如果在指定的超时值之前未满足条件，代码将会给出超时错误。

revealed = driver.find_element(By.ID, "revealed")
wait = WebDriverWait(driver, timeout=2)

driver.find_element(By.ID, "reveal").click()
wait.until(lambda d : revealed.is_displayed())

revealed.send_keys("Displayed")

可以使用的条件参考

参考链接

Selenium 文档