Python Selenium自动化获取页面信息的方法

(编辑:jimmy 日期: 2025/1/9 浏览:2)

1.获取页面title

title:获取当前页面的标题显示的字段

from selenium import webdriver
import time 

browser = webdriver.Chrome()
browser.get('https://www.baidu.com') 

#打印网页标题
print(browser.title)
#输出内容:百度一下,你就知道

2.获取页面URL

current_url:获取当前页面的URL

from selenium import webdriver
import time 

browser = webdriver.Chrome()
browser.get('https://www.baidu.com') 

#打印网页标题
print(browser.current_url)
#输出内容:https://www.baidu.com/

3.获取浏览器版本号

capabilities['version']):打印浏览器version的值

from selenium import webdriver
import time 

browser = webdriver.Chrome()
browser.get('https://www.baidu.com') 

#打印网页标题
print(browser.capabilities['version'])
#输出内容:67.0.3396.87

4.获取元素尺寸

size:返回元素的尺寸

from selenium import webdriver
import time 

browser = webdriver.Chrome()
browser.get('https://www.baidu.com') 

#定位输入框
input_box = browser.find_element_by_id('kw')
#打印输入框尺寸
print(input_box.size)
#输出内容:{'height': 22, 'width': 500}

5.获取元素的文本

text:返回元素的文本信息

from selenium import webdriver
import time 

browser = webdriver.Chrome()
browser.get('https://www.baidu.com') 

#定位备案元素
recordcode = browser.find_element_by_id('jgwab')
#打印备案元素信息
print(recordcode.text)
#输出内容:京公网安备11000002000001号

6.获得属性值

  • get_attribute('')方法
  • get_attribute('href'):获取href属性值
  • get_attribute('id'):获取id属性值
# coding=utf-8
import time
from selenium import webdriver


driver = webdriver.Chrome()
driver.maximize_window()
driver.implicitly_wait(6)
driver.get("https://www.baidu.com")
time.sleep(1)

for link in driver.find_elements_by_xpath("//*[@href]"):
  print (link.get_attribute('href'))
driver.quit()

一句话新闻

高通与谷歌联手!首款骁龙PC优化Chrome浏览器发布
高通和谷歌日前宣布,推出首次面向搭载骁龙的Windows PC的优化版Chrome浏览器。
在对骁龙X Elite参考设计的初步测试中,全新的Chrome浏览器在Speedometer 2.1基准测试中实现了显著的性能提升。
预计在2024年年中之前,搭载骁龙X Elite计算平台的PC将面世。该浏览器的提前问世,有助于骁龙PC问世就获得满血表现。
谷歌高级副总裁Hiroshi Lockheimer表示,此次与高通的合作将有助于确保Chrome用户在当前ARM兼容的PC上获得最佳的浏览体验。