python url lib.parse 解析 url

创建日期: 2023-08-27 12:40 | 作者: 风波 | 浏览次数: 14 | 分类: Python
import urllib.parse

url = "https://baijiahao.baidu.com/s?id=1775292027675766993"
u = urllib.parse.urlparse(url)

print(u) # ParseResult(scheme='https', netloc='baijiahao.baidu.com', path='/s', params='', query='id=1775292027675766993', fragment='')

# 获取域名
print(u.netloc) # baijiahao.baidu.com

# 替换域名
nu = u._replace(netloc='www.google.com')
print(nu)  # ParseResult(scheme='https', netloc='www.google.com', path='/s', params='', query='id=1775292027675766993', fragment='')

# 获取新的 url
nurl = urllib.parse.urlunparse(nu)
print(nurl) # https://www.google.com/s?id=1775292027675766993

来源:https://docs.python.org/3/library/urllib.parse.html

14 浏览
12 爬虫
0 评论