BeautifulSoup 获取 script 元素中的 javascript 代码

创建日期: 2022-10-31 21:48 | 作者: 风波 | 浏览次数: 14 | 分类: Python

不能使用 ele.get_text(),需要使用 ele.contents

    soup = None
    with open(filename, "rb") as f:
        content = f.read()
        soup = BeautifulSoup(content, "html.parser")
    if not soup:
        print("parse file failed: {}".format(filename), file=sys.stderr)
        return 0
    for s in soup.find_all("script"):
        for c in s.contents:
            print(c)
14 浏览
7 爬虫
0 评论