python+selenium获取某个节点元素的源码

今天有个需求需要用到selenium和beautifulsoup,需要获取单个节点的html源码并转换为soup对象

ele = self.find_element_by_id("id")
ele.get_attribute("innerHTML")

innerHTML输出当前标签的文本内容,如果标签内有子标签,会连子标签本身和子标签内的文本内容一起输出

<body>
    <div id="div1">这是一个标签div</div>
    <span id="span1">这是一个标签span</span>
    <div id="div2">
        <span>div2里面的span1</span>
        <span>div2里面的span2</span>
        <img src="" alt="">
    </div>
    <script>
        var div1 = document.getElementById("div1").innerText;
        var span1 = document.getElementById("span1").innerText;
        var div2 = document.getElementById("div2").innerText;
        console.log(div1);
        console.log(span1);
        console.log(div2);
        
    </script>
</body>

outerHTML输出当前标签的本身和标签内的文本内容,如果有子标签,那么子标签本身和标签内的文本内容也将一起输出

<body>
    <div id="div1">这是一个标签div</div>
    <span id="span1">这是一个标签span</span>
    <div id="div2">
        <span>div2里面的span1</span>
        <span>div2里面的span2</span>
        <img src="" alt="">
    </div>
    <script>
        var div1 = document.getElementById("div1").outerHTML;
        var span1 = document.getElementById("span1").outerHTML;
        var div2 = document.getElementById("div2").outerHTML;
        console.log(div1);
        console.log(span1);
        console.log(div2);
    </script>
</body>
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章