提取段落

 from lxml import etree
    from lxml.html import fromstring, tostring

    wb_data = """
        <div class="text" id="text1">
                            <div class="textad" id="ad4"></div>
                            <p><a href="https://www.c114.com.cn/keyword/default.asp?key=%BB%AA%CE%AA" target="_blank" class="keyword">華爲</a>昨天發佈了Mate50系列<a href="https://www.c114.com.cn/keyword/default.asp?key=%CA%D6%BB%FA" target="_blank" class="keyword">手機</a>,這是全球首款支持北斗衛星消息的大衆<a href="https://www.c114.com.cn/keyword/default.asp?key=%D6%C7%C4%DC%CA%D6%BB%FA" target="_blank" class="keyword">智能手機</a>,在無地面<a href="https://www.c114.com.cn/keyword/default.asp?key=%CD%F8%C2%E7" target="_blank" class="keyword">網絡</a>信號覆蓋環境下,仍可通過暢連App發送消息。</p>
        <p>根據官方註釋,作爲北斗衛星消息提供移動終端硬件,它們僅支持發送消息,不支持接收,而且需要在空曠、無遮蔽的環境使用。</p>
        <p>這是因爲北斗衛星信息目前僅支持發出內容,無法與接收者互動,<strong>這一限制是北斗衛星信息本身的性質決定的,並非Mate 50系列無法做到。</strong></p>
        <p align="center"><img alt="華爲Mate50衛星短信每月免費30條 專家:1元/條纔不虧本" src="https://image.c114.com.cn/20220907/38/1807676893933871142.jpg"></p>
        <p>好消息是,華爲Mate50的衛星<a href="https://www.c114.com.cn/keyword/default.asp?key=%B6%CC%D0%C5" target="_blank" class="keyword">短信</a>功能暫時並不收費,<strong>有網友實測華爲提供了每月免費30條的額度</strong>,每月到期會清零額度,下月自動充值30條免費額度。</p>
        <p>目前還是體驗期,不確定結束之後華爲是否會收費。</p>
        <p>華爲Mate50手機支持了<a href="https://www.c114.com.cn/keyword/default.asp?key=%CE%C0%D0%C7%CD%A8%D0%C5" target="_blank" class="keyword">衛星通信</a>,方便用戶在緊急情況下求救,不過這樣的成本也不低,第一財經採訪了多位業內專家,稱衛星通信實際上是個虧本買賣。</p>
        <p>有廠商的技術負責人表示,一顆衛星製造到上天成本十來個億,每年運營維護一個億,按照10年壽命來看,<strong>也就是說需要一顆衛星每年發2億條短消息,每條1塊錢纔不虧本</strong>,目前手機廠商做這個事情,開通<a href="https://www.c114.com.cn/keyword/default.asp?key=%B2%E2%CA%D4" target="_blank" class="keyword">測試</a>時就需要和各方將利益劃分清楚。</p>
        <p align="center"><img alt="華爲Mate50衛星短信每月免費30條 專家:1元/條纔不虧本" src="https://image.c114.com.cn/20220907/42/4630116951170932806.png"> <a href="http://www.c114.com.cn"><img src="https://www.c114.com.cn/news/images/t21.gif"></a></p>
                        </div>
                
            """
    html = etree.HTML(wb_data)
    # 1807676893933871142
    html_data = html.xpath('//p/img/..|//p')
    print(html_data)
    for i in html_data:
        print(etree.tostring(i, method='html' ,encoding='utf-8').decode("utf-8") )

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章