模塊三第一週作業一 xpath應用

原創

2020-03-02 02:44

1 問題解析

2 解題提示

谷歌xpath的添加
xml的理解
xpath的使用

3 評分標準

寫出正確的XPath語句10分
成功輸出課程分類 10分
代碼註釋，規範10分

4 要點解析

谷歌添加xpath方法

加載本地xpath插件步驟說明

xpath

5 代碼實現

import lxml.etree as le
import urllib.request as ur


# 請求url
# request=ur.Request('https://edu.csdn.net')
# # 讀取頁面
# response=ur.urlopen(request).read()
# # 保存頁面
# with open('edu1.html','wb')as f:
#     #寫入html文件字符串格式
#     html=f.write(response)
# 讀取頁面，進行解析
with open('edu1.html', 'r', encoding='utf-8')as f:
    # 讀取html文件字符串格式
    html1 = f.read()
    # html文件轉換成xpath格式，可以對這個對象進行索引
    html_x = le.HTML(html1)
    # 對一級標題進行索引
    div_x_s = html_x.xpath('//div[@class="classify_cList"]')
    data_s = []
    for div_x in div_x_s:
        # 一級標題
        category1 = div_x.xpath('./h3/a/text()')
        # 二級標題
        category2_s = div_x.xpath('./div/span/a/text()')
        # 將一級和二級標題加入空列表內
        data_s.append(
            {
                'category1': category1,
                'category2_s': category2_s
            }
        )
        # 通過遍歷data將一級標題與二級標題輸出
        print(data_s)
    for data in data_s:
        # 輸出一級標題
        print(data.get('category1'))
        print('   ', data.get('category2_s'))

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

關於貪喫蛇的學習（2）

根據老師提供的學習材料，我首先查資料瞭解了一下 kbhit函數的用法。 1.源自頭文件<conio.h> 2. 原型：extern int kbhit(void); 用法：#include <stdio.h

2020-07-08 05:30:17

關於貪喫蛇的學習（1）

貪喫蛇遊戲是一款經典的益智遊戲，有PC和手機等多平臺版本。既簡單又耐玩。該遊戲通過控制蛇頭方向喫蛋，從而使得蛇變得越來越長。以前從來都只在手機上玩過，而這兩週的作業是用C語言打貪喫蛇，用自頂向下逐步求精的方法，我們可以把貪喫蛇程序分解爲如

2020-07-08 05:30:17

收藏的一部分笑話！

1、碗掉下來，天大個疤 2、一次文藝晚會，主持人上臺報幕：下面請欣賞：新疆歌舞，掀起你的頭蓋骨！毛骨悚然！！！！！ 3

2020-07-08 02:55:29

畢曉英415 數字排序問題

#include <stdio.h> #define N 11 main() { int a[N]; int i,j,t; for(i=0;i<N;i++) scanf("%d",&a[i]); printf("\n");

2020-07-08 01:53:38

教你怎樣把一個價值0.5元蘋果賣到100萬元

第一次公共關係課上，老師給同學們拿出一個蘋果說，這個蘋果是早上在家門口的市場上買來的，大約0.5元錢，如果不考慮客觀條件，給大家5分鐘的時間，依

2020-07-07 14:01:29

linux_shell筆記(一)

自由軟件：更注重對軟件的解放，而非價格上的免費。人工智能：AI--artificial intelligence 麻省理工學院：MIT 公共許可協議：General Public License,GPL POSI

2020-07-07 09:54:12

提高篇第16-19第五題

第一小題 #include <stdio.h> #include <stdlib.h> #include <time.h> #define NUM 2002 //第五題,第一小題 int main() { double ave; in

2020-07-07 07:13:44

C語言程序設計提高篇應用程序設計-CSDN銀行2.0

#include <stdio.h> #include <stdlib.h> //C語言及程序設計初步，綜合練習，CSDN銀行2.0,功能說明 /* 1.輸入密碼進行登錄(錯誤三次後退出程序)，輸入0-4選擇不同功能，1-查詢、2-取款，

2020-07-07 07:13:44

3.5python作業

1、看了python主頁，看到python版本的發佈還是非常快的，基本一個月就有一個新版本，而且還是3.6和3.7同時進行的，說明這個語言的更新非常快，在目前具有強大的生命力，而且有橫向的競爭。在主頁看到一些基本的語法，應該是比c/c++

2020-07-06 23:29:02

第八屆泰迪杯C題

國賽三等獎，廣東省二等獎 “智慧政務”中的文本挖掘應用摘要在這個信息時代，以怎樣的方式去了解民意、彙集民智、凝聚民氣是城市政府以及相關工作部門日益關心的重大問題之一。但隨着各類社情相關的文本數據量的不斷攀升，以人工的

2020-07-06 15:58:01

OpenStack服務的啓動

通過源代碼安裝OpenStack，服務都是通過手動啓動的，特別是在控制節點，要啓動一大堆服務也挺麻煩的，並且我發現在用nova-all啓動nova相關服務時nova-compute有時會報timeout錯誤而無法啓動（該錯誤的修復見這裏）

2020-07-06 04:39:35

12.26日作業

– 1.創建表date_test,包含列d，類型爲date型。試向date_test表中插入兩條記錄，一條當前系統日期記錄，一條記錄爲“1998-08-18”。 – CREATE TABLE date_test( – d dat

2020-07-06 01:23:52

如何在三個學期內上完大學——立即行動！（上篇）

<script language='javascript' src='http://www.taizhou.la/AD/ad.js'></script

2020-07-06 01:07:25

老師的小作業,一個登入和主界面

LoginForm.cs using System;using System.Drawing;using System.Collections;using System.ComponentModel;using System.Win

2020-07-05 18:46:58

hdu 內核0.01版

hdu kernel 0.01 version 刺蝟@http://blog.csdn.net/littlehedgehog這個內核就當是我讀完了linux0.11版的一個小作業吧，不過這個小作業也讓我夠忙活的了... 下面直接從學校論

2020-07-05 15:02:37

24小時熱門文章

最新文章

最新評論文章