平院微信圖書館——中轉圖書查詢

    2014年做一個微信公衆平臺——平院小助手(pdsuhelp),想做一款產品,推廣平臺,於是便做了這個平院微信圖書館,託管於BAE(項目地址:pdsuhelp.duapp.com/lt),目前只能提供查詢功能,至於續借等功能,以後看情況添加!


項目工作流程:

1、獲取圖書館查詢圖書地址,通過get傳參,替換word的參數





2、抓取圖書列表頁內容,並顯示,抓取每本圖書詳情頁面超鏈接,並加上a 標籤 ,目前只能抓取第一頁


3:點擊進入圖書詳情頁面,抓取主要信息,書名,書放的位置。



主要技術:

    1:;前端框架採用jquery mobile

   2:參數傳遞(post傳參,主要傳遞“搜索關鍵詞,用於php抓取目錄頁處理腳本”,和傳遞每本書的詳情頁url地址,用於抓取書籍詳細信息頁處理腳本)



3:頁面抓取技術:

主要用了PHP採集庫-Snoopy.class.php

簡介:

Snoopy是一個php類,用來模擬瀏覽器的功能,可以獲取網頁內容,發送表單。
Snoopy的特點:
1、抓取網頁的內容 fetch
2、抓取網頁的文本內容 (去除HTML標籤) fetchtext
3、抓取網頁的鏈接,表單 fetchlinks fetchform
4、支持代理主機
5、支持基本的用戶名/密碼驗證
6、支持設置 user_agent, referer(來路), cookies 和 header content(頭文件)
7、支持瀏覽器重定向,並能控制重定向深度
8、能把網頁中的鏈接擴展成高質量的url(默認)
9、提交數據並且獲取返回值
10、支持跟蹤HTML框架
11、支持重定向的時候傳遞cookies
要求php4以上就可以了,由於本身是php一個類,無需擴支持,服務器不支持curl時候的最好選擇。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章