Feed43自定義 RSS 訂閱源

Google Reader 的關閉後,到處充斥着 RSS 將死的論調。如今看來並沒有想象中的那麼慘,許多人依舊喜歡沿用 RSS 作爲自己獲取信息的方式。 前段時間,少數派 Matrix 進行了一次關於 RSS 的討論,其中不乏有許多好的觀點迸發出來。如果你沒有參加,可以閱讀 這篇回顧文章 瞭解。

我喜歡 RSS,但又苦於許多網站不支持,這時候,就要藉助可以將任意網站變成 RSS 訂閱源的工具,我在用的是 Feed43。

你可能會好奇,它是怎樣做到的呢?通俗來說,網站通過後臺發佈的消息在你的瀏覽器上顯示時,有許多代碼段落是重複的。拿少數派來講,每一篇在首頁顯示的文章,使用了同一種樣式,變化的只是內容。Feed43 通過建立特定的篩選器來過濾複雜的樣式,簡化成 RSS 訂閱源。

所以,利用 Feed43 製作自己的 RSS 訂閱源時,你可能需要對網頁使用的 HTML 語言有一些基本的瞭解。不過,你完全不必擔心這一點,通過下面的例子,你很容易看明白。

手把手教你製作 RSS 源

我在少數派撰稿,但是並不知道自己的文章會在什麼時候被責編髮布,於是我就利用我在少數派的個人主頁,製作了一個「少數派發表了我的文章」的 RSS 源。一旦我的文章被髮布,就會收到提醒。下面,我就以此爲實例,來手把手教你製作一個 RSS 源。

1. 打開需要製作 RSS 內容的頁面,並在 Feed43 上新建一個 RSS 源。

在這裏,我打開的是我的個人主頁。因爲一旦我的文章被髮布,就會在此頁面有內容更新。然後 打開 Feed43,點擊「Create your own feed」開始創建 RSS 源。

2. 在 Feed43 中加載內容頁面,並獲取源碼。

接下來,將個人中心網址複製下來,並粘貼到 Feed43 的對應選框中。後面的 Encoding 代表網頁編碼方式,正常情況下留空就行,Feed43 會自動選擇。

點擊 Reload,你就會在下面的選框中看到當前網頁的源代碼了。其實這些源代碼你也可以通過右鍵點擊相應網頁的空白區域,選擇「查看網頁源代碼」來獲取。不過,這裏我們嚴格按照 Feed43 的流程來獲取。

3. 找到內容所在 HTML 字段規律。

這一步就會接觸到 HTML 了,完全不明白 HTML 的朋友也不必擔心,你就當作是找規律小遊戲。

滾動鼠標找到內容對應的區域,你會發現不同文章對應着相似源碼。Feed43 有一點做的比較好,它會自動捕捉一些標記標題的源碼,並標識成粉紅色。

4. 複製其中的一段源碼,留做下一步備用。

這一步就是將相似的源代碼複製一段。需要考慮到 3 個小問題

  • 實例中的源碼會包含多篇文章,但只需要複製其中一篇文章對應的那一段源碼就行。
  • 複製的部分需要通過你所製作的 RSS 來考慮。例如我這次製作的 RSS 可能會包括文章標題、鏈接、發佈時間、摘要等。
  • 需要考慮 HTML 語言的格式。HTML 語言在使用時,標記符號是相互對應的。例如標記標題三是:<h3>標題三</h3>。所以複製時不要丟掉後面的標記符號。下面展示了正確和錯誤的示例。錯誤的示例中,丟掉了 </div>

正確示例

錯誤示例

 最終我複製了一個包含標題、鏈接、摘要和時間的字段,分別如下所示:

<h3 class="post-title"><a href="https://sspai.com/34188">讓輸入更高效有趣,Google 出品的 iOS 鍵盤:Gboard</a></h3>
<a href="https://sspai.com/34188">鑑於 Google 輸入法在 Android 上的良好口碑,從 iOS 支持第三方輸入法開始,不少人就一直期盼着它什麼時候也能登陸 iOS 平臺。
終於在昨晚,Google 在 A...</a>
<span class="publish-time">04月26日</span>

5. 將特定的源碼字段變成通用源碼字段。

這一步將上面複製的源碼粘貼到「Item (repeatable) Search Pattern」選框中,「Global Search Pattern」留空即可。

接下來就是精簡源碼。將標題、鏈接,時間等變化的字段刪去用 {%}代替。將固定且多餘的字段刪去用 {*}代替注意,源碼中有換行的地方均需要添加{*}

如上圖所示,源碼已經被精簡了。點擊 Extract,如果左下方顯示 » OK (N items found),則代表成功了。看一看抓取到的內容是否有格式錯誤的地方。如果沒有抓取到內容,或者有格式錯誤,則需要繼續仔細調整。這一步需要多嘗試幾次,就能找到經驗了。

如上圖所示,每一篇文章的標題、鏈接、摘要、時間都已經成功抓取了。

6. 完善 RSS 源格式。

接下來,就是完善 RSS 訂閱源格式。如下圖所示,上半部分主要是填寫 RSS 信息,包括名稱和描述,相信大家很好理解。我重點介紹下半部分的填寫。

回到上一步,你會看到變化的字段用 {%+數字}的形式標示出來,而這個 {%+數字}是通用標識符。例如 {%2}代表了所有文章的標題,{%1}或 {%3}代表了所有文章的鏈接。所以,下面填寫時,標題的位置只需要填寫 {%2},當然我在後面加了一個發佈時間 {%5}。你只需要把這幾個通用標識符填寫到對於的區域就行,不同的 {%+數字}之間可以填寫隨意的文字、符號過渡。

7. 預覽並使用。

到了這裏,基本上宣佈大功告成了。點擊 Preview 預覽一下,如下方左圖所示,預覽沒有問題。如右圖所示,你可以通過頁面下方的選項將系統默認的隨機地址改成有意義的地址,方便使用。

我的經驗和感受

使用 Feed43 最大的好處就是,將那些不支持 RSS 的頁面變成 RSS 方便訂閱。而一旦有了 RSS 地址你就有了許多適合自己的玩法,比如我將它同 IFTTT 或者 Superfeedr 結合起來,一旦少數派發表了我的文章,我就會立即收到提醒。又比如,學校的教務處網站會以低頻率更新一些十分重要的信息,然後你又不可能每天打開關注,製作一個 RSS,更新即提醒。總之,你可以運用 Feed43 關注那些自己關心的內容。

你可以免費使用 Feed43 做 RSS 源,但免費版中包含的每條內容都會包含 Feed43 推廣鏈接,而抓取頻率也受到了嚴格的限制。當然,你也可以在官網上通過 Paypal 購買付費版,體驗會好許多。

你可以在 Feed43 官網 瞭解詳情。

© 本文著作權歸作者所有,並授權少數派獨家使用,未經少數派許可,不得轉載使用。


104


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章