【進階篇】RSS的世界:Feed43篇(2022.06.02新增內容)
上一篇中介紹了RSSHub的使用方法(CV13543035),但還是有些網(wǎng)站RSSHub里沒有收錄,這個時候可以用Feed43搞定~?
說個題外話,我這幾天折騰訂閱源其實是為了追星……尤其像我這樣的追星族,懶的用瀏覽器打開自己愛豆的官網(wǎng),結果錯過了好多消息……?關鍵是……他官網(wǎng)打開很費勁?。。?!加載就得一分鐘起步,加載出來的頁面……

這個頁面…… 我的手機和我一起穿越2003……
廢話不多說,先來看看feed43網(wǎng)頁:https://node2.feed43.com
嗯……?純英文,不怕,我一會上保姆級教程

就像它上面宣傳的一樣:I wish all my favorite sites provided RSS feeds.(我希望所有我喜歡的網(wǎng)站都提供RSS源)
點擊粉紅色的長按鈕(Create your first RSS feed)開始制作~

step 1(第一步),將你需要做成RSS源的網(wǎng)址填入
這里我以墨鏡老頭Chage的官網(wǎng)為例,這是我需要做成RSS源的網(wǎng)站。


將墨鏡老頭的網(wǎng)址填進去后,點擊右側的粉紅按鈕(Reload)

這時候我們先看一下一些老頭官網(wǎng)上的有用信息

比如第一條消息,它點開后的網(wǎng)址是https://中間省略……/detail-319.php,然后回到feed43,在那堆綠色的代碼里找這個detail-319.php的網(wǎng)址。

找到了,一般這種內容都會在中間位置,不會出現(xiàn)在開頭和結束部分,你看我右邊的滑塊基本快滑到中間了才到關鍵內容。
這里需要講幾句怎么看這個代碼。

代碼都是一段一段的,開頭是<英文,結束就是</相同的英文,有時候會一層一層套著,總體來說不難找。
把有關鍵信息的這么一段代碼復制出來,粘貼到記事本上。

在這個step 2里面有個小提示,里面有個舉例,也一并復制到記事本里面。

現(xiàn)在我們需要將那些關鍵信息所在的那一行復制出來。
啥是關鍵信息呢,一般來說就是新消息的標題,所對應的網(wǎng)址,還有發(fā)布時間,消息的類型也能算,具體看你需要多少關鍵信息吧。
第一個對勾是消息對應的網(wǎng)址,第二個對勾是消息發(fā)布的時間,第三個對勾是消息的標題。
下面講用網(wǎng)站給出的例子改寫這段代碼了,其實就兩句話完事,每行末尾加個{*},關鍵信息換成{%}。

先加{*},再將關鍵信息換成{%}

最后改完的代碼見上圖最下方,應該能看得懂是咋改的吧……?加{*}換{%}

將改好的代碼填到Step 2的Item這個框里,然后點擊右下角的粉紅按鈕(Extract)

這里發(fā)現(xiàn)第一條提取出來的網(wǎng)址不對,莫愁,這時候再回到剛剛的記事本,我們再把代碼修改一下。
把剛剛關鍵信息網(wǎng)址的上一行也算到有用的部分里,記得在末尾加{*}

多這么一行后,再點粉紅按鈕提取一下(Extract)

這一次的網(wǎng)址,標題,還有時間都沒有問題了。

將網(wǎng)頁往下拉,終于到Step 3了,這一步就是填寫一些信息,feed?title(訂閱源標題)、Feed Link(訂閱源地址)、Feed Description(訂閱源概述),這三項是自動生成的,一般不改,如果標題太長就像上圖那種,可以自己稍微精簡一下,比如我就改成了 Chage.jp(Information)……
需要自己填的是下面的Item?title、Item Link、Item Content
Item?title就是剛剛說到的關鍵信息的消息標題,提取出來的信息對應的是{%3}(見上圖的頂部,有截圖到)。
Item Link是剛剛說到的關鍵信息的消息對應的網(wǎng)址,提取出來的信息對應的是{%1}(見上圖的頂部,有截圖到)。
Item Content是消息的摘要等等,這個網(wǎng)站沒有,所以暫時不填,有的話可以填哦
可能有人會看到我在Item?title里填了個{%2}{%3},因為這樣是顯示的時間+標題。
比如填寫的{%2},{%3},那么就會顯示:2020.10.11,RSS的世界
比如填寫的{%2} |?{%3},那么就會顯示:2020.10.11 | RSS的世界
比如填寫的【{%2}】{%3},那么就會顯示:【2020.10.11】RSS的世界
這個填寫比較靈活,可以自己隨便來,或者只填標題,不要時間,都可以~
填好后點擊右下角的粉紅按鈕預覽(Preview)

到這一步基本就完成啦,Your?feed?is ready!
Feed URL就是我們需要的訂閱源網(wǎng)址了,把這個添加到RSS的應用里,就完成咯~
自動生成的URL是一大串數(shù)字,可以自己更改,就是下面的Change file name
輸入自己命名的就搞定啦,比如填入:my_rss,F(xiàn)eed URL就會變成:https://feed43.com/my_rss.xml,自己改一下就比較好記~


2022.06.02?增加新內容
一般情況下feed43時抓出來更新的文章,但是我遇到了一個麻煩的網(wǎng)站,它每周一更新兩篇文章,但是feed43會把第一頁的所有文章都抓出來,結果變成我每周一刷新RSS時,會一口氣出來好多文章,其中大部分都是我之前看過的。
對于這種情況,feed43能不能每次只抓取我需要的那倆篇文章呢?當然可以!
下面開始教程~
上面講怎么填代碼的時候,用的是下圖的第二個框,Item (repeatable) Search Pattern*:?
這次需要用到它上面的?Global Search Pattern (optional)?全局搜索模式(可選)

這個全局搜索是給你需要抓取的內容先規(guī)定個大概范圍,不填寫此項默認是全網(wǎng)頁抓取。
先看看這次的代碼。

可以發(fā)現(xiàn)代碼相當有規(guī)律,每一段都是<div class="box-article-item">起,</div>止。
下面在?Global Search Pattern (optional)?上寫大致搜索范圍,格式是這種:<h1>Local news:</h1>{%}<h1>
按著格式要求改成:<div class="box-article-item">{%}</div>{*}
末尾一定記得加{*},不加抓不出來。
然后再把下面的Item (repeatable) Search Pattern按上面的教程寫好,點擊Extract

嗯!抓出來了!但是……怎么只有一條呢……
這里要說下,feed43默認按從上到下的順序抓取,我們這里只填了一個<div class="box-article-item">{%}</div>,所以feed43默認只抓取第一段<div class="box-article-item">的內容,然后停止了。
解決辦法很簡單,需要幾條就在全局搜索寫幾條!
我需要feed43在網(wǎng)站更新時只抓前倆篇文章,所以寫兩遍即可。

最后按著上面的教程,輸出RSS,搞定!
剛改完便急著刷新RSS閱讀器會失望的哦,因為feed43做修改不是立刻生效~
在下次網(wǎng)站更新時,它肯定會按著你新寫的規(guī)則抓取噠,放心啦~

Feed43的用法基本算說完了,現(xiàn)在說下Feed43的缺點,它是6小時更新一次,不是說官網(wǎng)更新了啥,它就立刻顯示出來,不過這個也算不上啥缺點,一般也不會有啥火急火燎的消息要立刻就看到。然后它每次只提取20條消息,再多的消息就不提取了,我個人覺得20條夠看了~
RSS進階向基本就沒啥了,如果將來需要寫【RSS高級篇】會說到用Huginn提取網(wǎng)站內容,這個就更復雜了,會有人用到么……
? ? ? ?
