Wie fasse ich RSS-Feeds im Laufe der Zeit aus einer einzigen Quelle zusammen?

384
Lord Loh.

Ich möchte bestimmte RSS-Feeds archivieren und die Datenbank mit der Zeit erweitern. Ich habe festgestellt, dass ältere Artikel aus dem RSS-Feed fallen und neue hinzugefügt werden. Ich möchte sie auf meiner Festplatte archivieren können, also habe ich in einigen Jahren ein Archiv erstellt. Ich bevorzuge ein Linux-Terminal-Tool, bin aber mit der GUI einverstanden.

Welches Werkzeug kann ich dazu verwenden? Ich bin auch damit einverstanden, dies selbst in Python zu codieren, wenn mir jemand Bibliotheken vorschlagen kann ...

0

1 Antwort auf die Frage

0
Lord Loh.

Python-Feed-Parser scheint eine gute Lösung zu sein.

https://pypi.python.org/pypi/feedparser

Es scheint einfach zu benutzen ...

import feedparser d = feedparser.parse('https://www.eff.org/rss/updates.xml') for item in d.entries: print (item.title)

item.id scheint eindeutig zu sein, um zu überprüfen, ob die Feeds frisch sind.