wget (oder curl) den gesamten Inhalt eines Forenthreads?

1804
wgethelp

Die URL des Forums-Threads, auf den ich zugreifen möchte, befindet sich in der Form

http://domain.com/showthread.php?threadid=3333333&userid=0&perpage=40&pagenumber=1

ich habe es versucht

wget --user-agent = Mozilla / 5.0 -k -m -E -p -np -R http: //domain/showthread.php? noseen = 0 & threadid = 3333333 & pagenumber = 1

und ich hatte kein glück.

2

2 Antworten auf die Frage

1
Mikel

Warum nicht nur in einer for-Schleife:

for pageno in ; do wget ... http://domain/showthread.php?noseen=0&threadid=3333333&pagenumber=$pageno || break done 

oder vielleicht ist eine while-Schleife besser, wenn man etwas länger schreibt:

i=1 while true; do wget ... http://domain/showthread.php?noseen=0&threadid=3333333&pagenumber=$pageno if test $? -ne 0; then break fi i=$((i+1)) done 
OP hier, danke Mikel. Tatsächlich habe ich Probleme, nur den Inhalt einer Seite im Thread herunterzuladen. Sobald ich das getan habe, dachte ich über den ersten Weg nach, den Sie vorgeschlagen hatten, aber mit meinen Wget-Parametern scheint etwas nicht in Ordnung zu sein (vielleicht, ich weiß es nicht). vor 13 Jahren 0
0
Sirex

Vielleicht lohnt es sich zu prüfen, ob das Forum RSS-Feeds von Abschnitten / Threads unterstützt. Es würde dich die Mühe sparen.