Der gute alte Lynx kann Ihnen die meisten gewünschten Funktionen bieten. Versuchen Sie es lynx -dump http://superuser.com/
zum Beispiel.
Sie können auch wget
für das rekursive Crawlen der benötigten Sites verwenden und die Dateien dann mit verschiedenen verfügbaren Konvertern wie htmltidy verarbeiten .