Schneller Abruf von Informationen mit fester Struktur aus einer Liste von Weblinks

376
skyork

Ich habe eine Excel-Tabelle, die eine Liste von Weblinks enthält (alle auf dieselbe Website, aber unterschiedliche Seiten). Alle diese Seiten haben das gleiche Layout / die gleiche Struktur, und ich möchte von jeder Seite / jedem Link dieselbe Information (unterschiedliche Werte auf verschiedenen Seiten) abrufen.

Natürlich kann ich auf jeden Link in einer Zelle klicken, die Seite aufrufen und die Informationen manuell notieren. Es gibt jedoch Hunderte von ihnen, und ich sehe es als etwas, das automatisiert werden kann. Wie kann ich das angehen?

0
Wenn Sie nach Software oder einem Plug-In fragen, wird die Frage geschlossen, da dies nicht der Fall ist. Jemanden zu bitten, Ihnen ein Skript zu schreiben, wäre wahrscheinlich zu umfangreich. Fragen Sie einfach, wie Sie die Aufgabe erledigen können. Was uns zur nächsten Ausgabe bringt. Ihre Beschreibung ist ziemlich nebulös und das Ziel könnte eine beliebige Art von irgendetwas sein. Fügen Sie ein oder zwei Beispiele für genau das hinzu, was Sie abrufen möchten. fixer1234 vor 7 Jahren 0
Barlops Ansatz wird wahrscheinlich funktionieren. Wenn Sie etwas Excel-orientierteres wollen, schauen Sie sich die VBA an. Wie fixer1234 sagt, schreiben wir es nicht für Sie. Wenn Sie diesen Ansatz verfolgen möchten, lernen Sie VBA (es gibt viele Ressourcen im Internet und in Excel selbst; suchen Sie auch [SU]) und versuchen Sie, das Problem selbst zu lösen. Wenn Sie etwas zum Laufen bekommen, aber Sie in Schwierigkeiten geraten, können Sie uns mit Besonderheiten zurückkehren. G-Man vor 7 Jahren 0
@ fixer1234 es ist nicht so nebulös. Ich konnte es beantworten. Und wenn eine Person in der Lage ist, ihre Frage zu verallgemeinern und trotzdem eine Antwort zu erhalten, ist dies tatsächlich besser (und zeigt auch eine gute Denkweise bei der Problemlösung). Wenn eine Antwort für mehr als nur einen bestimmten Fall funktioniert, ist dies ebenfalls besser. barlop vor 7 Jahren 0
@ fixer1234 und wenn es nur ein winziges bisschen war, von dem Sie dachten, es wäre ein bisschen neblig wie nur die Hälfte seiner Sätze, die ein bisschen neblig wäre, dann sollten Sie das zitieren und sagen, warum, anstatt zu behaupten, dass sein Beitrag nebulös ist. barlop vor 7 Jahren 0
@barlop, ich habe das als Excel-Problem gelesen. Ein dickes Lob für dieses größere Bild. Anscheinend hat Ihre Antwort das Problem für das OP gelöst. Für mich war die gesamte Frage zu weit und zu vieldeutig und tut es immer noch, obwohl Sie das OP zu einer Lösung bringen konnten. Ich lese Ihre Antwort noch einmal und es sieht nach einer tatsächlichen Lösung aus, also +1. Ich denke, das beweist, dass die Frage nicht unbedingt zu vieldeutig ist. Ich ziehe also meine enge Abstimmung zurück. fixer1234 vor 7 Jahren 0

1 Antwort auf die Frage

2
barlop

Sie können sie aus Excel kopieren und in einen Notizblock einfügen, der einfach als Text gespeichert werden kann. Wenn Sie einen Link pro Zeile erhalten, speichern Sie diese Datei zB als blah.a und laden Sie wget herunter. Dann ist es keine Excel-Sache mehr.

Angenommen, Sie haben eine Link-Datei erstellt, dann können Sie den Befehl wget verwenden (den Sie herunterladen müssten und nichts mit Excel zu tun haben). Nehmen wir an, jede Zeile der Datei hat eine Zeile wie http://blah.com/abc.html. Dann machen Sie wget -i blah.a und laden dort jeden Link herunter. Sie sollten jedoch auch eine Verzögerung angeben so dass der Server nicht so heruntergefahren wird, wget -i blah.a aber mit so etwas wie -t -T und -w .. zB -t 1 -T 5 -w 1(Wiederholungen, Timeout bzw. Warten), also das Setzen von Sachen wie Retry und Timeout und Warten. So wget -t 1 -T 5 -w 1 -i blah.a<ENTER>Offensichtlich ist dies in wget --help. (mit noch mehr Details im wget-Handbuch, das online ist). Sie können wget mit zB cygwin bekommen.