Bei EC2-Instanzen handelt es sich im Wesentlichen um normale Server, auf denen ein Betriebssystem ausgeführt wird. Auf diese Weise können Sie nicht nur die Datenverarbeitungsaufgaben ausführen, sondern auch andere Schritte wie das Herunterladen, insbesondere wenn das Herunterladen eine komplexe Aufgabe ist.
Sie würden eine EC2-Instanz konfigurieren, die einen S3-Bucket permanent in das Betriebssystem einfügt, und dann ein Skript (z. B. ein Shell-Script) erstellen, das die Daten regelmäßig oder semi-regelmäßig herunterlädt und im Bucket speichert.
Eine noch einfachere Option wäre die Verwendung von AWS Lambda, um den Download in S3 durchzuführen, ohne dass ein EC2-Server hochgefahren werden muss. Dies bedeutet, dass Sie die Verarbeitung unabhängig voneinander ausführen können und auch vermeiden müssen, Daten zuerst auf den Server und dann auf S3 zu übertragen .
Beachten Sie, dass jeder Datenvorgang einen bestimmten Preis hat. Lesen Sie daher die Preisrichtlinien von EC2 und S3, und berechnen Sie die vorläufigen Kosten .