Mit dem Python-Modul " Beautiful Soup" finden Sie viele Erfolgsgeschichten, und es wird allgemein für das Web-Scraping empfohlen. Dies würde ich unter kategorisieren. Wenn Sie Lösungen mit regulären Ausdrücken vorschlagen, werden Sie von den Benutzern von SU und SO schnell verwarnt :-)). Das hätte ich benutzt, um Ihr Beispiel amazon.com zu kratzen, und ich habe es in anderen Zusammenhängen verwendet.
Wenn Sie einige grundlegende Python-Erfahrungen haben, können Sie wahrscheinlich Beispiele betrachten und schnell eine funktionierende Lösung finden. Wenn Sie eine gewöhnliche Programmiergewohnheit haben, können Sie das wahrscheinlich mit einem Bruchteil von mehr Zeit tun.
(Ich mag es nicht, wenn die Leute sagen "Oh, es ist wirklich einfach!", Wenn es in der Praxis für jemanden, der nicht an das Tool gewöhnt ist, sehr lange dauert, aber ich glaube, dass Beautiful Soup und Python eine einfache und robuste Lösung sind Finden Sie eine Lösung, die besser zu Ihnen passt: toll :-)).
Nachtrag: Welche Art von System haben Sie, wo alle Seiten statisches HTML sind? Sind die Daten nicht irgendwo in einer Datenbank gespeichert? Ich denke nicht wegen deiner Frage. Dies kann ein Problem darstellen (für jede automatische Lösung), wenn der HTML-Code auf den Produktseiten nicht konsistent ist.