Notepad ++ Regex-Hilfe erforderlich

516
Josh Bethell

Ich habe eine Hunderttausendzeilige XML-Datei, die voll ist mit Daten, die ich nicht brauche. Ich bin auf der Suche nach einer Möglichkeit, Tausende von irrelevanten Zeilen massenweise zu löschen, und ich bin mir dessen bewusst, dass dies durch Suchen und Ersetzen mit einer Regex durchgeführt werden kann. Aber meine Regex-Fähigkeiten sind im Grunde nicht vorhanden.

Die Datei ist XML-kompatibel, sodass jede Zeile mit Tags beginnt und endet. Ein Beispielblock, der im gesamten Dokument hunderte Male wiederholt wird, ist:

<g:payment_accepted>Visa</g:payment_accepted> <g:payment_accepted>Cash</g:payment_accepted> <g:payment_accepted>MasterCard</g:payment_accepted> <g:payment_accepted>Check</g:payment_accepted> <g:payment_accepted>WireTransfer</g:payment_accepted>

In diesem Fall möchte ich, dass eine Regex nach Instanzen sucht:

<g:payment_accepted>WILDCARD_ANYTHING_IN_BETWEEN</g:payment_accepted> 

Sobald ich eine funktionierende Regex habe, die ich verstehe, kann ich sie für andere wiederholte Tagblöcke im Dokument anpassen. Keine Ahnung wo ich anfangen soll.

1
Ah, ich bin einfach rausgegangen und habe es einfacher gemacht, als ich dachte, das wäre der Trick ^ (). * () $ Josh Bethell vor 5 Jahren 0
Willkommen bei Super User! Fühlen Sie sich frei, dies als Antwort zu posten :) bertieb vor 5 Jahren 1

0 Antworten auf die Frage