Notepad ++ Regex-Hilfe erforderlich
Ich habe eine Hunderttausendzeilige XML-Datei, die voll ist mit Daten, die ich nicht brauche. Ich bin auf der Suche nach einer Möglichkeit, Tausende von irrelevanten Zeilen massenweise zu löschen, und ich bin mir dessen bewusst, dass dies durch Suchen und Ersetzen mit einer Regex durchgeführt werden kann. Aber meine Regex-Fähigkeiten sind im Grunde nicht vorhanden.
Die Datei ist XML-kompatibel, sodass jede Zeile mit Tags beginnt und endet. Ein Beispielblock, der im gesamten Dokument hunderte Male wiederholt wird, ist:
<g:payment_accepted>Visa</g:payment_accepted> <g:payment_accepted>Cash</g:payment_accepted> <g:payment_accepted>MasterCard</g:payment_accepted> <g:payment_accepted>Check</g:payment_accepted> <g:payment_accepted>WireTransfer</g:payment_accepted>
In diesem Fall möchte ich, dass eine Regex nach Instanzen sucht:
<g:payment_accepted>WILDCARD_ANYTHING_IN_BETWEEN</g:payment_accepted>
Sobald ich eine funktionierende Regex habe, die ich verstehe, kann ich sie für andere wiederholte Tagblöcke im Dokument anpassen. Keine Ahnung wo ich anfangen soll.
0 Antworten auf die Frage
Verwandte Probleme
-
14
Regex-Tool für Linux
-
1
Deaktivieren der Hervorhebung von Klammern in Notepad ++
-
2
Schließen von Notepad ++ - Registerkarten beim Schließen der Anwendung
-
3
Kann nicht herausfinden, warum diese Regex nicht zutrifft
-
2
Entfernen von Zeilenumbrüchen aus einer RTF-Datei mit sed
-
10
Wie kann die Schriftgröße in Notepad ++ geändert werden?
-
2
Warum funktioniert Strg + F4 in Notepad ++ nicht?
-
5
Grep-Tool für XML
-
6
Wie kann ich Unicode-Text in Notepad ++ bearbeiten?
-
4
Wozu benutzt man ? in grep befehl .. und praktischen einsatz