Suchen nach Dateien, die kein ordnungsgemäßes XML-Stammelement enthalten?

1359
Richie086

Ich muss in der Lage sein, mehrere tausend XHTML- und XML-Dateien zu durchsuchen und eine Liste der Dateien anzuzeigen, die die folgende Zeichenfolge nicht in der ersten Zeile enthalten:

<?xml version="1.0" encoding="utf-8"?> 

Wie würde ich das machen? Ich dachte, ich könnte dies mit der Funktion Suchen in Dateien in Notepad ++ tun, aber ich sehe keine Möglichkeit, nach einer Zeichenfolge zu suchen, die nicht gefunden und / oder nicht richtig formatiert ist, und eine Liste mit Dateien ausgeben zu lassen.

2
Welches Betriebssystem verwenden Sie? Angel Brighteyes vor 11 Jahren 1

2 Antworten auf die Frage

5
B.Rossow

Ich weiß, dass dies eine alte Frage ist, aber ich kam hierher und suchte nach den gleichen Informationen. Ich dachte, ich würde mit Agent Ransack eine einfachere Lösung verwenden, die es Ihnen tatsächlich erlaubt, eine NOT-Bedingung anzugeben. Für die obige Frage funktioniert die Verwendung des folgenden Textes für die Suche einwandfrei. Die einzige notwendige Änderung an der fraglichen Zeichenfolge besteht in doppelten Anführungszeichen:

NOT "<?xml version=\"1.0\" encoding=\"utf-8\"?>" 

Hoffe das hilft jemand anderem.

1
Angel Brighteyes

Use Agent Ransack and set it to only search through .xml file types. If you know RegEx use that, I am at work or I would help with that. I believe Agent Ransack comes with the ability to just use a negative search but I'll have to check.

Agent Ransack has a "Specifies Not Expression" which will work for what you want, but you will need a regular expression match string in order to pull it off. If you are a developer it is a good skill to at least be pseudo familiar with enough to do some basic searches or text matching with.

[Edit] Agent Ransack does not have a "Not Expression" search ability. The RegEx was pretty simple though

(<\?xml version="1.0" encoding="utf-8"\?>) 

I'll keep looking for a tool/utility app.