Sie können die pdfgrep
Ausgabe wie folgt modifizieren, um sie in verwendbar zu machen xargs
:
$ echo 'RE/2011-01-RE_60822079000168_23022016_153923(1).PDF: Fatima Alves' | grep --perl-regexp --only-matching '.*(?=: Fatima Alves$)' RE/2011-01-RE_60822079000168_23022016_153923(1).PDF
pdfgrep
Sie können also für jeden regulären Ausdruck und jede Ausgabe Folgendes tun:
regex='Fatima Alves' pdfgrep -H "$regex" RE/* | grep --perl-regexp --only-matching ".*(?=: $regex\$)"
Bearbeiten:
Ich dachte ursprünglich, dass nur der passende Teil der Zeile von gedruckt wurde pdfgrep
. Da die gesamte Zeile gedruckt wird, müssen Sie einfach alles entfernen, einschließlich des Doppelpunkt-Trennzeichens :
pdfgrep -H "$regex" RE/* | sed 's/:.*//'