Wie extrahiere ich mehrere URLs aus String?

468
Aabir Hussain

Ich habe eine Zeichenfolge wie unten

https://website.com/BTAE/2015/BTAE Zuordnung jan 15.pdf²0ÔË '\ „QI„ "¾P¾ ^ ŒŸZ ‡ @ Æ *] Ü. ^„ vðƒ € Ù¾ Æ © © © € # # # # g g g g Û Û Û Û Û Û Û Û Û Û ÛÛ ^ gMdÉ% 9 € ˜˜žžžž0000 * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * *: *:::::::::::::::::::::::::::::::::::::::::::::::::::: * * * * * * * * * * * * * * * * ›, §Ààká @ ¡; (º \ 0AÇSª¾Q¾ÒÉœí ['rú €"? Í®§ YÈ <¸ ^ WÐPÁ'4îÖƒÔ'… ÷ f · qhttps: //webservices.ignou.ac.in/assignments/BTAE/ 2015 / BTAE-Zuweisung jan 15.pdf https://website.com/BTAE/2015/base-005.pdf

Ich muss URLs aller pdf-, doc-Dateien von der Zeichenfolge erhalten.

Ich bin neu bei SHELL SCRIPT und habe viel gesucht, aber keinen Erfolg gehabt.

1
Welches Betriebssystem und welche Shell? harrymc vor 5 Jahren 0
Ich benutze Ubuntu 14.04.5 Aabir Hussain vor 5 Jahren 0

1 Antwort auf die Frage

2
fejyesynb

Sie können so etwas tun:

grep --only-matching -P "http.*?\.(pdf|doc)" myfile.pdf 

Die Ausgabe für Ihre Probe lautet:

https://website.com/BTAE/2015/BTAE assignment jan 15.pdf https://webservices.ignou.ac.in/assignments/BTAE/2015/BTAE assignment jan 15.pdf https://website.com/BTAE/2015/base-005.pdf 
Danke @fejyesynb, es hat für mich funktioniert Aabir Hussain vor 5 Jahren 0
Es gibt noch ein Problem mit script => https://website.com/bschindi11.htm https://website.com/bschindi11.htm#aoc https://website.com/bschindi11.htm#ec https: // website.com/bschindi11.htm#fc https://website.com /CHEMISTRY/2007/CHE_01.doc. Es gibt mir diese URL. Aabir Hussain vor 5 Jahren 0
@AabirHussain Das liegt daran, dass der URL kein "http" vorangestellt ist fejyesynb vor 5 Jahren 0
Es tut uns leid für den falschen Kommentar, aber es gibt noch ein Problem mit script => https://website.com/bschindi11.htm https://website.com/bschindi11.htm#aoc https://website.com/bschindi11.htm# ec https://website.com/bschindi11.htm#fc https://website.com /CHEMISTRY/2007/CHE_01.doc. Es gibt mir diese URL Aabir Hussain vor 5 Jahren 0
@AabirHussain Schließen Sie Ihren gesamten Block in Backticks ein (`) fejyesynb vor 5 Jahren 0