Hex an base64 an * nix

2620
Kent Pawar

Hinweis: Ich habe diese Frage als Duplikat einer anderen Frage markiert. Ich behalte es trotzdem, da es ein Beispiel und eine klar definierte Antwort hat, also sollte es anderen helfen.

- Ich muss eine Zeichenfolge von Hex-Zeichen in base64 konvertieren, wie dies in diesem Online-Konverter in * nix der Fall ist.

Für " 5C78336D77D8DF448007D277DAD5C569" (Hex) weiß ich, dass die erwartete Ausgabe " XHgzbXfY30SAB9J32tXFaQ==" (base64) ist.

Aber wenn ich versuche, es in binär und dann in base64 zu konvertieren, bekomme ich Folgendes:

[kent@server SrcFiles]$ echo "5C78336D77D8DF448007D277DAD5C569" | xxd -b 0000000: 00110101 01000011 00110111 00111000 00110011 00110011 5C7833 0000006: 00110110 01000100 00110111 00110111 01000100 00111000 6D77D8 000000c: 01000100 01000110 00110100 00110100 00111000 00110000 DF4480 0000012: 00110000 00110111 01000100 00110010 00110111 00110111 07D277 0000018: 01000100 01000001 01000100 00110101 01000011 00110101 DAD5C5 000001e: 00110110 00111001 00001010 69. [kent@server SrcFiles]$ echo "001101010100001100110111001110000011001100110011001101100100010000110111001101110100010000111000010001000100011000110100001101000011100000110000001100000011011101000100001100100011011100110111010001000100000101000100001101010100001100110101001101100011100100001010" | base64 MDAxMTAxMDEwMTAwMDAxMTAwMTEwMTExMDAxMTEwMDAwMDExMDAxMTAwMTEwMDExMDAxMTAxMTAw MTAwMDEwMDAwMTEwMTExMDAxMTAxMTEwMTAwMDEwMDAwMTExMDAwMDEwMDAxMDAwMTAwMDExMDAw MTEwMTAwMDAxMTAxMDAwMDExMTAwMDAwMTEwMDAwMDAxMTAwMDAwMDExMDExMTAxMDAwMTAwMDAx MTAwMTAwMDExMDExMTAwMTEwMTExMDEwMDAxMDAwMTAwMDAwMTAxMDAwMTAwMDAxMTAxMDEwMTAw MDAxMTAwMTEwMTAxMDAxMTAxMTAwMDExMTAwMTAwMDAxMDEwCg== 

Kann mir jemand die richtige Richtung zeigen?

1
Wenn Sie einen Basis-16-Wert in einen Binärwert konvertieren, bleibt der Basis-16-Wert erhalten. Sie müssen die Basis 16 in die Basis 64 umwandeln und dann in eine Binärdatei umwandeln. Dies wurde vor http://superuser.com/questions/158142/how-can-i-convert-from-hex-to-base64?rq=1 abgefragt und beantwortet Ramhound vor 11 Jahren 1
@Ramhound - Thanks. I tried `echo "obase=10; ibase=16; `cat in.dat`" | bc | base64 > out.dat` and `echo "obase=64; ibase=16; `cat in.dat`" | bc`. Could you give me some pointers where I am going wrong..? Kent Pawar vor 11 Jahren 0
Deine Syntax ist falsch. Suchen Sie die richtige Syntax. Ramhound vor 11 Jahren 0
As a comment to the original question, `echo "0011010..." | base64` does not send the binary string of 0011010... but, the string of ascii 0 and ascii 1 characters. That is why your output is not what you expect. Kent vor 11 Jahren 1
Danke @Kent! in Ordnung. Aber sollte das nicht auch funktionieren? "echo" obase = 64; ibase = 16; 5C78336D77D8DF448007D277DAD5C569 "" # Sagen Sie "bc", die eingegebene ASCII-Zeichenfolge als Hex-Darstellung zu akzeptieren und in base64 umzuwandeln. Kent Pawar vor 11 Jahren 0
bc macht auch nicht das, was Sie erwarten. Als numerischer Prozessor ist der Wert für 0, 1, 2 in der Basis 64 immer noch 0, 1, 2. Die Basis64-Codierung von 0 ist jedoch A, 1 = B, 2 = C usw. Es ist willkürlich; Da "bc" ein Taschenrechner ist, wird diese willkürliche Konvertierung für uns nicht vorgenommen. Ich muss noch etwas dazu sagen, aber es erfordert Formatierungen und mehr als 512 Zeichen. Ich füge es dem Antwortabschnitt unten hinzu, auch wenn Ihre ursprüngliche Frage damit nicht beantwortet wird. Kent vor 11 Jahren 1

2 Antworten auf die Frage

6
Levans

Wenn Sie xxdIhren Hex-String dekodieren möchten, müssen Sie verwenden xxd -r -p. Und so bekommst du:

echo "5c78336d77d8df448007d277dad5c569" | xxd -r -p | base64 XHgzbXfY30SAB9J32tXFaQ== 

-rist für umgekehrt, also xxdwird Ihr Hex-Dump decodiert, und bedeutet -p, dass die Eingabe ein reiner Dump (dh ein nicht verzierter Hex-String) ist, ohne Formatierung wie Zeilennummer (n).

Sie könnten dasselbe Ergebnis mit einem Brute-Force-Ansatz erzielen: `` printf "\ x5C \ x78 \ x33 \ x6D \ x77 \ xD8 \ xDF \ x44 \ x80 \ x07 \ xD2 \ x77 \ xDA \ xD5 \ xC5 \ x69" | base64``. Scott vor 6 Jahren 0
2
Kent

Dies ist eine Fortsetzung der Kommentare in der ursprünglichen Frage. Es endete viel länger als ich erwartet hatte; also in den Antwortabschnitt verschoben.

bcist ein numerischer Prozessor, der mit einer beliebigen Basis umgehen kann; jedoch aus dem bc Command Manual :

Bei Basen, die größer als 16 sind, bcwerden die Zahlen mit einer aus mehreren Zeichen bestehenden Zahl gedruckt, wobei jede höhere Basisziffer als Basisnummer 10 gedruckt wird. Die aus mehreren Zeichen bestehenden Ziffern sind durch Leerzeichen getrennt.

(Eine ähnliche Aussage erscheint auf der Manpage von bc .)

Was wir "base64" nennen, ist eine spezielle Zuordnung von Zeichen zu jedem der 64 Werte. (Siehe den Wikipedia-Artikel zu Base64 .)

Die Darstellung von "0" bcwäre "0"; wohingegen die tatsächliche Basis64 "A" ist.

Die Ausgabe Ihres vorgeschlagenen Befehls bc lautet:

$ echo "obase=64; ibase=16; 5C78336D77D8DF448007D277DAD5C569" | bc  01 28 30 03 13 45 29 61 35 31 17 08 00 07 52 39 31 26 53 28 21 41 

Wenn also bcAusgaben ausgegeben werden 01 28 30 03 . . ., warum können wir nicht einfach die Werte für 01, 28, 30 usw. in der Tabelle nachschlagen (was "B", "c" und "e" ergibt, was sich von "XHg" unterscheidet … "Das erwartet Sie)?

Lassen Sie uns zunächst das Problem vereinfachen.

Wenn wir einen kürzeren String eingeben bc, wie beispielsweise nur die ersten 2,5 Bytes, sieht die Ausgabe ähnlich aus:

$ echo "obase=64; ibase=16; 5C783" | bc 01 28 30 03 

Eine noch kürzere Saite ist jedoch völlig anders:

$ echo "obase=64; ibase=16; 5C78" | bc 05 49 56 

Warum das? Ihre ursprüngliche Zeichenfolge bestand aus 32 Zeichen (2 ^ 4 * 32; 2 ^ 128), die in 64 (2 ^ 6) unterteilt sind und 22 Zeichen (22 * 6 = 132) mit einem Rest von 4 erfordern. Dieser Rest ist wichtig, wenn man die Ausgabe von betrachtet, bcaber nicht wirklich etwas anderes.

Die 4-stellige Eingabezeichenfolge hat 2 ^ 16 Werte. Durch 64 (2 ^ 6) dividiert, kann es in drei 64-Bit-Wörter passen (wobei 2 Bits übrig bleiben). Die 5-stellige Eingabezeichenfolge hat jedoch 2 ^ 20 Werte. Durch 2 ^ 6 dividiert, sind vier Wörter erforderlich (vier verbleibende Bits; derselbe Rest wie in der ursprünglichen Zeichenfolge).

Ein noch kürzerer Eingangswert (5C) hat auch den gleichen Rest (2 ^ 8/2 ^ 6 = 2 + 4 Bit).

$ echo "obase=64; ibase=16; 5C" | bc 01 28 

Wenn Sie dieses "Feature" von verwenden bc, können wir die ersten beiden Zeichen verwenden, um eine einfache Beschreibung der tatsächlichen Vorgänge zu entwickeln.

5Cin binär ist 01011100. In der base64-Welt betrachten wir die ersten 6 Bits ( 010111oder dezimal 23) und sehen in der Wikipedia-Tabelle, 23 ist eigentlich X. Großartig! Es entspricht dem, was Sie erwarten! Wir fuhren dann mit jeweils sechs Bits durch den String.

Auf der anderen Seite, woher kommt die 01 28? Zurück zum binären 01011100. Im Gegensatz zu der base64-Prozedur, die am Anfang des Strings beginnt und "=" bis zum Ende auflädt, gibt bc bei einem Rest (die Anzahl der base16-Zeichen ist kein Vielfaches von 3) an 0 an der Eingabewert. Mit dem vorgenannten Rest von 4 wird bc also tatsächlich arbeiten 0000 01011100; und in 6-Bit-Chunks (base64) endet dies als 000001 011100Dezimalwert von 01 und 28.


Wenn Sie das Ende der Eingabezeichenfolge mit bc so füllen, dass die Länge ein Vielfaches von drei ist, erhalten Sie etwas, das der gewünschten Ausgabe ähnelt:

$ echo "obase=64; ibase=16; 5C78336D77D8DF448007D277DAD5C5690" | bc  23 07 32 51 27 23 31 24 55 52 18 00 01 61 09 55 54 45 23 05 26 16 

Sie müssen immer noch 23 = X, 07 = H, 32 = gusw. in der Tabelle nachschlagen .

+1. Vergessen, mich dafür zu bedanken. Es ist sehr detailliert und hilfreich. Kent Pawar vor 10 Jahren 0