Wie groß denkst du, könnte N sein?
Wenn es sich nicht um "viele Millionen" handelt oder Sie in einer ungewöhnlich engen Umgebung (Speicherarmut) arbeiten, wird Ihnen der Speicher nicht ausgehen.
Ich muss zwei Dateien hinzufügen.
DATEI 1:
a A1 a A2 a A3 ... c C1 c C2 ...
DATEI 2:
a feature1_of_a a feature2_of_a ... a featureN_of_a ... ... c feature1_of_c c feature2_of_c ...
Nach dem Beitritt könnte ich die Datei so erhalten:
A1 feature1_of_a A2 feature1_of_a A3 feature1_of_a A1 feature2_of_a A2 feature2_of_a A3 feature2_of_a ... A1 featureN_of_a A2 featureN_of_a A3 featureN_of_a ...
Um das zu tun: Ich schrieb den Shell-Befehl join -11 -21 -o1.2,2.2 file1 file2
. Aber das Problem ist: Nummer N könnte riesig sein. Wenn also join alle Daten gleichzeitig in den Speicher einliest, reicht der Speicher möglicherweise nicht aus.
Ich weiß nicht, wie Join implementiert wird. Wollte die Momery zu einem Problem werden? Wenn ja, gibt es eine Möglichkeit, das zu bekommen, was ich will?
Wie groß denkst du, könnte N sein?
Wenn es sich nicht um "viele Millionen" handelt oder Sie in einer ungewöhnlich engen Umgebung (Speicherarmut) arbeiten, wird Ihnen der Speicher nicht ausgehen.