Es ist nicht möglich zu bestimmen, ob eine Datei in einem Torrent auch in einem anderen Torrent aus den in den Torrent-Dateien verfügbaren Daten vorhanden ist. Im Standard-BitTorrent-Protokoll gibt es einfach keine Deduplizierungsunterstützung.
Wenn ein Torrent erstellt wird, werden alle darin enthaltenen Dateien miteinander verkettet und dann in Stücke aufgeteilt.
example: Files |---#1|#2|---#3|-----------------------#4|#5|------#6|-----#7|-------#8| Pieces |--0|--1|--2|--3|--4|--5|--6|--7|--8|--9|-10|-11|-12|-13|-14|-15|-16|17|
- Alle Stücke sind bis auf das letzte Stück gleich lang.
- Eine Datei hat ein oder mehrere Teile.
- Ein Stück kann (Teile aus) mehr als eine Datei enthalten.
- Es ist sehr selten, dass interne Datei- und Stückgrenzen aneinander angereiht werden (ausgenommen, wenn Auffülldateien verwendet werden).
- Bei einer Datei in einem Torrent mit mehreren Dateien wird fast immer ein Teil mit einer anderen Datei geteilt.
Das Problem ist, dass es nicht möglich ist, einen Datei-Hash aus den Stück-Hashes zu erstellen.
(@jdwolf Auch wenn Datei # 1 und Datei # 3 identisch sind, unterscheiden sich ihre Hash-Werte.)
Es gibt einige Torrent-Creator-Programme, die optional Hashes für Dateien hinzufügen können, aber sie werden nirgendwo verwendet.