So entfernen Sie Seiten aus einem E-Book (und ändern Sie das Inhaltsverzeichnis entsprechend)

1879
Tim

Ich habe eine relativ große epub-Datei mit einem toc, bei der ich mich nur für einen Bruchteil der Seiten interessiere. (Genauer gesagt, es ist ein komplettes Verzeichnis für Zauber, und ich möchte nur die Zauber behalten, die mein Charakter gelernt hat oder lernen kann.

Gibt es ein Tool, mit dem Sie problemlos Seiten löschen und die gelöschten Seiten aus dem Inhaltsverzeichnis und anderen Links entfernen können?

Bis jetzt ist der einfachste Weg, den ich sehen kann, epub in html mit Kaliber zu konvertieren und dann mit einem riesigen bash (sed) -Skript die Links zwischen allen Seiten zu ändern (dies bedeutet ein Inhaltsverzeichnis für jedes Kapitel und sogar Links für das Blättern). in allen HTML-Dateien.

Gibt es Programme, die das besser können?

Vielen Dank!

0
Vielleicht https://code.google.com/p/sigil/ Dan D. vor 10 Jahren 0
@DanD. Ich habe es schon probiert. Ich kann die Seiten / Kapitel löschen, aber nur eine nach der anderen und es dauert immer einige Minuten, bis eine neue Eingabe möglich ist. Auch das Ändern des TOC scheint unmöglich zu sein. Wenn ich es unverändert lasse, wird ein Fehler ausgegeben, wenn ich einen Eintrag auswähle. Ein neu erstellter Index ist immer leer. In der Regel kann dieses Programm die Arbeit erledigen, aber in meinem Fall schlägt es fehl. Tim vor 10 Jahren 0

1 Antwort auf die Frage

2
Tim

After reading and trying for some time I found out, that any conversion to html makes things worse. Reading about how an epub is actually built, lead to the following steps:

  1. Unzip the epub file (it is a valid zip file just with a different suffix)
  2. Inside there there are all chapters as *.xhtml files and two important files content.opf and toc.ncx
  3. Using toc.ncx the unwanted xhtml files can be identified (delete the unwanted navPoint section afterwards)
  4. content.opf contains a manifest and a spine section.
  5. In the manifest section an id is assigned to each file. The order of these ids in the spine section is the order in which the chapter files occur in the book.
  6. Remove the corresponding line from the spine section and the chapter is gone.
  7. You can then remove the line from the manifest and delete the xhtml file. Everything works without this step, but it is just dead weight.
  8. Zip it again and change the suffix to epub.

These steps are scriptable well enough for me, so my problem is solved.