Ein HTML-Archiv besteht aus einer Reihe von HTML-Seiten mit zugehörigen Medien (lesen Sie: Bilder und einfaches Javascript).
Ein CHM hat einen Hinweis darauf, welche Seite die "Hauptseite" ist, normalerweise eine Übersichtsseite. Daneben gibt es ein Inhaltsverzeichnis (Table of Contents, TOC), eine Struktur von Knoten, die auf HTML-Dateien zeigen. Der Baum zu laufen würde eine mehr oder weniger lineare Reihenfolge geben.
Die Standardseite ist jedoch möglicherweise nicht die erste Seite des Inhaltsverzeichnisses oder überhaupt des Inhaltsverzeichnisses, und möglicherweise befinden sich nicht alle Seiten im Inhaltsverzeichnis. In diesem Fall gibt es keine Bestellung, die automatisiert erkannt werden kann.
Wenn Sie ein CHM mit einem allgemeinen Dekompilierungsprogramm extrahieren, erhalten Sie eine Reihe von HTMLs, eine .hhk und eine .hhc. Das .hhc ist das Inhaltsverzeichnis im XML-Format. Der hhk ist der Index, aber Sie brauchen ihn jetzt nicht. Die Standardseite befindet sich in einer internen Datei und ist nach dem Extrahieren im Allgemeinen nicht sichtbar (verwenden Sie die Eigenschaften von chm-Werkzeugen).
Neben der Festlegung der Reihenfolge gibt es die eigentliche Verschmelzung. Dies kann schwierig sein, aber durch praktische Problemumgehungen könnten sie mithilfe von Skripts in das Amt importiert werden.
Ich denke, ein fähiger Scripter könnte es schaffen, aber es ist nicht trivial.