Welche Auszeichnungssprache ist das? (ca. 1991)

677
Barry Brown

Ich bewahre ein von meinem Vater geschriebenes Manuskript auf. Die Datendateien befinden sich auf 5,25-Zoll-Disketten. Ich habe die Dateien erfolgreich von den Datenträgern gelesen, aber keiner von uns weiß, welches Format die Auszeichnungssprache ist. Dieses Format wurde von Buchverlegern Anfang der 1990er Jahre verwendet.

Hier sind ein paar Zeilen aus einer der Dateien.

\m\m<ps;3><l>\ <ep>\ 1 \ Rethinking Universality:<qa>\ Six Cases<lrh;;1>Rethinking Universality: Six Cases<xlrh><rrh;;2>Rethinking Universality: Six Cases<xrrh> \ In 1983 the anthropological community was convulsed by reactions to Derek Freeman\'s <ital>Margaret Mead and Samoa: The Making and Unmaking of a Myth.<med> Remarkably, two books with a very similar message but by different authors attacking different myths were published within a year of Freeman\'s. One was Melford Spiro\'s <ital>Oedipus in the Trobriands<med> (1982); the other was Ekkehart Malotki\'s <ital>Hopi Time<med> (1983). Each of these books refutes or questions one of the centerpieces of anthropological relativism.\ %In <ital>Coming of Age in Samoa<med> (1928) Margaret Mead argued that adolescence among Samoans was not the time of storm and stress that it is in the West and, hence, that the Western conception of adolescence is strictly cultural\Msomething that we could change. Freeman shows that adolescence was just as stressful in Samoa as in the West and that in other ways Samoa was not so different from Western societies as Mead had led us to believe.\ 

Kann jemand die verwendete Auszeichnungssprache identifizieren?

Ich habe sowohl diese Originaldateien als auch das veröffentlichte Buch. Es wäre nicht schwer für mich herauszufinden, was die Codes bedeuten. Wenn das Format identifiziert werden könnte, könnte eine Art automatischer Übersetzer in etwas neuerer Form (RTF, XML usw.) verfügbar sein.

Bearbeiten

Es ist wie ein Rätsel, das gelöst werden muss! So wird eine Tabelle begonnen:

<begtab;tbl2;1p><setnc;2><setctr;5p><tblwidth;15p><setbgut;rsidbox;0q> 

Ich habe ein bisschen gegoogelt für Begriffe wie begtabund setbgut. Letzteres hat ein PDF-Dokument aufgedeckt, das scheinbar einen "Tippfehler" enthält, aber der Tippfehler ist ein setbgutTag, der fast genau wie der aus meinen Dateien ist.

http://sfmb.ulb.ac.be/pdf/J_Biol_Chem_1999_274_22_15510.pdf (Suche nach setbgut)

Es scheint, dass dieses Forschungspapier mit der gleichen Software erstellt wurde. Ich habe es in Acrobat eingefügt und die Eigenschaften besagen, dass es von Xyvision Parlance Publisher (XPP) generiert wurde. Hier ist das Beste, was ich bisher über sie gefunden habe: http://www.isgmlug.org/n2-1/n2-1-49.htm

Bearbeiten 2

OK, ich verstehe jetzt. XPP ist eine SGML-ähnliche Auszeichnungssprache. In der XPP-Verkaufsliteratur wird sogar darauf hingewiesen, wie "einfach" es ist, ein vorhandenes SGML-Dokument zu nehmen und seine proprietären Tags hinzuzufügen. Leider wurde XPP vor einigen Jahren an General Dynamics verkauft. Das automatische Übersetzen des Dokuments in beispielsweise HTML ist ohne die DTD schwierig. Wie andere bereits erwähnt haben, sind die meisten Tags jedoch leicht zu erkennen. Einige von ihnen, wie z. B. die bibliografischen Referenzen und die Werte nach dem Semikolon in Tags wie <rrh;1>und <lp;&-1q>entziehen sich mir immer noch. Ich muss die Datei mit der physischen Hardcopy nebeneinander vergleichen, um alles zu entschlüsseln.

19
Nun, es ist kein TeX, RTF oder SGML. Wissen Sie, ob es handgeschrieben oder von einem Textverarbeitungsprogramm erstellt wurde? Kevin Reid vor 12 Jahren 0
Wahrscheinlich von Hand geschrieben. Das Markup ist zu kurz, um vom Computer generiert zu werden. Es wurde möglicherweise von einem Computerprogramm geschrieben, das dem Benutzer eine sehr spezifische Kontrolle über die Formatierungscodes ermöglicht - was jedoch nur einen Schritt von der Handcodierung entfernt wäre. Barry Brown vor 12 Jahren 1
Die Erweiterung des Dateinamens würde sehr helfen. Joel Coehoorn vor 12 Jahren 1
Ein kurzes Stoßen in der Umgebung schließt [XyWrite] (http://en.wikipedia.org/wiki/XyWrite) und Wordstar (verwendet Punktcodes) aus. Vielleicht sein Wort perfekt? Journeyman Geek vor 12 Jahren 0
Sind die ersten Zeilen in der Datei, was Sie hier geschrieben haben? Wenn nicht, bitte posten Sie sie. Hydaral vor 12 Jahren 0
"lrh" und "rrh" sind links und rechts laufende Köpfe. `xlrh` und` xrrh` verlassen den laufenden Kopfmodus. "cn" zentriert eine Zahl, während "ct" einen Titel zentriert. "ital" versetzt Sie in den kursiven Modus, während "med" Sie wieder in den mittleren Modus versetzt. "%" beginnt einen neuen Absatz, in dem ein umgekehrter Schrägstrich den Absatz fortsetzt. Ich kann die anderen nicht verstehen und habe einige Suchbegriffe verwendet, aber keiner enthüllt das Format ... Tom Wijsman vor 12 Jahren 4
WordPerfect hatte ** viele ** Steuerzeichen, die in das Dokument eingebettet waren. Es würde im Text viel unordentlicher aussehen. . surfasb vor 12 Jahren 0
@JoelCoehoorn Die Dateien haben keine Erweiterung. Barry Brown vor 12 Jahren 0
@Hydaral Dies sind die ersten 20 Zeilen einer der Dateien. Andere Dateien beginnen anders. Zum Beispiel ist die erste Zeile von CHAP02 " 2". Ich glaube nicht an die \ m \ m`In der Datei, die ich gepostet habe, ist eine magische Zahl. Barry Brown vor 12 Jahren 0
Da wir jetzt das Markup selbst dekodieren müssen, wäre dies vielleicht eine bessere Frage für Stack Overflow. Barry Brown vor 12 Jahren 0
Ich denke nicht, dass es für Stack Overflow gut geeignet ist, es sei denn, Sie können entweder einen vollständigen Satz von Markup-Befehlen zum Code erhalten oder vorhandenen Code, für den Sie Hilfe benötigen. Joel Coehoorn vor 12 Jahren 0
Einige andere Ideen (die ich auf die eine oder andere Weise nicht überprüfen kann), die bei der Veröffentlichung verwendet wurden: PageMaker, Quark, Quark Express, MS Publisher. Ich hatte große Hoffnungen in WordStar, aber es scheint, dass es bereits beseitigt wurde. Dieser Wikipedia-Artikel könnte nützlich sein: http://en.wikipedia.org/wiki/Desktop_publishing Joel Coehoorn vor 12 Jahren 0
Zusätzliches Material zur ursprünglichen Frage hinzugefügt. Barry Brown vor 12 Jahren 0

2 Antworten auf die Frage

4
jozzas

Ich habe dieses PDF auf Xyvision Production Publisher gefunden (was wahrscheinlich verwendet wurde). Hinweis unter FinalPages listet HTML als Ausgabeformat auf.

Wenn Sie irgendwie eine Kopie einer Version dieser Software erhalten könnten, können Sie sie dazu bringen, etwas HTML auszuspucken. Dies ist möglicherweise schwieriger als das Reverse-Engineering der Dokumentmarkierung. Weitere Informationen zu HTML-Exporten finden Sie am Ende dieser Seite .

4
RedGrittyBrick

Es ist möglich, dass sich das Produkt, mit dem Ihre Dateien erstellt wurden, in Portalyx SDL XPP entwickelt hat . Es könnte sich lohnen, Kontakt mit ihnen aufzunehmen.

Siehe XPP Personal Edition

Identifiziert über einen toten Link auf einer Wikipedia-Seite, der XyVision XPP erwähnte.

Gute Jagd. Vielen Dank! Ich werde in sie hineinschauen. Barry Brown vor 12 Jahren 0