Lassen Sie Pandoc die CSS-Stilklasse ignorieren

761
Seanny123

Ich versuche, eine HTML-Datei mit Pandoc in Markdown zu konvertieren, aber ich finde es schwer, die richtigen Optionen zu finden.

Ich möchte die gesamte HTML-Datei in den einfachsten möglichen Markdown konvertieren. Das heißt, keine <div>Tags und kein CSS-Stil in geschweiften Klammern. Wenn ich jedoch den folgenden HTML-Code in Pandoc eingebe, indem ich Folgendes anrufe pandoc -f html -t markdown reduced.html -o res.md:

<div class="section-content"> <div class="section-inner sectionLayout--insetColumn"> <h3 name="2ee9" id="2ee9" class="graf graf--h3 graf--leading graf--title">Post Title</h3> <p name="021f" id="021f" class="graf graf--p graf-after--h3">Preamble <a href="https://cogsci.stackexchange.com/users/4397/seanny123?tab=questions" data-href="https://cogsci.stackexchange.com/users/4397/seanny123?tab=questions" class="markup--anchor markup--p-anchor" rel="noopener" target="_blank">link</a> and conclusion.</p> </div> 

Ich bekomme die folgende Markdown-Ausgabe mit all den Dingen, die ich ignorieren möchte:

<div class="section-content">  <div class="section-inner sectionLayout--insetColumn">  ### Post Title {#2ee9 .graf .graf--h3 .graf--leading .graf--title name="2ee9"}  Preamble [link](https://cogsci.stackexchange.com/users/4397/seanny123?tab=questions){.markup--anchor .markup--p-anchor} and conclusion.  </div>  </div> 

Ich habe versucht, die Pandoc Markdown-Dokumente zu lesen, konnte jedoch keine Hinweise darauf finden, welche Parameter ich verwenden sollte.

1

1 Antwort auf die Frage

3
Seanny123

Wenn Sie es verwenden pandoc -f html -t markdown_github-raw_html reduced.html -o res.md, löst es das Problem.

  • markdown_github reduziert die Menge der Ausgaben, um das CSS zu ignorieren

  • -raw_htmlEntfernt die raw_htmlErweiterung, wodurch die Verknüpfungen behoben werden