PdfMasher: Aus PDF-Dokumenten HTML generieren

Wer ein PDF in HTML umwandeln möchte – um es besser archivieren (siehe dazu auch den interessanten Kommentarthread auf Google+) oder auf seinem E-Book-Reader lesen zu können –, findet in PdfMasher einen nützlichen Helfer. Das Programm gibt es für Mac, Windows und Linux. Es ist noch nicht perfekt, aber erste Tests waren schon recht viel versprechend. Die Software zerlegt das PDF in einzeln sortierbare Textteile, die man dann ausblenden oder editieren kann. Fußnoten werden auf Wunsch umgewandelt, auch wenn das leider noch etwas buggy ist. Ich zitiere aus der Programm-Beschreibung:

PdfMasher is a tool to convert PDF files containing text in ready-for-ebook HTML files. Most ebook readers support PDF files natively, but it’s often a real pain to read those documents because we don’t have font size control over the document like we have with native ebooks. In many cases, we have to use the zooming feature and it’s just a pain. Another drawback of PDFs on ebook readers is that annotations are not supported.

Wie die Arbeit mit PdfMasher funktioniert, wird anschaulich im Video-Tutorial erklärt:

In einem zweiten Video werden auch die Möglichkeiten des Markdown post processing vorgestellt.

Wer ein iPad hat, braucht sich mit solch einer Konvertierung nicht zu befassen, das geht wesentlich einfacher, wie ich unseren Lesern im vergangenen Jahr schon im Stabi-Blog gezeigt habe: Mit dem iPad die Angebote der Stabi nutzen.

[via Bitelia]

Ein Gedanke zu “PdfMasher: Aus PDF-Dokumenten HTML generieren

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.