Wie kann man hervorgehobenen Text aus PDF als Textdatei extrahieren?

Das Hervorheben von Text in einem PDF - Dokument ist praktisch, um wichtige Bereiche zu markieren, auf die Sie später schnell zugreifen können. Sie können Microsoft Edge verwenden, um PDF(Microsoft Edge to highlight PDF)  oder jede andere Software hervorzuheben, die mit der PDF -Hervorhebungsfunktion ausgestattet ist. Manchmal haben Sie vielleicht auch das Bedürfnis verspürt, nur den hervorgehobenen Text zu haben, damit Sie die Zusammenfassung der PDF -Datei haben , die den gesamten wesentlichen Text enthält. Wenn Sie nach Möglichkeiten suchen, nur markierten Text aus einer PDF -Datei als TXT -Datei zu speichern, kann dieser Beitrag hilfreich sein.

Markierten Text aus PDF extrahieren

Es gibt einige kostenlose Software und einen Dienst, um markierten Text aus einer PDF -Datei zu extrahieren und als Textdatei zu speichern:

  • PDF-Highlight-Extractor
  • Foxit Reader
  • Sumnotes.net
  • DyAnnotationExtractor.

Lassen Sie uns diese PDF Highlight Extractor(PDF Highlight Extractor) -Software nacheinander überprüfen .

1] PDF-Highlight-Extraktor

PDF Highlight Extractor-Software

PDF Highlight Extractor ist eine der einfachsten Optionen, um den hervorgehobenen Text aus einer PDF -Datei zu extrahieren. Dieser Open-Source- Extraktor für PDF-Texthervorhebungen(PDF text highlight extractor) hat zwei Funktionen, die die Aufmerksamkeit auf sich ziehen. Sie können den hervorgehobenen PDF-Text(preview highlighted text) auf der Softwareoberfläche in der Vorschau anzeigen.

Die zweite Funktion ist, dass Sie die Start- oder Endseite oder den Seitenbereich festlegen können, um den Text zu extrahieren(set start or end page or page range to extract the text) . Anstatt also das gesamte PDF zu scannen , können Sie Seitenzahlen definieren, um den hervorgehobenen Text zu erhalten.

Eine weitere gute Funktion ist, dass Sie die Möglichkeit haben , Text als einfachen Text(save text as plain text) oder als Excel-Datei(Excel file) zu speichern .

Fügen Sie auf seiner Oberfläche Ihre PDF -Datei mit der angegebenen Option hinzu und drücken Sie dann die Schaltfläche Extrahieren . (Extract)Deaktivieren Sie die Option Alle Seiten(All Pages) , wenn Sie den Seitenbereich festlegen möchten, oder lassen Sie ihn unverändert. Sobald der Text abgerufen wurde, können Sie ihn in der Vorschau anzeigen. Drücken Sie abschließend die Schaltfläche Text oder Excel , um den markierten Text zu speichern.

Sie können diese Software hier(here) herunterladen . Java wird auch benötigt, um diese Software zu verwenden. Installieren Sie also Java (falls noch nicht geschehen) und führen Sie diese Software aus, um sie zu verwenden.

2] Foxit-Reader

Markierten Text aus PDF extrahieren

Foxit Reader ist einer der besten kostenlosen PDF-Reader . Sie können mehrere PDF -Dateien in separaten Registerkarten öffnen, (PDF)PDF markieren , eine Notiz hinzufügen, Kommentare exportieren(export comments) , Signaturen hinzufügen(add signatures) und vieles mehr. Zu der riesigen Liste von Funktionen gehört auch das Extrahieren von hervorgehobenem Text aus PDF . Das Beste an dieser Funktion ist, dass neben dem extrahierten Text auch Seitenzahlen gespeichert werden(saves page numbers along with the extracted text) .

Um hervorgehobenen Text aus PDF abzurufen , öffnen Sie die PDF -Datei auf ihrer Oberfläche und greifen Sie auf die Registerkarte Kommentar zu. (Comment)Klicken Sie auf dieser Registerkarte auf die Option „ Exportieren “, die im Abschnitt „ (Export)Kommentare verwalten(Manage Comments) “ verfügbar ist. Sie sehen die Option Hervorgehobener Text . (Highlighted Text)Verwenden Sie diese Option und Sie können den gesamten markierten Text als Textdatei speichern.

Hier(Here) ist der Download-Link für diese Software. Während der Installation sollten Sie die benutzerdefinierte Installation(custom installation) auswählen , um nur die erforderlichen Komponenten dieser Software einzuschließen.

3] Sumnotes.net

Zusammenfassungen

Sumnotes.net ist ein kostenloser Dienst, mit dem Sie PDFs(PDF) kommentieren und den markierten Text extrahieren können. Der gesamte hervorgehobene Text ist separat in der linken Seitenleiste sichtbar. Mit dieser Seitenleiste können Sie auch hervorgehobenen Text entfernen, den Sie nicht benötigen,(remove highlighted text that you don’t need) und dann den Rest des hervorgehobenen Textes herunterladen.

Vor dem Herunterladen des hervorgehobenen Textes können Sie auch Seitenzahlen einfügen und den hervorgehobenen Text einer bestimmten Farbe (highlighted text of specific color)ausschließen(exclude) .

Sie haben auch die Möglichkeit, markierten Text aus PDF als Excel-(save highlighted text from PDF as Excel) oder Word -Datei zu speichern. Die Funktionen sind also gut. Sie können sich mit einem kostenlosen Plan anmelden und dann 50(extract 50 highlights) Markierungen oder Anmerkungen pro Download(per download) extrahieren , was in den meisten Fällen ausreicht.

Hier(Here) ist der Link zu seiner Homepage. Um markierten Text aus PDF zu extrahieren , fügen Sie ein PDF vom PC oder Google Drive hinzu . Wenn das PDF hochgeladen wird, sind Anmerkungen und hervorgehobener Text auf der linken Seite sichtbar. Verwenden Sie die Option Anmerkungen herunterladen(Download Annotations) und dann können Sie den markierten Text in einer Datei im TXT- , XLSX- oder DOC -Format speichern.

4] DyAnnotationExtractor

DyAnnotationExtractor-Befehlszeilensoftware

Die DyAnnotationExtractor-(DyAnnotationExtractor) Software kann Ihnen dabei helfen, hervorgehobenen Text und Kommentare(comments) aus einem PDF-Dokument zu extrahieren. Es ist eine Befehlszeilensoftware(command-line) , aber die Verwendung ist sehr einfach. Nur ein einziger Befehl ruft den in der Eingabe - PDF -Datei hervorgehobenen Text ab.

Sie können diese Software über diesen Link beziehen(this link) . Laden(Download) Sie die ZIP -Datei herunter und extrahieren Sie sie. Um das Ausführen des Befehls zu vereinfachen, sollten Sie PDF auch in denselben Ordner legen, in dem Sie diese Software extrahiert haben. Öffnen Sie danach das Eingabeaufforderungsfenster(Command Prompt) in diesem Ordner. Sie können dies tun, indem Sie cmd in das Adressfeld dieses Ordners eingeben und dann die Eingabetaste(Enter) drücken.

Wenn das CMD - Fenster geöffnet wird, fügen Sie die BAT -Datei dieser Software, den Eingabebefehl einschließlich des Pfads der Eingabe- PDF , den Ausgabebefehl und den Namen der Ausgabedatei zusammen mit der Erweiterung „.txt“ hinzu. Der vollständige Befehl wird sein-

DyAnnotationExtractor.bat -input path of input PDF -output outputfilename.txt

Führen Sie den Befehl aus. Warten Sie(Wait) ein paar Sekunden, und die Nur-Text-Datei ist fertig und enthält den gesamten hervorgehobenen Text und die Kommentare, die aus diesem PDF abgerufen(PDF) wurden . Die Ausgabedatei wird im selben Eingabeordner gespeichert.

Dies sind also einige Optionen, die Sie verwenden können, um hervorgehobenen Text aus PDF zu extrahieren und die Ausgabe dann als Textdatei zu speichern. Hoffe(Hope) , diese helfen.



About the author

Wenn es um Technologie geht, ist nichts wichtiger als Genauigkeit und Qualität. Wir bei Microsoft sind stolz auf unsere Fähigkeit, unseren Kunden das bestmögliche Erlebnis zu bieten. Unsere Windows- und iOS-Produkte gehören zu den innovativsten der Branche, und wir arbeiten ständig daran, sie zu verbessern. Unsere fehlerfreien PDFs sind ein weiterer Grund, warum unsere Produkte so erfolgreich sind. Wir wissen, dass Qualitätskontrolle bei Arbeitsabläufen und Kommunikation unerlässlich ist, deshalb achten wir sehr darauf, dass alle unsere PDFs fehlerfrei sind. Und schließlich verstehen wir als Gadget-Liebhaber, dass es immer eine Schlüsselpriorität ist, das Leben einfacher zu machen. Wir stellen sicher, dass alle unsere Lumia-Geräte mit Funktionen wie NFC und CarPlay ausgestattet sind, damit Sie Dateien ganz einfach mit Freunden und Familie teilen können. Mit diesen Fähigkeiten



Related posts