GetFormattedText
Inhalt
[
Ausblenden
]
GetFormattedText(FormattedTextOptions)
Extrahiert einen formatierten Text aus dem Dokument.
public TextReader GetFormattedText(FormattedTextOptions options)
Parameter | Typ | Beschreibung |
---|---|---|
options | FormattedTextOptions | Die Extraktionsoptionen für formatierten Text. |
Rückgabewert
Eine Instanz vonTextReader Klasse mit dem extrahierten Text; Null
wenn die Extraktion von formatiertem Text nicht unterstützt wird.
Bemerkungen
Erfahren Sie mehr:
- Formatierten Text aus Dokument extrahieren
- Extrahieren Sie einen Dokumenttext alsHTML
- Extrahieren Sie einen Dokumenttext alsAbschlag
- Extrahieren Sie einen Dokumenttext alsKlartext
Beispiele
Das folgende Beispiel zeigt, wie Sie einen Dokumenttext als HTML-Text extrahieren:
// Erstellen Sie eine Instanz der Parser-Klasse
using (Parser parser = new Parser(filePath))
{
// Einen formatierten Text in den Reader extrahieren
using (TextReader reader = parser.GetFormattedText(new FormattedTextOptions(FormattedTextMode.Html)))
{
// Einen formatierten Text aus dem Dokument drucken
// Wenn die Extraktion von formatiertem Text nicht unterstützt wird, ist ein Reader null
Console.WriteLine(reader == null ? "Formatted text extraction isn't suppported" : reader.ReadToEnd());
}
}
Siehe auch
- class FormattedTextOptions
- class Parser
- namensraum GroupDocs.Parser
- Montage GroupDocs.Parser
GetFormattedText(int, FormattedTextOptions)
Extrahiert einen formatierten Text aus der Dokumentseite.
public TextReader GetFormattedText(int pageIndex, FormattedTextOptions options)
Parameter | Typ | Beschreibung |
---|---|---|
pageIndex | Int32 | Der nullbasierte Seitenindex. |
options | FormattedTextOptions | Die Extraktionsoptionen für formatierten Text. |
Rückgabewert
Eine Instanz vonTextReaderKlasse mit dem extrahierten Text; Null
wenn die Extraktion formatierter Textseiten nicht unterstützt wird.
Bemerkungen
Erfahren Sie mehr:
- Extrahieren Sie formatierten Text von der Dokumentseite
- Extrahieren Sie einen Dokumenttext alsHTML
- Extrahieren Sie einen Dokumenttext alsAbschlag
- Extrahieren Sie einen Dokumenttext alsKlartext
Beispiele
Das folgende Beispiel zeigt, wie Sie einen Dokumentseitentext als Markdown-Text extrahieren:
// Erstellen Sie eine Instanz der Parser-Klasse
using (Parser parser = new Parser(filePath))
{
// Prüfen Sie, ob das Dokument die Extraktion von formatiertem Text unterstützt
if (!parser.Features.FormattedText)
{
Console.WriteLine("Document isn't supports formatted text extraction.");
return;
}
// Holen Sie sich die Dokumentinformationen
IDocumentInfo documentInfo = parser.GetDocumentInfo();
// Prüfe, ob das Dokument Seiten hat
if (documentInfo.PageCount == 0)
{
Console.WriteLine("Document hasn't pages.");
return;
}
// Über Seiten iterieren
for (int p = 0; p<documentInfo.PageCount; p++)
{
// Eine Seitenzahl drucken
Console.WriteLine(string.Format("Page {0}/{1}", p + 1, documentInfo.PageCount));
// Einen formatierten Text in den Reader extrahieren
using (TextReader reader = parser.GetFormattedText(p, new FormattedTextOptions(FormattedTextMode.Markdown)))
{
// Einen formatierten Text aus dem Dokument drucken
// Wir ignorieren die Nullprüfung, da wir zuvor die Unterstützung für die Funktion zum Extrahieren von formatiertem Text überprüft haben
Console.WriteLine(reader.ReadToEnd());
}
}
}
Siehe auch
- class FormattedTextOptions
- class Parser
- namensraum GroupDocs.Parser
- Montage GroupDocs.Parser