GetText
GetText()
Extrahiert einen Text aus dem Dokument.
public TextReader GetText()
Rückgabewert
Eine Instanz vonTextReader Klasse mit dem extrahierten Text; Null
wenn die Textextraktion nicht unterstützt wird.
Bemerkungen
Erfahren Sie mehr:
Beispiele
Das folgende Beispiel zeigt, wie Sie einen Text aus einem Dokument extrahieren:
// Erstellen Sie eine Instanz der Parser-Klasse
using(Parser parser = new Parser(filePath))
{
// Einen Text in den Reader extrahieren
using(TextReader reader = parser.GetText())
{
// Einen Text aus dem Dokument drucken
// Wenn die Textextraktion nicht unterstützt wird, ist ein Reader null
Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());
}
}
Siehe auch
- class Parser
- namensraum GroupDocs.Parser
- Montage GroupDocs.Parser
GetText(TextOptions)
Extrahiert eine Textseite aus dem Dokument mithilfe von Textoptionen (um den Rohtext-Schnellextraktionsmodus zu aktivieren).
public TextReader GetText(TextOptions options)
Parameter | Typ | Beschreibung |
---|---|---|
options | TextOptions | Die Textextraktionsoptionen. |
Rückgabewert
Eine Instanz vonTextReader Klasse mit dem extrahierten Text; Null
wenn die Textextraktion nicht unterstützt wird.
Bemerkungen
Erfahren Sie mehr:
Beispiele
Das folgende Beispiel zeigt, wie Sie einen Rohtext aus einem Dokument extrahieren:
// Erstellen Sie eine Instanz der Parser-Klasse
using(Parser parser = new Parser(filePath))
{
// Einen Rohtext in den Reader extrahieren
using(TextReader reader = parser.GetText(new TextOptions(true)))
{
// Einen Text aus dem Dokument drucken
// Wenn die Textextraktion nicht unterstützt wird, ist ein Reader null
Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());
}
}
Siehe auch
- class TextOptions
- class Parser
- namensraum GroupDocs.Parser
- Montage GroupDocs.Parser
GetText(int)
Extrahiert einen Text aus der Dokumentseite.
public TextReader GetText(int pageIndex)
Parameter | Typ | Beschreibung |
---|---|---|
pageIndex | Int32 | Der nullbasierte Seitenindex. |
Rückgabewert
Eine Instanz vonTextReader Klasse mit dem extrahierten Text; Null
wenn die Extraktion von Textseiten nicht unterstützt wird.
Bemerkungen
Erfahren Sie mehr:
Beispiele
Das folgende Beispiel zeigt, wie Sie einen Text aus der Dokumentseite extrahieren:
// Erstellen Sie eine Instanz der Parser-Klasse
using(Parser parser = new Parser(filePath))
{
// Prüfen, ob das Dokument Textextraktion unterstützt
if(!parser.Features.Text)
{
Console.WriteLine("Document isn't supports text extraction.");
return;
}
// Holen Sie sich die Dokumentinformationen
IDocumentInfo documentInfo = parser.GetDocumentInfo();
// Prüfe, ob das Dokument Seiten hat
if(documentInfo.PageCount == 0)
{
Console.WriteLine("Document hasn't pages.");
return;
}
// Über Seiten iterieren
for(int p = 0; p<documentInfo.PageCount; p++)
{
// Eine Seitenzahl drucken
Console.WriteLine(string.Format("Page {0}/{1}", p + 1, documentInfo.PageCount));
// Einen Text in den Reader extrahieren
using(TextReader reader = parser.GetText(p))
{
// Einen Text aus dem Dokument drucken
// Wir ignorieren die Nullprüfung, da wir zuvor die Unterstützung der Textextraktionsfunktion überprüft haben
Console.WriteLine(reader.ReadToEnd());
}
}
}
Siehe auch
- class Parser
- namensraum GroupDocs.Parser
- Montage GroupDocs.Parser
GetText(int, TextOptions)
Extrahiert einen Text aus der Dokumentseite mithilfe von Textoptionen (um den Rohtext-Schnellextraktionsmodus zu aktivieren).
public TextReader GetText(int pageIndex, TextOptions options)
Parameter | Typ | Beschreibung |
---|---|---|
pageIndex | Int32 | Der nullbasierte Seitenindex. |
options | TextOptions | Die Textextraktionsoptionen. |
Rückgabewert
Eine Instanz vonTextReader Klasse mit dem extrahierten Text; Null
wenn die Extraktion von Textseiten nicht unterstützt wird.
Bemerkungen
Erfahren Sie mehr:
Beispiele
Das folgende Beispiel zeigt, wie Sie einen Rohtext aus der Dokumentseite extrahieren:
// Erstellen Sie eine Instanz der Parser-Klasse
using(Parser parser = new Parser(filePath))
{
// Prüfen, ob das Dokument Textextraktion unterstützt
if(!parser.Features.Text)
{
Console.WriteLine("Document isn't supports text extraction.");
return;
}
// Holen Sie sich die Dokumentinformationen
DocumentInfo documentInfo = parser.GetDocumentInfo() as DocumentInfo;
// Prüfe, ob das Dokument Seiten hat
if(documentInfo == null || documentInfo.RawPageCount == 0)
{
Console.WriteLine("Document hasn't pages.");
return;
}
// Über Seiten iterieren
for(int p = 0; p<documentInfo.RawPageCount; p++)
{
// Eine Seitenzahl drucken
Console.WriteLine(string.Format("Page {0}/{1}", p + 1, documentInfo.RawPageCount));
// Einen Text in den Reader extrahieren
using(TextReader reader = parser.GetText(p, new TextOptions(true)))
{
// Einen Text aus dem Dokument drucken
// Wir ignorieren die Nullprüfung, da wir zuvor die Unterstützung der Textextraktionsfunktion überprüft haben
Console.WriteLine(reader.ReadToEnd());
}
}
}
Siehe auch
- class TextOptions
- class Parser
- namensraum GroupDocs.Parser
- Montage GroupDocs.Parser