GetTextAreas
내용물
[
숨다
]
GetTextAreas()
문서에서 텍스트 영역을 추출합니다.
public IEnumerable<PageTextArea> GetTextAreas()
반환 값
컬렉션PageTextArea
객체; 없는
텍스트 영역 추출이 지원되지 않는 경우.
비고
더 알아보기:
예
다음 예는 전체 문서에서 모든 텍스트 영역을 추출하는 방법을 보여줍니다.
// Parser 클래스의 인스턴스 생성
using(Parser parser = new Parser(filePath))
{
// 텍스트 영역 추출
IEnumerable<PageTextArea> areas = parser.GetTextAreas();
// 텍스트 영역 추출이 지원되는지 확인
if(areas == null)
{
Console.WriteLine("Page text areas extraction isn't supported");
return;
}
// 페이지 텍스트 영역을 반복합니다.
foreach(PageTextArea a in areas)
{
// 페이지 인덱스, 사각형 및 텍스트 영역 값을 인쇄합니다.
Console.WriteLine(string.Format("Page: {0}, R: {1}, Text: {2}", a.Page.Index, a.Rectangle, a.Text));
}
}
또한보십시오
- class PageTextArea
- class Parser
- 네임스페이스 GroupDocs.Parser
- 집회 GroupDocs.Parser
GetTextAreas(PageTextAreaOptions)
사용자 지정 옵션(정규식, 대/소문자 구분 등)을 사용하여 문서에서 텍스트 영역을 추출합니다.
public IEnumerable<PageTextArea> GetTextAreas(PageTextAreaOptions options)
모수 | 유형 | 설명 |
---|---|---|
options | PageTextAreaOptions | 텍스트 영역 추출 옵션. |
반환 값
컬렉션PageTextArea
객체; 없는
텍스트 영역 추출이 지원되지 않는 경우.
비고
더 알아보기:
예
다음 예는 왼쪽 위 모서리에서 숫자가 있는 텍스트 영역만 추출하는 방법을 보여줍니다.
// Parser 클래스의 인스턴스 생성
using(Parser parser = new Parser(filePath))
{
// 텍스트 영역 추출에 사용되는 옵션 생성
PageTextAreaOptions options = new PageTextAreaOptions("[0-9]+", new Rectangle(new Point(0, 0), new Size(300, 100)));
// 페이지의 왼쪽 위 모서리에서 숫자만 포함하는 텍스트 영역을 추출합니다.
IEnumerable<PageTextArea> areas = parser.GetTextAreas(options);
// 텍스트 영역 추출이 지원되는지 확인
if(areas == null)
{
Console.WriteLine("Page text areas extraction isn't supported");
return;
}
// 페이지 텍스트 영역을 반복합니다.
foreach(PageTextArea a in areas)
{
// 페이지 인덱스, 사각형 및 텍스트 영역 값을 인쇄합니다.
Console.WriteLine(string.Format("Page: {0}, R: {1}, Text: {2}", a.Page.Index, a.Rectangle, a.Text));
}
}
또한보십시오
- class PageTextArea
- class PageTextAreaOptions
- class Parser
- 네임스페이스 GroupDocs.Parser
- 집회 GroupDocs.Parser
GetTextAreas(int)
문서 페이지에서 텍스트 영역을 추출합니다.
public IEnumerable<PageTextArea> GetTextAreas(int pageIndex)
모수 | 유형 | 설명 |
---|---|---|
pageIndex | Int32 | 0부터 시작하는 페이지 인덱스입니다. |
반환 값
컬렉션PageTextArea
객체; 없는
텍스트 영역 추출이 지원되지 않는 경우.
비고
더 알아보기:
예
문서 페이지에서 텍스트 영역을 추출하려면 다음 방법이 사용됩니다.
// Parser 클래스의 인스턴스 생성
using(Parser parser = new Parser(filePath))
{
// 문서가 텍스트 영역 추출을 지원하는지 확인
if(!parser.Features.TextAreas)
{
Console.WriteLine("Document isn't supports text areas extraction.");
return;
}
// 문서 정보 가져오기
IDocumentInfo documentInfo = parser.GetDocumentInfo();
// 문서에 페이지가 있는지 확인
if(documentInfo.PageCount == 0)
{
Console.WriteLine("Document hasn't pages.");
return;
}
// 페이지를 반복
for(int pageIndex = 0; pageIndex<documentInfo.PageCount; pageIndex++)
{
// 페이지 번호 출력
Console.WriteLine(string.Format("Page {0}/{1}", pageIndex + 1, documentInfo.PageCount));
// 페이지 텍스트 영역을 반복합니다.
// 이전에 텍스트 영역 추출 기능 지원을 확인했으므로 null 검사를 무시합니다.
foreach(PageTextArea a in parser.GetTextAreas(pageIndex))
{
// 사각형 및 텍스트 영역 값을 인쇄합니다.
Console.WriteLine(string.Format("R: {0}, Text: {1}", a.Rectangle, a.Text));
}
}
}
또한보십시오
- class PageTextArea
- class Parser
- 네임스페이스 GroupDocs.Parser
- 집회 GroupDocs.Parser
GetTextAreas(int, PageTextAreaOptions)
사용자 지정 옵션(정규식, 대/소문자 구분 등)을 사용하여 문서 페이지에서 텍스트 영역을 추출합니다.
public IEnumerable<PageTextArea> GetTextAreas(int pageIndex, PageTextAreaOptions options)
모수 | 유형 | 설명 |
---|---|---|
pageIndex | Int32 | 0부터 시작하는 페이지 인덱스입니다. |
options | PageTextAreaOptions | 텍스트 영역 추출 옵션. |
반환 값
컬렉션PageTextArea
객체; 없는
텍스트 영역 추출이 지원되지 않는 경우.
비고
더 알아보기:
또한보십시오
- class PageTextArea
- class PageTextAreaOptions
- class Parser
- 네임스페이스 GroupDocs.Parser
- 집회 GroupDocs.Parser