表单提取器
2025/7/21小于 1 分钟pdfbox模块高级功能提取器
示例
提取表单字段
说明
返回值为 map ,key 为字段名称, value 为提取字段
try (
// 加载文档
Document document = PdfHandler.getDocumentHandler().load("E:\\PDF\\pdfbox\\extractor\\hello-world.pdf");
// 获取文档提取器
DocumentExtractor extractor = PdfHandler.getDocumentExtractor(document);
) {
// 提取字段信息
Map<String, PDField> map = extractor.extractFormField();
// 输出字段信息
map.forEach((key, value) -> System.out.println("字段名:" + key + "字段值:" + value));
}
提取表单文本
说明
返回值为 map ,key 为字段名称, value 为提取文本
try (
// 加载文档
Document document = PdfHandler.getDocumentHandler().load("E:\\PDF\\pdfbox\\extractor\\hello-world.pdf");
// 获取文档提取器
DocumentExtractor extractor = PdfHandler.getDocumentExtractor(document);
) {
// 提取文本信息
Map<String, String> map = extractor.extractFormText();
// 输出文本信息
map.forEach((key, value) -> System.out.println("字段名:" + key + "字段值:" + value));
}
提取表单图像
说明
返回值为 map ,key 为字段名称, value 为提取图像
try (
// 加载文档
Document document = PdfHandler.getDocumentHandler().load("E:\\PDF\\pdfbox\\extractor\\hello-world.pdf");
// 获取文档提取器
DocumentExtractor extractor = PdfHandler.getDocumentExtractor(document);
) {
// 提取图像信息
Map<String, BufferedImage> map = extractor.extractFormImage();
// 输出图像信息
map.forEach((key, value) -> System.out.println("字段名:" + key + "字段值:" + value));
}