Metadata & 校验规则
当使用严格的 PDF/A profiles (Level A 或 UA) 时,特定的标准元数据字段将变为必填项。
必填字段 (E003)
如果您选择了严格的 profile 但未提供必需的 metadata,系统将检查合规性。
| Profile | 必填字段 | 缺失时的行为 |
|---|---|---|
| PDF/A-UA1 | title, language | 如果 title 缺失,触发 E003 Error。 |
| PDF/A-1a/2a/3a | language | 自动检测 (见下文)。 |
WARNING
E003 Error: PDF 页面上会出现一个带有红色文字的白色文本框,列出缺失的字段 (例如 "Missing: title")。
语言自动检测 (Smart Detection)
metadata_language 字段对于可访问性 PDF (Level A/UA) 是强制要求的。为了简化集成,xPdf 采用了 智能检测策略:
- 显式指定: 如果您提供了
metadata_language(如"en","zh"),则直接使用。 - 自动检测: 如果缺失,系统会扫描文档内容:
- 中文字符 ->
zh - 日文假名 ->
ja - (支持 CJK, 阿拉伯语, 希伯来语等)
- 中文字符 ->
- 安全兜底: 如果检测失败 (例如全是数字或条码),系统默认设为
"und"(Undetermined - 语言未定)。
NOTE
这意味着您通常 不需要 手动设置 metadata_language 来避免报错。系统会自动确保合规性。