投视频分享服务「Docswell」的营运公司 Apluced 股份有限公司(总部位于东京都千代田区,以下简称「本公司」)宣布,Docswell 正式开始提供图片式 PDF 的全文自动转录功能。 通过本功能,在上传以 Google NotebookLM 等工具生成的图片式投视频,或以 Adobe Illustrator 等软件进行外框化处理的 PDF 时,投视频内的文本将可自动转录。过去图片式 PDF 的转录字段会呈现空白,导致搜索引擎难以正确创建索引,而此次功能上线后,只需上传即可自动完成全文转录,大幅提升通过搜索被发现的可能性。 开发背景 Docswell 会截取上传投视频中的文本信息,用于搜索引擎收录及站内搜索。然而,以下情况的 PDF 文件不含文本信息,导致转录字段保持空白,使高品质数据难以通过搜索引擎被找到: 以 NotebookLM 等 AI 工具生成的投视频(以图片形式输出,不含文本信息的情况) 以 Adobe Illustrator 等软件将字体外框化后制作的 PDF(文本已转换为路径数据的情况) 将纸本数据扫描后转为 PDF 的文件(仅含图片数据、无文本层的情况) 近年来,随着以 NotebookLM 为代表的 AI 工具普及,图片式投视频的数量持续增加,因此本公司决定开发此功能,使这类 PDF 也能正确辨识并转录文本内容。 功能概要 将图片式 PDF 上传至 Docswell 后,系统将自动辨识投视频内的文本信息并完成全文转录。转录后的文本会反映在投视频详细页面,并可被 Google、Yahoo! 等搜索引擎创建索引。