一款名为PDF Craft的开源工具突然在GitHub爆火,专门解决扫描版PDF转电子书的世纪难题。这个神器不仅能自动屏蔽页码、脚注这些干扰元素,连书本跨页的段落都能智能拼接,转出来的电子书直接带完整目录结构。 最狠的是它支持完全离线操作,首次使用时自动下载本地AI模型。实测发现,处理扫描版教材时,连复杂的数学公式和图表都能原样保留,转成Markdown或EPUB格式后,排版效果和正版电子书有得一拼。开发者还贴心配置了DeepSeek V3模型方案,据说处理专业文献的识别率能提升40%。 业内人士分析,这类工具的出现彻底改变了纸质资料电子化的困境。以往处理扫描书要手动删页眉页脚,处理跨页段落更是噩梦,现在AI全自动搞定。目前同类工具中,PDF Craft是首个实现离线AI处理的开源方案,特别适合处理涉密文档或需要保护隐私的场景。项目刚开源就收获上千星标,看来技术宅们早就受够了扫描书的排版噩梦。 ![]() |
|