转换PDF到HTML

将PDF文档转换为HTML浏览器的最佳解决scheme是什么? 该网站有几个PDF文档,访问者可以点击浏览为HTML,这应该在屏幕上作为HTML文件来查看。

运行PHP,Linux,Apache的标准网站。

pdftohtml工作正常:快速,稳定,但HTML结果是最好的。 我已经用了很长时间的一个网站,有很多工作简历。

然而,这是提取文本内容的好方法。

我会给scribd API一个尝试

或谷歌应用程序文档API。 GOogle在显示和转换PDF文件方面performance出色

您是否考虑将PDF数据保存在数据库中,然后根据访问者的selectdynamic创buildPDF或html页面?

如果您的托pipe服务提供商有命令行访问权限,poppler_utils包内有一个名为pdftohtml的实用工具。

http://poppler.freedesktop.org/

看起来很容易使用,没有从PHP内部调用它,但它应该工作。

如果你准备从PHP调用Java,你可以看看http://www.jpedal.org/html_index.php