Tag: pdf

在Django站点中将HTML呈现为PDF

对于我的Django动力网站,我正在寻找一个简单的解决scheme,将dynamic的HTML页面转换为PDF格式。 页面包括HTML可视化API(这是基于JavaScript,但包括这些图是必须的)的HTML和图表。

如何从PDF中提取文本?

任何人都可以推荐一个图书馆/ API从PDF提取文本和图像? 我们需要能够获取包含在文档的预知区域中的文本,因此API需要向我们提供页面上每个元素的位置信息。 我们希望这些数据以xml或json格式输出。 我们目前正在寻找似乎相当不错的PdfTextStream ,但希望听到其他人的经验和build议。 有没有替代品(商业或免费)从PDF中提取文本编程?

用PHP创buildPDF的最佳方式

我一直在阅读与PHP创buildPDF文件,我想知道什么是最简单的select。 创build一个PDF模板,打开它并replace占位符文本 – 我用哪个函数打开现有的PDF进行编辑? 创build一个PDF模板,并使用坐标在上面放置文本 创build一个HTML文档,然后使用某种免费工具将其转换为PDF? 使用PHP从头开始创build一个PDF(这种方式非常耗时)。

我怎样才能从PDF提取embedded的字体作为有效的字体文件?

我知道pdftk.exe实用程序可以指示哪些字体由PDF使用,而且它们是否embedded。 现在的问题是:由于我的PDF文件中embedded了字体 – 我怎样才能提取这些字体的方式,他们是可重用的常规字体文件? 有没有(最好是免费)的工具可以做到这一点? 另外:这可以用编程方式完成,比如iText?

embedded与对象

当我想要显示Adobe PDF查看器时,在我的HTML文件中使用的是正确/最佳标记? 现在我正在使用下面的代码,但有一些奇怪的副作用(例如,它似乎窃取了我已经设置到另一个INPUT文本框的起始焦点;它似乎并不能很好地使用jQueryUI Resizeable类等) <embed src="abc.pdf" type="application/pdf" /> 我甚至可以用OBJECT标签做同样的事情吗? 使用一个标签与另一个标签是否有优势/劣势?

我怎样才能将一系列的图像从Linux的命令行转换为PDF格式?

我有一个我在cgi / bash中编写的扫描服务器,希望能够将一堆图像(全部在一个文件夹中)从命令行转换为pdf。 如何做到这一点?

如何将chm转换为pdf

我有两种types的文件:CHM和PDF,但是我更喜欢它们,如果它们都是PDF格式。 我正在寻找一些好的方法来改变它。 有没有人有好主意? 我会感激的。 更新:感谢帮助我的eveyone。 🙂

如何search多个pdf文件的内容?

我怎样才能search目录/子目录中的PDF文件的内容? 我正在寻找一些命令行工具。 看来, grep不能searchPDF文件。

如何将PDF文档转换为PHP中的预览图像?

将PDF文档的一部分渲染为图像文件需要哪些库,扩展等? 我发现的大多数PHP PDF库都是以创buildPDF文档为中心的,但是有没有一种简单的方法将文档转换为适合网页使用的图像格式呢? 我们的环境是一个LAMP堆栈。

将PDF转换为高分辨率的图像

我正在尝试使用命令行程序convert PDF转换为图像(JPEG或PNG)。 这是我试图转换的PDF文件之一 。 我希望程序能够裁剪多余的空白区域,并返回足够高质量的图像,以便轻松读取上标。 这是我目前最好的尝试 。 正如你所看到的,修整工作正常,我只需要提高分辨率相当多。 这是我正在使用的命令: convert -trim 24.pdf -resize 500% -quality 100 -sharpen 0x1.0 24-11.jpg 我试图做出以下有意识的决定: 调整它的大小(对分辨率没有影响) 尽可能提高质量 使用-sharpen (我尝试了一系列值) 任何build议请得到最终的PNG / JPEG图像的分辨率将不胜感激!