Tag: pdf

使用Node.js将HTML转换为PDF

我正在寻找创build我的网站网页的可打印的pdf版本。 像express.render()这样的东西只会将页面渲染为pdf 有谁知道这样做的节点模块? 如果不是,你将如何去实施一个? 我已经看到一些方法使用像phantom.js这样的无头浏览器,但不知道stream量是phantom.js 。

在网页浏览器中显示PDF

如何在.html页面的Web浏览器中显示PDF?

如何知道PDF页面是彩色还是黑白?

给定一组PDF文件,其中一些页面是彩色的,其余的是黑白的,在给定的页面中是否有任何程序可以查找是彩色的还是黑白的? 例如,在打印一篇论文时,这将是有用的,并且只花费额外的费用来打印彩色页面。 对于考虑到双面打印的人员的奖励分数,并且如果在彩色打印机的对面跟着彩页,则发送适当的黑白页面到彩色打印机。

带有PDF输出的PHP PDF模板库?

是否有任何PHP PDF库可以replace现有PDF,ODT或DOCX文档中的占位符variables ,并生成PDF文件作为最终结果,而不会影响布局? 要求: 不需要第三方networking服务 能够运行共享networking托pipe将是理想的(不需要二进制安装/包) 请注意,能够加载现有PDF文件并以编程方式在特定位置插入文本的库对于我的用例来说是不够的。 据我的研究显示,没有图书馆可以做到这一点: TCPDF只能从头开始生成文档 FPDI可以读取现有的PDF模板,但只能以编程方式添加内容(不需要模板variablesreplace) 有不同的DOCX / ODT模板库,但它们不输出PDF PHPDOCx声称能够做到我需要的东西 – 但他们不提供试用版本,我不打算买一只猫,特别是当网上似乎没有其他产品这个。 我很难相信他们可以做到这一点没有问题 – 如果您已经成功地使用该产品,请在这里写下一行。 我可以俯视吗? 有没有办法使用PDF表单做到这一点? 我正在OpenOffice 3中创build源文档。 我可以使用标准的Linux命令(例如, pdftk可用,现在就pdftk 。) 更新: * 唉! *我被叫出了办公室,同时赏金过期了。 开始一个新的赏金:据我的testing显示,没有任何解决scheme完美的作品。 更新II:我很快就会看到pdftk的方法,但是我也开始了另外一个收集额外的input更多的奖金。 这个问题现在已经看到了1300点的赏金,必须是某种logging:)

如何在网页中embeddedPDF查看器?

如果我没有弄错,Google Docs提供了显示与网页通过iFrame存储在同一服务器上的PDF的方法,但是我需要知道如何以跨浏览器兼容的方式来完成此操作。

我如何使用pdfminer作为一个库

我正在尝试使用pdfminer从pdf获取文本数据。 我可以使用pdfminer命令行工具pdf2txt.py成功将这些数据提取到.txt文件。 我目前这样做,然后使用python脚本来清理.txt文件。 我想将pdf提取过程合并到脚本中,并保存一个步骤。 当我发现这个链接的时候 , 我以为自己在做什么 ,但是我没有任何解决scheme的成功。 也许在那里列出的function需要再次更新,因为我正在使用更新版本的pdfminer。 我也尝试了这里显示的function,但它也没有工作。 我尝试的另一种方法是使用os.system在脚本中调用脚本。 这也是不成功的。 我正在使用Python版本2.7.1和pdfminer版本20110227。

如何在HTML中显示PDF文件

我有一个由itext自动生成的PDF文件,我需要显示该HTML文件的PDF文件。 我的问题是:如何使用pdf.js在HTML中显示本地PDF文件? 该PDF文件是否应该由某些标准生成?

高级PDFparsing使用Python(提取文本没有表等):什么是最好的图书馆?

我正在寻找一个PDF库,这将允许我从PDF文档中提取文本。 我已经看了PyPDF,这可以很好地从PDF文档中提取文本。 问题在于,如果文档中有表格,则表格中的文本将与文档的其余部分一起提取。 这可能是有问题的,因为它会产生无用的文本部分,看起来乱码(例如,大量的数字拼凑在一起)。 我正在寻找一些更先进的东西。 我想从PDF文档中提取文本, 不包括任何表格和特殊的格式。 有没有这样的图书馆? 还是我不得不在输出文本上做一些后处理来摆脱这些部分?

大多数打印机可以处理的最小利润是多less?

我创buildpdfs服务器端与大量的graphics,所以最大限度地提高房地产是必须的,但同时确保用户打印机可以处理紧张的利润是必须的。 有没有人有一个想法,当创作PDF文件时,我可以使用哪些安全值作为边距。 在过去,我使用的工作和家用打印机的边距约1厘米没有问题,但当然我不能把这个事实上的最低限度。 哦,我真的不想让用户指定保证金(50%的懒惰50%会变得复杂)。 我GOOGLE了,但没有find具体的东西。 (平均最低保证金打印)

如何合并许多PDF文件到一个单一的?

我有16个PDF,我想转换成一个单一的…我在Ubuntu 10.10,我该怎么做呢?