Tag: ghostscript

优化PDF文件(使用Ghostscript或其他)

如果你想优化PDF文件并减小文件大小,Ghostscript是最好的select吗? 我需要存储大量的PDF文件,因此我需要尽可能优化和减小文件大小 有没有人有任何经验与Ghostscript和/或其他? 命令行 exec('gs -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/screen -sOutputFile='.$file_new.' '.$file);

什么“线程安全”真的意味着…在实际中

请忍受我的新手问题 我试图使用ghostscript将PDF转换为PNG,使用ASP.NET和C#。 不过,我也读过ghostscript不是线程安全的。 所以我的问题是: “ghostscript不是线程安全的”究竟意味着什么? 如果我在一个活着的ASP.NET(aspx)Web应用程序中使用它,并且同时有许多用户同时访问它,会产生什么影响? 我也从另一个网站上读到ghostscript ver的主要特性。 8.63是multithreading渲染。 这是否意味着我们的线程安全问题现已解决? ghostscript现在线程安全吗? 我也从PDFTron评估PDF2Image,这应该是线程安全的。 但是,每个CPU许可证并不便宜。 是否值得为“线程安全”和“不安全”付出额外的钱?

Ghostscript合并PDF压缩结果

我发现这个整洁的命令将多个PDF合并为一个,使用Ghostscript: gs -dBATCH -dNOPAUSE -q -sDEVICE=pdfwrite -sOutputFile=out.pdf in1.pdf in2.pdf 生成的大小比2个PDF的组合大小要小。 以单个文件作为input运行该命令仍然会导致较小的输出文件。 Ghostscript有没有一个选项只是复制合并时出现的页面而不进行任何压缩? 如果不是的话,Ghostscript的压缩是否可以达到绝对的质量?

如何从PDF中提取文本?

任何人都可以推荐一个图书馆/ API从PDF提取文本和图像? 我们需要能够获取包含在文档的预知区域中的文本,因此API需要向我们提供页面上每个元素的位置信息。 我们希望这些数据以xml或json格式输出。 我们目前正在寻找似乎相当不错的PdfTextStream ,但希望听到其他人的经验和build议。 有没有替代品(商业或免费)从PDF中提取文本编程?

我怎样才能从PDF提取embedded的字体作为有效的字体文件?

我知道pdftk.exe实用程序可以指示哪些字体由PDF使用,而且它们是否embedded。 现在的问题是:由于我的PDF文件中embedded了字体 – 我怎样才能提取这些字体的方式,他们是可重用的常规字体文件? 有没有(最好是免费)的工具可以做到这一点? 另外:这可以用编程方式完成,比如iText?

将PDF转换为PNG

我试图将PDF转换为PNG图像(至less是一个封面)。 我正在用pdftk成功提取PDF的第一页。 我正在使用imagemagick进行转换: convert cover.pdf cover.png 这个工作,但不幸的是,cover.png来通过不正确的渲染(PDF中的一些alpha对象不能正确渲染)。 我知道ImageMagick使用GhostScript来进行转换,如果我直接与gs做,我可以得到所需的结果,但我宁愿使用转换库,因为它有其他工具,我想利用。 GhostScript中的这个命令可以完成所需的图像: gs -sDEVICE=pngalpha -sOutputFile=cover.png -r144 cover.pdf 我想知道有没有办法通过转换为GhostScript传递参数还是我坚持直接调用GhostScript?