Tag: pdf

如何执行ImageMagick只将多页PDF的第一页转换为JPEG?

如果我只想从多页PDF 的第一页开始执行JPEG ,我该如何执行ImageMagick的convert ?

C#4.0:将PDF转换为字节,反之亦然

如何将PDF文件转换为字节[],反之亦然?

PDF查明文本是带下划线还是表格单元格

我一直在玩PdfBox和PDFTextStripperByArea方法。 如果文本是粗体或斜体 ,我能够提取信息,但是我无法获取下划线信息。 据我所知在PDF中,下划线是通过画线来完成的。 所以从理论上讲,我应该可以得到关于文本周围某些线条的某种信息。 提供这些信息,我可以找出是否有文字加下划线或表格。 这是我的代码到目前为止: List<TextPosition> textPos = charactersByArticle.get(index); for (TextPosition t : textPos) { if (t.getFont().getFontDescriptor() != null) { if (t.getFont().getFontDescriptor().getFontWeight() > BOLD_WEIGHT || t.getFont().getFontDescriptor().isForceBold()) { isBold = true; } if (t.getFont().getFontDescriptor().isItalic()) { isItalic = true; } } } 我试图在PDFStreamEngine类中的processEncodedText方法中处理PDGraphicsState对象,但没有在其中find行的信息。 任何build议,这些信息可以从中检索?

摆脱matlabgraphicspdf输出的空白

我想在LaTeX文档中使用我的matlab图的PDF版本。 我正在使用带有PDF选项的“saveas”命令来保存数字,但是我在pdf文件的图中获得了巨大的空白空间。 这是正常的吗? 我怎样才能摆脱它? 自动,当然,因为我有“很多”的情节。

PDF文件的结构?

对于一个小项目,我必须parsingPDF文件,并采取其中的一个特定部分(一个简单的字符链)。 我想使用python来做到这一点,我发现了几个能够在某些方面做我想做的事情的库。 但现在经过一些研究,我想知道什么是一个PDF文件的真正结构,有没有人知道是否有一个规格或在网上任何解释? 我已经find了Adobe的链接,但似乎它是一个无效的链接:(

如果PDF / A兼容,我如何testingPDF文档?

我们编写一个创buildPDF文件的软件。 我们如何检查PDF文件是否兼容PDF / A? 有没有可用的testing套件? 知道Open-Office等其他产品是否生成PDF / A兼容性文件也是很好的。

IPython / Jupyter将笔记本保存为PDF的问题

所以,我一直在试图保存一个jupyter笔记本PDF,但我不知道如何做到这一点。 我尝试的第一件事是从文件菜单下载PDF格式,但这样做的结果是: nbconvert failed: PDF creating failed 接下来的事情是尝试从命令提示符这样做转换 $ ipython nbconvert –to latex –post PDF MyNotebook.ipynb 但是,这又会导致错误信息 ImportError: No module named 'PDF' 如果我尝试 $ ipython nbconvert –to latex MyNotebook.ipynb 这导致 IPython.nbconvert.utils.pandoc.PandocMissing: Pandoc wasn't found: Please check that pandoc is installed 如果我尝试安装pandoc( pip install pandoc ),这给了我 ImportError: No module named 'ConfigParser' 这是我卡住,因为我只是不知道还有什么要做。 任何人有想法如何解决什么是错的?

用PHP填充PDF表单

是否有PHP库可用于填写PDF表单,然后将其保存(压扁)到PDF文件?

在IE 8中无法显示HTTPS中的PDF(在64位Vista上)

我有一个本土的HTTPS服务器,提供简单的文件(它embedded我的应用程序)。 它工作得很好 – 一直使用它。 最近添加的SSL支持 – Chrome,FireFox和IE都喜欢它,并加载页面就好了。 我发现的问题是当我尝试通过HTTPS连接加载PDF文件。 出于某种原因,PDF不会显示在IE 8(64位Vista上的64位)中。 它在Chrome中正常工作。 而且在使用普通HTTP的情况下,它在IE 8中工作正常 – 仅在使用HTTPS时失败。 注意:当提到IE 8时,它是64位Vista上的32位IE 8,尽pipe64位IE 8具有相同的行为。 这使我认为这是某种IE 8 / HTTPS / PDF / 64位操作系统的问题,但我不确定。 IE 8的DebugBar显示请求和响应完全按照预期进行 – 完全没有错误。 IE 8不显示任何错误或任何东西 – 纯白色的屏幕(或我试图加载PDF之前显示的页面)。 清除caching/ cookies /等。 IE / PDF / HTTPS有任何已知的问题吗?

什么是最小可能的有效PDF?

出于简单的好奇心,看到最小的GIF ,什么是最小的可能有效的PDF文件?