Tag: pdf

从研究论文的PDF中提取信息

我需要一种从PDF文档中提取书目元数据的机制,以保存用户手动input或剪切粘贴的机制。 至less,标题和摘要。 作者名单和他们的从属关系是好的。 提取参考将是惊人的。 理想情况下,这将是一个开源解决scheme。 问题在于并不是所有的PDF都对文本进行编码,而且许多文件不能保留文本的逻辑顺序,所以只要做pdf2text就可以得到第1列的第1行,第2列的第1行,第1列的第2行等等。 我知道有很多图书馆。 它是在我需要解决的文件上识别摘要,标题作者等等。 这是不可能的每一次,但80%将节省大量的人力。

如何在PDF表单上启用保存填充字段?

可以保存一些PDF表单,包括所有填写的字段数据: 可以保存为http://i41.tinypic.com/14lj4o2.png 其他人不能保存 ,所有填写的字段数据都将丢失: 无法保存http://i44.tinypic.com/2zgc5mh.png 如何在我的PDF表单上启用保存填充字段?

如何将DOMPDF生成的内容保存到文件?

我正在使用Dompdf来创buildPDF文件,但我不知道为什么它不保存创build的PDF到服务器。 有任何想法吗? require_once("./pdf/dompdf_config.inc.php"); $html = '<html><body>'. '<p>Put your html here, or generate it with your favourite '. 'templating system.</p>'. '</body></html>'; $dompdf = new DOMPDF(); $dompdf->load_html($html); $dompdf->render(); file_put_contents('Brochure.pdf', $dompdf->output());

Firefox到本地或networking页面的链接不起作用

我有一个.asp应用程序,其中图像文件(.PDF)存储在目录中(由复印机/扫描仪提供)。 创build的文件名存储在数据库表中。 从网页启动查询时,会创build指向该文件的链接。 点击时应显示图像。 此function在Internet Explorer中100%可用。 在Firefox中没有这样的运气(我有一些Firefox用户)。 创build的超链接看起来像这个file://Server/Scanner/XYZ.pdf Firefox帮助build议原因是这样的: 链接到本地​​或networking页面不起作用。 作为安全防范措施,Firefox禁止Internet上的站点链接到存储在本地计算环境中的文件。 这些文件可能包括计算机上的文件,映射的networking驱动器和UNCnetworkingpath 没有一个解决方法的build议似乎工作(或者我不理解的步骤来创build图像显示)任何build议?

只在PHP中计算PDF中的页数

我需要一种方法来计算PHP中的PDF页数。 我已经做了一些谷歌search,我发现的唯一的东西要么使用shell / bash脚本,Perl或其他语言,但我需要本地PHP的东西。 有没有图书馆或如何做到这一点的例子?

结合两个(或更多)PDF的

背景:我需要为销售人员提供每周报告包。 这个软件包包含几个(5-10)水晶报告。 问题:我希望允许用户运行所有报告,并且只运行一个报告。 我想我可以通过创build报告来做到这一点,然后做: List<ReportClass> reports = new List<ReportClass>(); reports.Add(new WeeklyReport1()); reports.Add(new WeeklyReport2()); reports.Add(new WeeklyReport3()); <snip> foreach (ReportClass report in reports) { report.ExportToDisk(ExportFormatType.PortableDocFormat, @"c:\reports\" + report.ResourceName + ".pdf"); } 这将为我提供一个包含所有报告的文件夹,但是我想用每周的所有报告给每个人发一封PDF。 所以我需要把它们结合起来 有没有简单的方法来做到这一点,而无需安装更多的第三方控制? 我已经有DevExpress和CrystalReports,我不想添加太多。 将它们合并到foreach循环还是单独循环最好? (或另一种方式) 谢谢

优化PDF文件(使用Ghostscript或其他)

如果你想优化PDF文件并减小文件大小,Ghostscript是最好的select吗? 我需要存储大量的PDF文件,因此我需要尽可能优化和减小文件大小 有没有人有任何经验与Ghostscript和/或其他? 命令行 exec('gs -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/screen -sOutputFile='.$file_new.' '.$file);

创build页面页眉和页脚使用CSS进行打印

我使用Flying Saucer(将CSS / HTML转换为iText为PDF)创buildPDF,我试图使用CSS3将图像页眉和页脚应用到每个页面。 我基本上想把这个div放在每个页面的左上angular: <div id="pageHeader"> <img src="…" width="250" height="25"/> </div> 我的CSS看起来有点像这样: @page { size: 8.5in 11in; margin: 0.5in; @top-left { content: "Hello"; } } 有没有办法让我把这个div的content ?

命令`libreoffice –headless –convert-to pdf test.docx –outdir / pdf`不工作

在使用这个旨在将DOCX转换为PDF的LibreOffice命令之后,我必须等很长时间: libreoffice –headless –convert-to pdf test.docx –outdir /pdf 但我没有得到任何回应,也没有错误。 没有文件被转换。 它看起来像terminal挂。 那么,有什么方法可以跟踪这个错误吗?

将PDF分成两份

如何轻松地将大型PDF分成两个(或更多)独立的PDF? 假设我们有foo-bar.pdf,foo部分来自第1-12页,而section bar从第13页到最后。 我想foo​​-bar.pdf分成foo.pdf和bar.pdf。