Tag: pdf

Python PDF库

什么是Python PDF库? 我需要用很多网格来制作一些PDF,而且我正在寻找一个允许pipe理页面的库(多页)。 图书馆应该计算何时页面结束,然后创build下一页。

使用PDFBoxparsingPDF文件(尤其是使用表格)

我需要parsing一个包含表格数据的PDF文件。 我正在使用PDFBox来提取文件文本以后parsing结果(string)。 问题是文本提取不像我预期的表格数据那样工作。 例如,我有一个包含这样一个表的文件(7列:前两个总是有数据,只有一个Complexity列有数据,只有一个Financing列有数据): +—————————————————————-+ | AIH | Value | Complexity | Financing | | | | Medium | High | Not applicable | MAC/Other | FAE | +—————————————————————-+ | xyz | 12.43 | 12.34 | | | 12.34 | | +—————————————————————-+ | abc | 1.56 | | 1.56 | | | 1.56| +—————————————————————-+ 然后我使用PDFBox: […]

使用CSS将前置元素保存为PDF

我做了一个语法荧光笔 ,我想要一个选项来保存为PDF。 我已经看过这个问题 ,但是下载它并不能保留CSS样式,这会破坏下载突出显示的文件的要点。 有没有一种方法可以保存我的pre元素作为PDF,同时保持CSS? HTML: <pre id='output'> (highlighted portion) </pre> <button id='save'>Save as PDF</button> JS: $('#save').click(function(){ //this is what I need help with }); 正如你可能已经注意到,我使用jQuery,如果这很重要。

我如何testing如果我的字体在pdf中正确显示?

在jasper报告中使用不同的字体时,您需要使用font-extensions 。 但是,如果字体不能正确呈现有没有一种方法,我可以testing,如果该字体是由PDF支持,以便我可以理解,如果问题是与我的字体扩展名或我的.ttf字体? 从jasper报告导出为pdf时,字体显示不正确是一个常见问题示例Jasper Reports PDF不会导出西里尔文的值 ,如清单1所示,使用font-extensions并不总是足够的,字体也需要支持PDF生成库,并能够呈现实际的字符。 这就是为什么我决定通过这个QA风格的问题,以便将来的用户打击清单1时可以有一个如何快速testing字体的参考。

用itextsharp检查pdfcheckbox

我已经尝试了很多不同的方式,但我不能得到checkbox被检查! 以下是我所尝试的: var reader = new iTextSharp.text.pdf.PdfReader(originalFormLocation); using (var stamper = new iTextSharp.text.pdf.PdfStamper(reader,ms)) { var formFields = stamper.AcroFields; formFields.SetField("IsNo", "1"); formFields.SetField("IsNo", "true"); formFields.SetField("IsNo", "On"); } 他们都没有工作。 有任何想法吗?

如何合并多个pdf文件(在运行时生成)?

如何通过ItextSharp合并多个pdf文件(在运行时生成),然后打印出来。 我发现了以下链接,但该方法需要pdf名称考虑到PDF文件存储,这不是我的情况。 我有多个报告,我会通过这种方法将它们转换成pdf files : private void AddReportToResponse(LocalReport followsReport) { string mimeType; string encoding; string extension; string[] streams = new string[100]; Warning[] warnings = new Warning[100]; byte[] pdfStream = followsReport.Render("PDF", "", out mimeType, out encoding, out extension, out streams, out warnings); //Response.Clear(); //Response.ContentType = mimeType; //Response.AddHeader("content-disposition", "attachment; filename=Application." + extension); //Response.BinaryWrite(pdfStream); //Response.End(); } 现在我想合并所有生成的文件( Bytes […]

使用pdfbox从PDF中提取图像

我尝试使用pdfbox从PDF中提取图像。 这里的例子pdf 但即时通讯只有空白图像。 代码即时尝试: – public static void main(String[] args) { PDFImageExtract obj = new PDFImageExtract(); try { obj.read_pdf(); } catch (IOException ex) { System.out.println("" + ex); } } void read_pdf() throws IOException { PDDocument document = null; try { document = PDDocument.load("C:\\Users\\Pradyut\\Documents\\MCS-034.pdf"); } catch (IOException ex) { System.out.println("" + ex); } List pages = […]

确定PDF文件中的页数

我需要使用C#代码(.NET 2.0)来确定指定PDF文件中的页数。 PDF文件将从文件系统读取,而不是从URL读取。 有没有人有任何指示如何做到这一点? 注意:将在执行此项检查的PC上安装Adobe Acrobat Reader。

直接将.aspx转换为.pdf

我正在处理的一个项目需要我构build一个以HTML(.aspx)和PDF格式输出的报表。 有没有可用的解决scheme,可以将.aspx页面的输出提供给PDF生成工具? 完全支持HTML和CSS将是理想的。 谢谢!

使用PHP中的DOMPDF的PDF页面中的标题

我正在使用DOMPDF创build一个PDF文件。 我有一个很大的内容来提取PDF,我们需要在所有页面的一些标题。 所以任何人都可以打电话怎么在PDF中添加一个页眉和页脚,这样页眉就会在使用DOMPDF的所有页面中显示出来。