将PDF转换为SVG

我想转换PDF到SVG,请build议一些图书馆/可执行文件,将能够有效地做到这一点。 我已经使用apache PDFBox和Batik库编写了自己的java程序 –

PDDocument document = PDDocument.load( pdfFile ); DOMImplementation domImpl = GenericDOMImplementation.getDOMImplementation(); // Create an instance of org.w3c.dom.Document. String svgNS = "http://www.w3.org/2000/svg"; Document svgDocument = domImpl.createDocument(svgNS, "svg", null); SVGGeneratorContext ctx = SVGGeneratorContext.createDefault(svgDocument); ctx.setEmbeddedFontsOn(true); // Ask the test to render into the SVG Graphics2D implementation. for(int i = 0 ; i < document.getNumberOfPages() ; i++){ String svgFName = svgDir+"page"+i+".svg"; (new File(svgFName)).createNewFile(); // Create an instance of the SVG Generator. SVGGraphics2D svgGenerator = new SVGGraphics2D(ctx,false); Printable page = document.getPrintable(i); page.print(svgGenerator, document.getPageFormat(i), i); svgGenerator.stream(svgFName); } 

这个解决scheme效果很好,但是生成的svg文件的大小很大(比pdf大很多倍)。 我已经通过在文本编辑器中查看svg来找出问题所在。 即使字符的字体属性相同,也会将原始文档中的每个字符都包含在自己的块中。 例如,hello这个词将显示为6个不同的文本块。 有没有办法解决上面的代码? 或者请build议另一个更高效的解决scheme。

Inkscape也可以用来将PDF转换为SVG。 实际上它非常好,尽pipe它所生成的代码有点臃肿,但至less在程序中似乎没有遇到特定的问题。 我认为把它直接集成到Java中会是一个挑战,但是Inkscape为这个function提供了一个方便的命令行界面,所以访问它最简单的方法可能是通过系统调用。

要使用Inkscape的命令行界面将PDF转换为SVG,请使用:

 inkscape -l out.svg in.pdf 

然后你可以打电话使用:

 Runtime.getRuntime().exec("inkscape -l out.svg in.pdf") 

http://download.oracle.com/javase/1.4.2/docs/api/java/lang/Runtime.html#exec%28java.lang.String%29

我认为,exec()是同步的,只有在进程完成后才会返回(尽pipe我不是100%确定的),所以你应该只能阅读“out.svg”。 在任何情况下,谷歌search“java系统调用”将产生更多的信息,如何正确地做到这一点。

看看pdf2svg :

使用

 pdf2svg <input.pdf> <output.svg> [<pdf page no. or "all" >] 

当使用all给它一个文件名%d (这将被replace页码)。

 pdf2svg input.pdf output_page%d.svg all 

有关疑难解答,请参阅: http : //www.calcmaster.net/personal_projects/pdf2svg/

 pdftk 82page.pdf burst sh to-svg.sh 

to-svg.sh内容

 #!/bin/bash FILES=burst/* for f in $FILES do inkscape -l "$f.svg" "$f" done 
Interesting Posts