Tag: apache tika

从Zip文件中的文件读取内容

我正在尝试创build一个简单的java程序,它从zip文件内的文件中读取和提取内容。 Zip文件包含3个文件(txt,pdf,docx)。 我需要阅读所有这些文件的内容,我正在使用Apache Tika来达到这个目的。 有人可以帮助我在这里实现function。 我迄今尝试过,但没有成功 代码片段 public class SampleZipExtract { public static void main(String[] args) { List<String> tempString = new ArrayList<String>(); StringBuffer sbf = new StringBuffer(); File file = new File("C:\\Users\\xxx\\Desktop\\abc.zip"); InputStream input; try { input = new FileInputStream(file); ZipInputStream zip = new ZipInputStream(input); ZipEntry entry = zip.getNextEntry(); BodyContentHandler textHandler = new BodyContentHandler(); Metadata […]