在Java中,如果需要读取docx和doc文件内容,可以使用Apache POI库。使用POI库需要先在项目中添加相关依赖。
import java.io.File;
import java.io.FileInputStream;
import org.apache.poi.hwpf.HWPFDocument; // 读取doc文件
import org.apache.poi.hwpf.extractor.WordExtractor; // 读取doc文件
import org.apache.poi.xwpf.usermodel.XWPFDocument; // 读取docx文件
import org.apache.poi.xwpf.extractor.XWPFWordExtractor; // 读取docx文件
public class ReadWordFile {
public static void readDocFile(String filePath) {
try {
FileInputStream fis = new FileInputStream(new File(filePath));
HWPFDocument document = new HWPFDocument(fis);
WordExtractor extractor = new WordExtractor(document);
String text = extractor.getText();
System.out.println(text);
extractor.close();
fis.close();
} catch (Exception e) {
e.printStackTrace();
}
}
public static void readDocxFile(String filePath) {
try {
FileInputStream fis = new FileInputStream(new File(filePath));
XWPFDocument document = new XWPFDocument(fis);
XWPFWordExtractor extractor = new XWPFWordExtractor(document);
String text = extractor.getText();
System.out.println(text);
extractor.close();
fis.close();
} catch (Exception e) {
e.printStackTrace();
}
}
public static void main(String[] args) {
String docFilePath = "test.doc";
String docxFilePath = "test.docx";
readDocFile(docFilePath);
readDocxFile(docxFilePath);
}
}
以上代码演示了如何读取docx和doc文件内容,先使用FileInputStream读取文件,然后再使用HWPFDocument、WordExtractor和XWPFDocument、XWPFWordExtractor来解析文件并获取文件内容。POI库还支持对文档进行修改、创建等操作。