首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 网络技术 > 网络基础 >

lucene读取pdf资料出错

2012-12-31 
lucene读取pdf文件出错! INFO [main] (SimplePDFReader.java:32) - SQL21自学通.pdfSQL21自学通.pdfExcept

lucene读取pdf文件出错!
 INFO [main] (SimplePDFReader.java:32) - SQL21自学通.pdf
SQL21自学通.pdf
Exception in thread "main" java.lang.NoClassDefFoundError: org/fontbox/cmap/CMapParser
at org.pdfbox.pdmodel.font.PDFont.parseCmap(PDFont.java:534)
at org.pdfbox.pdmodel.font.PDFont.encode(PDFont.java:412)
at org.pdfbox.util.PDFStreamEngine.showString(PDFStreamEngine.java:325)
at org.pdfbox.util.operator.ShowText.process(ShowText.java:64)
at org.pdfbox.util.PDFStreamEngine.processOperator(PDFStreamEngine.java:452)
at org.pdfbox.util.PDFStreamEngine.processSubStream(PDFStreamEngine.java:215)
at org.pdfbox.util.PDFStreamEngine.processStream(PDFStreamEngine.java:174)
at org.pdfbox.util.PDFTextStripper.processPage(PDFTextStripper.java:336)
at org.pdfbox.util.PDFTextStripper.processPages(PDFTextStripper.java:259)
at org.pdfbox.util.PDFTextStripper.writeText(PDFTextStripper.java:216)
at org.pdfbox.util.PDFTextStripper.getText(PDFTextStripper.java:149)
at cn.sh.ideal.test.SimplePDFReader.getTextFromPDF(SimplePDFReader.java:39)
at cn.sh.ideal.test.SimplePDFReader.main(SimplePDFReader.java:19)

[解决办法]
java.lang.NoClassDefFoundError: org/fontbox/cmap/CMapParser 

很明显了少了一个jar包,从了、org/fontbox/cmap/CMapParser来看,jar包名字可能带fontbox的名字,你在百度上检索下 fontbox  .jar试试能不能找到这个jar包呢?
[解决办法]

引用楼主 cmc20090523 的帖子:
INFO [main] (SimplePDFReader.java:32) - SQL21自学通.pdf 
SQL21自学通.pdf 
Exception in thread "main" java.lang.NoClassDefFoundError: org/fontbox/cmap/CMapParser 
at org.pdfbox.pdmodel.font.PDFont.parseCmap(PDFont.java:534) 
at org.pdfbox.pdmodel.font.PDFont.encode(PDFont.java:412) 
at org.pdfbox.util.PDFStreamEngine.showString(PDFStreamEngine.java:325) 
at org.pdfbox.util.operator.ShowText…


对了,你用的什么jar包读取pdf文件呢,是用的poxpdf jar包吗?

热点排行