分享

poi 获取excel中图片

 WindySky 2017-05-27

先贴代码,再解释与疑问(这段代码是我努力了半天的结果)

 

 

Java代码  收藏代码
  1. import java.io.FileInputStream;  
  2. import java.io.FileOutputStream;  
  3. import java.io.InputStream;  
  4. import java.util.List;  
  5.   
  6. import org.apache.poi.hssf.usermodel.HSSFClientAnchor;  
  7. import org.apache.poi.hssf.usermodel.HSSFPicture;  
  8. import org.apache.poi.hssf.usermodel.HSSFPictureData;  
  9. import org.apache.poi.hssf.usermodel.HSSFShape;  
  10. import org.apache.poi.hssf.usermodel.HSSFSheet;  
  11. import org.apache.poi.hssf.usermodel.HSSFWorkbook;  
  12. import org.apache.poi.openxml4j.exceptions.InvalidFormatException;  
  13. import org.apache.poi.ss.usermodel.PictureData;  
  14. import org.apache.poi.ss.usermodel.WorkbookFactory;  
  15.   
  16. public class ReadPicturesFromExcel {  
  17.   
  18.     public static void main(String[] args) throws InvalidFormatException,  
  19.             Exception {  
  20.   
  21.         InputStream inp = new FileInputStream(  
  22.                 "D:\\Users\\Fancy1_Fan\\桌面\\work\\test.xls");  
  23.         HSSFWorkbook workbook = (HSSFWorkbook) WorkbookFactory.create(inp);  
  24.   
  25.         List<HSSFPictureData> pictures = workbook.getAllPictures();  
  26.         HSSFSheet sheet = (HSSFSheet) workbook.getSheetAt(0);  
  27.           
  28.           
  29.         int i = 0;  
  30.         for (HSSFShape shape : sheet.getDrawingPatriarch().getChildren()) {  
  31.             HSSFClientAnchor anchor = (HSSFClientAnchor) shape.getAnchor();  
  32.   
  33.             if (shape instanceof HSSFPicture) {  
  34.                 HSSFPicture pic = (HSSFPicture) shape;  
  35.                 int row = anchor.getRow1();  
  36.                 System.out.println(i + "--->" + anchor.getRow1() + ":"  
  37.                         + anchor.getCol1());  
  38.                 int pictureIndex = pic.getPictureIndex()-1;  
  39.                 HSSFPictureData picData = pictures.get(pictureIndex);  
  40.   
  41.                 System.out.println(i + "--->" + pictureIndex);  
  42.                 savePic(row, picData);  
  43.             }  
  44.             i++;  
  45.         }  
  46.     }  
  47.   
  48.     private static void savePic(int i, PictureData pic) throws Exception {  
  49.   
  50.         String ext = pic.suggestFileExtension();  
  51.   
  52.         byte[] data = pic.getData();  
  53.         if (ext.equals("jpeg")) {  
  54.             FileOutputStream out = new FileOutputStream(  
  55.                     "D:\\Users\\Fancy1_Fan\\桌面\\work\\pict" + i + ".jpg");  
  56.             out.write(data);  
  57.             out.close();  
  58.         }  
  59.         if (ext.equals("png")) {  
  60.             FileOutputStream out = new FileOutputStream(  
  61.                     "D:\\Users\\Fancy1_Fan\\桌面\\work\\pict" + i + ".png");  
  62.             out.write(data);  
  63.             out.close();  
  64.         }  
  65.     }  
  66.   
  67. }  

 

  思路:

        1.获得所有图片---->

        2.得到sheet DrawingPatriarch的所有shape--->

        3.获得shape的anchor --->

        4.获得picture的pictureIndex(这个很关键)------->

        5.最后假定pictureIndex就是allPictures中图片的位置,从而获得这张picture的data信息.

  问题:

         对于最后的假定没有官方文档的支持,所以有待测试.但是简单测试结果是ok的!

 

  对于假定的证明:

         官方文档向excel添加图片的流程是:

         1.调用workbook的addPicture,并且返回此pictureIndex------>

         2.然后创建一个ClientAnchor--------->

         3.最后通过这个pictureIndex和Anchor把它绘到sheet上

    由此可见pictureIndex,ClientAnchor以及pictureData是一一对应的关系,只要能够关联这三者,就可以获得

    Excel中picture的完整信息了.

    然而根据poi的api,只能单独获得picture,或者包含pictureIndex和anchor的HSSFPicture,并没有把它们关联在一起.

 

 

    查看源码发现 HSSFWorkbook只不过是一个外观类,或者适配器类,low level工作类为InternalWorkbook

 

Java代码  收藏代码
  1. /** 
  2.    * this is the reference to the low level Workbook object 
  3.    */  
  4.   
  5.   private InternalWorkbook workbook;  
 

    查看InternalWorkbook有api如下

 

Java代码  收藏代码
  1. public EscherBSERecord getBSERecord(int pictureIndex) {  
  2.       return escherBSERecords.get(pictureIndex-1);  
  3.   }  

  此处表明:如果能获得InternalWorkbook对象和pictureIndex,就可以获得图片数据和信息.但是没法通过 HSSFWorkbook对象获得InternalWorkbook对象,因为如下:(此方法为包访问)

 

Java代码  收藏代码
  1. InternalWorkbook getWorkbook() {  
  2.       return workbook;  
  3.   }  

 

  但是观察InternalWorkbook可以发现,如图:

 

Java代码  收藏代码
  1. private List<EscherBSERecord> escherBSERecords;  

 保存图像数据的底层是一个List有序的集合.以及根据getBSERecord方法,就推断出picutreIndex就是表示picture在List里面的下标.

 

 

以上仅仅是个人的见解,由于对于poi的整体设计理念并没有把握,所以对于以上问题暂时找不到没有一个合理的解释.

 

 

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多