论坛首页 入门技术论坛

从网页中提取图片地址(java 正则表达式)

浏览 9329 次
精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
作者 正文
   发表时间:2010-01-30   最后修改:2010-02-03

   /**
    * 得到网页中图片的地址
     */
   public static List<String> getImgStr(String htmlStr){   
        String img="";   
        Pattern p_image;   
        Matcher m_image;   
        List<String> pics = new ArrayList<String>();

        String regEx_img = "<img.*src=(.*?)[^>]*?>"; //图片链接地址   
        p_image = Pattern.compile 
                (regEx_img,Pattern.CASE_INSENSITIVE);   
       m_image = p_image.matcher(htmlStr); 
       while(m_image.find()){   
            img = img + "," + m_image.group();   
            Matcher m  = Pattern.compile("src=\"?(.*?) 
                         (\"|>|\\s+)").matcher(img); //匹配src
            while(m.find()){
            	pics.add(m.group(1));
            }
        }   
           return pics;   
    }  
     //重点在于正则表达式 <img.*src=(.*?)[^>]*?>   
     //               src=\"?(.*?)(\"|>|\\s+)                     
论坛首页 入门技术版

跳转论坛:
Global site tag (gtag.js) - Google Analytics