java - 如何用正则提取html内容
習慣沉默
習慣沉默 2017-05-17 10:06:13
[Java讨论组]
    <p class="info-detail-head-classify-subname"><a id="info_detail_head_classify_type" href="" target="_blank">财富</a></p>
    
    
    想用java 提取财富两个字 请问用正则怎么提取 

    用jsoup会不会简单一点
習慣沉默
習慣沉默

全部回复(2)
伊谢尔伦

可以使用jsoup和regex, 推荐使用jsoup!
jsoup document:
https://jsoup.org/cookbook/in...
http://www.open-open.com/jsoup/


    import org.jsoup.Jsoup;
    import org.jsoup.nodes.Document;
    import org.jsoup.nodes.Element;
    
    import java.util.regex.Matcher;
    import java.util.regex.Pattern;
    
    public class Main {
    
        public static void main(String[] args) {
    
            // 方法1: jsoup
            String html = "<p class=\"info-detail-head-classify-subname\"><a id=\"info_detail_head_classify_type\" href=\"\" target=\"_blank\">财富</a></p>";
    
            Document doc = Jsoup.parse(html);
            Element element = doc.getElementById("info_detail_head_classify_type");
            System.out.println(element.text());
    
            // 方法2: regex
            Pattern r = Pattern.compile("<a.*>(.*)</a>");
            Matcher m = r.matcher(html);
            if (m.find()) {
                System.out.println(m.group(1));
            }
        }
    }
淡淡烟草味
<a[^>]*>([^<]*)</a>

<a></a>中的内容

热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习
PHP中文网抖音号
发现有趣的

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号