之前我介绍过htmlagilitypack的css选择器扩展——scrapysharp,它可以非常方便的实现通过css选择器表达式来查询htmlnode。今天在使用的过程中,发现它不支持nth-child语法,导致在许多查询的地方不大方便。
在网上搜了一下,找到了另一个支持得更全面的HtmlAgilityPack的CSS选择器扩展 FizzlerEx。它的使用方法也非常相似。
using HtmlAgilityPack;using Fizzler.Systems.HtmlAgilityPack;var web = new HtmlWeb();var document = web.Load("http://example.com/page.html")var page = document.DocumentNode;foreach(var item in page.QuerySelectorAll("div.item")){ var title = item.QuerySelector("h3:not(.share)").InnerText; var date = DateTime.Parse(item.QuerySelector("span:eq(2)").InnerText); var description = item.QuerySelector("span:has(b)").InnerHtml;}它还自带了一个查看的GUI工具,用起来还蛮方便的。就是稍微不便的是没有NuGet安装包
HTML怎么学习?HTML怎么入门?HTML在哪学?HTML怎么学才快?不用担心,这里为大家提供了HTML速学教程(入门课程),有需要的小伙伴保存下载就能学习啦!
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号