总结
豆包 AI 助手文章总结

QueryList递归采集多级数据时,range()方法失效导致结果错误的原因是什么?

心靈之曲
发布: 2025-03-16 10:54:19
原创
296人浏览过

querylist递归采集多级数据时,range()方法失效导致结果错误的原因是什么?

QueryList递归多级数据采集:范围选择器(range())失效问题及解决方案

使用QueryList进行多级数据抓取时,可能会遇到文档示例与实际结果不符的情况,这通常与递归调用和range()方法的用法有关。本文分析一个具体案例,解释问题根源并提供解决方案。

问题描述:

以下代码尝试使用QueryList递归提取嵌套HTML结构中的数据。目标是从HTML中提取标题(

)及其下列表(.list)中的各个项目(.item)。然而,运行结果显示.item字段的值并非预期的数组,而是所有.item内容的拼接结果。

问题代码:

$html = <<<str
- ### xxx
    <div class="list"><div class="item">item1</div><div class="item">item2</div> </div>
- ### xxx2
    <div class="list"><div class="item">item12</div><div class="item">item22</div> </div>
str;

$data = querylist::html($html)
    ->rules(array(
        'title' => array('h3','text'),
        'list' => array('.list','html')
    ))
    ->range('#demo li') //此处range()参数无效
    ->queryData(function($item){
        // 问题在于这里复用了QueryList对象
        $item['list'] = querylist::html($item['list'])
            ->rules(array(
                'item' => array('.item','text')
            ))
            ->range('') //尝试重置range(),但无效
            ->queryData();
        return $item;
    });

dump($data);
登录后复制

运行结果:

array (
  [0] => array (
    [title] => xxx
    [list] => array (
      [item] => item1item2
    )
  )
  [1] => array (
    [title] => xxx2
    [list] => array (
      [item] => item12item22
    )
  )
)
登录后复制

问题分析:

虽然代码在递归调用QueryList时使用了range(''),试图重置范围选择器,但这并没有生效。range('')并没有真正清除QueryList对象内部的范围选择状态,导致后续查询仍然受到之前range('#demo li')的影响。

解决方案:

为了解决这个问题,应该在递归调用QueryList时,创建新的QueryList对象,而不是复用之前的对象。这样可以保证每个级别的选择器独立工作,避免范围选择器冲突。

修改后的代码:

$item['list'] = (new QueryList($item['list']))->rules(array(
    'item' => array('.item','text')
))->queryData();
登录后复制

通过创建新的QueryList对象,可以有效避免范围选择器冲突,从而得到预期的结果。 每个递归调用都拥有独立的范围选择器设置,不会受到上一级调用的影响。 请注意,#demo li 在原始代码中似乎是多余的,因为HTML结构中并没有 #demo 元素。 修改后的代码去除了这个多余的 range() 调用。

修改后的代码确保了正确的递归抓取,并解决了range()方法失效的问题。 在处理嵌套结构时,创建新的QueryList对象是最佳实践,以避免对象状态的意外影响。

以上就是QueryList递归采集多级数据时,range()方法失效导致结果错误的原因是什么?的详细内容,更多请关注php中文网其它相关文章!

最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
相关标签:
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
豆包 AI 助手文章总结
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习
PHP中文网抖音号
发现有趣的

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号