项目中要用到采集的数据,所以就先拿CSDN博客来试了试。这里使用Simple HTML DOM(官网)这个库,它能够方便的遍历HTML文档。
<?php
include_once('simple_html_dom.php');
header('Content-Type:text/html;charset=utf-8');
$html = file_get_html('http://blog.csdn.net/szy361');
$res = $html->find('#hotarticls ul.panel_body li a[title]');//取得id=hotarticls下class为panel_bodya的ul标签下的a的title
$span = $html->find('#hotarticls ul.panel_body li span');//取得span
foreach($res as $element){
$arr[] = $element->title.'+'.$element->href;//将title值和href的值通过+连起来
}
foreach($span as $e){
$brr[] = $e->innertext;//得到span下的值组成的数组
}
//将两个数组组成一个新的二维数组
for($i=0;$i<count($res);$i++){
$crr[] = explode('+',$arr[$i]);
$crr[$i][] = $brr[$i];
}
return $crr;
扩展:
PHP Simple HTML DOM解析器使用入门
PHP怎么学习?PHP怎么入门?PHP在哪学?PHP怎么学才快?不用担心,这里为大家提供了PHP速学教程(入门到精通),有需要的小伙伴保存下载就能学习啦!
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号