使用PHP XPath采集的时候，如何保留nodeValue里的html符号-php教程-PHP中文网

使用PHP XPath采集的时候，如何保留nodeValue里的html符号

php中文网

发布： 2016-06-06 20:29:45

原创

2097人浏览过

代码如下：

$html = <<<EOF
<!DOCTYPE html>
<html>
<head lang="en">
    <meta charset="UTF-8">
    <title>Test</title>
</head>
<body>
<div id="content">
  <p>
    <span>
      abcdefghijklmn<br />opqrstuvwxyz
    </span>
  </p>
</div>

</body>
</html>
EOF;
// create document object model
$dom = new DOMDocument();
// load html into document object model
@$dom->loadHTML($html);
// create domxpath instance
$xPath = new DOMXPath($dom);
// get all elements with a particular id and then loop through and print the href attribute
$elements = $xPath->query('//*[@id="content"]/p/span');
$content = $elements->item(0)->nodeValue;
echo $content;

登录后复制

内容里的<br>会被去除，使用什么操作比如有没有$e->innerHtml之类的，可以保留html标签。

立即学习“PHP免费学习笔记（深入）”；

8.18 更新：

$html = <<<EOF
<!DOCTYPE html>
<html>
<head lang="en">
    <meta charset="UTF-8">
    <title>Test</title>
</head>
<body>
<div id="content">
  <p>
    <span class='aaa'>
      abcdefghijklmn<br /><span>opq</span>rstuvwxyz
    </span>
  </p>
</div>

</body>
</html>
EOF;

// create document object model
$dom = new DOMDocument();
// load html into document object model
@$dom->loadHTML($html);
// create domxpath instance
$xPath = new DOMXPath($dom);
// get all elements with a particular id and then loop through and print the href attribute
$elements = $xPath->query('//*[@id="content"]/p/span');
$nodeName = $elements->item(0)->nodeName;
// $content = $elements->item(0)->nodeValue;
$content = $dom->saveXml($elements->item(0));
$content = $dom->saveHtml($elements->item(0));
$content = preg_replace(array("#^<{$nodeName}.*>#isU", "#</{$nodeName}>$#isU"), array('', ''), $content);
echo $content;

登录后复制

回复内容：

代码如下：

$html = <<<EOF
<!DOCTYPE html>
<html>
<head lang="en">
    <meta charset="UTF-8">
    <title>Test</title>
</head>
<body>
<div id="content">
  <p>
    <span>
      abcdefghijklmn<br />opqrstuvwxyz
    </span>
  </p>
</div>

</body>
</html>
EOF;
// create document object model
$dom = new DOMDocument();
// load html into document object model
@$dom->loadHTML($html);
// create domxpath instance
$xPath = new DOMXPath($dom);
// get all elements with a particular id and then loop through and print the href attribute
$elements = $xPath->query('//*[@id="content"]/p/span');
$content = $elements->item(0)->nodeValue;
echo $content;

登录后复制

内容里的<br>会被去除，使用什么操作比如有没有$e->innerHtml之类的，可以保留html标签。

立即学习“PHP免费学习笔记（深入）”；

8.18 更新：

$html = <<<EOF
<!DOCTYPE html>
<html>
<head lang="en">
    <meta charset="UTF-8">
    <title>Test</title>
</head>
<body>
<div id="content">
  <p>
    <span class='aaa'>
      abcdefghijklmn<br /><span>opq</span>rstuvwxyz
    </span>
  </p>
</div>

</body>
</html>
EOF;

// create document object model
$dom = new DOMDocument();
// load html into document object model
@$dom->loadHTML($html);
// create domxpath instance
$xPath = new DOMXPath($dom);
// get all elements with a particular id and then loop through and print the href attribute
$elements = $xPath->query('//*[@id="content"]/p/span');
$nodeName = $elements->item(0)->nodeName;
// $content = $elements->item(0)->nodeValue;
$content = $dom->saveXml($elements->item(0));
$content = $dom->saveHtml($elements->item(0));
$content = preg_replace(array("#^<{$nodeName}.*>#isU", "#</{$nodeName}>$#isU"), array('', ''), $content);
echo $content;

登录后复制

自己找到了办法。。。

$content = $elements->item(0)->nodeValue;

// >> 改成 >>

$content = $dom->saveXml($elements->item(0));

登录后复制

大家都在看：

php赋值二维数组_php多维数组数据设置方法【解析】 php的query怎么搞成数组_PHP将查询结果query转为数组网站php源码怎么使用教程_网站php源码使用教程与实例演示【技巧】 php怎么将一个变量存入数组_php变量存数组[]追加与指定键赋值法【技巧】 php解密文件怎么用_用PHP工具与代码结合解密文件教程【技巧】