python BeautifulSoup 解析错误
大家讲道理
大家讲道理 2017-04-17 11:56:16
[Python讨论组]
html = """
{a href="http://www.baidu.com/" target="_blank">
    {img src="image/logo.gif" height="31" width="88" border="0" alt="test" />
"""
soupHtml = BeautifulSoup(html)
print soupHtml

注:由于代码无法显示出来,所以就将 标签a和img分别改成 {a、{img
输出结果:

很明显,以上结果是错误的,错在img标签结束符位。
导致print soupHtml.img的结果如下:

大家讲道理
大家讲道理

光阴似箭催人老,日月如移越少年。

全部回复(1)
大家讲道理

有BeautifulSoup的问题是少不了我凑个热闹的。

不过这个问题真是让我无语到要爆发……

  1. 完整代码,别弄半拉磕叽的东西。容易丢失细节的。
  2. 代码贴不上你可以找个http://paste.openstack.org/这样的pastebin网站贴上去啊!
  3. 我不知道你用的是不是最新的bs4。我用bs4能解析(即容忍HTML属性里出现没有被转义的字符)。你可能用的是低版本的bs3?那我也不知道啊!!!所以再怪你一次没给完整源码,下次注意点吧。
  4. HTML/XML属性值中出现,>等东西的时候需要转义成HTML实体& lt;,& gt;等。
  5. 另外,求你了,别把未解析的ASP代码,完全当成HTML送进HTML解释器里行不行啊!!!
  6. 就不吐槽用ASP了……
  7. SF你能不能别把Markdown代码块里的HTML标签和HTML实体给解析了啊!!!

http://paste.openstack.org/show/60873/

热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习
PHP中文网抖音号
发现有趣的

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号