扫码关注官方订阅号
用pyspider爬虫爬取了html需要把整个html部分都保存但在保存的时候遇到一个问题就是标签里面带有“”引号这个问题,导致无法存到数据库,不知道你们一般是怎么解决的
人生最曼妙的风景,竟是内心的淡定与从容!
不明白为什么要用数据库来保存HTML内容。保存文件名不可以吗...
\" 转移一下就行了.
\"
parser自己爬到的内容 HTMLParser实现自己格式化后存库
如果你是用的MySQLdb的话,这个库有个函数叫escape_string(str)它可以把字符串中的符号转义掉:
escape_string(str)
html_escaped = MySQLdb.escape_string(html.encode('utf-8'))
这样就可以存入MySQL了。
微信扫码关注PHP中文网服务号
QQ扫码加入技术交流群
扫描下载App
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号
PHP学习
技术支持
返回顶部
不明白为什么要用数据库来保存HTML内容。保存文件名不可以吗...
\"
转移一下就行了.parser自己爬到的内容
HTMLParser
实现自己格式化后存库
如果你是用的MySQLdb的话,这个库有个函数叫
escape_string(str)
它可以把字符串中的符号转义掉:
这样就可以存入MySQL了。