微信公众号讲师中心

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机/移动开发手机游戏

最近更新

搜索

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程

首页 > 后端开发 > Python教程 > 正文

为什么这个网页的源代码用python爬下来后用beautifulsoup解析后会出现字符丢失？

php中文网

发布： 2016-06-06 16:22:10

原创

2132人浏览过

回复内容：

又是你这个只点感谢不点赞的坏人……
话说你为什么要这么心急地学呢，基础不扎实啊，太冒进了，很显然没有清晰的思路…

首先编程要有默认的编码，也就是在文件的一开始加上

<code class="text"> # -*- coding: utf-8 -*-
</code>登录后复制

你是python2  代码前 加上# coding:utf-8

看python培训黄哥的三篇文章 
python开发爬虫汉字编码不再是问题： 
将python2中汉字会出现乱码的事一次性说清楚 
article/python_bianma.md at master · pythonpeixun/article · GitHub
python爬虫访问多个网站、中文编码的处理。 
python爬虫访问多个网站、中文编码的处理。
python3访问sina首页中文的处理 
python3访问sina首页中文的处理


可能在你这个转来转处的地方丢失。
ur = list(ur)
 ur = ur[:-1]
＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊
<code class="text"> ur = res.contents[0]
    ur = list(ur)
    ur = ur[:-1]
    temp = unicode(ur[0])
    for index in range(0, len(ur), 4):
        temp = unicode(ur[index])
        print temp.strip()
        print ur[index+1].string
        print ur[index+1]['href']
        print '\n'
</code>登录后复制

似乎response 后面用了俩decode 后面一个改encode应该就好了吧。。。

Decode是把括号里转成Unicode

Encode是Unicode转成括号里，就是UTF-8

Unicode就是个中转站


再不行就同一楼ignore。。。

还是用Requests库来处理http请求吧

python速学教程(入门到精通)

python速学教程(入门到精通)

python怎么学习？python怎么入门？python在哪学？python怎么学才快？不用担心，这里为大家提供了python速学教程(入门到精通)，有需要的小伙伴保存下载就能学习啦！

来源：php中文网

上一篇：Python 有什么奇技淫巧？下一篇：怎样用 Windows 入门Python？

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

最新问题

使用 Pandas 实现条件性累积最小值（cummin）重置的技巧本文深入探讨了在PandasDataFrame中，如何创建一个新列c，该列的值基于列b的累积最小值(cummin())，但其计算过程会根据列a和c的前一个值的特定条件进行动态重置。我们将通过一个复杂的布尔掩码和分组操作的组合，展示一个高效且完全向量化的解决方案，以应对这种递归依赖的计算挑战。

2025-11-23 10:34:01

172

python中如何使用RE正则表达检验字符串答案：Python中使用re模块处理正则表达式，常用方法有re.match()从开头匹配、re.search()查找第一个匹配、re.fullmatch()完全匹配整个字符串、re.findall()返回所有匹配结果，可通过compile()编译正则提升效率，适用于验证手机号、邮箱等格式。

2025-11-23 10:04:02

717

Python中利用正则表达式统计特定标记词后的单词数量本教程旨在详细讲解如何在Python中使用正则表达式精确统计文本字符串中，特定下划线标记词（例如_Earth）后出现的单词数量。文章提供了两种核心解决方案：分别针对仅统计标记词之后的单词，以及将标记词本身也纳入统计的场景。通过深入解析正则表达式模式和提供完整的Python代码示例，帮助开发者高效、灵活地处理此类文本分析任务。

2025-11-23 09:32:11

794

python中partial函数如何使用？ partial函数来自functools模块，用于冻结函数的部分参数以创建新函数。例如add_five=partial(add,5)固定第一个参数为5，调用add_five(3)输出8；也可固定关键字参数如say_hi=partial(greet,greeting="Hi")，调用say_hi("Alice")输出"Hi,Alice!"；在高阶函数中，可结合map使用，如square=partial(power,exponent=2)，对numbers列表进行平方运算，提升代码复用性。

2025-11-23 08:59:38

469

Slurm作业提交：Python脚本内嵌srun的性能影响分析本文探讨了在Slurm集群中，通过sbatch提交一个Bash脚本，该Bash脚本进而调用Python脚本，而Python脚本内部再通过subprocess模块调用srun来启动大规模并行计算任务的工作流。研究表明，这种嵌套调用方式在作业启动阶段会引入微乎其微的（可忽略不计的）开销，但对实际HPC工作负载的运行时性能没有负面影响，只要Python脚本仅在启动时执行一次srun调用。

2025-11-23 08:02:19

238

Python yield 与异常传播的关系 yield是生成器内外交互的核心，可传递值和异常；通过throw()方法能将外部异常注入生成器并在yield处抛出，内部未捕获异常会向上传播并终止生成器，而close()会触发GeneratorExit用于清理资源。

2025-11-23 05:09:18

936

python中str内置函数总结归纳 Python字符串方法丰富，用于高效处理文本。1.大小写转换：upper()、lower()、capitalize()、title()、swapcase()实现字母格式调整；2.查找与判断：find()、index()、count()定位子串，startswith()、endswith()检查前缀后缀；3.去除与填充：strip()、lstrip()、rstrip()清理空白，center()、ljust()、rjust()、zfill()格式化对齐；4.分割与连接：split()、rsplit

2025-11-23 00:21:26

889

如何使用python中threadpool模块？答案是推荐使用concurrent.futures.ThreadPoolExecutor。Python标准库中无官方threadpool模块，常用的是concurrent.futures.ThreadPoolExecutor，支持submit提交任务和map批量处理，适用于I/O密集型任务，如网络请求，并发下载等，而第三方threadpool库已过时不推荐使用。

2025-11-22 23:59:35

976

python对象有几种类型 Python对象主要分为内置数据类型（如int、str、list、dict）、可变与不可变对象（如list可变，str不可变）、用户自定义类型（如class实例）及函数、模块等特殊对象，一切皆对象，可通过type()查看类型。

2025-11-22 23:57:05

461

python中缺少module怎么办？缺少module通常因未安装或环境不匹配，需用pip或conda安装并确保python与pip路径一致，使用python-mpipinstall可避免环境错乱，注意模块安装名与导入名可能不同。

2025-11-22 23:54:11

411

相关专题

更多>

热门推荐

python速学教程(入门到精通)

开源免费商场系统

广告

热门教程

更多>

相关推荐

热门推荐

最新课程

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新 English: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

PHP中文网APP: 随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部