python - 我该怎么写正则?
天蓬老师
天蓬老师 2017-05-27 17:39:31
[Python讨论组]

s = u'\ud83d\udc8b'
co = re.compile( u'\ud83d\udc8b')
co.sub(u'',s)
print(u'ud83d')

输出如下
UnicodeEncodeError: 'utf-8' codec can't encode character 'ud83d' in position 0: surrogates not allowed

s中大概是一个微博表情,搞了一下午怎么都显示不出来,想着替换掉算了然后怎么都没法匹配到,为什么呢

天蓬老师
天蓬老师

欢迎选择我的课程,让我们一起见证您的进步~~

全部回复(2)
高洛峰

首先,是2个问题
1.为什么显示不出来
2.想替换掉但是为什么匹配不到

回答
1.特殊编码在终端上是无法显示的,如果是在UI上显示,那么需要把UI的encoding设置好。
2.试试下面的代码

import re
s = u'hello \ud83d\udc8b world'
co = re.compile( u'\ud83d\udc8b')
ss = co.sub(u'',s)
print(ss)

运行结果:
hello world

黄舟

我都是抄的

热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习
PHP中文网抖音号
发现有趣的

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号