千锋教育-做有情怀、有良心、有品质的职业教育机构

手机站
千锋教育

千锋学习站 | 随时随地免费学

千锋教育

扫一扫进入千锋手机站

领取全套视频
千锋教育

关注千锋学习站小程序
随时随地免费学习课程

当前位置:首页  >  技术干货  > python2中的Unicode Strings

python2中的Unicode Strings

来源:千锋教育
发布人:xqq
时间: 2023-11-07 19:08:47 1699355327

python2.0开始,就有一种新的数据类型UnicodeStrings,但是在python3的到来,这个概念已经被弱化了。python2.*的默认编码格式是ASCII码,而python3.*的默认编码格式已经换成了Unicode,所以2.*还是有必要提一下。在python2系列中,如果要操作非ASCII码的字符,就可以用这个对象进行操作。它可以跟strings进行任意的转换。比如,现在有一个字符串变量s,保存中文字符"测试",现在直接打印是会报错的,因为存在一个非ASCII码的字符,python2.*是无法进行解析的,如果在上面加个u,就能正常显示(在集成开发工具内,设置集成工具和工程的默认编码为utf-8)

#-*-coding:gbk-*-if__name__=="__main__":

s1='测试'

#s1=s1.decode('gbk')

s1=unicode(s1,'gbk')

prints1

如上代码段在JetBrainsPyCharm2016.1.2内,使用2.7.11做解释器,做了一个小测试~~

1.不设置源文件编码格式,输入中文,后直接打印,会提示存在‘non-ascii’,编译不通过

2.设置源文件编码格式为gbk,输入中文后,打印乱码

3.设置源文件编码格式为gbk,输入中文s1=u'测试'后,打印正常

4.设置源文件编码格式为gbk,输入中文后,先将字符串解码decode或者unicode方法,后打印正常

5.设置源文件编码格式为utf-8,输入中文后直接输出正常

6.设置工具和工程的默认编码为gbk,输入中文后,打印正常。

然后有点明白了~~在python2系列的IDE中声明一个非ASCII码的字符串,不声明源文件的编码格式,编译是不通过的,因为源文件python2的解析器尝试使用默认的ASCII码去编译,却发现存在非ASCII码的字符串;如果在此基础上设置源文件的编码格式为gbk,编译是可以通过了,但是打印出来的字符串是乱码的,为啥乱码呢?因为IDE是采用utf-8的编码格式,而源文件是采用gbk格式,所以会出现中文乱码现象,单纯的解决乱码有3种可行方式,一个方法是:将源文件里需要打印的字符串解码成utf-8(或者unicode)再打印;另一个方法是:修改源文件的编码格式直接为utf-8,最后一种是:修改IDE编码格式为gbk;显然第二种方法是最佳方法。

以上内容为大家介绍了python2中的UnicodeStrings,希望对大家有所帮助,如果想要了解更多Python相关知识,请关注IT培训机构:千锋教育。

tags: python培训
声明:本站稿件版权均属千锋教育所有,未经许可不得擅自转载。
10年以上业内强师集结,手把手带你蜕变精英
请您保持通讯畅通,专属学习老师24小时内将与您1V1沟通
免费领取
今日已有369人领取成功
刘同学 138****2860 刚刚成功领取
王同学 131****2015 刚刚成功领取
张同学 133****4652 刚刚成功领取
李同学 135****8607 刚刚成功领取
杨同学 132****5667 刚刚成功领取
岳同学 134****6652 刚刚成功领取
梁同学 157****2950 刚刚成功领取
刘同学 189****1015 刚刚成功领取
张同学 155****4678 刚刚成功领取
邹同学 139****2907 刚刚成功领取
董同学 138****2867 刚刚成功领取
周同学 136****3602 刚刚成功领取
相关推荐HOT