Python基础数据类型---bytes
由于Python的字符串类型是str,在内存中以Unicode表示,一个字符对应若干个字节。如果要在网络上传输,或者保存到磁盘上,就需要把str变为以字节为单位的bytes。
Python对bytes类型的数据用带b前缀的单引号或双引号表示:
b1 = b'alex'
print(b1,type(b1)
b'alex' <class 'bytes'>
要注意区分’ABC’和b’ABC’,前者是str,后者虽然内容显示得和前者一样,但bytes的每个字符都只占用一个字节。
字符串与bytes相互转换:
'''
遇到问题没人解答?小编创建了一个Python学习交流QQ群:579817333
寻找有志同道合的小伙伴,互帮互助,群里还有不错的视频学习教程和PDF电子书!
'''
s1 = 'alex'
# str ---> bytes encode 编码
b1 = s1.encode('utf-8')
print(b1)
# bytes---> str decode 解码
s2 = b1.decode('utf-8')
print(s2)
b'alex'
alex
指定编码转换:
s1 = 'alex'
b2 = s1.encode('gbk')
s3 = b2.decode('gbk')
print(b2)
print(s3)
b'alex'
alex
中文转换时,不同的编码不能直接转换报错如下
'''
遇到问题没人解答?小编创建了一个Python学习交流QQ群:579817333
寻找有志同道合的小伙伴,互帮互助,群里还有不错的视频学习教程和PDF电子书!
'''
s4 = '中国'
b4 = s4.encode('utf-8')
s5 = b4.decode('gbk')
print(s5)
UnicodeDecodeError: 'gbk' codec can't decode byte 0xad in position 2: illegal multibyte sequence
s4 = '中国'
b4 = s4.encode('utf-8') # utf-8 bytes
print(b4)
b6 = b4.decode('utf-8') # utf-8 unicode
print(b6)
b7 = b6.encode('gbk') # gbk bytes
print(b7)
b'\xe4\xb8\xad\xe5\x9b\xbd' #不同编码的bytes数据,长度不一样
中国
b'\xd6\xd0\xb9\xfa'