python:編碼和解碼
關(guān)于編碼方式:
美國(guó)? ?- ASCII 256個(gè)
中國(guó)? ?- GBK 有很多gbk的子集,比如gb312?
萬(wàn)國(guó)碼 - unicode 一個(gè)中文4個(gè)字節(jié),占用內(nèi)存較多
萬(wàn)國(guó)碼 - utf-8? 一個(gè)中文3個(gè)字節(jié)
使用時(shí)的tips:
mac/linux open默認(rèn)打開(kāi)文件的編碼格式 utf-8
win open默認(rèn)打開(kāi)文件的編碼格式 gbk?
讀取文件時(shí) open,mode中帶有b,無(wú)需再寫(xiě)encoding,因?yàn)橐呀?jīng)是二進(jìn)制
編碼與解碼使用代碼:
(1)編碼:將中文編碼成二進(jìn)制
content = "中國(guó)".encode('gbk')#結(jié)果是:b'\xd6\xd0\xb9\xfa',gbk編碼方式一個(gè)中文2個(gè)字節(jié)
content2 = "中國(guó)".encode('utf-8')#結(jié)果是:b'\xe4\xb8\xad\xe5\x9b\xbd',uft-8是一個(gè)中文3個(gè)字節(jié)
(2)解碼
content.decode('gbk')
標(biāo)簽: