韩漫免费漫画在线观看方法,《好好疼爱里面》免费看,年轻漂亮的女士护士内衣,妈妈醉酒后把我当爸爸电视剧

文章 > Python基础教程 > 一文带你了解编码集

一文带你了解编码集

头像

爱喝马黛茶的安东尼

2019-07-06 11:35:193061浏览 · 0收藏 · 0评论

编码集

1. ASCII编码:

127个字母 8个数据位足够存储字母、数字、符号,支持到0x7F。

1562383604239602.jpg

2. GB2312编码  

每个汉字占据2个字节(高位和低位),16个数据。GB2312是对ASCII的中文扩展,共包含7000多个汉字。是计算机发展到中国后发展起来的编码,检测高位和低位,如果同时大于0x7F,则认为是GB2312,否则认为是ASCII编码。

相关推荐:《Python视频教程

3. GBK(1995)和GB18030(2005/2000)

每个汉字占据2个字节,由于汉字的数量太大,GB2312不能满足需求。GBK包括了GB2312的所有内容,

同时增加了近20000个新的汉字(包括繁体)和符号 。只要求高位大于0x7F,低位可以小于0x7F,认为是中文。 

>  国家标准GB18030-2000《信息交换用汉字编码字符集基本集的补充》是我国继GB2312-1980和

GB13000-1993之后最重要的汉字编码标准,包含多种我国少数民族文字,其中收入汉字70000余个。

4.Unicode编码 

> 定长存储, 将所有语言都统一到一套编码集,通常使用2个字节,有的是4个字节。收录很全。

分为17个面,基本面采用2个字节,普通中文子也在基本面中,另外16个面是4个字节。

不兼容ASCII码,即存储的时候,对ASCII码前面补0,导致存储的数据变大。

5. utf-8---变长存储

> 国际标准组织(ISO)制定英文字符使用1个字节,沿用原来的ASCII码。

> 使用1~4个字节表示一个符号,中文存储使用3个字节(ascii码中的内容用1个字节保存\欧洲的字符用2个字节保存\东亚的字符用3个字节保存\特殊符号用4个字节)

> Unicode是内存编码表示方案(规范),而utf-8是如何保存和传输Unicode的方案(实现)

> 优点:虽然内存汇总的数据都是Unicode,但当数据保存到磁盘或者用于网络传输时,使用utf-8会节省更多的流量和硬盘空间。

如何判断几个字节表示一个字符:

每个字节添加识别位,其中高位识别位为4位,低位识别位为2位。判断高位字节开头有几个1,可以确定共有几个字节来表示一个字符。

6. utf-8和Unicode对应关系

utf-8去掉识别位,变成unicode。

关注

关注公众号,随时随地在线学习

本教程部分素材来源于网络,版权问题联系站长!

老公说我越来越骚的心理| 成品人和精品人的特点分析| 蜜桃成时熟| 国产暴力强伦轩| 嫂子的职业电影| 女人一旦尝到粗硬的心理变化| 《黏糊糊的你》免费观看| 麻豆成人啪啪色婷婷久久| 妈妈的朋友在线播放| 《淫毛》在线观看免费| 人犬兽人在线观看免费完整一| 《公天天吃我奶躁我》| 《女教师的味道3》在线观看| 快乐8| 闺蜜老公把我压在怀里| 厨房激战饥荒老奶奶能睡觉吗| 小妹妹爱大棒棒免费观看电视剧一| 《完美邻居2》电影在线观看| GTV一同看GTV蓝颜| 夸克浏览器APP官方下载正版| 白色变态蕾丝超薄开档连身袜| 摸摸大扔子的视频大全| 《湿点》未增减板相似| 省委书记和他的秘书们| 共享女儿小诗1~10章的背景资..| 妈妈与儿子高清免费版电视剧 | BOBO浏览器| 男同| 法国女海军 伦理| 黑料正能量| 三人成虎| 黑色蕾丝透视露胸旗袍连衣裙| YSL水蜜桃86满十八岁会黑吗.| 沙漠女性治疗营2| 美女和帅哥一起努力生产豆浆的视.. | 小柔与王叔的第一次相遇是第几集 | 爱的精灵| 《从上司到妻子》动画结局| 星空无限MV在线观看免费| 《性呻吟》伦理| 亚洲AV少妇高潮嗷嗷叫