字母编码是什么 -k8体育

字母编码是把字符集中的字母为指定集合中某一对象(例如:比特模式、自然数序列、8位组或者电脉冲),以便文本在计算机中存储和通过通信网络的传递。

字母编码是把字符集中的字母为指定集合中某一对象(例如:比特模式、自然数序列、8 位组或者电脉冲),以便文本在计算机中存储和通过通信网络的传递。

字母编码是什么

编码简介

在显示器上看见的文字、图片等信息在电脑里面其实并不是我们看见的样子,即使你知道所有信息都存储在硬盘里,把它拆开也看不见里面有任何东西,只有些盘片。假设,你用显微镜把盘片放大,会看见盘片表面凹凸不平,凸起的地方被磁化,凹的地方是没有被磁化;凸起的地方代表数字 1,凹的地方代表数字 0。硬盘只能用 0 和 1 来表示所有文字、图片等信息。那么字母”a”在硬盘上是如何存储的呢?可能小张计算机存储字母”a”是 1100001,而小王存储字母”a”是 11000010,这样双方交换信息时就会误解。

比如小张把 1100001 发送给小王,小王并不认为 1100001 是字母”a”,可能认为这是字母”x”,于是小王在用记事本访问存储在硬盘上的 1100001 时,在屏幕上显示的就是字母”x”。也就是说,小张和小王使用了不同的编码表。小张用的编码表是 ascii,ascii 编码表把 26 个字母都一一的对应到 2 进制 1 和 0 上;小王用的编码表可能是 ebcdic,只不过 ebcdic 编码与 ascii 编码ψ的字母和 01 的对应关系不同。一般地说,开放的操作系统(linux、windows 等)采用 ascii 编码,而大型主机系统(mvs、os/390 等)采用 ebcdic 编码。在发送数据给对方前,需要事先告知对方自己所使用的编码,或者通过转码,使不同编码方案的两个系统可沟通自如。

ascii 码使用 7 位 2 进制数表示一个字符,7 位 2 进制数可以表示出 2 的 7 次方个字符,共 128 个字符。ebcdic 码使用 8 位,可以表示出 2 的 8 次方个字符,256 个字符。

无论是 ascii 码还是 ebcdic 码,都无法对拥有几万个的汉字进行编码。因为上面已经提过,7 位 2 进制数最多对应上 128 个字符,8 位最多对应上 256 个字符。

英文字母编码方案直观编码

由 a 到 z 依次可编码,如图所示。

直观编码 a~w

直观编码 xyz

阵列编码

由 a 到 z 依次可编码,如图所示。

二进编码

ψ(ω)=111111111111111111111111111111111

ψ(a)=0000010010001001101010000101000001

ψ(b)=0100100010010001010010001001000101

ψ(c)=1010100001010000000010000001000111

ψ(d)=0100100010010000100010001001000101

ψ(e)=1010100000010000101010000001000011

ψ(f)=1010100000010000101010000001000000

ψ(g)=101000001010000001010000101000111

ψ(h)=0000100001010001101010000101000100

ψ(i)=0000000100000010000000010000100000

ψ(j)=0000000100000010000000010000001001

ψ(k)=000100100010000000101000010010000

ψ(l)=0000100000010000000010000001000001

ψ(m)=0001010101101010010010000101000001

ψ(n)=0001010010100100010010010101000101

ψ(o)=0100100100010010000010010001001011

ψ(p)=0100100100010010010010000001000000

ψ(q)=0000010010001000100001010100101010

ψ(r)=0100100010010001010010001001000010

ψ(s)=0100100100010000001000010001001001

ψ(t)=0101000100000010000000010000001000

ψ(u)=0000100001010000010010000101000111

ψ(v)=0000100010100000010001000100100100

ψ(w)=0000100001010000010101011010100101

ψ(x)=0000010001001001000001001000100010

ψ(y)=0000010001001001000000010000001000

ψ(z)=01010000010000010000001000001000

绝对码重相对码重

由 a 到 z 依次可编码,如图所示

中文字母编码汉字编码史

汉字编码回溯到我国东汉时期,许慎首创部首编排法,将 9353 个汉字划分为 540 部,编出我国第一部系统分析汉字字形的字典《说文解字》。由于这种编排法揭示了汉字复杂的内部结构,因而流传至今。现在出版的有些字典只不过将部首略作删改,如《新华字典》改为 189 部,《现代汉语词典》改为 188 部。然而,部首编排法查字速度太慢,更谈不上见字识码。原商务印书馆长王云五创四角号码检字法,第一次解决了“见字识码”的问题。这种编码法现在仍是权威性的编码法之一,除了《四角号码新词典》采用以外,《现代汉语词典》在书前,新版《辞源》在书后均附有四角号码检字表。不过,这种编码的重码率太高,不能满足电子计算机的要求。

要知道,造成重码的原因是多方面的。就以“王”、“豆”两字的编码为例,它们的编码都是 1010,造成同码的原因为:(1)四角号码法只考虑了汉字四角的特点,而忽略了汉字的内部结构。然而,“王”与“豆”的根本区别正是在内部。(2)对这两字名义上是取四角,但所取的角中只有左上、左下两角生效。

树形编码

从以上对汉字编码史的回顾,我们得出如下结论:只有抓住汉字字形复杂的内部结构这一根本点,才可能得出先进的编码方案。“汉字树形结构中文字母编码法”(简称“树”法)正是在总结我国编码史的基础上提出来的。它以汉字结构文法及其语法树为理论基础,直接将三十六对中文字母(从数万汉字中提炼出,每对中文字母只对应一个数字或一个英文字母)作为汉字的编码,并共用现成的英文键盘。

象物质由分子组成一样,汉字由几个小块复合而成。这些构字小块简称块。块的形状多样,有矩形、三角形、凹多边形诸种。块内笔划之间相互关系错综复杂。那些笔划之间纵横相交或相连的块,如“丰”、“王”、“艺”……都是交连块。笔划分离的块如“甲”、“三”、“立,.··…等都是离散块。块内有块的那些块如“国”,“田”……是相套块。块与块彼此相嵌的块,如“臾”是相嵌块。上述这些块合称分块。

对数万汉字进行分解的结果,从中提炼出三十六对字符,作为中文字母。中文字母成对出现,每对字母对应一个数字或一个英文字母。换言之,每对中文字母对应于同一个 ascli 码。中文字母分成两类,甲类为三十六个常用符号,乙类为三十六个大容量的偏旁部首,且为汉字,如“木,之”等。对《新华字典》71 年修订重排本“部容量”作了一个统计。该字典收字 8500 左右,将汉字分为 189 部,在中文字母中所出现的偏旁部首总容量为 7955 字,占整个字典总容量的 93.59%。这说明中文字母具有极强的构字能力。甲类符号又分为四区。

如果一汉字不是分块,那么对它进行树形结构的一级分解。设 leae(cw)={b1,b2,…bn},这里 n=2,3,4,5

1.1 若 n=2,对 b1、b2 分别进行二级分解,限分两块。转 3.

1.2 若 n>3,转 3。

2.如果一汉字是一分块,那么对它进行二级分解。

3.取每块为首的最大字母为其编码。

“树”法方法简明,不用记忆,识码高速。不管是哪一个国家的人,只要他能正确书写汉字,就能按书写分块的先后次序,对汉字进行树形结构的一级分解并进行编码,其速度不低于书写一个英文字的速度。

树”法平均码长短且重码率低。“树”法不局限于对汉字几个“角”的了解,它对汉字进行了层层剖析,将汉字分解为分块,又将分块继续分解为原子块,深刻地揭示了汉字复杂的内部结构。因而,收到了平均码长短且重码率低的效果。以一九八二年五月出版的《快速集中识字手册》的六千多汉字为例,重码率仅 0.3%,平均码长 2.5。

“树”法对高频汉字以及大容量部首都进行了巧妙安排。而且高频汉字的编码直接由“树”法规则决定,且编码长度短,不必另设简码表。前 20 个高频汉字的平均码长仅 1.75。

(0)

相关推荐

  • 沪港通是指上海证券交易所和香港联合交易所允许两地投资者通过当地证券公司买卖规定范围内的对方交易所上市的股票。而深港通是内地和香港投资者可以通过当地证券公司或经纪商买卖规定范围内的对…

  • 职务是指人们在某一职位上所应完成的工作任务和所应具备的任职资格。如果把“职位”说成是组织的“物化”表现,那么职务则是组织的“人格化”表现。而在法律意义上,职务则意味着获得一定的法定…

  • bmpcc 4k是您获得专业品质视频的门票,它也非常适合进行直播,使您可以从计算机控制相机的几乎所有方面,从焦点到色彩校正。专为电影制作而设计,不必担心长时间的 pcc4k 过热。…

  • 绩效考核是人力资源管理的核心职能之一,是指评定者运用科学的方法、标准和程序,对行为主体的与评定任务有关的绩效信息(业绩、成就和实际作为等)进行观察、收集、组织、贮存、提取、整合,并…

  • 实在权重影戏网站与正常的权重站没什么纷歧样,只是说影戏网站词库,全是影戏词库而已。影戏大站我感受实在没什么剖析的需要,别人是靠时间和内容玩起来的,好比他可能是几年的时间发展起来的,…

    2022年3月31日
  • 1月28日消息,最近法国奢侈品公司lvmh公布了2021年全年财报,他们2021年的全年总销售额为642.2亿欧元(约合721.9亿美元),比2020年增长44%,较2019年疫情出现前的536.7亿欧元则增长14%。

    2022年1月29日
  • 微软通过将各种选项移动到“设置”应用程序,继续让用户远离 windows 11 上的控制面板。windows 11 的最新预览版本 22523 引入了关键更改,作为公司“将设置从控…

  • 如果之前京东白条有取现选项,如今不见了或不能再进取现的话,很可能是因为客户之前在给京东白条还款时出现了逾期情况,导致个人信用受损、账户风险上升。而白条取现功能是经系统综合评估后为优…

  • 随着移动互联网的快速发展,智能手机已经成为人们生活中必不可少的一部分。而作为一款经典的老牌手机品牌,诺基亚一直以来都备受用户的喜爱。而诺基亚930作为诺基亚的经典产品之一,其性能和使用体验也备受好评。但是,随着windowsphone系统

    2023年10月3日
  • hive 是基于 hadoop 的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在 hadoop 中的大规模数据的机制。 hive 是基于 had…

  • sewise player是一款专业的免费网页html5视频、流播放器,它功能强大,体积小,跨平台,兼容性好,使用方便简洁。 sewise player 是一款专业的免费网页 ht…

  • 触摸屏笔记本电脑曾经是一种奢侈,但是现在有很多选择。您不必坚持一个品牌或型号,您几乎可以以任何价格找到触摸屏笔记本电脑,尽管有时它可能需要支付高于非触敏显示器。在 惠普 spect…

  • 快压是一款免费的压缩解压缩软件,它能够帮助用户快速地压缩和解压缩各种格式的文件,如zip、rar、7z等等。不仅如此,快压还支持加密压缩、分卷压缩、自解压等多种高级功能。本文将介绍快压的主要功能和使用方法,帮助读者更好地掌握这款软件的使用技

    2023年10月2日
  • 个人是没有权利查酒店的记录,法律上是不允许的。除非是公安机关办案,你要出示证件之后才可以查询。 酒店管理规定,3 星级以下酒店,客人住宿记录信息存留时间为 3 个月, 4 星级酒店…

  • serv-u ftp server是一种被广泛运用的ftp服务器端软件,可设定多个ftp服务器、限定登录用户权限、登录主目录及空间大小等,具有非常完备的安全特性,支持ssl ftp…

发表回复

登录后才能评论
网站地图