中国语言文字论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

只需一步,快速开始

搜索
查看: 1040|回复: 1

为什么中国的程序员,不能用汉字编制电脑程序?

[复制链接]

284

主题

766

帖子

4329

积分

论坛元老

Rank: 8Rank: 8

积分
4329
 楼主| 发表于 2021-2-10 19:21:28 | 显示全部楼层 |阅读模式
   为什么中国的程序员,不能用汉字编制电脑程序?
   为什么中国的程序员,不能用汉字编制电脑程序?原因有2:
1是汉字问题。2是技术问题。
先说汉字问题:
电脑是用电子管的“通电”、“断电”的两种状态,来表达“0”、“1”数码的。人们利用四个电子管的通、断两种状态,就可以使用“0、”“1”,来进行“二进制”“四位编码”,可以做出16组编码来:
0000     0001      0010      0011     0100    。。。。。。。。。。。。。。。。 1111
通通通通  通通通断  通通断通  通通断断  通断通通  。。。。。。。。。。。。。。。。断断断断
   零       一         二        三       四      。。。。。。。。。。。。。。。。。十五
人们可以随意设定“0”、“1”二进制的任何一组编码,来代表任何一种东西,例如让0000代表“零、水、狗、秒、走、作用、启动发动机、红、先、A、 a、tapotement、 %、 ?、にほんご  、 ......等等。
人们把“0”、“1”组成的二进制编码,称为“源码”;在电脑上,把某一个可以替代某一个“源码”功能的“符号”,称为该“源码”的“代码”。
    当然,要让“代码”起到代替“源码”的作用,还必须使用一种“电子逻辑电路”,来把二者,关联起来。
在电子计算机发明初期,人们在编制电子计算机程序时,是用“0”、“1”组成的二进制编码,来作为电子计算机的输入、输出信息形式的。这时的“0、1二进制编码组”,就如“电报数码组”一样;要知道每个“编码组”的含义,就必须查对事先编好的“编码含义对照表”。这时,人与电脑的关系是:人---“0”、“1”编码组---含义。多位“0”、“1”编码组和成千上万的各种含义,对于99%的广大普通民众来说,是很难掌握的,所以,使用“0”、“1”编码组作电脑输入、输出信息形式的操作方式,是不能普及于广大民众的。为了让电脑普及于广大普通民众,就在“人”与“0”、“1”编码组之间,夹上一个过渡“桥梁”-----“人、机信息交换代码”。最适宜作这种“桥梁”的,就是人们日常熟悉的“文字”和“图符”。方法是:
让某个“0”、“1”编码组,来表示一个组成文字的基本元件,例如,让二进制16位编码“0010011000101010”代表英文字母K ,人们按下英文键盘的K按钮,就能使用“0010011000101010”编码了。人们把“0、1编码组”称为“源码”,把“文字或图符”称为“代码”。
这样,电脑的设计者,就把“文字的基本构字元件”和一些“图符”,作为“人、机信息交换的“源码”的“代码”了。这样,就把早先的“人---0、1编码组”的关系,改成“人----文字、图符----0、1编码组”的关系了。
把“源码”的电子计算机升级为“代码”的电子计算机后,普通大众就可以用一种文字的有限的“基本构字元件”,用电子计算机键盘组建出无限的文字,再用文字组成电子计算机的指令,编制电子计算机的各种“软件”,来操作电子计算机了。从此,文字、图符就成为设计制造电子计算机的硬件和软件的一个不可或缺的要素了。
把“源码”的电子计算机升级为“代码”的电子计算机后,充分发挥了广大民众的创新潜力,使电子计算机不断得到改进,功能不断加强,不断接近或超过人脑的能力。于是,人们就改称“电子计算机”为“电脑”了。
美国采用了“代码”操作电脑方法以后,美国国家标准学会(American National Standard Institute ,ANSI ),为了解决各个编程专业部门使用代码不一致的问题,在1961年,就制定了“美国标准信息交换代码(ASCII码)”。它是标准的单字节字符编码方案,用于基于英文文本的数据。它最初是美国国家标准,供不同电脑在相互通信时用作共同遵守的西文字符编码标准,在1967年定案。后来又被国际标准化组织(International Organization for Standardization, ISO)定为国际标准,称为ISO 646标准。
“ASCII”码,既是设计电脑芯片的一个基础,也是编制电脑“程序”的基础。美国设计的电脑CPU芯片架构MIPS、Alpha等等,都以ASCII码为依据的,并且只支持“ASCII”。
   电脑是按事先设计好的“工作标准、工作规范和工作程序”来运行的,因此,只有具有“规律性、标准性”和“规范性”的文字,才可作为电脑的“人机信息交换标准代码”。
  26个英文字母,具有““规律性、标准性”和“规范性”,所以它就可作电脑的键盘代码;英文单词,都是用英文字母,从左至右依次排列组建的,所以组建英文单词的方式,是具有“规律性”的。因此,电脑就能够用带有26个英文字母代码的键盘按钮,按照英文单词的排列顺序规律,组建出任何英文单词和英文指令。
  而中国的从甲骨文到楷体的各种体式的汉字,是方块结构的,其组字基本元件,在不同的字上,具有不同的大小、不同安置角度、不同的粗细、不同的长短、不同的连接方式,所以,组字元件没有“标准性”和“规范性”,例如:丿在大夭、幺、爻、春、走等字上的形状和安置角度,各不相同;楷体汉字的组字方式,也是多种多样,没有统一的“规律性”。例如,音与昱,元件一样,上下位置改变了,字义就变了;巳、己、已,三字的区别,只是左边开口不同;马,在“码、妈、玛、杩”字上,为“表音”部件,在“驼、驾、驭、驰”字上有为“表意”部件,在“冯、凴”字上,只起到区别字形的“符号”作用。
所以,电脑就不能用楷体汉字的几十个基本组字元件,作为“人、机信息交换标准代码”。这样,就不能用楷体汉字的组字元件,在电脑上组建汉字;也就不能用楷体汉字作为指令,编制电脑作程序了。
从技术方面说,因为汉字不能作为电脑的“人机信息交换标准代码”,中国的电脑设计制造工程师,就不能设计出支持汉字的芯片架构,所以,中国即使具有了设计和制造电脑芯片的技术能力,也还是制造不出支持汉字的电脑芯片。所以,中国制造电脑芯片时,都是买了美国和英国的支持美国“ASCII”码的芯片架构专利和芯片刻录机器。这样,中国的电脑程序员,就不能用汉字编制电脑程序了。
此时,有人会问:我们在电脑屏幕上,看到的汉字,是怎么回事呢?
  在美国的电脑上,显示出汉字办法是这样的:
第一步,把每个汉字做成一个“小图片”。
第二步,给每一个汉字赋予一个唯一的“汉字字模库”的区位码(例如:灯---2138,登---2139,等---2140
邓---2141,凳---2142,瞪---2143  。。。。。。。)然后存入“汉字字模库”里。
第三步,编制一种从字库里调取“汉字”整体的“汉字输入程序”。
第四步,把 “汉字字模库”的使用方法程序,嵌入到“ASCII码”的电脑操作系统(Windows)内。
第五步,在电脑操作系统的管理下,通过“汉字输入程序”,把英文键盘代码(又叫“输入码”),与汉字字模库里的汉字区位码(又叫“汉字内码”)关联起来 ,把汉字从“汉字字模库”里调出。
在英文代码的电脑上,“汉字输入程序”,最基本的有两种:
第一种、汉语拼音输入法。
这种输入法,适合“见字会读音”的人们使用。这种输入法的制作思路是:首先,给每一个楷体汉字,赋予表示这个字的汉语读音的“键盘代码”。在英文键盘上,就设定用“英文字母”来表示“汉语拼音字母”,然后用“英文键盘代码”,来拼写每个汉字的读音。这样,表示一个汉字读音的“键盘代码”,就作为这个汉字的“命名”。然后编一个《汉字拼音输入程序》,把每一个字的“命名”与这个字在字库里的区位码关联起来。例如:楷体字“灯、登、等、邓、凳、瞪。。。。。。”,这些同音字的汉语拼音都是“德鞥(没有含‘声调’)”。在英文键盘上,用英文键盘代码“d”取代声母“德”,用“eng”三个键盘代码取代“鞥”。
“灯、登、等、邓、凳、瞪。。。。。。”在汉字字库的区位码,分别设定为“2138, 2139, 2140,2141, 2142, 2143  。。。。。。。”。《汉字拼音输入程序》把英文键盘代码“deng”与“2138, 2139, 2140,2141, 2142, 2143  。。。。。。。”都关联起来。当打开《汉字拼音输入程序》时,要调出“登”字,就在英文键盘上连续按下“d、e、n、g”键钮,就把汉字库里凡是与键盘代码组“deng ”相关联的汉字“灯、登、等、邓、凳、瞪。。。。。。”,都调出在列表中了。打字者可以从这个列表中选取所需用的汉字“登”。
第二种、汉字笔画输入法。
这种输入法,适合见字不会读音的人们使用。《五笔字输入法》就是“笔画输入法”。这种输入法的制作思路是:
首先对楷体汉字的结构,进行分解,例如“登”字,可以分解为“file:///C:/DOCUME~1/ADMINI~1/LOCALS~1/Temp/msohtml1/01/clip_image002.jpg”、“file:///C:/DOCUME~1/ADMINI~1/LOCALS~1/Temp/msohtml1/01/clip_image003.gif”、 “file:///C:/DOCUME~1/ADMINI~1/LOCALS~1/Temp/msohtml1/01/clip_image004.gif”、“file:///C:/DOCUME~1/ADMINI~1/LOCALS~1/Temp/msohtml1/01/clip_image005.gif”。这些被分解的零件,称作“字根”。
然后给每个“字根”赋予一个英文键盘代码。例如:“file:///C:/DOCUME~1/ADMINI~1/LOCALS~1/Temp/msohtml1/01/clip_image002.jpg” 的代码为弯w ,“file:///C:/DOCUME~1/ADMINI~1/LOCALS~1/Temp/msohtml1/01/clip_image003.gif” 的代码为g , “file:///C:/DOCUME~1/ADMINI~1/LOCALS~1/Temp/msohtml1/01/clip_image004.gif” 的代码为K ,“file:///C:/DOCUME~1/ADMINI~1/LOCALS~1/Temp/msohtml1/01/clip_image005.gif”的键盘代码为u。这样,“登”字的英文键盘代码命名就是“wgku ”。
再编一个“汉字笔画输入法程序”,把“登”字的“wgku ”命名与“登”字在汉字字模库中的区位码“2139”关联起来。
要调出这个字时,只要输入键盘命名“wgku ”,就把汉字库里凡是与键盘代码组“wgku ”相关联的汉字,都调出在列表中了。打字者可以从这个列表中选取所需用的汉字“登”。
由于汉字楷体字数很多,字根数量远远超过26个英文键盘的英文字母代码,所以,每个英文键盘按钮代码,就只能表示几个字根了。
这种处理汉字的方法,与英文处理方法,有着根本的区别。主要表现如下:
在美国的电脑上,是用英文字母组建英文单词的,即用26个英文字母,随机地组建出无限的英文单词,单词怎么写,键盘就怎么打。
而楷体汉字,不是在电脑上用汉字元件组建的,而是“调取整字”的。这种处理汉字的方式,就是早先的汉字机械打字机的处理方式。只是把铅字盘换成了字模库,拾字“机械手”换成“英文指令”,印字蜡纸换成显示屏,选字还得靠人工。机械打字机存在的那些缺点,在电脑打字中依然存在;并且,如果没有英文信息系统的支持,采用整字调取法,在电脑上也实现不了。
在使用楷体汉字的情况下,汉人与机器的关系是:“人---汉语拼音符号(或五笔画)----ASCII码--- 0、1编码----汉字”关系
在英文代码的电脑上使用的汉字只可以显示出来,是不能当作电脑指令,用来汉字来编制电脑程序的。
因此,没有汉字代码的电脑,就没有中国独立自主的电脑信息系统和电脑产业体系,中文信息,只能通过英文来调取使用,只能成为英文信息系统的附庸;中国的电脑产业,也只能作为美国电脑产业的附庸。

回复

使用道具 举报

16

主题

506

帖子

2420

积分

金牌会员

Rank: 6Rank: 6

积分
2420
发表于 2024-4-2 16:44:32 | 显示全部楼层
      顶     
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|中国语言文字论坛

GMT+8, 2024-4-20 08:43 , Processed in 0.059171 second(s), 25 queries .

快速回复 返回顶部 返回列表