
![]() 汉字 |
||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 字体 | ||||||||||||||||||||
|
||||||||||||||||||||
| 字形 | ||||||||||||||||||||
|
||||||||||||||||||||
| 汉字文化圈 | ||||||||||||||||||||
| 日本 朝鲜半岛 越南 | ||||||||||||||||||||
| 派生文字 | ||||||||||||||||||||
| 国字 方言字 则天文字 | ||||||||||||||||||||
| 假名 古壮字 喃字 女书 | ||||||||||||||||||||
| 契丹文 女真文 西夏文 | ||||||||||||||||||||
| →破音字 | ||||||||||||||||||||
| 注意:本条目可能有Unicode扩展汉字,若遇此情况请参看Wikipedia:Unicode扩展汉字 | ||||||||||||||||||||
汉字,是汉字文化圈内使用甚广的一种文字,属于表意文字书写系统的词素音节文字[1],汉字为上古时代的华夏族人所创制,可追溯至约公元前1300年商朝的甲骨文,到秦朝的小篆,发展至汉朝才被取名为“汉字”,至唐代楷化为今日所用的手写字体(楷书)。中国历代皆以汉字为主要官方文字,现时分别为中华人民共和国与中华民国定为国家规范用字,又被外国人称为中国字(Chinese)。汉字在古代已发展至高度完备的水平,不单中国使用,更在很长时期内充当东亚地区唯一的国际交流文字,二十世纪前还是日本、朝鲜半岛、朝鲜、越南等东亚和东南亚国家官方的书面规范文字。
现代汉字,在中文体系大致分成繁体中文(或称正体中文)与简体中文两个体系。前者主要用于台湾、港澳地区以及欧洲和北美的早期华人移民与八十年代以前的新加坡、马来西亚,而后者主要用于中国大陆、东南亚的华人以及八十年代之后的新加坡、马来西亚,一般来讲,繁简两个体系的使用者都能在短期内适应并能看懂另一体系的文字。日本和韩国则是另行各自制定了官方的汉字使用规范,但汉字在越南和朝鲜已不再具有官方规范地位。
目录 |
汉字一词早出自《北史》卷九本纪第九,“章宗一”:“十八年,封金源郡王。始习本朝语言小字,及汉字经书,以进士完颜匡、司经徐孝美等侍读”。
《金史》也出现多次,如:“女真初无文字,及破辽,获契丹、汉人,始通契丹、汉字,于是诸子皆学之”。 “长子布辉,识女真、契丹、汉字,善骑射”。
在清朝前期,政府官方文字是满文,当时已用汉字一词称呼中国传统的文字。更之前的古代中国,因为没有与他国区分的必要,多称呼为“字”或“文字”。
直到目前为止,台湾官方文字相关政策制定的中华民国教育部,以定义官方文字的“国字”作为称谓,而不使用其他国家使用的汉字一词,例如《国字标准字形表》等。民进党执政时期曾有意更名“汉字”,但遭媒体及部份人士批评为“去中国化”的一环而作罢。
另外,日本人也称呼为“汉字”,以别于由汉字衍生的假名。在南韩,汉字则与训民正音(谚文)相区别。
汉字的特点有以下几项:
汉字是世界上最古老的三大文字系统之一。其中,古埃及的圣书字、两河流域苏美尔人的楔形文字已经失传,仅有中国的汉字沿用至今。
传说中,汉字起源于仓颉造字。黄帝的史官仓颉根据日月形状、鸟兽足印创造了汉字。从历史角度来看,复杂的汉字系统不可能由一个人发明,仓颉应该是在汉字的搜集、整理、统一上做出了突出贡献,所以《荀子‧解蔽》中记载“好书者众矣,而仓颉独传者,一也”,而汉朝淮南子一书更描述仓颉的贡献为“天雨粟,鬼夜哭”:描述文字的发明有如天上降下五谷广披大众,使得资讯透过文字能传载给任何人;而仓颉之前已去逝的人(鬼)都痛哭没有办法享用到文字的好处。[2]
有观点认为《周易》中的八卦对汉字形成有较大影响,但支持者甚少。
文字发明前的口语知识在传播和积累中有明显缺点,原始人类使用了结绳、刻契、图画的方法辅助记事,后来用特征图形来简化、取代图画。当图形符号简化到一定程度,并形成与语言的特定对应时,原始文字形成。
1994年,湖北杨家湾大溪文化遗址出土了大量陶器,其上170多种符号中,部分特征与甲骨文有较大类似之处。这一发现将原始汉字的形成过程推定到距今6000年以前。此外,山东大汶口出土的陶器上的象形符号,西安半坡彩陶上的几何符号,河南贾湖距今8000年前龟甲上的几何符号贾湖契刻符号等,都可能是原始文字形成中(或形成前)不同阶段的表现。
但是,商朝以后的汉字和这些几何符号是否一脉相承?这个问题还在争议中。许多学者提出,这些符号不一定是汉字的前身,甚至不能绝对肯定是文字符号。
从甲骨文到小篆,汉字经历了从巨细靡遗描绘意象的方式往简化成容易纪录刻画的方向变迁,字形逐步脱离事物的具体形象。这一时期的汉字也称为古文字。
商周时期的甲骨文已经是一种比较完整的文字体系。在已发现的4500多个甲骨文单字中,目前已能认出近2000字。与甲骨文同期,青铜器上铸造的文字称为金文或钟鼎文,西周时期的《散氏盘》、《毛公鼎》具备很高的史料和艺术价值。
春秋时代开始,各地诸侯相争,而原本周文化独尊的局面逐渐破坏,各地区文化开始有"在地化"的改变趋势。到了战国时代以后,这种情况更明显,在文字使用方面可以粗略依照地域分为五大系统:东方齐系、东北燕系、南方楚系、北方晋系和西方秦系文字,各系统的文字大体上相近,只有小部份文字有所差异,因此彼此文书往来并没有太大问题。[来源请求]
秦始皇统一中国后,李斯在大篆(秦系文字)和六国古文的基础上,进行规范和整理,制定出了小篆作为秦朝的标准书写字体,统一了中国的文字。小篆呈长方形,笔画圆润流畅。
小篆解决了各国文字间出现大量异体字的情况,“书同文”的历史从此开始。文字的统一有力促进了不同语族间的文化传播,对中国的统一以及东亚各国的文化交流发挥了重要作用,为世界文字史所罕见。
汉字的发展经历了许多不同的演变。初期汉字系统的字数很少,以象形与指事的独体字为主,大量事物以通假字来表示,使文字表述存在较大歧义。例如先秦的“文”,兼有后世的新字“纹”的功能,表示一组成各种事务的规律、型式,不单指文字的文,也包含野兽身上的花“文”、布上面的织“文”、手指的指“文”等数种含意。
除了“凹”、“凸”等特例直到唐朝才发明[3],大部分的象形指事字很早就已经定型,成为下个时代形声会意组字法的基础。
为了能更精准的表述,最早从小篆的时代开始一直到现代,因应随文明发展不断增加的新事物,以基本的象形指事字为基础,发展了形声、会意的组字法,以组合方式,来细化大量的字出来,使得文书上记载越来越精密,到今天一直为造字的主力。
例如:
有了造好的象形、指事的独体字为基础,使用形声、会意组字法随着文明的发展,组出表示新事物的合体字,这使得记载为文时,以前述的各种不同的船来说,只要看一单位的字形,我们就知道指的是那一种“舟”,这样辨识理解的效率非常高;反过来,以组词的方式就要看过前后文(或短或长)有其他哪些字才能判断正确的意义,较缺乏辨识效率,但方便口语沟通(汉字同音字太多,听觉不易辨识,解法一为组词,二为如韩日语数音为一字:“浬”发音为海里)。
小篆笔画以曲线为主,后来逐步变得直线特征较多、更容易书写。到汉代,隶书取代小篆成为主要书体。隶书的出现,奠定了现代汉字字形结构的基础,成为古今文字的分水岭。
汉代以后,汉字的书写方式逐步从木简和竹简,发展到到在帛、纸上的毛笔书写。草书、楷书、行书等字体开始出艺术。古代印刷术发明后,出现了用于印刷的新字形宋体,传入日本,衍生出明体(可能是在明朝传入。微软操作系统默认字形,细明体即为之),在现代又陆续出现了黑体、仿宋体等字形。
六书是汉字组字的基本原理,在周礼中就有提到了六书,只是没有说明具体内容。到了东汉,许慎在《说文解字》中,详细阐述了“六书”这个汉字构造原理:象形、指事、会意、形声、转注、假借。
(其中“转注”“假借”两项的意义,至今争讼不休,尚无令人满意的说法。)
总结以上古代六书,前两项,“造字法”也;中两项,“组字法”也;后两项,“用字法”也。这六个原理,是古代文字学学者归纳出来的字学理论。其所含汉字构成法则,是长期演化而成的,不是任何一个人独创的。
汉字由一个或以上的字根以二维方式(欧语系是一维文字)在特定的正块空间内组成,因此有方块字的别称。
所谓的“文字”,古代是两个东西,东汉许慎《说文解字》叙:“仓颉之初作书,盖依类象形,故为之字,其后形声相益,即谓之文。”;宋郑樵《象类书》云:“独体为文,合体为字”。这个文,现代的术语叫作字根部件,汉字是以意念的表达需要组合所需部件于一方块,合成千千万万的字。
郑樵的搜集,以形为主的文有三百三十个,称为形母,以声为主的文共有八百七十个,称为声母,合计一千二百文。
但郑樵的声母形母已经失传,近代周何教授依据中文资讯交换码(CCCII)第二集的22394字的字集重新整理的结果,得出汉字有869个声母及265个形母,共计1134个
汉字有各种不同的书写方式,即有不同的字体;不同的字体,汉字的字形不一样。
规整的字体(如:楷书、宋体、隶书、篆书等)书写下的汉字是一种方块字,每个字占据同样的空间。汉字包括独体字和合体字,独体字不能分割,如“文”、“中”等;合体字由基础部件组合构成,占了汉字的90%以上。合体字的常见组合方式有:上下结构,如:“笑”、“尖”;左右结构,如:“词”、“科”;半包围结构,如:“同”、“趋”;全包围结构,如:“团”、“回”;复合结构,如:“赢”、“斑”等。汉字的基末级部件(或称基础部件)包括独体字、偏旁部首和其他非字部件。
末级部件,再行拆解,及为汉字的最小构成单位:笔画。
书写汉字时,笔画的走向和出现的先后次序,即“笔顺”,是比较固定的。基本规则是,从上到下,从左到右,先横后竖,先撇后捺,先外后内,先外后内再封口,先中间后两边。不同书写体汉字的笔顺可能有所差异。
汉字是多种语言的共同书写体系,每个字代表一个音节或数个音节(视语言而定)。此外念法上在日语以及各汉语方言中,读音有“音读”和“训读”之分。
台湾官方语言国语与中国大陆标准语普通话,与皆由一个声母、一个韵母及声调确定,实际用到1300多个音节。由于汉字数目庞大,因而有明显的同音字现象;同时还有同一字多音的情形,称为多音字或破音字。这一情况在各种汉语中是普遍存在的。
日语,在汉字的发音上,有着多音节,如国(こく)、肉(にく),也有单音节如空気(空气)的気(き,Ki),此外有许多字因训读、音读,在不同状况,发不同音的情形。
朝鲜语中汉字大致为一字一种发音,没有训读。
除了日本以外,其他汉字使用地区仍有少数字使用多音节字,如“浬”(海里)、“嗧”(加侖)、“瓩”(千瓦)、吋(英寸)、哩(英里)等。台湾官方机构或民间均普遍使用,在大陆地区由于官方废除已不使用,但一般人也理解其意思。
最早的注音方法是读若法和直注法。读若法就是用音近的字来注音,许慎的说文解字就采用这种注音方法,如“埻,射臬也,读若准”。 直注法就是用另一个汉字来表明这个汉字的读音,如“女为说己者容”中,使用“说者曰悦”来进行注音。
以上两种方法都有先天上不完善的地方,有些字没有同音字或是同音字过于冷僻,这就难以发挥注音的作用,例如“襪音韈”等。
魏晋时期发展出了反切法,据传是受使用拼音文字的梵文影响。汉字的发音可以透过反切法进行标注,即用第一个字的声母和第二个字的韵母和声调合拼来注音,使得所有汉字发音都有可能组合出来。如“练,朗甸切”,即“练”的发音是“朗”的声母与“甸”的韵母及声调所拼成。
近代以来,又发展出了仿汉字形式的注音符号及众多拉丁化拼音方式。注音符号一直都是台湾官方教学的一部分,学生在学习汉字前先要求必需掌握。而目前中国大陆最为广泛使用的是汉语拼音。
由于汉字以本身表义为主,注音方面较为薄弱。这个特性使得上下千年的文献,不至于产生如同使用拼音文字的西方世界一样,用字措辞太悬殊的差距,但也造成推断古代声韵的难度,必须进行专门的汉语音韵学才能推测它们在上古汉语和中古汉语的发音。例如“庞”从“龙”而得声,但今日北京话前者读“páng”(ㄆㄤˊ),后者为“lóng”(ㄌㄨㄥˊ)。
此外有学者经研究认为:汉朝之前,一个汉字发音为两个音节,即次要音节和主要音节。详见上古汉语。
表意上,汉字是汉文组成的最小单位,大半汉字就可以为独立表意单位,为单字词。随着语言文字的发展,有大量惯用的双字词甚至多字词出现,近代白话尤其众多,主要分为
不过,从另一方面来说,准确掌握为数众多的复合词的搭配形式和用法也成了一种负担。汉语常用词汇约为几万条,总词汇量约有百万条,从数量上来说可能使有些人望而却步。
而从古文的角度来看,多用字本义,比起过度依赖词语,会来的精确且有效率,例如朱邦复先生就提倡精确使用“字”的复古作为。
汉字由于是开放集合,数量并没有准确数字,日常所使用的汉字约为几千字。汉字数量的首次统计是汉朝许慎在《说文解字》中进行的,共收录9353字。其后,南朝时顾野王所撰的《玉篇》据记载共收16917字,在此基础上修订的《大广益会玉篇》则据说有22726字。此后收字较多的是宋朝官修的《类篇》,收字31319个;另一部宋朝官修的《集韵》中收字53525个,曾经是收字最多的一部书。
近代编集的字典收字量更高,如清朝的《康熙字典》收字47035个;台湾的《中文大字典》收字49905个;大陆的《汉语大字典》收字54678;最新的《中华字海》收字85568个,包含了《汉语大字典》、《中文大字典》、《康熙字典》和《说文解字》的所有收字;日本的《大汉和字典》收字48902个,另有附录1062个。21世纪已出版的字数最多的是《日本今昔文字镜》,收字15万个。
本世纪所新创的,还有第一批简化字后跟第二批的“二简字”,其中也包括社会上不少人造的文字,不过二简字已被大陆官方废除,只有少数字在社会上流行,但现时并没有于计算机编码中被收录。
在汉字计算机编码标准中,目前最大的汉字编码是台湾的国家标准CNS11643,目前(4.0)共收录可考证之正简、日、韩语汉字共76,067个,在户政系统等官方机构普遍使用。台湾及港澳地区民间通用的大五码收录正体汉字13053个。GB 18030是中华人民共和国现时最新的内码字集,GBK收录简体、繁体及日语、韩语汉字20912个,而早期的GB 2312收录简体汉字6763个。而Unicode的中日韩统一表意文字基本字集则收录汉字20902个,另有两个扩展区,总数亦高达七万多字。
初期的汉字系统字数不足,很多事物以通假字表示,使文字的表述存在较大歧义。为完善表述的明确性,汉字经历了逐步复杂、字数大量增加的阶段。过去在汉字组成基本因子(前述字根部件)研究与教学上落后,造成学习上必须逐字学习难以举一反三,汉字数量越多学习越困难,组建新字的风气日趋保守,也没有相应的资讯处理技术,于是有许多单一的汉语意义是以词表示,例如常见的双字词,所以近代书写的发展多朝向造新词而非造新字。
香港教育署于2000年颁布的《常用字字形表》收录4,759字,适用于香港;中华民国教育部于1996年颁布的《常用国字标准字体》收录4,808字,适用于台湾;国家语言文字工作委员会于1988年颁布的《现代汉语常用字表》收录3,500字(2,500个常用字,1,000个次常用字),适用于中国大陆。
山西大学计算机科学系受国家语言文字工作委员会委托,抽样统计200万字的材料,检测《现代汉语常用字表》收字的使用频率。结果是:2,500常用字覆盖率达97.97%,1,000次常用字覆盖率达 1.51%,合计共3,500字覆盖率达99.48%。 这说明只需学习约3,500个字,已可以正常阅读中文。
日本内阁于1946年颁布《当用汉字》,收录1,850汉字;文部省国语审议会(今文部科学省文化审议会)于1981年颁布《常用汉字》,收录1,945汉字,取代《当用汉字》。依《常用汉字》,1006个汉字在小学教授,939个在中学中教授,共计1,945个。
自1975年,日本汉字能力检定协会推出日本汉字能力检定,测试日本人对汉字的掌握。直至2007年,共2,716,711人考核。成绩分为12级,由最高至最低排列分别为:1级、准1级、2级、准2级、3级、4级、5级、6级、7、8级、9级、10级。
最简单的汉字只有一划,但却不止一个字:除了“一”字以外,“丨”、“亅”、“丿”等都是汉字,而且都有各自的读音。而现时已知最多笔画的汉字,应该是“
”,由3个“龍”字和3个“雲”个组合而成,共有84划,这个字收录于日本的TRON[1]计划内。其次是由四个“龍”字组成的“𪚥”字,有64划,收录于统汉码;同样属于64划的字有四个兴组成的字,收入自(中文大辞典)再之后的是由四个“雷”字组成的字,有52划,收录于《说文解字》。
由于各地对字形的使用并没有统一,加之大陆地区使用“新字形”,便产生了许多差异。例如“刃”及“角”,在各地写法都不尽相同。又如“口”字,台湾官方规定最后一横要写得超过上面的横折露出来一点,其他地区的写法却是不出头的(注意右图“启”字的口部)。
汉字书写体系也是世界上最主要的基础文字之一,在汉字的影响下,还产生过契丹文、女真文、西夏文、古壮字(方块壮字)、古白字(方块白字)、古布依字(方块布依字)、字喃等文字。但它们都因各种原因而消亡,而汉语中的女书,如今也无几人能识。日语的假名(仮名)在创制时也大量受到汉字字形的影响。
此外如蒙古文、满文、锡伯文等也是在汉字书写方式和书写工具的影响下,将从右向左书写的源自察合台文的书写方式改为从上到下书写,文字的结构也随之有所变化。
汉字是承载文化的重要工具,目前留有大量用汉字书写的典籍。不同的方言、甚至语言都使用汉字作为共同书写体系。在古代日本、朝鲜和越南,汉字都曾是该国正式文书的唯一系统,因而汉字在历史上对文明的传播分享有着重要作用。
| “汉字”发音 | |
|---|---|
| 中华区 | |
| 国语/普通话 | hànzì |
| 粤语 | hon3 zi6 |
| 闽南语 | hàn-jī |
| 朝鲜半岛 | |
| 韩语 | hanja |
| 日本 | |
| 日语 | kanji |
| 越南 | |
| 越南语 | hán tự |
由于汉字和发声的联系不是非常密切,比较容易被其他民族所借用,如日本、朝鲜半岛和越南都曾经有过不会说汉语,单纯用汉字书写的历史阶段。汉字的这个特点对于维系一个文化圈—一个充满各种互相不能交流的方言群体的民族——发挥了主要的作用。
汉字对周边国家的文化产生过巨大的影响,形成了一个共同使用汉字的汉字文化圈,在日本、越南和朝鲜半岛,汉字被融合成它们语言的文字“漢字(かんじ)”、“漢字(한자)”、“漢字(hán tự)”。直到现在,日语中仍然把汉字认为是书写体系的一部分。在朝鲜和越南,已经完全不再使用汉字;在韩国,汉字的使用在近几十年来越来越少;但是由于朝鲜语/韩语中使用了大量的汉字词汇,并且重音现象严重,所以在需要严谨表达的场合时仍然会使用汉字。虽然在通常情况下人名、公司机构名称等均使用韩文书写,不过大多数的人名、公司机构均有其对应的汉字名称。
中国许多民俗都与汉字有关,例如:
汉字独特优美的结构,书写的主要工具——毛笔有多样的表现力,因而产生了中文独特的造型艺术——书法。而篆刻是和书法相关的艺术,用刀在石材上雕刻出篆字作为印章。
汉字历史上是不断在组新字的,目前所见的各种汉字并非一口气完成在某一年代,而是应时代需要渐渐发展成今的面貌。例如:“人”这个字商朝就有了,凹凸这二字则是在唐朝的时候才出现。
此外不同的行业有不同的用字需求因而组字。例如:传统国乐在记谱上会用到减字谱、工字谱,中华民国政府各专门机关也有各自的特有用字,如:户政用字等等。
组字往往比组词在表意上更有效率,但组字组得太复杂又适逢变成常用字的话,就会衍生简化的努力。
汉字书写复杂,传统印刷更复杂。所以自古以来就已经有许多的简字,但多半是人民私下使用,正式的文书仍然是用繁体字,而虽然活字印刷是华人发明的,但由于汉字的结构特性,活字印刷帮助有限。
近代,处于强势地位的西方文明开始进入东亚,整个汉字文化圈的各个国家中纷纷掀起了学习西方的思潮。当中有人坚持汉字的传统,亦有鼓吹放弃使用汉字。这些鼓吹放弃汉字运动的立论“汉字落后论”,内容为:跟西方拼音文字相比,汉字是繁琐笨拙的。尤其在近代个人电脑还没有普遍化以前, 因为汉字不能透过打字机书写,而必须使用巨型的排版房的铅字,也就是说汉字已成为教育及资讯化上的瓶颈。但是近代个人电脑普遍化以后,汉字能透过个人电脑输入,此种论述已经不具说服性。许多使用汉字国家以政治推行的方式,进行了不同程度的汉字简化,甚至还有完全拼音化的尝试。日本的使用假名方案以及汉语多种拼音方案的出现都是基于这种考量。
中国大陆1956年1月28日发布《汉字简化方案》,1964年5月审定通过《简化字总表》,1986年经少量修订后重新发表,一直在中国大陆地区使用至今。1977年,曾公布《第二批汉字简化方案(草案)》,发布“二简字”,试用一段时间(约八年)后因为字形过于简单且混乱而于1986年正式宣布废除。新加坡和马来西亚分别发布了同《简化字总表》相同的简化字表。
日本也有汉字简化,但没有中国的简体字那么激进。
近四百年来,西方人和华人本身都提出了很多汉字的拉丁化方案,主要包括:
现在,汉语拼音方案是使用最广且被联合国接受的汉字拉丁化方案。“汉字落后论”的说法存在了很长时间,认为汉字是教育及资讯化的瓶颈,并有“汉字拉丁化”甚至废除汉字的推动行为。现在一般认为汉字也有突出优点,初始学习难度虽大,但掌握常用字之后就不会有类似大量英文单词的继续学习问题,且其表意特性也能充分训练人脑的学习能力。在电脑输入问题获得解决后,“汉字落后论”及“汉字拉丁化”在现实上已逐渐被绝大多数人抛弃。[来源请求]
除了造字以外,另外还有许多异体字。他们是意义和读音完全相同,但写法不同的字。有的是因为历史缘故,有的是名人造字,如“和”与“龢”,“秋”、“秌”和“龝”等。
台湾也有使用所谓的异体字,例如“臺”与“台”、“體”与“体”以及“學”与“学”等等。
中国大陆于1956年公布整理异体字表,废除了大量异体字,但后来因为各种原因恢复了部分异体字。如“於”曾被当作“于”的异体字废除掉,但在1988年发表的《现代汉语通用字表》中又恢复成为规范字,因为姓氏中于、於同时存在,不宜合并。另外,不同地区对异体字的取舍有所不同,例如:韩国就以汉字各种异体字中最早出现的样式为标准写法。所以,在韩语汉字的标准中,取“甛”而不取“甜”、取“幇”而不取“幫”、取“畵”而不取“畫”。
由于打字机键盘在设计时本身没有考虑汉字输入的问题,输入汉字往往比输入拼音文字困难。汉字没有经过中文打字机的普及,直接进入了电脑中文信息处理阶段。在电脑发明初期曾引起汉字能否适应电脑时代的问题,支持汉字拉丁化的学者甚至以此为理据。
随着各种中文输入法的出现,汉字的计算机输入、存储、输出技术得到了基本解决,大大提高了中文写作、出版、信息检索等的效率。目前中文输入法有上千种之多,主要包括表音输入和表形输入两类,也有两者兼之的。汉字的语音输入、手写识别和光学字符识别(OCR)技术也已得到广泛应用。
如收录数千字的GB 2312(中国大陆)、Big5及CNS 11643(台湾)、HKSCS(香港)、JIS(日本),以及收录两万多字的GBK(中国大陆)、国际标准Unicode、ISO 10646等等。在这个过程中,因为技术及其他种种因素,在收录字数,及收录字体等方面或做不同层次的调整。
中国大陆当局为了解决邮政,户籍整理等领域用字的迫切需要,于2000年实行了一个新的汉字编码的国家标准《汉字编码字符集-基本集的扩充》GB 18030-2000,共收汉字27484个。并强制所有在中国大陆地区售卖的计算机产品必须使用这个新官方标准。
为进行信息交换,各汉字使用地区都制订了一系列汉字字符集标准。
到目前为止流通的各种汉字编码规格,过去号称万码奔腾,是在没有文字学专家的指导下,科技人员以欧美处理字母的作法在处理汉字,汉字就因此被西方资讯技术所束缚,走向无法造新字,只好固定字数,弱化文字本身表义机能,把字当作字母来组词以表达事物。结果制作、运行成本远高于表音文字不说(汉字常用字就一万五千多,最简化也要六千多),汉字的诸多形、音、义等问题更不能很好的解决,中文还因此变成了一个停滞发展的文字系统。反观英文可是仍然不断在演化,例如“Central Processing Unit”一开始是很复杂的一个词,但是后来为了频繁的使用需要,缩写为:“CPU”;在中文全名是“中央处理器”,无法找到合适的中文缩写,不同科技产业都有如此表达新技术名词的痛苦,这使得欧语文大量侵蚀了中文。
经过数十年的研究,两岸各有不同的人研究出动态组字这新兴技术,这技术简单的来说,就是借由资讯科技重新解放汉字原有的生命力:任何汉字都可以由基本的百来个字根(也就是汉字的字母)以二维编码的方式即时合成为汉字,简单的理解,就以前面的中央处理单元来说,可以形声的原则创新单字:“电心”,既有效率,且本身表意,学过百来个字根的,就可以知道它代表什么,再赋予一个读音(通常与心同音),如此这般以此类推,就可以一次解决汉字形音义以及成本高的等等问题,使汉字与西文站在同样的资讯平等点,甚至因表意的特性比起西文更占新时代资讯处理的优势(比较好做电脑理解)。
现在正体汉字则通行于台湾、港澳地区、欧美的华人社区;简体汉字主要通行于中国大陆、马来西亚、新加坡和东南亚的华人社区。随着中国大陆政经的崛起,简体字的影响程度也成正比。虽然如此,在计算机科学进步的今天,输入汉字的方便与单字的高资讯量可以并行不悖,且印刷的成本跟表音文字已无差异之时,汉字简化的方向被重新检视。其中也有务实的看法:如同欧语文,正体字作印刷用,简体字作书写用(识繁写简)。无论如何,根据使用用途,选择适合的字体,会是必然趋势。[来源请求]
此外一个文字系统的造字的需求,这就有待动态组字技术的发展。
韩国自1991年以来开始举办国际汉字研讨会,邀请使用汉字的国家的专家和学者共同讨论汉字的使用和比较。2007年第二届的国际汉字研讨会于北京举行[4][5]。
| 此章节没有列出任何参考或来源。 请协助添加来自可靠来源的引用来改善这个章节。无法查证的内容可能被异议而移除。 |
虽有前述差异,然常用汉字的个体差异据统计,不到25%。此外,在日本与韩国也有各自简化的作为。在台湾,官方用字或正式文书必须使用正体字;在手写的非正式文书中,有些人会使用行、草书或民间的俗写(例:“台”(臺)、“门”(門)、“与”(與));但是,几乎不会使用大陆简化字中较难辨识字意的合并字(例:“里”(裡)、“后”(後)、“余”(餘)、“制”(製)、“面”(麵,亦作麪)、“谷”(穀)、“复”(復)、“复”(複),皆不简化)。
Why are we here?
All text is available under the terms of the GNU Free Documentation License
This page is cache of Wikipedia. History