一、世界上共有超过10万个汉字
世界上一共有多少汉字?
首先给出答案——世界上共有超过10万个汉字。
2018年8月,华语教学出版社出版一本《汉字海》,该书由中国人蓝德康和日本人松冈荣志联合编辑,16开本,共上下两册,2720页,780万字,定价1580元。
《汉字海》收录汉字102434个,是第一本突破10万汉字的字典,另收录异体字11112个。
该书超过了1994年9月由冷玉龙、韦一心主编的中国友谊出版公司出版的《中华字海》85568个汉字。
二、 中华文明五千年,十万汉字进化史
1990年出版的《汉语大字典》附录中,详细罗列了自《说文解字》以来历代字典的字数。
这里头有一个异类是公元1067年丁度等主编的《集韵》,号称有53525字,远远超过一年之前也就是1066年司马光主编的《类篇》的31319字。
这是为什么呢?
根据《汉语大字典》四川大学编写组编的《集韵通检》统计,《集韵》实际收字应为32381个,《类篇》字数31319相差不远。《集韵》之所以会被误点成五万多字,原因是韵书按韵来编排字,汉字的又读(音)多,同一个字的不同读音,韵书就列在不同的韵部,同一个字可以多次出现。所以按字头一算,字数就多了很多。
上表对历代汉字字数进行了简单的统计,基本可以得出一个规律,汉字每1000年字数翻倍,比如公元前1000年,大约有5000汉字,公元元年大约有一万汉字,公元1000年大约有3万汉字,公元2000年,就有6-10万汉字。
当然字数增加很多是因为近代收集信息能力增强,很多异体字被广泛收集起来,我们常用的汉字并没有较大增加。
《历代字典:中华文明五千年,十万汉字进化史》1、商朝:甲骨文,近5000不同字形,识别汉字约1500个。
2、商周:金文,《金文编》收录3772字,识别汉字2420个。
3、秦代:《仓颉》、《博学》、《爰历》:3300字,
4、西汉:扬雄《训纂篇》,2040字(另说5340字)
5、东汉:许慎《说文解字》,9353字,异体字1163个,共10516字。
6、三国魏:李登《声类》,11520字。
7、三国魏:张辑《广雅》,18150个。
8、晋朝:吕忱作《字林》,12824字。
9、后魏:杨承庆《字统》,13734字。
10、梁朝:顾野王《玉篇》,16917字。
11、唐代:孙强,增字本《玉篇》,22726字。
12、辽代,行均《龍龕手鑑》,26430字。
13、宋代:陈彭年《广韵》,26194字。
14、宋代:司马光《类篇》,31319字。
15、宋代:丁度《集韵》, 32381字(重复为53525字。)
16、金代:韩道昭《改併五音聚韻四聲篇海》,35189字。
17、明代:梅膺祚《字彙》,33179字。
18、明代:张自烈《正字通》,共收录33549字。
19、清代:张玉书等《康熙字典》,47035字。
20、清代:王锡侯《字贯》
21、清代:段玉裁《说文解字注》
22、民国:陆费逵《中华大字典》,48000多字。
23、1959年,日本诸桥辙次《大汉和辞典》,49964字。
24、1971年,张其昀《中文大辞典》,49888字。
25、1990年,徐中舒《汉语大字典》,54678字。
26、1994年,冷玉龙《中华字海》,85568字。
27、2008年,社会科学文献出版社修订《康熙字典》,57557字。
28、2008年,韩国《韩汉大词典》,55000字。
29、2018年,蓝德康、松冈荣志《汉字海》,102434字,异体字11112个。
三、汉字的国家标准
《信息交换用汉字编码字符集》是由中国国家标准总局1980年发布,1981年5月1日开始实施的一套国家标准,标准号是GB 2312—1980。
1、1980年, GB 2312:6763个汉字,其中一级汉字3755个,二级汉字3008个;682个全角字符。
2、1993年,GB13000.1-1993的字符集:20902个汉字。
3、1995年,GBK全称《汉字内码扩展规范》:21003个汉字。
4、2000年,GB18030-2000,《信息技术 汉字编码字符集 基本集的扩充》。规定了常用非汉字符号和27533个汉字(包括部首、部件等)的编码。
5、2005年,GB 18030-2005,收录了70244个汉字。
四、常用汉字3500字和识字等级表
当代作家王朔曾调侃自己:身体发育时适逢三年自然灾害,受教育时赶上文化大革命,所谓全面营养不良。身无一技之长,只粗粗认得三五千字,正是那种志大才疏之辈,理当庸碌一生,做他人脚下之石;也是命不该绝,社会变革,偏安也难,为谋今后立世于一锥之地,故沉潭泛起,舞文弄墨。
其中提到了三五千字,也就是中国人需要认识的基本汉字也就三五千字,其余几万汉字基本用不到。就像鲁迅在《孔乙己》中提到的回字的四种写法,其他三种不知道,也不影响正常生活。
上文提到 GB 2312标准共收录6763个汉字,其中一级汉字3755个,二级汉字3008个;已经覆盖中国大陆99.75%的使用频率。
有人统计过十三经(《易经》、《尚书》、《左传》、《公羊传》、《论语》、《孟子》等13部典籍),全部字数为589283个字,其中不相同的单字数为6544个字。
1965年出版的《印刷通用汉字字形表》(收6196字),也是六千多字。
2011年,《新华字典》第11版,收录汉字13000字。
1988年国家发布两个汉字字表:
1、《现代汉语常用字表》:3500字。分为常用字(2,500字)和次常用字(1,000字)两部份。
2、《现代汉语通用字表》:7000字。包含《现代汉语常用字表》中的3500字。
2013年《通用规范汉字表》:大数据时代的常用字表《通用规范汉字表》是《中华人民共和国国家通用语言文字法》的配套规范,是现代记录汉语的通用规范字集。
2013年6月5日,国务院发出关于公布《通用规范汉字表》的通知,公布《通用规范汉字表》。《通用规范汉字表》公布后,社会一般应用领域的汉字使用以《通用规范汉字表》为准,原有相关字表停止使用。该表共收录汉字8105个。
《通用规范汉字表》共收字8105个,分为三级。
一级字表为常用字集,收字3500个,主要满足基础教育和文化普及的基本用字需要。二级字表收字3000个,使用度仅次于一级字。
一、二级字表合计6500字,主要满足出版印刷、辞书编纂和信息处理等方面的一般用字需要。
三级字表收字1605个,是姓氏人名、地名、科学技术术语和中小学语文教材文言文用字中未进入一、二级字表的较通用的字,主要满足信息化时代与大众生活密切相关的专门领域的用字需要。
能够入选一、二级字表的汉字,是根据其使用频率来确定的。采用了9个信息庞大的“语料库”的数据进行了统计,其中,最重要的两个语料库是“国家语委现代汉语平衡语料库”和“北京语言大学现代新闻媒体动态流通语料库”,收录的汉字量分别为9100万和3.5亿。
综上所述,我们可以列一个《中国人识字等级表八级(一字一人)》
一级:扫盲级,500字
二级:中学级:2500字
三级:大学级:7000字
四级:新华级:13000字
五级:博士级:20000字
六级:专家级:40000字
七级:电脑级:60000字
八级:骨灰级:100000字
附录:《最常用的500个汉字》的、一、是、在、不、了、有、和、人、这、中、大、为、上、个、国、我、以、要、他、
时、来、用、们、生、到、作、地、于、出、就、分、对、成、会、可、主、发、年、动、
同、工、也、能、下、过、子、说、产、种、面、而、方、后、多、定、行、学、法、所、
民、得、经、十、三、之、进、着、等、部、度、家、电、力、里、如、水、化、高、自、
二、理、起、小、物、现、实、加、量、都、两、体、制、机、当、使、点、从、业、本、
去、把、性、好、应、开、它、合、还、因、由、其、些、然、前、外、天、政、四、日、
那、社、义、事、平、形、相、全、表、间、样、与、关、各、重、新、线、内、数、正、
心、反、你、明、看、原、又、么、利、比、或、但、质、气、第、向、道、命、此、变、
条、只、没、结、解、问、意、建、月、公、无、系、军、很、情、者、最、立、代、想、
已、通、并、提、直、题、党、程、展、五、果、料、象、员、革、位、入、常、文、总、
次、品、式、活、设、及、管、特、件、长、求、老、头、基、资、边、流、路、级、少、
图、山、统、接、知、较、将、组、见、计、别、她、手、角、期、根、论、运、农、指、
几、九、区、强、放、决、西、被、干、做、必、战、先、回、则、任、取、据、处、队、
南、给、色、光、门、即、保、治、北、造、百、规、热、领、七、海、口、东、导、器、
压、志、世、金、增、争、济、阶、油、思、术、极、交、受、联、什、认、六、共、权、
收、证、改、清、己、美、再、采、转、更、单、风、切、打、白、教、速、花、带、安、
场、身、车、例、真、务、具、万、每、目、至、达、走、积、示、议、声、报、斗、完、
类、八、离、华、名、确、才、科、张、信、马、节、话、米、整、空、元、况、今、集、
温、传、土、许、步、群、广、石、记、需、段、研、界、拉、林、律、叫、且、究、观、
越、织、装、影、算、低、持、音、众、书、布、复、容、儿、须、际、商、非、验、连、
断、深、难、近、矿、千、周、委、素、技、备、半、办、青、省、列、习、响、约、支、
般、史、感、劳、便、团、往、酸、历、市、克、何、除、消、构、府、称、太、准、精、
值、号、率、族、维、划、选、标、写、存、候、毛、亲、快、效、斯、院、查、江、型、
眼、王、按、格、养、易、置、派、层、片、始、却、专、状、育、厂、京、识、适、属、
圆、包、火、住、调、满、县、局、照、参、红、细、引、听、该、铁、价、严、龙、飞。
,