埃德蒙顿华人社区-Edmonton China

 找回密码
 注册
查看: 2244|回复: 5

中文英文孰优孰劣难有定论:知道《红楼梦》有多少词汇量吗?-ZT

[复制链接]
鲜花(19) 鸡蛋(0)
发表于 2009-3-29 19:51 | 显示全部楼层 |阅读模式
老杨团队,追求完美;客户至上,服务到位!
7 T! |3 P+ a" R5 u' I; _- E& z+ s
看到一篇有意思的文章. 但我个人并不完全其观点.6 E& ]- u7 v+ L1 I' x+ d% ?/ C

  k0 g! J+ F. W4 }9 S4 v" ]
9 x( G5 `8 e. s# \4 O( G' `以下是转贴:
! I5 o1 R( f: l: o
* N/ J+ b. C' F& i信源:天涯杂谈
$ J/ n/ d4 T, I6 h, Y+ p$ ^8 N  W
: ~  t- y9 f* B! r* P0 v
八阕 http://www.popyard.org 中文英文孰优孰劣,这个问题在网上已经被广泛讨论过了。攻守双方各持一端,难有定论。论者有拿出如鲁迅,胡适等名人的论说加以佐证者,历数中文之罪恶,似乎有不灭中文誓不罢休之势。旁观者如我不免心有戚戚焉。想炎黄子孙使用了数千年的文字,乃是华夏文化之精髓,如何到头来竟成了罪不可赦之物事,只教这帮人弃之如敝履? 我也不才,潜水多年。今日冒头一呼,也要为中文呐喊几声。 中文“罪恶”之大者,难认难学为其一也。辩者常以老外见了方块字晕菜为例来论证中文之难学。殊不知国内又有多少平头百姓视英文为天书的呢!若以为英文只有 26个字母,任何单词都可由其拼写而成,不似中文动则数千字,故以为中文不如英文易学。其论看似有理,实则大谬。英文字母实为构成文字之元素。若论何为中文文字之元素,横竖撇捺点勾之属者也,其数远少于26!似此中文才应易学为是。但是为何感觉总是中文难学呢?国人学英文从初中(如今从小学)学到大学,从家教学到东方。宁可丢下专业课也要确保4级,6级过关。就业靠此撑门面,晋级提薪也得经历考试关。中文不通者大可不必自卑,英文不通则会要了你的命!倘若山姆大叔学中文能有这股干劲,中文真的会有这么难吗? 我也学过几年英文,平时自忖还能对付两下。但是每到一翻英文书,却见满眼都是生字!如今流行托福,鸡阿姨。托福要求词汇量至少为8000,大约相当美国高中生的语文程度。不要以为这个程度已经有多么了不起,它尚不足以支持你读完一部长篇小说!我小学四年级读了浩然的《艳阳天》,五年级尝试读《红楼梦》。当时除了有些意思不大理会得了,记忆中生字倒不是特别多。你现在让一个美国的高中生读读《简爱》试试,更不必说《莎士比亚全集》了。 说到这里,有人会问《红楼梦》的词汇量到底有多少?我也不知。倒是听人说过,看报纸大概有个三,四千就够用了。人家《红楼梦》好歹是经典著作呀,没有一万,怎么也得有个六,七千才说得过去吧。我不知道是否有人做过这方面的统计,不才虽然无能,一时心血来潮,也想试试身手。其实说难也不难,上网当书,再写个小程序,运行两秒钟,一切搞定,不过才费时半日。你道是多少?说来你别不信,不过才四千几百字! 一部《红楼梦》一百二十回,洋洋大观,总共七十三万余字,词汇量不过四千有余。《简爱》又如何呢?心痒难忍,英文网站上当下“Jane Eyre”,改改程序再来一番运算。结果出来了,总共一十九万余字,词汇量一万三千有余!当然,这里是以英文单词为计算单位的。 诸位看客,您以为要达到阅读小说的程度,是学习一万三千字容易还是学习四千多字容易? 如今凡事讲究“与国际接轨”,不要到有朝一日中文之轨接到英文之轨上去了!有道是“国家兴亡,匹夫有责”。中文是中华民族,中华文化安身立命的支柱。它的兴衰你我都有责任! 下表是我作的六部古典中文著作的文字统计结果。四大名著之外《金瓶梅》也在其内。另外,为了进一步了解中文的深度,还包括了《资治通鉴》。统计内容除了总字数和词汇量外,也把每部作品中使用最多的前十个字罗列其中。 作品名 金瓶梅 红楼梦 水浒传 三国演义 西游记 资治通鉴 总字数 777291 734405 854011 598462 746187 3257270 词汇量 4305 4503 4134 3947 4494 6431 1 了 13965 了 21180 了 11459 曰 8750 道 11083 之 65850 2 来 10634 的 15700 道 10444 之 7849 不 8867 以 39754 3 不 10427 不 15011 一 10075 不 6735 一 8194 为 35574 4 道 9680 一 12178 来 9798 人 5126 了 7740 不 34263 5 儿 9251 来 11422 人 8833 军 4910 那 7504 王 21556 6 一 9197 道 11029 不 8352 兵 4686 我 7219 曰 21190 7 的 7984 人 10542 个 6577 大 4174 是 6583 于 20112 8 他 7795 是 10125 是 5942 一 4027 来 5995 其 20027 9 你 7659 说 9689 上 5757 马 3902 他 5737 人 18977 10 说 7268 我 9155 去 5496 将 3795 个 5694 军 18640 需要说明的是,统计是以网上下载的电子书版本作为对象的,书中如有输入错误,也被统计在内。另外电子书中常有的多余的文字,例如“某某校对”之类,由于本人懒惰,并未给予删除,一并记入统计结果。但是所有文件的控制字符都被排除在统计之外了。 表中可见,六部小说中词汇量最多的是《红楼梦》,4503。即算三百二十五万字的大部头著作《资治通鉴》词汇量也不到六千五百!另外,有些意思的是,在所有六部作品中,平均出现率最高的文字既不是“一”,也不是“了”,而是“不”。这是否证明自古以来国人说“不”的频率是很高的?一笑。附注:表中所列文字右边的数字表示该字在作品中出现的次数。 上表是我的一个游戏作品,其数据如上所述不是很精确的。如果有人将其应用到如论文之类的场合,我不会怪你剽窃。但是如果由此产生某些错误结果,你也不要怨我害人。我的原意是既然有了这样的东西,不敢藏私,不妨拿出来以飱同好。总而言之,也算是为中文呐喊的意思吧。
2 s4 g# g: {; l
鲜花(78) 鸡蛋(0)
发表于 2009-3-29 20:02 | 显示全部楼层

9 }7 J/ `7 D) ?# @: H单是中文语法就远远没有英文语法这么啰嗦、复杂
鲜花(143) 鸡蛋(1)
发表于 2009-3-29 21:48 | 显示全部楼层

补充两句

1)中国古汉语是没有语发的. 所以才出现那么多倒置结构.
; |! {# n3 ]4 ~+ \# t, w! s2)中国汉字本来是一个字一个意思,字是意思的最小单位.很少有词组.后来慢慢发展些词组(合成词),到现在则以词组为单位构造句子.
8 f* m* _8 \0 k3)以单个字表意思的汉字,可以组成千万个词组. 所以比较词汇量,不能以汉字词组和E文词组来比较.没有意义.
鲜花(16) 鸡蛋(0)
发表于 2009-3-30 13:20 | 显示全部楼层
老杨团队 追求完美
对我来说永远是中文比英文要容易。
鲜花(546) 鸡蛋(20)
发表于 2009-3-30 13:29 | 显示全部楼层
呵呵
鲜花(0) 鸡蛋(0)
发表于 2009-3-30 16:31 | 显示全部楼层
更聪明的民族讲的语言应该更nb吧,哈哈。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

联系我们|小黑屋|手机版|Archiver|埃德蒙顿中文网

GMT-7, 2024-11-28 12:43 , Processed in 0.154036 second(s), 20 queries , Gzip On, APC On.

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表