找回密码
 注册
搜索
查看: 3131|回复: 0

[EN] 英语单词的长度和音节数

[复制链接]
发表于 2013-3-27 23:56 | 显示全部楼层 |阅读模式
发信人: liuchangjie (so much to learn,so little we know), 信区: EnglishWorld
标  题: 英语单词的长度和音节数
发信站: 水木社区 (Sun Mar 24 09:37:43 2013), 站内  [累计积分奖励: 0/100]
  
最近对自己的vocabulary进行了整理,对于英语的words有一些有意思的发现。
  
首先是英语单词的长度,利用了List Of All English Words Database Software的数据库,该数据库中共有189444个单词,包含单词的复数,-ed,-ing,不加more、most构成的比较级、最高级形式,首字母缩略词等;不含紧缩形式(can't之类的)以及包含空格、连词符号的词(school bus、roll-up之类的)。统计结果如下(第一列代表n-letter,第二列是n-letter的单词数量):
1    2
2    36
3    988
4    5759
5    11251
6    18478
7    26121
8    30748
9    26489
10    21297
11    16004
12    11508
13    7933
14    5197
15    3223
16    1956
17    1136
18    599
19    329
20    160
21    64
22    30
23    17
24    9
25    2
27    2
28    3
30    2
45    1
可见8个字母的单词最多,有30748个。
其次是单词的音节。我利用LDCOE5建立一个含26760个单词的数据库(基本是手动建立的),这基本上是我词汇量的上限了,其中所有词汇都在LDCOE5中有单独的entry,不含有空格、连词符号的词,不含变形形式。关于这些单词的音节数量,统计结果如下:
monosyllable    1    3918
disyllable    2    10959
trisyllable    3    7041
quadrisyllable    4    3443
pentasyllable    5    1158
hexasyllable    6    207
heptasyllable    7    29
octasyllable    8    5
可见两个音节的单词是最多的。其中5个8音节单词是utilitarianism(u|til|i|tar|i|an|is|m),neocolonialism,interdenominational,electroencephalogram,electroencephalograph,另有一些极品长词暂且不论。单音节词数量也不少,最长的有八个字母(如schmooze, squashed等词)。
在这26760个单词中,一共有68025个音节,去掉重复的,一共有7730个音节!其中有3316个音节只出现了一次,出现100次以上的音节如下:
1    1326    a   
2    1273    i   
3    1104    er   
4    864    ing   
5    863    o   
6    851    in   
7    831    tion   
8    686    e   
9    651    re   
10    633    un   
11    564    y   
12    563    ter   
13    560    ble   
14    512    al   
15    509    con   
16    492    ly   
17    425    de   
18    405    ry   
19    405    ty   
20    375    ti   
21    369    en   
22    360    u   
23    350    ed   
24    336    di   
25    308    per   
26    307    ra   
27    306    an   
28    291    ri   
29    288    ta   
30    286    dis   
31    286    ex   
32    265    ver   
33    264    ma   
34    258    to   
35    256    man   
36    250    ic   
37    245    com   
38    240    der   
39    221    tive   
40    218    na   
41    210    la   
42    202    ca   
43    201    tor   
44    200    ni   
45    198    pro   
46    197    ment   
47    192    m   
48    188    li   
49    181    is   
50    180    im   
51    177    pre   
52    175    ous   
53    169    si   
54    167    less   
55    166    ac   
56    165    mo   
57    164    cal   
58    158    sion   
59    154    ful   
60    149    ci   
61    146    ar   
62    140    co   
63    138    pa   
64    137    cy   
65    137    or   
66    135    be   
67    135    mi   
68    129    bi   
69    128    mis   
70    128    out   
71    128    vi   
72    127    le   
73    127    par   
74    126    ate   
75    125    tu   
76    124    ro   
77    124    tic   
78    122    ist   
79    121    gy   
80    120    ad   
81    120    as   
82    118    on   
83    115    fi   
84    114    tal   
85    114    ten   
86    112    so   
87    111    pe   
88    110    po   
89    109    ize   
90    108    no   
91    106    el   
92    103    cu   
93    103    te   
94    102    ish   
95    102    su   
96    100    men   
97    100    sub   
汉语总共也就四百来个音节(不含声调变化),英语音节我估计也就这八千个左右。
其实通过音节记单词和通过字根记单词有异曲同工之妙,举个例子,在我这26760个单词中,含有cious音节的单词只有39个,分别是gracious, luscious, precious, spacious, specious, vicious(这6个是双音节);atrocious, audacious, auspicious, capacious, capricious, delicious, fallacious, ferocious, judicious, loquacious, lubricious, malicious, mendacious, officious, pernicious, precocious, pugnacious, rapacious, sagacious, salacious, suspicious, tenacious, ungracious, vivacious, voracious(这25个是三音节);bootylicious, efficacious, inauspicious, injudicious, meretricious, perspicacious, pertinacious, suspiciously(这8个是四音节),而且cious在这些词中发音还是一模一样的,一口气(约1分钟)读下来感觉很爽(这39个词中,双音节词primary stress在第一个音节;三音节词primary stress在第二个音节;四音节词的第一个音节是secondary stress,第三个音节是primary stress,suspiciously除外),而单词只要读熟了,拼写基本就不是问题了,至于意义,可以通过词根判断,再加上一定的死记硬背、例句、搭配等等,很快就把这些词都搞定了。当然,知道单词的含义还只是刚入门,要真正掌握一个单词,把单词收入自己囊中,只有多读多写多说了。
附件有个音频,内容是:atrocious, audacious, auspicious, bodacious, bootylicious, capacious, capricious, class consciousness, conscious, consciousness, consciousness raising, delicious, efficacious, fallacious, ferocious, gracious, inauspicious, injudicious, judicious, loquacious, lubricious, luscious, malicious, mendacious, meretricious, officious, pernicious, pernicious anaemia, perspicacious, pugnacious, precious, precious metal, precious stone, precocious, pugnacious, rapacious, sagacious, salacious, self-conscious, semi-precious, spacious, specious, stream of consciousness, subconscious, suspicious, suspiciously, tenacious, unconscious, ungracious, vicious, vicious circle, vivacious, voracious.每个词(组)读了两遍,总共也不过97秒啊。上面的词在我看来,最难的是conscious, gracious, precious, suspicious, vicious这5个,因为它们最常用,在学习型词典里义项最多(也不过几项)、例句最多,其他的词都是纸老虎而已。
  
统计中简单用到了List Of All English Words Database Software, Microsoft Excel 2010, Edit Plus v3.50, AntConc,没有编程。
在整理的过程中,也发现自己之前的一些错误,比如lieutenant,自己一直发作/lju:ten…/,因为有个习语in lieu of sth中的lieu我一直就发作/lju:/(其实也可以发作/lu:/),事实上lieutenant英音是/lef’ten…/(这里的f来得很蹊跷啊,有人知道origin吗?),美音是/lu:’ten…/这里lieu-ten-ant三个音节中的lieu也真够奇怪的。tenant是个单词,lieu也是个单词,lieutenant也是个单词,单词拼写中含有lieu的词还有halieutic, milieu, purlieus,还有就是lieutenancy之类的变形了。
还有parliament(par-lia-ment),我一直把第二个音节lia发作leer一样的音,现在发现其实ia只发一个schwa或者/i/音,不是一个diphthong。
另外一个收获就是英语中由动词加-ed、-ing后缀构成的形容词,数量不少,但是这些形容词和动词的分词形式一模一样,我自己一般很少用这些词,顶多用用interesting, inspiring, boring, exciting, insulting, grasping之类带有感情色彩的词,而且都是用在连系动词之后作表语。事实上,很多-ed、-ing形式的形容词在词典中都单列条目,例句多多,比如说marked,unmarked,headed之类的我们一看就知道意思的词,其实也可以用在名词前作定语,而我自己却很少这么用,以后要多用。等有空再整理一下在词典中单列为形容词、名词的-ed、-ing形式的条目。
  
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|虎纹猫家园

GMT+8, 2024-5-15 21:24 , Processed in 0.022440 second(s), 14 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表