|
|
| Тема |
Дължини и статистически данни [re: ivz] |
|
| Автор |
bsb_2 () |
|
| Публикувано | 18.02.12 11:27 |
|
|
|
Има разни корпуси на български в интернет - http://dcl.bas.bg/corpora_bg.html Само че не ми се търси колко излиза средната дължина на думата. Но ако вземем средно претеглена въз основа на употребата, сигурен съм, че в българския е по-голяма (без да имам данни). Т.е. в английския има много повече дълги думи като абсолютен брой, но за сметка на това с голяма честота на употреба са сравнително по-късите думи. (Разбира се, това вероятно важи за повечето езици, които не са "лепящи".) Което донякъде се компенсира от известни случаи на многословност, но пък те са по-редки.
Иначе за моите текстове (технически - околокомпютърни) на око оценявам увеличаване на средния обем с 20 до 30 процента на български спрямо английския. Не е ясно каква част от увеличението се дължи на повече думи и каква - на по-дълги. Не съм правил статистики, най-вече защото ме мързи :), но принципно бих могъл.
| |
| |
|
|
|