Клубове Дир.бг
powered by diri.bg
търси в Клубове diri.bg Разширено търсене

Вход
Име
Парола

Клубове
Dir.bg
Взаимопомощ
Горещи теми
Компютри и Интернет
Контакти
Култура и изкуство
Мнения
Наука
Политика, Свят
Спорт
Техника
Градове
Религия и мистика
Фен клубове
Хоби, Развлечения
Общества
Я, архивите са живи
Клубове Дирене Регистрация Кой е тук Въпроси Списък Купувам / Продавам 22:15 13.06.24 
Клубове / Общества / Професионални / Преводачи Пълен преглед*
Информация за клуба
Тема Re: Дължини и статистически данни [re: xakepxakep]
Автор ivz (любопитен)
Публикувано19.02.12 09:59  



Изглежда има някаква формула за претеглено изчисляване на тези характеристики, като под претеглено имам предвид не просто честотата на дадена дума, а присъствието й в текстове от различен тип: художествена литература, техническа, публицистика и т.н. (какво значи "т.н." не знам). Казвам това, защото си направих труда да проверя ср. дължина в английски текстове (худ. литература) и най-голямото число, което получих, беше 4.40. А за английския се дава (почти единодушно) 5.1 букви/дума. Явно в тази стойност участват с по-голямо тегло думи с по-голяма дължна. Всички тези неща са (били са - вече не в такава степен, както някога) от голямо значение в криптографията и по-точно в криптоанализа, и несъмнено са отдавна изчислени (и текущо преизчислявани) за повечето езици. Чел съм, че най-добрата граматика на българския език била написана още 50-те/60-те години в NSA. Там със сигурност знаят всякаква статистика за българския, но е за тяхна консумация...
Иначе не е голям проблем да се сметнат дължините и честотите за произволно големи извадки на текстове ("Читанка" е налице като източник, по-трудно е се подберат представителни текстове от различен вид/тип). Не сте казали, не съм написал програмата за няколко часа. Но какъв е смисълът?

Иначе да се дели общата дължина на броя на думите (в даден списък) е абсолютно безсмислено, защото така се приравняват предлозите на по- рядко използваните думи от по 10+ (примерно) букви, което очевидно няма нищо общо с истината ("на" = "перлюстрация"?). Много по-близко до нея е да се вземе един текст и същата сметка да се направи за него (като се премахнат от текста всички знаци, които не са букви - пунктоация, числа, табулация, сдвоени интервали, свързващи тирета и пр.)

"You'd be surprised how much it costs to look this cheap."

Редактирано от ivz на 19.02.12 10:07.



Цялата тема
ТемаАвторПубликувано
* Въпрос за един израз Дeнни   14.02.12 09:43
. * Re: Въпрос за един израз ivz   14.02.12 10:05
. * Re: Въпрос за един израз Дeнни   14.02.12 10:18
. * Re: Въпрос за един израз regdog   14.02.12 10:59
. * Re: Въпрос за един израз Дeнни   14.02.12 11:18
. * Re: Въпрос за един израз 741   14.02.12 11:29
. * Re: Въпрос за един израз Дeнни   14.02.12 11:42
. * Re: Въпрос за един израз Sol y Sombra   15.02.12 09:32
. * Re: Въпрос за един израз Дeнни   15.02.12 11:49
. * Re: Въпрос за един израз ivz   15.02.12 20:09
. * Re: Въпрос за един израз Дeнни   15.02.12 21:05
. * Мнения на native speakers ivz   16.02.12 12:13
. * Re: Мнения на native speakers Liya   16.02.12 13:20
. * Re: Мнения на native speakers ivz   16.02.12 13:37
. * Re: Мнения на native speakers Liya   16.02.12 13:51
. * Re: Мнения на native speakers Naki   16.02.12 14:36
. * Re: Мнения на native speakers ivz   16.02.12 14:40
. * Re: Мнения на native speakers Naki   16.02.12 19:22
. * Re: Мнения на native speakers ivz   16.02.12 22:30
. * Re: Мнения на native speakers Liya   17.02.12 03:33
. * Re: Мнения на native speakers Naki   17.02.12 19:32
. * Дължини и статистически данни bsb_2   18.02.12 11:27
. * Re: Дължини и статистически данни xakepxakep   19.02.12 04:45
. * Re: Дължини и статистически данни xakepxakep   19.02.12 04:55
. * Re: Дължини и статистически данни ivz   19.02.12 09:59
. * Re: Мнения на native speakers ivz   16.02.12 14:37
. * Re: Мнения на native speakers Liya   16.02.12 15:03
. * Re: Мнения на native speakers Liya   16.02.12 14:47
. * Re: Мнения на native speakers ivz   16.02.12 15:06
. * Re: Мнения на native speakers Liya   17.02.12 03:17
. * Re: Мнения на native speakers ivz   17.02.12 13:07
. * Re: Мнения на native speakers chavdar4e   16.02.12 15:08
. * Re: Мнения на native speakers Дeнни   16.02.12 17:05
. * Re: Мнения на native speakers Дeнни   16.02.12 17:02
. * Re: Мнения на native speakers Liya   17.02.12 03:21
. * Re: Мнения на native speakers Дeнни   17.02.12 10:18
. * Re: Мнения на native speakers Дeнни   16.02.12 16:58
. * Re: Мнения на native speakers Дeнни   16.02.12 16:51
Клуб :  


Clubs.dir.bg е форум за дискусии. Dir.bg не носи отговорност за съдържанието и достоверността на публикуваните в дискусиите материали.

Никаква част от съдържанието на тази страница не може да бъде репродуцирана, записвана или предавана под каквато и да е форма или по какъвто и да е повод без писменото съгласие на Dir.bg
За Забележки, коментари и предложения ползвайте формата за Обратна връзка | Мобилна версия | Потребителско споразумение
© 2006-2024 Dir.bg Всички права запазени.