|
Тема |
Линейна регресия |
|
Автор |
Lincecum () |
|
Публикувано | 16.08.09 15:27 |
|
|
Тия дни с един колега се опитваме да решим една задача свързана със системата ЕЛО в шахмата. Понеже оптимизирахме формулата по която се изчисляват рейтингите на играчите искаме да тестваме статистически това, което сме направили. Имаме около 6000 шахматни срещи и техните резултати. Всяка партия си има индекс, който представлява разликата в ело коефициентите на съответните шахматисти. Искаме да проследим корелацията между размерът на разликата в коефициентите и процента на постигнатите победи при партии със индекс отговарящ на конкретната разлика. Тръгнах да правя линейната регресия, която би трябвало да отговори на въпросите ни. Обаче се натъкнах на проблем, който ми идва в повече (от двама ни с колегата аз съм дилетант математик, моят принос към задачата е основно в написването на компютърна програма, която обработва данните). Та, проблема се състои в това, че имам 6000 различни стойности на X понеже програмата смята ЕЛО коефициентите с точност до втория знак след десетичната запетая и за всяка стойност имам само по една партия. А когато стойностите на X са цели числа тогава за всяка стойност имам повече от една партия с такъв индекс (например X=46 с Y=56, докато в моя случай имам 56 различни партии с индекс около 46). Ползвам ексел за да построя графично регресията и да намеря уравнението и коефициента на съответствие. В случая с коефициентите като цели числа всичко е чудесно, но в моя вариант...
От ровенето ми в разни сайтове посветени на статистиката останах с впечатлението, че ключа от палатката е нещо наречено процентил, но така и не успях да схвана какво точно представлява и дали ще ми свърши работа.
Ще съм благодарен ако някой успее да ме измъкне от затруднението.
Редактирано от Lincecum на 16.08.09 21:23.
|
| |
|
|
|