|
Тема |
Re: мивки [re: lR] |
|
Автор |
Nero (черен) |
|
Публикувано | 16.06.05 22:48 |
|
|
Видях че никой не могъл да демонстрира подобрение с използване на хипервръзки. Няма да гледам какво точно са правили - нещо трудничко се намират тия papers на сайта за information retrieval - налага се ровене през Google!
Хипотезата за broken links обяснява защо участниците на TREC не постигат резултат ако pagerank работи; не обяснява защо pagerank не работи. Всички експерименти с Google (пак: search engine optimizers, link farms, google bombs) произлизат от и са consistent с хипотезата че Google ползва хипервръзки (макар и не чист pagerank, а с използване на думите в текста на хипервръзките). Ако другите не могат да постигнат резултат така - лошо за тях, добре за Google. Ама не си мисли че щом другите не са могли, значи не е това начина.
Възможно е наистина pagerank да работи само ако го прилагаш само върху целия уеб, но не и върху части от него. Такъв domain поставя интересни предизвикателства пред изследването му.
За стеминга - аз не твърдя че Google прави прост стеминг. Знам, че преди не намираше други форми на думите, сега намира. Те самите казват, че правят нещо такова:
Други източници твърдят, че различните словоформи са с различно тегло (формата която търсиш е с най-голямо). Всичко това се потвърждава експериментално.
|
| |
|
|
|