|
Тема |
Re: мивки [re: lR] |
|
Автор |
XaMaB (Нерегистриран) |
|
Публикувано | 13.06.05 15:27 |
|
|
Превод на горното мнение:
почти толкова нечетимо си остана.
Извинявам се на тези на които не мога да отговоря директно понеже съм малко зает тя дни. В този пост съм отговорил на пове4ето въпроси дето са ми зададени.
Подходът на Гоогле коренно се разли4ава от подхода с онтологиес. Проблемът със сеарч енгинес (СЕ) (Гоогле, етц) като цяло е 4е СЕ не могат да решат така наре4еня "амбигуитъ проблем". Един пример коъто постоъанно се цитира по конференциите е 4е пове4ето СЕ като Гоогле не правят разлика между "туркеъ" (страна) и "туркеъ" (птица). Също така ако имаш например страница коъато е отностно "лъвове и тигри", но в страницата никъде не се казва, 4е лъвовете и тигрите са бозаъници, то ако търсиш по клу4 "бозаъници", страницата за лъвове и тигри директно ще бъде изпусната.
Подхода с онтологиес е нан4инът да се реши този вид проблеми, но както ве4е казах такива състеми пък имат недостатъка, 4е по4ти вси4ко се вкарва на ръка и то от експерт. Респонсе тиме от такава състема е също доста голям.
Има и трети вид състемъ дето извършват "пхрасе евалуатион" и 4есто използват таxономъ, което е нещо средно между СЕ и "онтологъ басед състем". Такива състеми могат да ти отговарят на зададени въпроси като използват съдържанието на документа (qуестион ансверинг състемс). Те по4ти не изискват ръ4на работа, но са също по-бавни от обикновените СЕ понеже по-ве4е оценяваня (из4исленя) се правят.
В УСА в момента в онтологъ басед състем (децисион суппорт състемс, етц) се наливат пове4е пари отколкото е буджета на някои европеъски държави и вси4ко това заради тероризма.
Тези които ме питаха къде могат да намерят 4етиво за СЕ, етц:
На хттп://ввв.дцс.гла.ац.ук/Кеитх/Префаце.хтмл има една доста стара но много хубава книга коъато добре описва какво всъщност прави един СЕ (ИР енгине). Книгата е стари4ка, но от 70-те насам нещата не са се променили много (изклу4ение правят някоъ СЕ дето ползват фонт сизе, титле теxт, хъперлинкс, етц на веб страниците). Има описание на разли4ни симиларитъ фунцтионс дето се използват за сравняване на клу4ови думи и теxт и т.н. Всеки дето ъа про4ете може да си направи симпле СЕ дето ще му върши работа.
Има една стара статя за една от наъ-ранните версии на гоогле ат: хттп://ввв-дб.станфорд.еду/~бацкруб/гоогле.хтмл
хттп://трец.нист.гов/ - това е един сите дето може да видите последните резултати от разли4ни СЕ. Там има разли4ни класове "цомпетитионс"- например Веб Трацк се нари4а този за търсене по клу4ови думи.
Ако някоъ напише ИР (информатион ретриевал) в коъ да е СЕ, ще му изплуе куп инфо за алгоритхмии т.н.
За онтологиес: наъ-големя КБ (кновледге басе) на света е цъц КБ. Има опен цъц (много орязана верся) на цъц, коъато може да се довнлоадне от хттп://ввв.цъц.цом/. В3Ц има няколко езици за представяне на "онтологъ" предимно за Семантиц Веб (РДФ, ОВЛ, ДАМЛ-ОИЛ), но те даже не се доближават до ЦъцЛ.
Някоъ беше казал, 4е Мицрософт ще настигне Гоогле за 1-2 години. Моля идете на хттп://трец.нист.гов/ и вижте къде е Мицрософт и къде са другите. При оценяването се гледа прецисион анд рецалл. Моъат въпрос е: Защо Мицрософт изпраща техните резултати на ТРЕЦ след като на други у4астници ве4е не им приемат резултатите?
Също така Нонаме беше казал "Това, че си способен да забравиш езика си и да пишеш "4" вместо "ч" говори лошо за теб." и т.н. От 2001 насам нито съм бил в БГ нито съм имал щастието да говоря с някого на български и наъ-малкото съм дошъл в този клуб да се правя на велик.
Поздрави
|
| |
|
|
|