малко за големите езикови модели - аз лично не ги смятам много-много за ИИ /то не че има и общоприети дефиниции за интелект или ИИ ако трябва да сме точни/. навремето беше излязал тоя лаф за "двата вагона книги" /мисля, че тома томов го беше казал по едно време за да уязви някакъв негов не толкова интелигентен колкото него опонент/. и сега във връзка с тия "умни" модели, това сравнение пак става актуално и даже излиза от сферата на преносния смисъл, защото това, което тия модели са "чели" /текстовия корпус на който са тренирани/, не на шега, а в действителност може да се измери във вагони печатен текст, някакъв невероятен обем, който никое човешко същество никога няма да е способно да възприеме като информация. за по-старите чат джипити модели се говореше нещо от сорта на 45 терабайта текстова информация, при последния сигурно е в пъти повече, даже бях чул някъде, че почнали да се оплакват, че почти не били останали нови дигитални данни, които да дадат на моделите.
и значи тука става въпрос за почти всичката смислена дигитална информация налична в интернет - примерно цялата укипедия /всички езици/, цялата референтна литература ползвана за уикипедия, която е в публичния домейн /вкл и много неща от непубличния домейн, имаше някакви съдебни искове по въпроса/, значи тука трябва да има хиляди книги на историческа тематика, философия, икономика, география, всички възможни трудове в цялата човешка история по математика, физика, химия и пр. точни науки и т.н. и т.н.
и сега малко е спорно дали модела може да "измисли" нещо качествено ново, което го няма в тая информация с която са го тренирали, но може би точно защото не може, това което ще даде ще бъде едно добро резюме /точно резюмирането и информационното кондензиране е силната им страна/ на примерно няколко стотинте книги и статии свързани със зададения въпрос. и очевидно е, че това резюме ще отрази в много по-голяма степен общоприетия научен консенсус в определената област отколкото да тръгне на промотира някакви крайни и далечни от общоприетите позиции /в крайна сметка в основата на работата на моделите има много статистическа теория, а точно статистиката показва главния тренд или трендове, а не отклоненията/.
кажи му северномакедонец вместо да го обиждаш
|