Клубове Дир.бг
powered by diri.bg
търси в Клубове diri.bg Разширено търсене

Вход
Име
Парола

Клубове
Dir.bg
Взаимопомощ
Горещи теми
Компютри и Интернет
Контакти
Култура и изкуство
Мнения
Наука
Политика, Свят
Спорт
Техника
Градове
Религия и мистика
Фен клубове
Хоби, Развлечения
Общества
Я, архивите са живи
Клубове Дирене Регистрация Кой е тук Въпроси Списък Купувам / Продавам 10:25 27.05.24 
Хуманитарни науки
   >> Езикознание
Всички теми Следваща тема *Кратък преглед

Страници по тази тема: 1 | 2 | 3 | >> (покажи всички)
Тема машинен превод шльокавица -> български език  
Автор Baлeнтин ()
Публикувано17.04.06 21:09



Здравейте,
интересувам се от мнението на специалисти по въпроса за машинен превод на шльокавица (методиевица, чатица, мейлица).
Какво смятате за

?
Ползва се речник, който е генериран автоматично от списък с много от думите в българския език. Ето една нищожна извадка:


bega бега
bega(4|ch) бегач
bega(4|ch)a бегача
bega(4|ch)i бегачи
bega(4|ch)ite бегачите
bega(4|ch)(k|c|ck)a бегачка
bega(4|ch)(k|c|ck)ata бегачката
bega(4|ch)(k|c|ck)i бегачки
bega(4|ch)(k|c|ck)ite бегачките
bega(4|ch)o бегачо
bega(4|ch)(u|a|y)t бегачът


Предполагам, че се досещате какво значат скобите и чертите - в скобите се съдържат различни варианти на части от думата, а чертите разграничават отделните варианти.
Данните са разделени в 834 файла - програмата се ориентира в кой файл да търси по първите няколко букви от търсената дума (така се ускорява търсенето).

Речникът е генериран автоматично чрез прилагане на следните правила:


а --> a
б --> b
в --> (w|v)
г --> g
д --> d
е --> e
ж --> (v|j|zh|g|zg|z)
з --> z
и --> i
й --> (j|i|y)
к --> (k|c|ck)
л --> l
м --> m
н --> n
о --> o
п --> p
р --> r
с --> s
т --> t
у --> u
ф --> f
х --> (h|x)
ц --> (c|ts|z)
ч --> (4|ch)
ш --> (sh|6)
щ --> (sht|6t)
ъ --> (u|a|y)
ы --> (u|a)
ь --> (j|y|i)
э --> e
ю --> (iu|ju|u)
я --> (ia|ja|q|a|ya)
ё --> e


Освен на този речник, програмата разчита и на това:


[начало_на_дума]nemoga => не мога
[начало_на_дума]neis(k|c)am => не искам
[начало_на_дума]ne(w|v)i(v|j|zh|g|zg|z)dam => не виждам
[начало_на_дума]neobi(ch|4)am => не обичам
[начало_на_дума]nemo(v|j|zh|g|zg|z)e => не може

bulgar => българ
balgar => българ
ercher => ерцхер # изключение: ch не е ч (в думата ерцхерцог)

[начало_на_дума]zeli(a|q)t => целият

[начало_на_дума]mount(v|w)a => монтира

[начало_на_дума](sht|6t)ur(u|o)ti => щуроти
[начало_на_дума](c|k)li(ck|k) => клик

(v|w)azg => важ # важност
lezg => леж # разглеждане, ....
per(fe|f)(k|c|ck)tno => перфектно



# низове от три букви:
[начало_на_дума](w|v)ah[край_на_дума] => вах # update-vah
nix[край_на_дума] => никс
sht => щ
ija => ия
zge[край_на_дума] => же # каже, може
lyo => льо # няма думи, които да съдържат низ "лйо". пример: шльокавица

# низове от две букви:
tz => ц # tzar = цар; shlyokawitza=шльокавица
yo => йо
sh => ш
ux[край_на_дума] => укс
zh => ж
iu => ю
ju => ю
ya => я
ia => я # понякога "ia" е "ия"
tc => ц
ts => ц
ch => ч
lq => ля
ck => к # пример: hacker -> хакер

6t => щ
4 => ч
3 => з
6 => ш


a => а
b => б
c => ц
d => д
e => е
f => ф
g => г
h => х
i => и
j => ж
k => к
l => л
m => м
n => н
o => о
p => п
q => я
r => р
s => с
t => т
u => у
v => в
w => в
x => х
y => у
z => з


Тази процедура се прилага преди думата да се търси в речника. След това се проверява дали думата се съдържа в списъка с думи от българския език (става по-бързо от търсенето в речника). Разбира се списъкът с думите от българския език е разделен също на 834 файла (определянето, коя дума в кой файл се намира, става бързо (по първите две букви), тъй като думите са подредени по азбучен ред).


Моля обърнете внимание на това, че програмата е ; можете да я разпространявате и променяте съгласно условията на лиценза версия 2 или (по ваша преценка) по-нова версия, в този вид, в който е публикуван от Фондацията за свободен софтуер. Програмата се разпространява с надеждата, че ще бъде полезна, но БЕЗ ГАРАНЦИИ, дори без косвена гаранция за ПРИГОДНОСТ ЗА ОПРЕДЕЛЕНА ЦЕЛ. За повече подробности, вижте условията на лиценза GNU GPL.



Тема Re: машинен превод шльокавица -> български езикнови [re: Baлeнтин]  
Авторsoftware (Нерегистриран)
Публикувано19.04.06 14:22



Добре, добре, а уеб страници може ли да превежда Че то иначе на мен не ми трябва.......... Направо като плъгинче към браузъра да дисплейва нещата като хората



Тема Re: машинен превод шльокавица -> български езикнови [re: software]  
Автор Baлeнтин ()
Публикувано19.04.06 18:26



Аз не знам как се прави плъгин за браузър, но който има желание може да го направи - програмата е свободен софтуер и който желае може да направи подходящ интерфейс за да работи с някой браузър (разбира се ще трябва да разпространява получената програма под същите условия, под които е получил оригинала! ако не му харесва - да си пише всичко от нула).



Тема Re: машинен превод шльокавица -> български езикнови [re: Baлeнтин]  
Авторsoftware (Нерегистриран)
Публикувано20.04.06 00:49



Е батка, тази като твоята програма и петокласник я пише, като не можеш да минеш на по-високо ниво, кво ме гощаваш с код, тоя код и аз си го пиша за 3 часа. Нищо де, сигурно ще върши някаква работа, и земи му стегни малко визията на сайтчето, че на нищо не мяза.



Тема Re: машинен превод шльокавица -> български езикнови [re: Baлeнтин]  
Авторsoftware (Нерегистриран)
Публикувано20.04.06 00:58



А ти знаеш ли на кое му викат машинен превод. Леле мале..........Машинен превод, за да има превод, трябва да има два различни езика, и кое точно е преводаческото, машинна транслитераця батка, не се цели на високо, там където няма да стигнеш, ти га напишеш машинен превод..........................аз съм трамвай.





Тема Re: машинен превод шльокавица -> български езикнови [re: software]  
Автор Baлeнтин ()
Публикувано20.04.06 18:32



Програмата не прави транслитерация. Не можеш да ме убедиш, че това e транслитерация (нито пък, че е транскрибиране):

Текст на шльокавица:

Zdr
v momenta editvam edin tekst
razdelih diska na partishani za da si instaliram linoks.
10x za saveta
nemoga da si kompiliram kernela
mountvam si partitiona
installera na tozi linoks e mnogo lesen
tvyrdia disk e 120GB
zabravih passworda
driverite ne mi triabvat


Резултат от превода:

Здравей
в момента редактирам един текст
разделих диска на дялове за да си инсталирам Линукс.
благодаря за съвета
не мога да си компилирам ядрото
монтирам си дяла
инсталатора на този Линукс е много лесен
твърдия диск е 120 гигабайта
забравих паролата
драйверите не ми трябват


И смятам, че шльокавицата е друг език, просто защото така дефинирам това понятие.
Има хора, за които шльокавицата е просто български с латински букви, но аз когато казвам шльокавица имам предвид както "български език с латински букви", така и "разширена версия на българския език, която ползва думи, написани с латински букви и числата 4 и 6, които не могат чрез транслитериране и/или транскрибиране да се преобразуват в български думи".

Редактирано от Baлeнтин на 20.04.06 18:54.



Тема Re: машинен превод шльокавица -> български езикнови [re: software]  
Автор Baлeнтин ()
Публикувано20.04.06 18:43



Разбира се писането на този код не е сложно (особено след като се знае какво трябва да прави този код). По-сложно е да се измисли алгоритъма, а не неговия запис на даден език за програмиране.
Затова пуснах тази тема в точно този форум - защото смятам, че все някой ще сподели някоя идея; нещо за което аз не съм се сетил.

И защо трябва да "стягам визията" на сайта? Все пак не го ползвам за да продавам нещо. И освен това времето ми не е толкова много колкото ми се иска - предпочитам да имам нещо, което работи малко по-добре, отколкото нещо, което е малко по-лъскаво.

Редактирано от Baлeнтин на 20.04.06 18:46.



Тема Re: машинен превод шльокавица -> български езикнови [re: Baлeнтин]  
Авторsoftware (Нерегистриран)
Публикувано20.04.06 19:09



:) Тенкс за разяснението. Сега вече по-прилича на превод. И по ми прилича на програма, в която има смисъл. Обаче си мисля, че това е просто някой товой дипломен проект, защото ако не беше така щеше да го пипнеш малко. А не да ни изсипваш съдържанието от кошчето, нали така. Верно, че има някакви ценни намачкани листа в него, ама.............

И моето мнение си остава, че вие опън сорсъджиите сте просто афункционални, просто нямам думи, изтеглете програмката от тук:

62c-10042006.4.tar.bz2 10-Apr-2006 18:14 13M
62c-10042006.4.tar.bz2.md5 10-Apr-2006 18:13 57
62c-15012006.tar.bz2 15-Jan-2006 10:57 6.4M
62c-15012006.tar.bz2.md5 15-Jan-2006 10:57 55
62c-150420061256.tar.bz2 15-Apr-2006 10:00 15M
62c-150420061256.tar.bz2.md5 15-Apr-2006 09:59 59
62c-200420061824.tar.bz2 20-Apr-2006 15:27 15M
62c-200420061824.tar.bz2.md5 20-Apr-2006 15:26 59
data_1251.tar.gz 12-Jan-2006 21:14 6.7M
demo/ 15-Apr-2006 18:39 -
slackware-packages/ 15-Apr-2006 19:46 -
wget-log 20-Apr-2006 15:46 24K


Ми брао, То екзе, че няма - няма. Че инструкции няма няма-. Че мейла ти не е никъде на видно място на странициата ти - не е. Че е написан като

тук в инфото ти. ................................................... трепач си батка!


Интсрукции за инсталация, ала бала, вие тез неща ги нямате за нищо, тайното ми подозрение като ползувател на опънати продукти - понеже криете недостатъците им, а искате в същото време да се тупате в гърдите. Знам че това е така не се притеснявай, понеже познавам много Линукс опъняци, които са най-страшните, но като ги хванат на тясно са едно голямо нищо. Един наскоро ми се тупаше как щял да си оправи печката. Накрая се оказа че не знае какво има в нея. Но щели да му кажат. Беше многу отворен в начолото, докато подозираше, че не разбрам от печки. Не че разбирам, ама пък не се тупам излишно в гърдите. Така че направи някъв свестен вид на сайтчето, сложи инструкции, кажи програмата, ако въобще може да се инсталира, на каква ос и т.н.

Иначе не работи зле, но по български е недоизпипано. Ние винеги се задоволяваме с малко. За това не можем и нямаме като софтуер почти нищо.



Тема Re: машинен превод шльокавица -> български езикнови [re: Baлeнтин]  
Авторsoftware (Нерегистриран)
Публикувано20.04.06 19:18



А размишленията ти по български езк ще ги пропусна. Не се отличават особена дълбинност. Езика не се изчерпва с азбуката си. Освен нас и гърци и други наред имат проблем с писането на собствената си азбука и на латиница. Този проблем не е само български. Скоро "се опитах да чета" СТАТИЯ на руски писана на латиница. Е как да ти кажа. Пак си беше на руски, лексиката беше напълно руска, без чуждици, без кернели и т.н. Но на латиница. Не става дума за превод от латиница. Кернел аз сега ти го пиша на кирилица. Нещо да имаш да кажеш по въпроса.



Тема Re: машинен превод шльокавица -> български езикнови [re: software]  
Автор Baлeнтин ()
Публикувано20.04.06 19:26



Програмата работи на ГНУ/Линукс. Затова няма exe. Който иска да прави инсталатор зa Windows - ако иска даже и плъгин към Internet Explorer да си направи.

Всеки грамотен потребител на ГНУ/Линукс би трябвало да се досети какво значат тези файлове и имената им - 62c е името на програмата, числата след тирето е версията (ден/месец/година/час/минуи). Това, че файлът завършва на bz2 означава, че е архив във формат bzip2. Такъв файл се разархивира с програма, която се стартира като кликнеш върху него. Файловете, които завършват на md5 са контролни суми на съответните файлове, които не завършват на md5.
Директорията slackware-packages означава "пакети, предназначени за дистрибуцията на ГНУ/Линукс, наречена Slackware". За тези, които не са чували за Slackware очевидно няма никакъв смисъл това име на директория да им говори нещо - съдържанието на директорията е непотребно за тях.
Когато се разархивира архива, има един файл, наречен install.bash. За един потребител на ГНУ/Линукс това говори достатъчно - това е скрипт на bash и трябва да го стартира за да си инсталира програмата (освен ако не е потребител на Slackware - тогава е по-добре да инсталира съответния пакет, предназначен за Slackware).



Тема Re: машинен превод шльокавица -> български езикнови [re: Baлeнтин]  
Авторsoftware (Нерегистриран)
Публикувано20.04.06 19:26



Добре, нямам предвид да го излъскаш с фотошоп, един бутон бек, и начин да се ползва формата за "превод" многократно е достатъчен на най-първо време, плюс малко инструкции. Това не е чак толкова трудно?

За да е използваемо. Не мисли, че само се заяждам ей така, ще ми се да се радват всички на тази програмка и тя да стане наистина "за ползване", след като така и така си се трудил по въпроса, аз скоро четох доста по темата - спелчекъри. Такива в чужбина има от доста отдавна. Има цели лингвистични изследвания по въпроса.



Тема Re: машинен превод шльокавица -> български езикнови [re: Baлeнтин]  
Авторsoftware (Нерегистриран)
Публикувано20.04.06 19:32



Ако можеш наклая да ме навиеш и да си инсталирам Линукс, цена няма да имаш.



Тема Re: машинен превод шльокавица -> български езикнови [re: software]  
Автор Baлeнтин ()
Публикувано20.04.06 19:39



В естествените езици една дума (или израз) може да има няколко значения. Даже има случаи един човек да не се досеща неговият събеседник кое значение на дадена дума (израз) има предвид. Даже е невъзможно това да не се случва достатъчно често.

Аз мога да кажа, че шльокавицата е българския език с латински букви и арабски цифри. Мога да кажа също така, че шльокавицата е друг език. Това не значи, че си провитвореча - това означава, че в двата случая имам предвид съвсем различни значения на израза бъларски език. Ако отвориш и прочетеш какво пише в тълковните речници за думата "език", ще се убедиш, че там това понятие е дефинирано доста мъгляво и всеки може да му придава каквото си иска значение.

Смятам, че с това темата се изчерпа и няма смисъл повече да разискваме дали шльокавицата е друг език или просто си е български с латински букви и арабски цифри. Това е въпрос на терминология и не е особено важно.



Тема Re: машинен превод шльокавица -> български езикнови [re: Baлeнтин]  
Авторsoftware (Нерегистриран)
Публикувано20.04.06 19:45



razgovora na Alice s H-D, kojto kazva, 4e dumata prinadlezhi na nego i 6te j slaga kakvoto zna4enie si iska

разговора на Алице с Х-Д, който казва, че думата принадлежи на него и ще ж слага каквото значение си иска


сложи алгоритам за самостоятелно "j" между две шпации да е "й".



Тема Re: машинен превод шльокавица -> български езикнови [re: software]  
Автор Baлeнтин ()
Публикувано20.04.06 19:54



Не виждам смисъл да се опитвам да убеждавам хората да си инсталират Линукс или да вярват в нещо.
Както виждаш от страниците ми, аз не се опитвам да убеждавам хората в нещо. Просто им го показвам (т.е. сложил съм хипервръзки към разни сайтове - Линукс за българи, Уикипдеия) - те да се оправят нататък.
Ако искаш да разбереш защо някои хора гледат да ползват свободен софтеур, може да прегледаш четивата от раздела "философия и история" на тази страница:



Ако искаш аргументи против "Линукс и отворения код" - вж. книгата на .



Тема Re: машинен превод шльокавица -> български езикнови [re: Baлeнтин]  
Авторsoftware (Нерегистриран)
Публикувано20.04.06 19:56



И аз ползвам свободен софтуер по много причини, например защото понякога е добре написан. Но когато не е, нищо не може да ме накара да го ползвам.



Тема Re: машинен превод шльокавица -> български езикнови [re: software]  
Автор Baлeнтин ()
Публикувано20.04.06 20:00



По-скоро трябва се сложи ударено и. Това ще работи само на кодиране UTF-8. Във версията, която работи с кодиране CP1251 ще го преобразува на обикновено и.



Тема Re: машинен превод шльокавица -> български езикнови [re: Baлeнтин]  
АвторSoftware (Нерегистриран)
Публикувано20.04.06 20:06



Ми убаво, тури квот искаш да не е ж. Ако нямаш нищо против, че ти поразчета кода, че ми стана интересно това ще ме хвърли леко във хорор-филма инсталирай Линукс 1 част.



Тема Re: машинен превод шльокавица -> български езикнови [re: software]  
Автор Baлeнтин ()
Публикувано20.04.06 20:08



Съществуват хора, които ползват свободния софтуер, дори и когато не работи идеално, за да могат да се запознаят по-добре с недостатъците му и по този начин да го подобрят (или да кажат на автора какво трябва да се оправи). Ако пък е много зле - направо пристъпват към подобряването му или писане на аналогичен софтуер (ако няма вече написан) (разбира се докато свободния софтуер стане използваем карат на несвободен, който към момента върши работа).

Аз например не се гнуся да ползвам несвободен софтуер - почти всеки ден го правя. Но го правя главно защото ми плащат за това :-) Иначе безплатно не бих го правил. Неслучайно на домашния компютър ползвам предимно свободен софтуер.
Но за съжаление няма свободен софтуер за всичко - понякога се налага да се ползва несвободен докато някой (някоя група хора) не напише свободен софтуер за съответната задача.



Тема Re: машинен превод шльокавица -> български езикнови [re: Software]  
Автор Baлeнтин ()
Публикувано20.04.06 20:13



Разбира се, че нямам нищо против :-) Даже ще се радвам - аз затова съм го публикувал под лиценз GNU GPL - за да може всеки, който желае да го чете, използва и подобрява

Едва ли ще разбереш нещо от инсталиране на Линукс след прочитане на кода - той е почти еднакъв с този за всяка друга операционна система. Със съвсем леки промени ще работи на всяка друга операционна система, с инсталиран Perl (подходяща версия).



Тема Re: машинен превод шльокавица -> български езикнови [re: Baлeнтин]  
Авторsoftware (Нерегистриран)
Публикувано20.04.06 20:14



Е батка принципно си прав, но аз ако мога да дам 30$ и да си реша проблема от раз и то добре, вместо да се трепя цял живот като куче да пиша неща като добавки за кофти софтуер - например Миранда, извинявай ама това нещо съкс и то отвсякъде. И в мен живее някакъв идеализъм и аз съм за това да има свободен софтуер, но няма нищо по-важно от това един софтуер да върши работа, той е писан предимно за това, а не да си губиш времето с него. Тоест процента на използваемост трябва да е по-голям от прозента "надежда някой ден да работи".



Тема Re: машинен превод шльокавица -> български езикнови [re: software]  
Автор Baлeнтин ()
Публикувано20.04.06 20:26



Разни хора - разни идеали. Благодарение на "идеалистите" съществуват много от свободните програми.

Има хора, за които е важно програмата да работи, приблизително толкова, колкото да задоволяват нуждите си от творчество, чрез писане на софтуер. И когато пишат софтуер, който ползват, тогава са най-щастливи. Много често създателите на свободен софтуер, са и негови потребители и са започнали да създават даден продукт, защото не са успели да намерят такъв какъвто търсят.

Понякога не можеш по никакъв начин да убедиш дадена фирма, която произвежда една програма, да вгради в програмата някаква функционалност на разумна цена. Тогава е добра идея да си напишеш своя собствена програма, която да можеш да променяш както си искаш, и като я публикуваш да си намериш хора, които безплатно ще ти я подобряват.

В Линукс за българи има една статия, за която се твърди че е добре да бъде прочетена от потребители, които искат да преминават от Windows на Линукс -

. Не мога да кажа, че съм съгласен 100% с нея, но има и неща, с които се съгласявам. Виж и коментарите. Много от писанията в полза на Линукс или против Линукс са безсмислен флейм (не само от посочената статия).

Спирам вече. Повече няма да преразказвам вече .

Редактирано от Baлeнтин на 20.04.06 20:46.



Тема Re: машинен превод шльокавица -> български езикнови [re: Baлeнтин]  
Авторsoftware (Нерегистриран)
Публикувано20.04.06 21:35



Ти си комунист батка. Проповядваш ми, че ако се борим с дружни усилия ще преминем от смотан опънат свободен софтуер към добър опънат свободен софтуер. И аз съм комунист, но комунист песимист.

Обаче истината е че добрия безплатен софтуер, който е фрии, и пак в някакъв смисъл свободен, най често изобщо не е опънат



Тема Re: машинен превод шльокавица -> български езикнови [re: software]  
Автор Baлeнтин ()
Публикувано20.04.06 22:52



Не съм комунист. Нищо не проповядвам.

Свободният софтуер не е комунизъм. При комунизма те принуждават да правиш нещо (да споделяш с другите - от всеки според възможностите, на всеки според нуждите). А свободния софтуер (в условията на демокрация) може да го ползваш само ако желаеш - никой не те принуждава. Ако не - може да си ползваш несвободен софтуер. Също така никой не те кара да споделяш (да пишеш свободен софтуер). Имаш право да избираш какви права да имат потребителите на твоята интелектувална собственост (закон за авторските права).

Дружните усилия са невъзможни по принцип. Скапан софтуер винаги ще има - както свободен, така и несвободен. Ненаписан софтуер - също. Мотивацията на различните хора да направят нещо е различна. Хората са различни.

Вярно е, че има гръмогласни потребители и разработчици на свободен софтеур, които са комунисти, но това не значи, че всички са такива.

Свободният софтуер засилва ефекта от пазарната икономика - всеки има право да плаща на когото си поиска по подобряването на свободния софтуер. Когато софтуерът е несвободен, само собственикът на софтуера има право да събира пари за подобряване на софтуера. Свободният софтуер не позволява да има такъв монопол. (Разбира се това не значи непременно много ниска цена на свободния софтуер; понякога свободния софтуер може да струва многократно повече от несвободния - това е нормално, защото в много случаи по-качественото е и по-скъпо).

Достатъчно вече преразказах неща, които вече са

.



Тема Re: машинен превод шльокавица -> български езикнови [re: Baлeнтин]  
Авторsoftware (Нерегистриран)
Публикувано21.04.06 03:37



Линукс - Селска чест. Съжалявам не можах да се сдържа.



Тема Re: машинен превод шльокавица -> български езикнови [re: software]  
Автор Baлeнтин ()
Публикувано21.04.06 18:10



Какво е това "селска чест"?




Страници по тази тема: 1 | 2 | 3 | >> (покажи всички)
Всички темиСледваща тема*Кратък преглед
Клуб :  


Clubs.dir.bg е форум за дискусии. Dir.bg не носи отговорност за съдържанието и достоверността на публикуваните в дискусиите материали.

Никаква част от съдържанието на тази страница не може да бъде репродуцирана, записвана или предавана под каквато и да е форма или по какъвто и да е повод без писменото съгласие на Dir.bg
За Забележки, коментари и предложения ползвайте формата за Обратна връзка | Мобилна версия | Потребителско споразумение
© 2006-2024 Dir.bg Всички права запазени.