Клубове Дир.бг
powered by diri.bg
търси в Клубове diri.bg Разширено търсене

Вход
Име
Парола

Клубове
Dir.bg
Взаимопомощ
Горещи теми
Компютри и Интернет
Контакти
Култура и изкуство
Мнения
Наука
Политика, Свят
Спорт
Техника
Градове
Религия и мистика
Фен клубове
Хоби, Развлечения
Общества
Я, архивите са живи
Клубове Дирене Регистрация Кой е тук Въпроси Списък Купувам / Продавам 16:15 28.04.24 
Хуманитарни науки
   >> Езикознание
Всички теми Следваща тема *Кратък преглед

Страници по тази тема: 1 | 2 | 3 | >> (покажи всички)
Тема машинен превод шльокавица -> български езикнови  
Автор Baлeнтин ()
Публикувано17.04.06 21:09



Здравейте,
интересувам се от мнението на специалисти по въпроса за машинен превод на шльокавица (методиевица, чатица, мейлица).
Какво смятате за

?
Ползва се речник, който е генериран автоматично от списък с много от думите в българския език. Ето една нищожна извадка:


bega бега
bega(4|ch) бегач
bega(4|ch)a бегача
bega(4|ch)i бегачи
bega(4|ch)ite бегачите
bega(4|ch)(k|c|ck)a бегачка
bega(4|ch)(k|c|ck)ata бегачката
bega(4|ch)(k|c|ck)i бегачки
bega(4|ch)(k|c|ck)ite бегачките
bega(4|ch)o бегачо
bega(4|ch)(u|a|y)t бегачът


Предполагам, че се досещате какво значат скобите и чертите - в скобите се съдържат различни варианти на части от думата, а чертите разграничават отделните варианти.
Данните са разделени в 834 файла - програмата се ориентира в кой файл да търси по първите няколко букви от търсената дума (така се ускорява търсенето).

Речникът е генериран автоматично чрез прилагане на следните правила:


а --> a
б --> b
в --> (w|v)
г --> g
д --> d
е --> e
ж --> (v|j|zh|g|zg|z)
з --> z
и --> i
й --> (j|i|y)
к --> (k|c|ck)
л --> l
м --> m
н --> n
о --> o
п --> p
р --> r
с --> s
т --> t
у --> u
ф --> f
х --> (h|x)
ц --> (c|ts|z)
ч --> (4|ch)
ш --> (sh|6)
щ --> (sht|6t)
ъ --> (u|a|y)
ы --> (u|a)
ь --> (j|y|i)
э --> e
ю --> (iu|ju|u)
я --> (ia|ja|q|a|ya)
ё --> e


Освен на този речник, програмата разчита и на това:


[начало_на_дума]nemoga => не мога
[начало_на_дума]neis(k|c)am => не искам
[начало_на_дума]ne(w|v)i(v|j|zh|g|zg|z)dam => не виждам
[начало_на_дума]neobi(ch|4)am => не обичам
[начало_на_дума]nemo(v|j|zh|g|zg|z)e => не може

bulgar => българ
balgar => българ
ercher => ерцхер # изключение: ch не е ч (в думата ерцхерцог)

[начало_на_дума]zeli(a|q)t => целият

[начало_на_дума]mount(v|w)a => монтира

[начало_на_дума](sht|6t)ur(u|o)ti => щуроти
[начало_на_дума](c|k)li(ck|k) => клик

(v|w)azg => важ # важност
lezg => леж # разглеждане, ....
per(fe|f)(k|c|ck)tno => перфектно



# низове от три букви:
[начало_на_дума](w|v)ah[край_на_дума] => вах # update-vah
nix[край_на_дума] => никс
sht => щ
ija => ия
zge[край_на_дума] => же # каже, може
lyo => льо # няма думи, които да съдържат низ "лйо". пример: шльокавица

# низове от две букви:
tz => ц # tzar = цар; shlyokawitza=шльокавица
yo => йо
sh => ш
ux[край_на_дума] => укс
zh => ж
iu => ю
ju => ю
ya => я
ia => я # понякога "ia" е "ия"
tc => ц
ts => ц
ch => ч
lq => ля
ck => к # пример: hacker -> хакер

6t => щ
4 => ч
3 => з
6 => ш


a => а
b => б
c => ц
d => д
e => е
f => ф
g => г
h => х
i => и
j => ж
k => к
l => л
m => м
n => н
o => о
p => п
q => я
r => р
s => с
t => т
u => у
v => в
w => в
x => х
y => у
z => з


Тази процедура се прилага преди думата да се търси в речника. След това се проверява дали думата се съдържа в списъка с думи от българския език (става по-бързо от търсенето в речника). Разбира се списъкът с думите от българския език е разделен също на 834 файла (определянето, коя дума в кой файл се намира, става бързо (по първите две букви), тъй като думите са подредени по азбучен ред).


Моля обърнете внимание на това, че програмата е ; можете да я разпространявате и променяте съгласно условията на лиценза версия 2 или (по ваша преценка) по-нова версия, в този вид, в който е публикуван от Фондацията за свободен софтуер. Програмата се разпространява с надеждата, че ще бъде полезна, но БЕЗ ГАРАНЦИИ, дори без косвена гаранция за ПРИГОДНОСТ ЗА ОПРЕДЕЛЕНА ЦЕЛ. За повече подробности, вижте условията на лиценза GNU GPL.



Тема Re: машинен превод шльокавица -> български езикнови [re: Baлeнтин]  
Авторsoftware (Нерегистриран)
Публикувано19.04.06 14:22



Добре, добре, а уеб страници може ли да превежда Че то иначе на мен не ми трябва.......... Направо като плъгинче към браузъра да дисплейва нещата като хората



Тема Re: машинен превод шльокавица -> български езикнови [re: software]  
Автор Baлeнтин ()
Публикувано19.04.06 18:26



Аз не знам как се прави плъгин за браузър, но който има желание може да го направи - програмата е свободен софтуер и който желае може да направи подходящ интерфейс за да работи с някой браузър (разбира се ще трябва да разпространява получената програма под същите условия, под които е получил оригинала! ако не му харесва - да си пише всичко от нула).



Тема Re: машинен превод шльокавица -> български езикнови [re: Baлeнтин]  
Авторsoftware (Нерегистриран)
Публикувано20.04.06 00:49



Е батка, тази като твоята програма и петокласник я пише, като не можеш да минеш на по-високо ниво, кво ме гощаваш с код, тоя код и аз си го пиша за 3 часа. Нищо де, сигурно ще върши някаква работа, и земи му стегни малко визията на сайтчето, че на нищо не мяза.



Тема Re: машинен превод шльокавица -> български езикнови [re: Baлeнтин]  
Авторsoftware (Нерегистриран)
Публикувано20.04.06 00:58



А ти знаеш ли на кое му викат машинен превод. Леле мале..........Машинен превод, за да има превод, трябва да има два различни езика, и кое точно е преводаческото, машинна транслитераця батка, не се цели на високо, там където няма да стигнеш, ти га напишеш машинен превод..........................аз съм трамвай.





Тема Re: машинен превод шльокавица -> български езикнови [re: software]  
Автор Baлeнтин ()
Публикувано20.04.06 18:32



Програмата не прави транслитерация. Не можеш да ме убедиш, че това e транслитерация (нито пък, че е транскрибиране):

Текст на шльокавица:

Zdr
v momenta editvam edin tekst
razdelih diska na partishani za da si instaliram linoks.
10x za saveta
nemoga da si kompiliram kernela
mountvam si partitiona
installera na tozi linoks e mnogo lesen
tvyrdia disk e 120GB
zabravih passworda
driverite ne mi triabvat


Резултат от превода:

Здравей
в момента редактирам един текст
разделих диска на дялове за да си инсталирам Линукс.
благодаря за съвета
не мога да си компилирам ядрото
монтирам си дяла
инсталатора на този Линукс е много лесен
твърдия диск е 120 гигабайта
забравих паролата
драйверите не ми трябват


И смятам, че шльокавицата е друг език, просто защото така дефинирам това понятие.
Има хора, за които шльокавицата е просто български с латински букви, но аз когато казвам шльокавица имам предвид както "български език с латински букви", така и "разширена версия на българския език, която ползва думи, написани с латински букви и числата 4 и 6, които не могат чрез транслитериране и/или транскрибиране да се преобразуват в български думи".

Редактирано от Baлeнтин на 20.04.06 18:54.



Тема Re: машинен превод шльокавица -> български езикнови [re: software]  
Автор Baлeнтин ()
Публикувано20.04.06 18:43



Разбира се писането на този код не е сложно (особено след като се знае какво трябва да прави този код). По-сложно е да се измисли алгоритъма, а не неговия запис на даден език за програмиране.
Затова пуснах тази тема в точно този форум - защото смятам, че все някой ще сподели някоя идея; нещо за което аз не съм се сетил.

И защо трябва да "стягам визията" на сайта? Все пак не го ползвам за да продавам нещо. И освен това времето ми не е толкова много колкото ми се иска - предпочитам да имам нещо, което работи малко по-добре, отколкото нещо, което е малко по-лъскаво.

Редактирано от Baлeнтин на 20.04.06 18:46.



Тема Re: машинен превод шльокавица -> български езикнови [re: Baлeнтин]  
Авторsoftware (Нерегистриран)
Публикувано20.04.06 19:09



:) Тенкс за разяснението. Сега вече по-прилича на превод. И по ми прилича на програма, в която има смисъл. Обаче си мисля, че това е просто някой товой дипломен проект, защото ако не беше така щеше да го пипнеш малко. А не да ни изсипваш съдържанието от кошчето, нали така. Верно, че има някакви ценни намачкани листа в него, ама.............

И моето мнение си остава, че вие опън сорсъджиите сте просто афункционални, просто нямам думи, изтеглете програмката от тук:

62c-10042006.4.tar.bz2 10-Apr-2006 18:14 13M
62c-10042006.4.tar.bz2.md5 10-Apr-2006 18:13 57
62c-15012006.tar.bz2 15-Jan-2006 10:57 6.4M
62c-15012006.tar.bz2.md5 15-Jan-2006 10:57 55
62c-150420061256.tar.bz2 15-Apr-2006 10:00 15M
62c-150420061256.tar.bz2.md5 15-Apr-2006 09:59 59
62c-200420061824.tar.bz2 20-Apr-2006 15:27 15M
62c-200420061824.tar.bz2.md5 20-Apr-2006 15:26 59
data_1251.tar.gz 12-Jan-2006 21:14 6.7M
demo/ 15-Apr-2006 18:39 -
slackware-packages/ 15-Apr-2006 19:46 -
wget-log 20-Apr-2006 15:46 24K


Ми брао, То екзе, че няма - няма. Че инструкции няма няма-. Че мейла ти не е никъде на видно място на странициата ти - не е. Че е написан като

тук в инфото ти. ................................................... трепач си батка!


Интсрукции за инсталация, ала бала, вие тез неща ги нямате за нищо, тайното ми подозрение като ползувател на опънати продукти - понеже криете недостатъците им, а искате в същото време да се тупате в гърдите. Знам че това е така не се притеснявай, понеже познавам много Линукс опъняци, които са най-страшните, но като ги хванат на тясно са едно голямо нищо. Един наскоро ми се тупаше как щял да си оправи печката. Накрая се оказа че не знае какво има в нея. Но щели да му кажат. Беше многу отворен в начолото, докато подозираше, че не разбрам от печки. Не че разбирам, ама пък не се тупам излишно в гърдите. Така че направи някъв свестен вид на сайтчето, сложи инструкции, кажи програмата, ако въобще може да се инсталира, на каква ос и т.н.

Иначе не работи зле, но по български е недоизпипано. Ние винеги се задоволяваме с малко. За това не можем и нямаме като софтуер почти нищо.



Тема Re: машинен превод шльокавица -> български езикнови [re: Baлeнтин]  
Авторsoftware (Нерегистриран)
Публикувано20.04.06 19:18



А размишленията ти по български езк ще ги пропусна. Не се отличават особена дълбинност. Езика не се изчерпва с азбуката си. Освен нас и гърци и други наред имат проблем с писането на собствената си азбука и на латиница. Този проблем не е само български. Скоро "се опитах да чета" СТАТИЯ на руски писана на латиница. Е как да ти кажа. Пак си беше на руски, лексиката беше напълно руска, без чуждици, без кернели и т.н. Но на латиница. Не става дума за превод от латиница. Кернел аз сега ти го пиша на кирилица. Нещо да имаш да кажеш по въпроса.



Тема Re: машинен превод шльокавица -> български езикнови [re: software]  
Автор Baлeнтин ()
Публикувано20.04.06 19:26



Програмата работи на ГНУ/Линукс. Затова няма exe. Който иска да прави инсталатор зa Windows - ако иска даже и плъгин към Internet Explorer да си направи.

Всеки грамотен потребител на ГНУ/Линукс би трябвало да се досети какво значат тези файлове и имената им - 62c е името на програмата, числата след тирето е версията (ден/месец/година/час/минуи). Това, че файлът завършва на bz2 означава, че е архив във формат bzip2. Такъв файл се разархивира с програма, която се стартира като кликнеш върху него. Файловете, които завършват на md5 са контролни суми на съответните файлове, които не завършват на md5.
Директорията slackware-packages означава "пакети, предназначени за дистрибуцията на ГНУ/Линукс, наречена Slackware". За тези, които не са чували за Slackware очевидно няма никакъв смисъл това име на директория да им говори нещо - съдържанието на директорията е непотребно за тях.
Когато се разархивира архива, има един файл, наречен install.bash. За един потребител на ГНУ/Линукс това говори достатъчно - това е скрипт на bash и трябва да го стартира за да си инсталира програмата (освен ако не е потребител на Slackware - тогава е по-добре да инсталира съответния пакет, предназначен за Slackware).




Страници по тази тема: 1 | 2 | 3 | >> (покажи всички)
Всички темиСледваща тема*Кратък преглед
Клуб :  


Clubs.dir.bg е форум за дискусии. Dir.bg не носи отговорност за съдържанието и достоверността на публикуваните в дискусиите материали.

Никаква част от съдържанието на тази страница не може да бъде репродуцирана, записвана или предавана под каквато и да е форма или по какъвто и да е повод без писменото съгласие на Dir.bg
За Забележки, коментари и предложения ползвайте формата за Обратна връзка | Мобилна версия | Потребителско споразумение
© 2006-2024 Dir.bg Всички права запазени.