|
Страници по тази тема: 1 | 2 | 3 | >> (покажи всички)
Тема
|
машинен превод шльокавица -> български език
|
|
Автор |
Baлeнтин () |
Публикувано | 17.04.06 21:09 |
|
Здравейте,
интересувам се от мнението на специалисти по въпроса за машинен превод на шльокавица (методиевица, чатица, мейлица).
Какво смятате за ?
Ползва се речник, който е генериран автоматично от списък с много от думите в българския език. Ето една нищожна извадка:
bega бега
bega(4|ch) бегач
bega(4|ch)a бегача
bega(4|ch)i бегачи
bega(4|ch)ite бегачите
bega(4|ch)(k|c|ck)a бегачка
bega(4|ch)(k|c|ck)ata бегачката
bega(4|ch)(k|c|ck)i бегачки
bega(4|ch)(k|c|ck)ite бегачките
bega(4|ch)o бегачо
bega(4|ch)(u|a|y)t бегачът
Предполагам, че се досещате какво значат скобите и чертите - в скобите се съдържат различни варианти на части от думата, а чертите разграничават отделните варианти.
Данните са разделени в 834 файла - програмата се ориентира в кой файл да търси по първите няколко букви от търсената дума (така се ускорява търсенето).
Речникът е генериран автоматично чрез прилагане на следните правила:
а --> a
б --> b
в --> (w|v)
г --> g
д --> d
е --> e
ж --> (v|j|zh|g|zg|z)
з --> z
и --> i
й --> (j|i|y)
к --> (k|c|ck)
л --> l
м --> m
н --> n
о --> o
п --> p
р --> r
с --> s
т --> t
у --> u
ф --> f
х --> (h|x)
ц --> (c|ts|z)
ч --> (4|ch)
ш --> (sh|6)
щ --> (sht|6t)
ъ --> (u|a|y)
ы --> (u|a)
ь --> (j|y|i)
э --> e
ю --> (iu|ju|u)
я --> (ia|ja|q|a|ya)
ё --> e
Освен на този речник, програмата разчита и на това:
[начало_на_дума]nemoga => не мога
[начало_на_дума]neis(k|c)am => не искам
[начало_на_дума]ne(w|v)i(v|j|zh|g|zg|z)dam => не виждам
[начало_на_дума]neobi(ch|4)am => не обичам
[начало_на_дума]nemo(v|j|zh|g|zg|z)e => не може
bulgar => българ
balgar => българ
ercher => ерцхер # изключение: ch не е ч (в думата ерцхерцог)
[начало_на_дума]zeli(a|q)t => целият
[начало_на_дума]mount(v|w)a => монтира
[начало_на_дума](sht|6t)ur(u|o)ti => щуроти
[начало_на_дума](c|k)li(ck|k) => клик
(v|w)azg => важ # важност
lezg => леж # разглеждане, ....
per(fe|f)(k|c|ck)tno => перфектно
# низове от три букви:
[начало_на_дума](w|v)ah[край_на_дума] => вах # update-vah
nix[край_на_дума] => никс
sht => щ
ija => ия
zge[край_на_дума] => же # каже, може
lyo => льо # няма думи, които да съдържат низ "лйо". пример: шльокавица
# низове от две букви:
tz => ц # tzar = цар; shlyokawitza=шльокавица
yo => йо
sh => ш
ux[край_на_дума] => укс
zh => ж
iu => ю
ju => ю
ya => я
ia => я # понякога "ia" е "ия"
tc => ц
ts => ц
ch => ч
lq => ля
ck => к # пример: hacker -> хакер
6t => щ
4 => ч
3 => з
6 => ш
a => а
b => б
c => ц
d => д
e => е
f => ф
g => г
h => х
i => и
j => ж
k => к
l => л
m => м
n => н
o => о
p => п
q => я
r => р
s => с
t => т
u => у
v => в
w => в
x => х
y => у
z => з
Тази процедура се прилага преди думата да се търси в речника. След това се проверява дали думата се съдържа в списъка с думи от българския език (става по-бързо от търсенето в речника). Разбира се списъкът с думите от българския език е разделен също на 834 файла (определянето, коя дума в кой файл се намира, става бързо (по първите две букви), тъй като думите са подредени по азбучен ред).
Моля обърнете внимание на това, че програмата е ; можете да я разпространявате и променяте съгласно условията на лиценза версия 2 или (по ваша преценка) по-нова версия, в този вид, в който е публикуван от Фондацията за свободен софтуер. Програмата се разпространява с надеждата, че ще бъде полезна, но БЕЗ ГАРАНЦИИ, дори без косвена гаранция за ПРИГОДНОСТ ЗА ОПРЕДЕЛЕНА ЦЕЛ. За повече подробности, вижте условията на лиценза GNU GPL.
| |
Тема
|
Re: машинен превод шльокавица -> български език
[re: Baлeнтин]
|
|
Автор | software (Нерегистриран) |
Публикувано | 19.04.06 14:22 |
|
Добре, добре, а уеб страници може ли да превежда Че то иначе на мен не ми трябва.......... Направо като плъгинче към браузъра да дисплейва нещата като хората
| |
Тема
|
Re: машинен превод шльокавица -> български език
[re: software]
|
|
Автор |
Baлeнтин () |
Публикувано | 19.04.06 18:26 |
|
Аз не знам как се прави плъгин за браузър, но който има желание може да го направи - програмата е свободен софтуер и който желае може да направи подходящ интерфейс за да работи с някой браузър (разбира се ще трябва да разпространява получената програма под същите условия, под които е получил оригинала! ако не му харесва - да си пише всичко от нула).
| |
Тема
|
Re: машинен превод шльокавица -> български език
[re: Baлeнтин]
|
|
Автор | software (Нерегистриран) |
Публикувано | 20.04.06 00:49 |
|
Е батка, тази като твоята програма и петокласник я пише, като не можеш да минеш на по-високо ниво, кво ме гощаваш с код, тоя код и аз си го пиша за 3 часа. Нищо де, сигурно ще върши някаква работа, и земи му стегни малко визията на сайтчето, че на нищо не мяза.
| |
Тема
|
Re: машинен превод шльокавица -> български език
[re: Baлeнтин]
|
|
Автор | software (Нерегистриран) |
Публикувано | 20.04.06 00:58 |
|
А ти знаеш ли на кое му викат машинен превод. Леле мале..........Машинен превод, за да има превод, трябва да има два различни езика, и кое точно е преводаческото, машинна транслитераця батка, не се цели на високо, там където няма да стигнеш, ти га напишеш машинен превод..........................аз съм трамвай.
| |
Тема
|
Re: машинен превод шльокавица -> български език
[re: software]
|
|
Автор |
Baлeнтин () |
Публикувано | 20.04.06 18:32 |
|
Програмата не прави транслитерация. Не можеш да ме убедиш, че това e транслитерация (нито пък, че е транскрибиране):
Текст на шльокавица:
Zdr
v momenta editvam edin tekst
razdelih diska na partishani za da si instaliram linoks.
10x za saveta
nemoga da si kompiliram kernela
mountvam si partitiona
installera na tozi linoks e mnogo lesen
tvyrdia disk e 120GB
zabravih passworda
driverite ne mi triabvat
Резултат от превода:
Здравей
в момента редактирам един текст
разделих диска на дялове за да си инсталирам Линукс.
благодаря за съвета
не мога да си компилирам ядрото
монтирам си дяла
инсталатора на този Линукс е много лесен
твърдия диск е 120 гигабайта
забравих паролата
драйверите не ми трябват
И смятам, че шльокавицата е друг език, просто защото така дефинирам това понятие.
Има хора, за които шльокавицата е просто български с латински букви, но аз когато казвам шльокавица имам предвид както "български език с латински букви", така и "разширена версия на българския език, която ползва думи, написани с латински букви и числата 4 и 6, които не могат чрез транслитериране и/или транскрибиране да се преобразуват в български думи".
Редактирано от Baлeнтин на 20.04.06 18:54.
| |
Тема
|
Re: машинен превод шльокавица -> български език
[re: software]
|
|
Автор |
Baлeнтин () |
Публикувано | 20.04.06 18:43 |
|
Разбира се писането на този код не е сложно (особено след като се знае какво трябва да прави този код). По-сложно е да се измисли алгоритъма, а не неговия запис на даден език за програмиране.
Затова пуснах тази тема в точно този форум - защото смятам, че все някой ще сподели някоя идея; нещо за което аз не съм се сетил.
И защо трябва да "стягам визията" на сайта? Все пак не го ползвам за да продавам нещо. И освен това времето ми не е толкова много колкото ми се иска - предпочитам да имам нещо, което работи малко по-добре, отколкото нещо, което е малко по-лъскаво.
Редактирано от Baлeнтин на 20.04.06 18:46.
| |
Тема
|
Re: машинен превод шльокавица -> български език
[re: Baлeнтин]
|
|
Автор | software (Нерегистриран) |
Публикувано | 20.04.06 19:09 |
|
:) Тенкс за разяснението. Сега вече по-прилича на превод. И по ми прилича на програма, в която има смисъл. Обаче си мисля, че това е просто някой товой дипломен проект, защото ако не беше така щеше да го пипнеш малко. А не да ни изсипваш съдържанието от кошчето, нали така. Верно, че има някакви ценни намачкани листа в него, ама.............
И моето мнение си остава, че вие опън сорсъджиите сте просто афункционални, просто нямам думи, изтеглете програмката от тук:
62c-10042006.4.tar.bz2 10-Apr-2006 18:14 13M
62c-10042006.4.tar.bz2.md5 10-Apr-2006 18:13 57
62c-15012006.tar.bz2 15-Jan-2006 10:57 6.4M
62c-15012006.tar.bz2.md5 15-Jan-2006 10:57 55
62c-150420061256.tar.bz2 15-Apr-2006 10:00 15M
62c-150420061256.tar.bz2.md5 15-Apr-2006 09:59 59
62c-200420061824.tar.bz2 20-Apr-2006 15:27 15M
62c-200420061824.tar.bz2.md5 20-Apr-2006 15:26 59
data_1251.tar.gz 12-Jan-2006 21:14 6.7M
demo/ 15-Apr-2006 18:39 -
slackware-packages/ 15-Apr-2006 19:46 -
wget-log 20-Apr-2006 15:46 24K
Ми брао, То екзе, че няма - няма. Че инструкции няма няма-. Че мейла ти не е никъде на видно място на странициата ти - не е. Че е написан като тук в инфото ти. ................................................... трепач си батка!
Интсрукции за инсталация, ала бала, вие тез неща ги нямате за нищо, тайното ми подозрение като ползувател на опънати продукти - понеже криете недостатъците им, а искате в същото време да се тупате в гърдите. Знам че това е така не се притеснявай, понеже познавам много Линукс опъняци, които са най-страшните, но като ги хванат на тясно са едно голямо нищо. Един наскоро ми се тупаше как щял да си оправи печката. Накрая се оказа че не знае какво има в нея. Но щели да му кажат. Беше многу отворен в начолото, докато подозираше, че не разбрам от печки. Не че разбирам, ама пък не се тупам излишно в гърдите. Така че направи някъв свестен вид на сайтчето, сложи инструкции, кажи програмата, ако въобще може да се инсталира, на каква ос и т.н.
Иначе не работи зле, но по български е недоизпипано. Ние винеги се задоволяваме с малко. За това не можем и нямаме като софтуер почти нищо.
| |
Тема
|
Re: машинен превод шльокавица -> български език
[re: Baлeнтин]
|
|
Автор | software (Нерегистриран) |
Публикувано | 20.04.06 19:18 |
|
А размишленията ти по български езк ще ги пропусна. Не се отличават особена дълбинност. Езика не се изчерпва с азбуката си. Освен нас и гърци и други наред имат проблем с писането на собствената си азбука и на латиница. Този проблем не е само български. Скоро "се опитах да чета" СТАТИЯ на руски писана на латиница. Е как да ти кажа. Пак си беше на руски, лексиката беше напълно руска, без чуждици, без кернели и т.н. Но на латиница. Не става дума за превод от латиница. Кернел аз сега ти го пиша на кирилица. Нещо да имаш да кажеш по въпроса.
| |
Тема
|
Re: машинен превод шльокавица -> български език
[re: software]
|
|
Автор |
Baлeнтин () |
Публикувано | 20.04.06 19:26 |
|
Програмата работи на ГНУ/Линукс. Затова няма exe. Който иска да прави инсталатор зa Windows - ако иска даже и плъгин към Internet Explorer да си направи.
Всеки грамотен потребител на ГНУ/Линукс би трябвало да се досети какво значат тези файлове и имената им - 62c е името на програмата, числата след тирето е версията (ден/месец/година/час/минуи). Това, че файлът завършва на bz2 означава, че е архив във формат bzip2. Такъв файл се разархивира с програма, която се стартира като кликнеш върху него. Файловете, които завършват на md5 са контролни суми на съответните файлове, които не завършват на md5.
Директорията slackware-packages означава "пакети, предназначени за дистрибуцията на ГНУ/Линукс, наречена Slackware". За тези, които не са чували за Slackware очевидно няма никакъв смисъл това име на директория да им говори нещо - съдържанието на директорията е непотребно за тях.
Когато се разархивира архива, има един файл, наречен install.bash. За един потребител на ГНУ/Линукс това говори достатъчно - това е скрипт на bash и трябва да го стартира за да си инсталира програмата (освен ако не е потребител на Slackware - тогава е по-добре да инсталира съответния пакет, предназначен за Slackware).
| |
Тема
|
Re: машинен превод шльокавица -> български език
[re: Baлeнтин]
|
|
Автор | software (Нерегистриран) |
Публикувано | 20.04.06 19:26 |
|
Добре, нямам предвид да го излъскаш с фотошоп, един бутон бек, и начин да се ползва формата за "превод" многократно е достатъчен на най-първо време, плюс малко инструкции. Това не е чак толкова трудно?
За да е използваемо. Не мисли, че само се заяждам ей така, ще ми се да се радват всички на тази програмка и тя да стане наистина "за ползване", след като така и така си се трудил по въпроса, аз скоро четох доста по темата - спелчекъри. Такива в чужбина има от доста отдавна. Има цели лингвистични изследвания по въпроса.
| |
Тема
|
Re: машинен превод шльокавица -> български език
[re: Baлeнтин]
|
|
Автор | software (Нерегистриран) |
Публикувано | 20.04.06 19:32 |
|
Ако можеш наклая да ме навиеш и да си инсталирам Линукс, цена няма да имаш.
| |
Тема
|
Re: машинен превод шльокавица -> български език
[re: software]
|
|
Автор |
Baлeнтин () |
Публикувано | 20.04.06 19:39 |
|
В естествените езици една дума (или израз) може да има няколко значения. Даже има случаи един човек да не се досеща неговият събеседник кое значение на дадена дума (израз) има предвид. Даже е невъзможно това да не се случва достатъчно често.
Аз мога да кажа, че шльокавицата е българския език с латински букви и арабски цифри. Мога да кажа също така, че шльокавицата е друг език. Това не значи, че си провитвореча - това означава, че в двата случая имам предвид съвсем различни значения на израза бъларски език. Ако отвориш и прочетеш какво пише в тълковните речници за думата "език", ще се убедиш, че там това понятие е дефинирано доста мъгляво и всеки може да му придава каквото си иска значение.
Смятам, че с това темата се изчерпа и няма смисъл повече да разискваме дали шльокавицата е друг език или просто си е български с латински букви и арабски цифри. Това е въпрос на терминология и не е особено важно.
| |
Тема
|
Re: машинен превод шльокавица -> български език
[re: Baлeнтин]
|
|
Автор | software (Нерегистриран) |
Публикувано | 20.04.06 19:45 |
|
razgovora na Alice s H-D, kojto kazva, 4e dumata prinadlezhi na nego i 6te j slaga kakvoto zna4enie si iska
разговора на Алице с Х-Д, който казва, че думата принадлежи на него и ще ж слага каквото значение си иска
сложи алгоритам за самостоятелно "j" между две шпации да е "й".
| |
Тема
|
Re: машинен превод шльокавица -> български език
[re: software]
|
|
Автор |
Baлeнтин () |
Публикувано | 20.04.06 19:54 |
|
Не виждам смисъл да се опитвам да убеждавам хората да си инсталират Линукс или да вярват в нещо.
Както виждаш от страниците ми, аз не се опитвам да убеждавам хората в нещо. Просто им го показвам (т.е. сложил съм хипервръзки към разни сайтове - Линукс за българи, Уикипдеия) - те да се оправят нататък.
Ако искаш да разбереш защо някои хора гледат да ползват свободен софтеур, може да прегледаш четивата от раздела "философия и история" на тази страница:
Ако искаш аргументи против "Линукс и отворения код" - вж. книгата на .
| |
Тема
|
Re: машинен превод шльокавица -> български език
[re: Baлeнтин]
|
|
Автор | software (Нерегистриран) |
Публикувано | 20.04.06 19:56 |
|
И аз ползвам свободен софтуер по много причини, например защото понякога е добре написан. Но когато не е, нищо не може да ме накара да го ползвам.
| |
Тема
|
Re: машинен превод шльокавица -> български език
[re: software]
|
|
Автор |
Baлeнтин () |
Публикувано | 20.04.06 20:00 |
|
По-скоро трябва се сложи ударено и. Това ще работи само на кодиране UTF-8. Във версията, която работи с кодиране CP1251 ще го преобразува на обикновено и.
| |
Тема
|
Re: машинен превод шльокавица -> български език
[re: Baлeнтин]
|
|
Автор | Software (Нерегистриран) |
Публикувано | 20.04.06 20:06 |
|
Ми убаво, тури квот искаш да не е ж. Ако нямаш нищо против, че ти поразчета кода, че ми стана интересно това ще ме хвърли леко във хорор-филма инсталирай Линукс 1 част.
| |
Тема
|
Re: машинен превод шльокавица -> български език
[re: software]
|
|
Автор |
Baлeнтин () |
Публикувано | 20.04.06 20:08 |
|
Съществуват хора, които ползват свободния софтуер, дори и когато не работи идеално, за да могат да се запознаят по-добре с недостатъците му и по този начин да го подобрят (или да кажат на автора какво трябва да се оправи). Ако пък е много зле - направо пристъпват към подобряването му или писане на аналогичен софтуер (ако няма вече написан) (разбира се докато свободния софтуер стане използваем карат на несвободен, който към момента върши работа).
Аз например не се гнуся да ползвам несвободен софтуер - почти всеки ден го правя. Но го правя главно защото ми плащат за това :-) Иначе безплатно не бих го правил. Неслучайно на домашния компютър ползвам предимно свободен софтуер.
Но за съжаление няма свободен софтуер за всичко - понякога се налага да се ползва несвободен докато някой (някоя група хора) не напише свободен софтуер за съответната задача.
| |
Тема
|
Re: машинен превод шльокавица -> български език
[re: Software]
|
|
Автор |
Baлeнтин () |
Публикувано | 20.04.06 20:13 |
|
Разбира се, че нямам нищо против :-) Даже ще се радвам - аз затова съм го публикувал под лиценз GNU GPL - за да може всеки, който желае да го чете, използва и подобрява
Едва ли ще разбереш нещо от инсталиране на Линукс след прочитане на кода - той е почти еднакъв с този за всяка друга операционна система. Със съвсем леки промени ще работи на всяка друга операционна система, с инсталиран Perl (подходяща версия).
| |
Тема
|
Re: машинен превод шльокавица -> български език
[re: Baлeнтин]
|
|
Автор | software (Нерегистриран) |
Публикувано | 20.04.06 20:14 |
|
Е батка принципно си прав, но аз ако мога да дам 30$ и да си реша проблема от раз и то добре, вместо да се трепя цял живот като куче да пиша неща като добавки за кофти софтуер - например Миранда, извинявай ама това нещо съкс и то отвсякъде. И в мен живее някакъв идеализъм и аз съм за това да има свободен софтуер, но няма нищо по-важно от това един софтуер да върши работа, той е писан предимно за това, а не да си губиш времето с него. Тоест процента на използваемост трябва да е по-голям от прозента "надежда някой ден да работи".
| |
Тема
|
Re: машинен превод шльокавица -> български език
[re: software]
|
|
Автор |
Baлeнтин () |
Публикувано | 20.04.06 20:26 |
|
Разни хора - разни идеали. Благодарение на "идеалистите" съществуват много от свободните програми.
Има хора, за които е важно програмата да работи, приблизително толкова, колкото да задоволяват нуждите си от творчество, чрез писане на софтуер. И когато пишат софтуер, който ползват, тогава са най-щастливи. Много често създателите на свободен софтуер, са и негови потребители и са започнали да създават даден продукт, защото не са успели да намерят такъв какъвто търсят.
Понякога не можеш по никакъв начин да убедиш дадена фирма, която произвежда една програма, да вгради в програмата някаква функционалност на разумна цена. Тогава е добра идея да си напишеш своя собствена програма, която да можеш да променяш както си искаш, и като я публикуваш да си намериш хора, които безплатно ще ти я подобряват.
В Линукс за българи има една статия, за която се твърди че е добре да бъде прочетена от потребители, които искат да преминават от Windows на Линукс - . Не мога да кажа, че съм съгласен 100% с нея, но има и неща, с които се съгласявам. Виж и коментарите. Много от писанията в полза на Линукс или против Линукс са безсмислен флейм (не само от посочената статия).
Спирам вече. Повече няма да преразказвам вече .
Редактирано от Baлeнтин на 20.04.06 20:46.
| |
Тема
|
Re: машинен превод шльокавица -> български език
[re: Baлeнтин]
|
|
Автор | software (Нерегистриран) |
Публикувано | 20.04.06 21:35 |
|
Ти си комунист батка. Проповядваш ми, че ако се борим с дружни усилия ще преминем от смотан опънат свободен софтуер към добър опънат свободен софтуер. И аз съм комунист, но комунист песимист.
Обаче истината е че добрия безплатен софтуер, който е фрии, и пак в някакъв смисъл свободен, най често изобщо не е опънат
| |
Тема
|
Re: машинен превод шльокавица -> български език
[re: software]
|
|
Автор |
Baлeнтин () |
Публикувано | 20.04.06 22:52 |
|
Не съм комунист. Нищо не проповядвам.
Свободният софтуер не е комунизъм. При комунизма те принуждават да правиш нещо (да споделяш с другите - от всеки според възможностите, на всеки според нуждите). А свободния софтуер (в условията на демокрация) може да го ползваш само ако желаеш - никой не те принуждава. Ако не - може да си ползваш несвободен софтуер. Също така никой не те кара да споделяш (да пишеш свободен софтуер). Имаш право да избираш какви права да имат потребителите на твоята интелектувална собственост (закон за авторските права).
Дружните усилия са невъзможни по принцип. Скапан софтуер винаги ще има - както свободен, така и несвободен. Ненаписан софтуер - също. Мотивацията на различните хора да направят нещо е различна. Хората са различни.
Вярно е, че има гръмогласни потребители и разработчици на свободен софтеур, които са комунисти, но това не значи, че всички са такива.
Свободният софтуер засилва ефекта от пазарната икономика - всеки има право да плаща на когото си поиска по подобряването на свободния софтуер. Когато софтуерът е несвободен, само собственикът на софтуера има право да събира пари за подобряване на софтуера. Свободният софтуер не позволява да има такъв монопол. (Разбира се това не значи непременно много ниска цена на свободния софтуер; понякога свободния софтуер може да струва многократно повече от несвободния - това е нормално, защото в много случаи по-качественото е и по-скъпо).
Достатъчно вече преразказах неща, които вече са .
| |
Тема
|
Re: машинен превод шльокавица -> български език
[re: Baлeнтин]
|
|
Автор | software (Нерегистриран) |
Публикувано | 21.04.06 03:37 |
|
Линукс - Селска чест. Съжалявам не можах да се сдържа.
| |
Тема
|
Re: машинен превод шльокавица -> български език
[re: software]
|
|
Автор |
Baлeнтин () |
Публикувано | 21.04.06 18:10 |
|
Какво е това "селска чест"?
| |
|
Страници по тази тема: 1 | 2 | 3 | >> (покажи всички)
|
|
|