машинен превод шльокавица -> български език / Наука / Хуманитарни науки / Езикознание

търси в

Клубове

diri.bg


Име
Парола

• Нов потребител

• Забравена парола

Клубове

• Dir.bg
• Взаимопомощ
• Горещи теми
• Компютри и Интернет
• Контакти
• Култура и изкуство
• Мнения
• Наука
• Политика, Свят
• Спорт
• Техника
• Градове
• Религия и мистика
• Фен клубове
• Хоби, Развлечения
• Общества
• Я, архивите са живи

14:38 25.04.24

Клубове / Наука / Хуманитарни науки / Езикознание
Информация за клуба

Тема	машинен превод шльокавица -> български език
Автор	Baлeнтин ()
Публикувано	17.04.06 21:09

Здравейте,
интересувам се от мнението на специалисти по въпроса за машинен превод на шльокавица (методиевица, чатица, мейлица).
Какво смятате за

Съдържаниет е скрито
Влезте за да го видите

?
Ползва се речник, който е генериран автоматично от списък с много от думите в българския език. Ето една нищожна извадка:

bega бега
bega(4|ch) бегач
bega(4|ch)a бегача
bega(4|ch)i бегачи
bega(4|ch)ite бегачите
bega(4|ch)(k|c|ck)a бегачка
bega(4|ch)(k|c|ck)ata бегачката
bega(4|ch)(k|c|ck)i бегачки
bega(4|ch)(k|c|ck)ite бегачките
bega(4|ch)o бегачо
bega(4|ch)(u|a|y)t бегачът

Предполагам, че се досещате какво значат скобите и чертите - в скобите се съдържат различни варианти на части от думата, а чертите разграничават отделните варианти.
Данните са разделени в 834 файла - програмата се ориентира в кой файл да търси по първите няколко букви от търсената дума (така се ускорява търсенето).

Речникът е генериран автоматично чрез прилагане на следните правила:

а --> a
б --> b
в --> (w|v)
г --> g
д --> d
е --> e
ж --> (v|j|zh|g|zg|z)
з --> z
и --> i
й --> (j|i|y)
к --> (k|c|ck)
л --> l
м --> m
н --> n
о --> o
п --> p
р --> r
с --> s
т --> t
у --> u
ф --> f
х --> (h|x)
ц --> (c|ts|z)
ч --> (4|ch)
ш --> (sh|6)
щ --> (sht|6t)
ъ --> (u|a|y)
ы --> (u|a)
ь --> (j|y|i)
э --> e
ю --> (iu|ju|u)
я --> (ia|ja|q|a|ya)
ё --> e

Освен на този речник, програмата разчита и на това:

[начало_на_дума]nemoga => не мога
[начало_на_дума]neis(k|c)am => не искам
[начало_на_дума]ne(w|v)i(v|j|zh|g|zg|z)dam => не виждам
[начало_на_дума]neobi(ch|4)am => не обичам
[начало_на_дума]nemo(v|j|zh|g|zg|z)e => не може

bulgar => българ
balgar => българ
ercher => ерцхер # изключение: ch не е ч (в думата ерцхерцог)

[начало_на_дума]zeli(a|q)t => целият

[начало_на_дума]mount(v|w)a => монтира

[начало_на_дума](sht|6t)ur(u|o)ti => щуроти
[начало_на_дума](c|k)li(ck|k) => клик

(v|w)azg => важ # важност
lezg => леж # разглеждане, ....
per(fe|f)(k|c|ck)tno => перфектно

# низове от три букви:
[начало_на_дума](w|v)ah[край_на_дума] => вах # update-vah
nix[край_на_дума] => никс
sht => щ
ija => ия
zge[край_на_дума] => же # каже, може
lyo => льо # няма думи, които да съдържат низ "лйо". пример: шльокавица

# низове от две букви:
tz => ц # tzar = цар; shlyokawitza=шльокавица
yo => йо
sh => ш
ux[край_на_дума] => укс
zh => ж
iu => ю
ju => ю
ya => я
ia => я # понякога "ia" е "ия"
tc => ц
ts => ц
ch => ч
lq => ля
ck => к # пример: hacker -> хакер

6t => щ
4 => ч
3 => з
6 => ш

a => а
b => б
c => ц
d => д
e => е
f => ф
g => г
h => х
i => и
j => ж
k => к
l => л
m => м
n => н
o => о
p => п
q => я
r => р
s => с
t => т
u => у
v => в
w => в
x => х
y => у
z => з

Тази процедура се прилага преди думата да се търси в речника. След това се проверява дали думата се съдържа в списъка с думи от българския език (става по-бързо от търсенето в речника). Разбира се списъкът с думите от българския език е разделен също на 834 файла (определянето, коя дума в кой файл се намира, става бързо (по първите две букви), тъй като думите са подредени по азбучен ред).

Моля обърнете внимание на това, че програмата е
Съдържаниет е скрито
Влезте за да го видите
; можете да я разпространявате и променяте съгласно условията на лиценза
Съдържаниет е скрито
Влезте за да го видите
версия 2 или (по ваша преценка) по-нова версия, в този вид, в който е публикуван от Фондацията за свободен софтуер. Програмата се разпространява с надеждата, че ще бъде полезна, но БЕЗ ГАРАНЦИИ, дори без косвена гаранция за ПРИГОДНОСТ ЗА ОПРЕДЕЛЕНА ЦЕЛ. За повече подробности, вижте условията на лиценза GNU GPL.

Съдържаниет е скрито
Влезте за да го видите

Цялата тема
Тема	Автор	Публикувано
машинен превод шльокавица -> български език	Baлeнтин	17.04.06 21:09
Re: машинен превод шльокавица -> български език	software	19.04.06 14:22
Re: машинен превод шльокавица -> български език	Baлeнтин	19.04.06 18:26
Re: машинен превод шльокавица -> български език	software	20.04.06 00:49
Re: машинен превод шльокавица -> български език	Baлeнтин	20.04.06 18:43
Re: машинен превод шльокавица -> български език	software	20.04.06 19:26
Re: машинен превод шльокавица -> български език	software	20.04.06 00:58
Re: машинен превод шльокавица -> български език	Baлeнтин	20.04.06 18:32
Re: машинен превод шльокавица -> български език	software	20.04.06 19:09
Re: машинен превод шльокавица -> български език	Baлeнтин	20.04.06 19:26
Re: машинен превод шльокавица -> български език	software	20.04.06 19:32
Re: машинен превод шльокавица -> български език	Baлeнтин	20.04.06 19:54
Re: машинен превод шльокавица -> български език	software	20.04.06 19:56
Re: машинен превод шльокавица -> български език	Baлeнтин	20.04.06 20:08
Re: машинен превод шльокавица -> български език	software	20.04.06 20:14
Re: машинен превод шльокавица -> български език	Baлeнтин	20.04.06 20:26
Re: машинен превод шльокавица -> български език	software	20.04.06 21:35
Re: машинен превод шльокавица -> български език	Baлeнтин	20.04.06 22:52
Re: машинен превод шльокавица -> български език	software	21.04.06 03:37
Re: машинен превод шльокавица -> български език	Baлeнтин	21.04.06 18:10
Re: машинен превод шльокавица -> български език	software	20.04.06 19:18
Re: машинен превод шльокавица -> български език	Baлeнтин	20.04.06 19:39
Re: машинен превод шльокавица -> български език	software	20.04.06 19:45
Re: машинен превод шльокавица -> български език	Baлeнтин	20.04.06 20:00
Re: машинен превод шльокавица -> български език	Software	20.04.06 20:06
Re: машинен превод шльокавица -> български език	Baлeнтин	20.04.06 20:13

Клуб :

Clubs.dir.bg е форум за дискусии. Dir.bg не носи отговорност за съдържанието и достоверността на публикуваните в дискусиите материали.

Никаква част от съдържанието на тази страница не може да бъде репродуцирана, записвана или предавана под каквато и да е форма или по какъвто и да е повод без писменото съгласие на Dir.bg

За Забележки, коментари и предложения ползвайте формата за Обратна връзка | Мобилна версия | Потребителско споразумение
© 2006-2024 Dir.bg Всички права запазени.