|
Тема |
Re: използване на "Combining Diacritical Marks" [re: Caмия Инжинep] |
|
Автор | l (Нерегистриран) | |
Публикувано | 03.07.03 19:37 |
|
|
Би трябвало да се чете винаги, защото е част от Unicode стандарта. Отделен е въпросът дали всички приложения, които претендират че поддържат Unicode наистина го поддържат :)
Предимства:
- няма нужда да се чака някой да благоволи да добави гласните от кирилицата с ударения в Unicode
- лесно се реализира "точно" и "неточно" сравнение на текст. Просто във втория случай, наличието на символи от 0300 до 036F се игнорира. Неприятното е, че програмите в момента не могат да правят "неточно" търсене :(
- ако все пак някога се добавят гласни с ударения, просто се дефинират правила за еквивалентност и нормализация (те са част от Unicode) и всяка програма която поддържа Unicode ще знае, че двете форми са еквивалентни.
Недостатъци:
- гласните с ударения ще се представят от два символа
|
| |
|
|
|