|
Тема |
Regexp и немски умлаути (буквите с 2 точки отгоре) |
|
Автор | rahj (Нерегистриран) | |
Публикувано | 23.03.05 00:01 |
|
|
Здравейте,
Чета един файл и искам да стрипна всичко, що не е алфа-нумерик или интервал. Дотук добре, обаче файла е на немски и ми маха и въпросните спешъл-символи.
Пробвах така:
$file_contents = ereg_replace("[^\u00DC\u00FC\u00C4\u00E4\u00D6\u00F6\u00DFa-zA-Z0-9 ]", "", $file_contents);
,където \u00DC, \u00FC .. са юникодовете на символите, взети от уърд-а (кодовете ги взех от там; от "Insert Symbol" диалога), обаче не става; тоест regexp-а не ги match-ва.
После пробвах и директно да ги плясна в регекспа ето така (само че тук във форума нещо не излизат както трябва):
$file_contents = ereg_replace("[^ÄäÖöÜüßa-zA-Z0-9 ]", "", $file_contents);
но и сам не си вярвах, че ще стане
Имате ли идеи как да накарам Regexp-а да match-ва и тези символи??
|
| |
|
|
|