Авторизация:

Проблема с кодировкой иврита

Создать тему  |  Поиск

Найти сообщения:  За сутки  |  Без ответов
Автор Сообщение
Ссылка06.05.2008 в 10:48
Cтолкнулся с проблемой вывода букв иврита. Кодировка документа стоит utf8, буквы отображаются нормально в в документе. А вот, когда пытаюсь вывести в <input type="text"> для редактирования, то получаю набор значений, типа &#1508;&#1512;&#1493;&#1508;&#1497;&#1500; &#1513;&#1500; &#1513;&#1500;&#1502;&#1492;
Как этот набор кодов привратить в символы из иврита?
Ссылка06.05.2008 в 11:40
Цитата:
А вот, когда пытаюсь вывести в <input type="text"> для редактирования

не понятно - куда и что выводите?
Ссылка06.05.2008 в 11:44
Из базы в этот элемент вывожу данные
Ссылка06.05.2008 в 12:05
Ну, продолжайте мысль. В базе какая кодировка, чем выводите - php у вас или что, как выводите?
Ссылка06.05.2008 в 13:36
Да, php. Вывожу в инпут средствами библиотеки xajax($objResponse->addAssign('inputname','value',<значение>. В базе кодировка юникод. И что это дает?
Ссылка06.05.2008 в 13:46
Дает хотя бы понимание того с какой стороны подойти к вопросу
http://xajaxproject.org/wiki/tutorials:character_e...
читали?
Ссылка06.05.2008 в 16:31
Нет, но я знаю, что по умолчанию все данные передаются в юникоде, что меня устраивает и это все работает, если я вывод данных из базы сделаю куда-нибудь в див, типа $objResponse->addAssign('divname','innerHTML',<значение> ) и символы отображаются, как им надо(т.е. иероглифами). А вот в случае вывода данных в инпут получаю коды. Как их там превратить в иероглифы?
Ссылка06.05.2008 в 17:37
Сдаюсь, не знаю, нет возможности проверить.
Ссылка06.05.2008 в 18:15
... всюду ставить utf-8 и жестко пресекать другие варианты
Ссылка06.05.2008 в 18:39
Utf-8 стоит везде. И вывод в див дает нужные иероглифы. А вот вывод в инпут для редактирования дает коды. Для примера можете вывести коды, которые в первом посте в див в документе с юникод кодировкой и он даст нормальный результат. А вот в инпут они уйдут без изменений.
Ссылка06.05.2008 в 19:03  [Отредактировано: 06.05.2008 в 19:03]
Х/з действительно... помнится мастерхост этим глючил - еще правил htaccess на
Код:
AddType "text/html; charset=utf-8" .htm
AddDefaultCharset Off
Ссылка06.05.2008 в 21:50
Ох, уж этот иврит...) вспомнился анекдот:слепой перепутал книгу со специальными знаками с мацой (лепешка, которая в произвольном порядке проколота вилкой). " читает" пальцами, ничего не может понять, и кричит:"что за ненормальный написал этот бред!"
Ссылка07.05.2008 в 20:16  [Отредактировано: 07.05.2008 в 20:17]
Сложно так сказать, надо смотреть. У меня есть сайт на иврите, там все нормально с выводом в input для редактирования.
Причем оба варианта (и строчка в виде последовательности кодов символов и просто иврит в таблицах) выводятся нормально.
Естественно нужно проверить, чтобы и БД была в utf и страница сама тоже.
Потом попробовать прописать в файле .htaccess следующее:
Код:
CharsetDisable On
AddDefaultCharset UTF-8


Попробуйте выводить средствами php сначала, если все будет нормально, значит дело в xajax
Ссылка08.05.2008 в 15:16  [Отредактировано: 08.05.2008 в 15:30]
В спецификации html говорится о некоторых заранее определяемых флагах...
дык вот... их молжно определить сразу ко всему телу HTML т.е.
Код:

<HTML lang="fr">

а можно к отдельным элементам, как в принципе и указать кодировку.
вот спецификация по формам:
http://www.w3.org/tr/html401/interact/forms.html
вот по языковым параметрам:
http://www.w3.org/tr/html401/struct/dirlang.html#l...
http://www.w3.org/tr/html401/struct/dirlang.html#b...

там много полезного по этому поводу написано....

кстати... у xajax есть проблемы с кодировкой отличной от стандартной "виндовой" и с языками отличными от английского...
Ссылка14.05.2008 в 18:41
А знаете ли вы, что utf8_general_ci отличается от utf8_unicode_ci?