Я использую функцию PHP imagettftext () для преобразования текста в изображение GIF. Текст, который я конвертирую, содержит символы Юникода, включая японский. На моем локальном компьютере (Ubuntu 7.10) все работает нормально, но на моем сервере веб-хостинга японские символы искажены. В чем может быть разница? Все должно быть в кодировке UTF-8.
Сломанное изображение на сервере веб-хостинга: http://www.ibeni.net/flashcards/imagetest.php
Копия правильного изображения с моего локального компьютера: http://www.ibeni.net/flashcards/imagetest.php.gif
Копия phpinfo () с моего локального компьютера: http://www.ibeni.net/flashcards/phpinfo.php.html
Копия phpinfo () с моего сервера веб-хостинга: http://example5.nfshost.com/phpinfo
Код:
mb_language('uni');
mb_internal_encoding('UTF-8');
header('Content-type: image/gif');
$text = '日本語';
$font = './Cyberbit.ttf';
// Create the image
$im = imagecreatetruecolor(160, 160);
$white = imagecolorallocate($im, 255, 255, 255);
$black = imagecolorallocate($im, 0, 0, 0);
// Create some colors
imagefilledrectangle($im, 0, 0, 159, 159, $white);
// Add the text
imagettftext($im, 12, 0, 20, 20, $black, $font, $text);
imagegif ($im);
imagedestroy($im);






Мой главный подозреваемый - это шрифт, который вы используете для рендеринга.
Согласно http://fr3.php.net/imagettftext, разные версии библиотеки GD, используемые php, могут демонстрировать разное поведение.
Редактировать:
Еще одна идея: можете ли вы убедиться, что $text = '日本語'; действительно сохранен таким образом на вашем рабочем сервере? Возможно, в вашем скрипте есть проблема с кодировкой.
Следующее редактирование: BKB это уже предлагал. Так что на случай, если причина в этом: он первым дал ответ ;-)
Этот конкретный файл шрифта существует на вашей производственной машине? Если вы используете FTP для загрузки файлов, используете ли вы двоичное кодирование?
Вот решение, которое наконец сработало для меня:
$text = "你好";
// Convert UTF-8 string to HTML entities
$text = mb_convert_encoding($text, 'HTML-ENTITIES',"UTF-8");
// Convert HTML entities into ISO-8859-1
$text = html_entity_decode($text,ENT_NOQUOTES, "ISO-8859-1");
// Convert characters > 127 into their hexidecimal equivalents
$out = "";
for($i = 0; $i < strlen($text); $i++) {
$letter = $text[$i];
$num = ord($letter);
if ($num>127) {
$out .= "&#$num;";
} else {
$out .= $letter;
}
}
Преобразование строки в объекты HTML работает, за исключением того, что функция imagettftext () не принимает именованные объекты. Например,
日本語
нормально, но
ç
не является. При обратном преобразовании в ISO-8859-1 именованные объекты преобразуются обратно в символы, но возникает вторая проблема. imagettftext () не поддерживает символы со значением больше> 127. Последний цикл for кодирует эти символы в шестнадцатеричном формате. Это решение работает для меня с текстом, который я использую (включая японские, китайские и латинские символы с акцентом для португальского), но я не уверен на 100%, что оно будет работать во всех случаях.
Вся эта гимнастика необходима, потому что imagettftext () на самом деле не принимает строки UTF-8 на моем сервере.
Почему UTF-8> HTML-объекты> преобразование ISO-8859 вместо простого UTF-8> ISO-8859?
+1 Как уже упоминал deceze, я бы, вероятно, выбрал iconv('UTF-8', 'ISO-8859-1', $text) вместо подхода сущностей, но в остальном преобразование в шестнадцатеричное представление - это выход! Спасибо за чаевые!
и UTF-8 в ISO-8859-1 имеет функцию, ее utf8_decode
@deceze, потому что речь не идет о преобразовании кодировки
У меня была такая же проблема со сценарием, который будет отображать текст в изображении и выводить его. Проблема заключалась в том, что из-за разных браузеров (или устойчивости кода / паранойи, как бы вы ни думали об этом) у меня не было возможности узнать, какая кодировка была помещена в массив $_GET.
Вот как я решил проблему.
$item_text = $_GET['text'];
# detect if the string was passed in as unicode
$text_encoding = mb_detect_encoding($item_text, 'UTF-8, ISO-8859-1');
# make sure it's in unicode
if ($text_encoding != 'UTF-8') {
$item_text = mb_convert_encoding($item_text, 'UTF-8', $text_encoding);
}
# html numerically-escape everything (&#[dec];)
$item_text = mb_encode_numericentity($item_text,
array (0x0, 0xffff, 0, 0xffff), 'UTF-8');
Это решает любую проблему с imagettftext, который не может обрабатывать символы выше # 127, просто заменяя ВСЕ символы (включая многобайтовые символы Unicode) на их числовые символы HTML - "& # 65;" для "A", "& # 66;" для "B" и т. д., о поддержке которых заявляет страница руководства.
У меня тоже сработало. Я пытался напечатать символ TM. Однако работал только с определенными шрифтами, хотя все шрифты, которые я пробовал, содержали символы.
У меня такая же проблема. Помогло преобразование шрифта из otf в ttf. Вы можете использовать FontForge (доступный в стандартном репозитории) для конвертации.
Этот комментарий сэкономил мне много часов на отладку. Совет, если вы не хотите использовать FontForge: http://www.freefontconverter.com/
Однозначно лучшее решение здесь!
Это комментарий, а не ответ на вопрос, отсюда и отрицательный голос.