Функция PHP imagettftext () и юникод

Я использую функцию PHP imagettftext () для преобразования текста в изображение GIF. Текст, который я конвертирую, содержит символы Юникода, включая японский. На моем локальном компьютере (Ubuntu 7.10) все работает нормально, но на моем сервере веб-хостинга японские символы искажены. В чем может быть разница? Все должно быть в кодировке UTF-8.

Сломанное изображение на сервере веб-хостинга: http://www.ibeni.net/flashcards/imagetest.php

Копия правильного изображения с моего локального компьютера: http://www.ibeni.net/flashcards/imagetest.php.gif

Копия phpinfo () с моего локального компьютера: http://www.ibeni.net/flashcards/phpinfo.php.html

Копия phpinfo () с моего сервера веб-хостинга: http://example5.nfshost.com/phpinfo

Код:

mb_language('uni');
mb_internal_encoding('UTF-8');

header('Content-type: image/gif');

$text = '日本語';
$font = './Cyberbit.ttf';

// Create the image
$im = imagecreatetruecolor(160, 160);
$white = imagecolorallocate($im, 255, 255, 255);
$black = imagecolorallocate($im, 0, 0, 0);

// Create some colors
imagefilledrectangle($im, 0, 0, 159, 159, $white);

// Add the text
imagettftext($im, 12, 0, 20, 20, $black, $font, $text);
imagegif ($im);
imagedestroy($im); 
Стоит ли изучать PHP в 2026-2027 годах?
Стоит ли изучать PHP в 2026-2027 годах?
Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...
Symfony Station Communiqué - 7 июля 2023 г
Symfony Station Communiqué - 7 июля 2023 г
Это коммюнике первоначально появилось на Symfony Station .
Оживление вашего приложения Laravel: Понимание режима обслуживания
Оживление вашего приложения Laravel: Понимание режима обслуживания
Здравствуйте, разработчики! В сегодняшней статье мы рассмотрим важный аспект управления приложениями, который часто упускается из виду в суете...
Установка и настройка Nginx и PHP на Ubuntu-сервере
Установка и настройка Nginx и PHP на Ubuntu-сервере
В этот раз я сделаю руководство по установке и настройке nginx и php на Ubuntu OS.
Коллекции в Laravel более простым способом
Коллекции в Laravel более простым способом
Привет, читатели, сегодня мы узнаем о коллекциях. В Laravel коллекции - это способ манипулировать массивами и играть с массивами данных. Благодаря...
Как установить PHP на Mac
Как установить PHP на Mac
PHP - это популярный язык программирования, который используется для разработки веб-приложений. Если вы используете Mac и хотите разрабатывать...
12
0
23 733
5
Перейти к ответу Данный вопрос помечен как решенный

Ответы 5

Мой главный подозреваемый - это шрифт, который вы используете для рендеринга.

Согласно http://fr3.php.net/imagettftext, разные версии библиотеки GD, используемые php, могут демонстрировать разное поведение.

  • Версия GD на вашем локальном компьютере: 2.0 или выше
  • Версия GD на вашем сервере веб-хостинга: в комплекте (совместима с 2.0.34)

Редактировать: Еще одна идея: можете ли вы убедиться, что $text = '日本語'; действительно сохранен таким образом на вашем рабочем сервере? Возможно, в вашем скрипте есть проблема с кодировкой.

Следующее редактирование: BKB это уже предлагал. Так что на случай, если причина в этом: он первым дал ответ ;-)

Этот конкретный файл шрифта существует на вашей производственной машине? Если вы используете FTP для загрузки файлов, используете ли вы двоичное кодирование?

Это комментарий, а не ответ на вопрос, отсюда и отрицательный голос.

mirabilos 03.11.2016 16:02
Ответ принят как подходящий

Вот решение, которое наконец сработало для меня:

$text = "你好";
// Convert UTF-8 string to HTML entities
$text = mb_convert_encoding($text, 'HTML-ENTITIES',"UTF-8");
// Convert HTML entities into ISO-8859-1
$text = html_entity_decode($text,ENT_NOQUOTES, "ISO-8859-1");
// Convert characters > 127 into their hexidecimal equivalents
$out = "";
for($i = 0; $i < strlen($text); $i++) {
    $letter = $text[$i];
    $num = ord($letter);
    if ($num>127) {
      $out .= "&#$num;";
    } else {
      $out .=  $letter;
    }
}

Преобразование строки в объекты HTML работает, за исключением того, что функция imagettftext () не принимает именованные объекты. Например,

&#26085;&#26412;&#35486;

нормально, но

&ccedil;

не является. При обратном преобразовании в ISO-8859-1 именованные объекты преобразуются обратно в символы, но возникает вторая проблема. imagettftext () не поддерживает символы со значением больше> 127. Последний цикл for кодирует эти символы в шестнадцатеричном формате. Это решение работает для меня с текстом, который я использую (включая японские, китайские и латинские символы с акцентом для португальского), но я не уверен на 100%, что оно будет работать во всех случаях.

Вся эта гимнастика необходима, потому что imagettftext () на самом деле не принимает строки UTF-8 на моем сервере.

Почему UTF-8> HTML-объекты> преобразование ISO-8859 вместо простого UTF-8> ISO-8859?

deceze 27.02.2012 03:38

+1 Как уже упоминал deceze, я бы, вероятно, выбрал iconv('UTF-8', 'ISO-8859-1', $text) вместо подхода сущностей, но в остальном преобразование в шестнадцатеричное представление - это выход! Спасибо за чаевые!

Levite 31.08.2014 18:12

и UTF-8 в ISO-8859-1 имеет функцию, ее utf8_decode

AbiusX 08.02.2015 01:34

@deceze, потому что речь не идет о преобразовании кодировки

mirabilos 03.11.2016 16:01

У меня была такая же проблема со сценарием, который будет отображать текст в изображении и выводить его. Проблема заключалась в том, что из-за разных браузеров (или устойчивости кода / паранойи, как бы вы ни думали об этом) у меня не было возможности узнать, какая кодировка была помещена в массив $_GET.

Вот как я решил проблему.

$item_text = $_GET['text'];

# detect if the string was passed in as unicode
$text_encoding = mb_detect_encoding($item_text, 'UTF-8, ISO-8859-1');
# make sure it's in unicode
if ($text_encoding != 'UTF-8') {
    $item_text = mb_convert_encoding($item_text, 'UTF-8', $text_encoding);
}

# html numerically-escape everything (&#[dec];)
$item_text = mb_encode_numericentity($item_text,
    array (0x0, 0xffff, 0, 0xffff), 'UTF-8');

Это решает любую проблему с imagettftext, который не может обрабатывать символы выше # 127, просто заменяя ВСЕ символы (включая многобайтовые символы Unicode) на их числовые символы HTML - "& # 65;" для "A", "& # 66;" для "B" и т. д., о поддержке которых заявляет страница руководства.

У меня тоже сработало. Я пытался напечатать символ TM. Однако работал только с определенными шрифтами, хотя все шрифты, которые я пробовал, содержали символы.

Jarett Millard 15.10.2012 07:48

У меня такая же проблема. Помогло преобразование шрифта из otf в ttf. Вы можете использовать FontForge (доступный в стандартном репозитории) для конвертации.

Этот комментарий сэкономил мне много часов на отладку. Совет, если вы не хотите использовать FontForge: http://www.freefontconverter.com/

Eirik H 12.04.2013 00:12

Однозначно лучшее решение здесь!

Aurélien Grimpard 24.08.2020 12:57

Другие вопросы по теме