Изменение кодировки по умолчанию для String (byte [])

Есть ли способ изменить кодировку, используемую конструктором String (byte [])?

В моем собственном коде я использую String (byte [], String) для указания кодировки, но я использую внешнюю библиотеку, которую я не могу изменить.

String src = "with accents: é à";
byte[] bytes = src.getBytes("UTF-8");
System.out.println("UTF-8 decoded: "+new String(bytes,"UTF-8"));
System.out.println("Default decoded: "+new String(bytes));

Результат для этого:

UTF-8 decoded: with accents: é à
Default decoded: with accents: é à

Я попытался изменить системное свойство file.encoding, но это не сработало.

Пользовательский скаляр GraphQL
Пользовательский скаляр GraphQL
Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...
Как вычислять биты и понимать побитовые операторы в Java - объяснение с примерами
Как вычислять биты и понимать побитовые операторы в Java - объяснение с примерами
В компьютерном программировании биты играют важнейшую роль в представлении и манипулировании данными на двоичном уровне. Побитовые операции...
Поднятие тревоги для долго выполняющихся методов в Spring Boot
Поднятие тревоги для долго выполняющихся методов в Spring Boot
Приходилось ли вам сталкиваться с требованиями, в которых вас могли попросить поднять тревогу или выдать ошибку, когда метод Java занимает больше...
Полный курс Java для разработчиков веб-сайтов и приложений
Полный курс Java для разработчиков веб-сайтов и приложений
Получите сертификат Java Web и Application Developer, используя наш курс.
10
0
23 877
3
Перейти к ответу Данный вопрос помечен как решенный

Ответы 3

Цитируется из defaultCharset ()

The default charset is determined during virtual-machine startup and typically depends upon the locale and charset of the underlying operating system.

В большинстве ОС вы можете установить кодировку с помощью переменной окружения.

Не совсем тот ответ, на который я надеялся (я бы хотел иметь возможность делать это динамически). Было бы здорово дать образец того, как изменить кодировку для основных операционных систем. Спасибо

Michel 17.09.2008 13:25
Ответ принят как подходящий

Перед запуском JVM необходимо изменить языковой стандарт; видеть:

Java, ID ошибки 4163515

Некоторые места предполагают, что вы можете сделать это, установив переменную file.encoding при запуске JVM, например

java -Dfile.encoding=UTF-8 ...

... но я сам не пробовал. Самый безопасный способ - установить переменную среды в операционной системе.

Кто-нибудь пробовал подход -Dfile.encoding? Было бы здорово иметь возможность делать это независимо от платформы.

Matt Passell 09.01.2013 00:28

@MattPassell Мы используем следующие аргументы при запуске JVM, чтобы убедиться, что мы правильно указываем UTF-8 везде: -Dfile.encoding = ISO646-US -Dsun.jnu.encoding = ISO646-US и, похоже, все работает нормально.

Mat Mannion 10.01.2013 18:42

Спасибо за ответ. Я что-то пропустил? Я только что поискал в Google ISO646-US и узнал, что это официальное название для ASCII. Как это помогает убедиться, что вы используете UTF-8?

Matt Passell 30.01.2013 18:22

@MattPassell не гарантирует, но делает очевидным, что мы не указываем кодировку явно во время разработки, поскольку набор символов настолько ограничен

Mat Mannion 18.02.2013 16:49

Благодарность! Для меня это решение сработало, добавив этот параметр JVM при запуске tomcat.

Neets 18.06.2014 13:38

Думаю, вам нужно следующее: System.setProperty ("file.encoding", "UTF-8");

Он решил некоторые проблемы, но у меня остались другие. Символы «í» и «Í» не преобразуются правильно, если SO - ISO-8859-1. Просто с опцией JVM при запуске я решаю эту проблему. Теперь только моя консоль Java в IDE NetBeans дает сбой кодировки при отображении специальных символов.

Другие вопросы по теме