Schemas.microsoft.com/2003/10/Serialization .net Извлечение двоичных данных в кодировке base64 в php

У меня есть некоторые данные, сериализованные в приложении С#.net, используя

C# .net десериализовать двоичный файл XML

public static object DeSerializeXmlBinary(byte[] bytes)
    {
        using (XmlDictionaryReader rdr = XmlDictionaryReader.CreateBinaryReader(bytes, XmlDictionaryReaderQuotas.Max))
        {
            NetDataContractSerializer serializer; 
            serializer = new NetDataContractSerializer();
            serializer.AssemblyFormat = FormatterAssemblyStyle.Simple;
            return serializer.ReadObject(rdr);
        }
    }

как я могу десериализовать то же самое в PHP

Обновление 1 строка для десериализации: https://pastebin.com/FrUNsm9H

проанализировать строку в функции php и сериализовать ее.

после анализа приведенного выше сериализованного строки в базе 64 ответ будет



Обновление 2 Строка в БД



Что я нашел до сих пор

  1. Сначала я декодирую строку из base64 base64_decode()
  2. Затем я сдуваю веревку gzinflate()
  3. После чего строка анализируется, вот чего я достиг.

Шаги 1 и 2 я подтвердил в базе кода С#, и ожидается результат.

обновление 3

парсинг кода в c#

 ms = new MemoryStream(((System.Byte[])DecompressData(System.Convert.FromBase64String(Convert.ToString(__DBSTRING__)))));
 byte[] byteArr = ms.ToArray();
___OUTPUT___= Convert.ToBase64String(byteArr);


private static object DecompressData(byte[] inb)
    {
        byte[] outb;
        using (MemoryStream istream = new MemoryStream(inb))
        {
            using (MemoryStream ostream = new MemoryStream())
            {
                using (System.IO.Compression.DeflateStream sr =
                    new System.IO.Compression.DeflateStream(istream, System.IO.Compression.CompressionMode.Decompress))
                {
                    sr.CopyTo(ostream);
                } outb = ostream.ToArray();
            }
        } return DeSerializeXmlBinary(outb);
    }

часть xml - это то, что я не понимаю, почему?

Что такое «тот самый»? Можете ли вы поделиться примером строки, которую хотите десериализовать?

Nico Haase 11.06.2024 09:52

«NetDataContractSerializer включает информацию о типе CLR в сериализованный XML, тогда как DataContractSerializer этого не делает. Таким образом, NetDataContractSerializer можно использовать только в том случае, если и сериализующая, и десериализирующая стороны используют одни и те же типы CLR». - Learn.microsoft.com/en-us/dotnet/api/… . Поэтому мне интересно, действительно ли это лучший формат для обмена между языками, поскольку он сериализует информацию, специфичную для .NET. Я думаю, что DataContractSerializer больше подходит для ваших целей.

ADyson 11.06.2024 10:07

ок, добавляю обновление

Mureithi Maina 11.06.2024 10:07

И если у вас вообще нет какой-то конкретной причины делать это таким образом, рассматривали ли вы возможность использовать JSON вместо XML-формата, специфичного для .NET? В PHP уже есть встроенная функция десериализации JSON, а .NET также может легко сериализоваться в JSON. Это почти наверняка потребует гораздо меньше работы, чем написание десериализатора на PHP для данных XML.

ADyson 11.06.2024 10:08

Не говоря уже о том, что XML закодирован в специфичном для MS двоичном формате...

Olivier 11.06.2024 10:12

У меня проблема в том, что данные уже находятся в системной базе данных, созданной с помощью C#.net 3 или что-то в этом роде, мне нужно прочитать данные и перейти к php.

Mureithi Maina 11.06.2024 10:16

PS: это кодирование изображения в базе данных для клиентов.

Mureithi Maina 11.06.2024 10:18

Хранение сериализованных данных для конкретного языка в базе данных — действительно плохая идея. Рассмотрите возможность написания кода C# для преобразования данных в совместимый формат.

Olivier 11.06.2024 10:20

Что бы вы ни имели в виду под «кодированием изображения»: поделитесь, во что должна быть десериализована эта строка, и чего вы пытались достичь.

Nico Haase 11.06.2024 10:21

последний вывод — это data:image/png;base64,

Mureithi Maina 11.06.2024 10:24

Если это изображение, то какое отношение к нему имеет XML? Моя организация не разрешает доступ к Pastebin, поэтому я не могу проверить, что вы там разместили. В соответствии с Как задавать пожалуйста, предоставьте минимальный воспроизводимый пример вашей проблемы в своем вопросе. Спасибо.

ADyson 11.06.2024 10:28

Если вы знаете, что это необработанное изображение, чего не хватает, чтобы предпринять следующие шаги? В какой формат вы хотите его десериализовать?

Nico Haase 11.06.2024 10:30

«Как, черт возьми, здесь задействован XML» Сериализатор использует (двоичный) формат XML для кодирования объектов (см. здесь).

Olivier 11.06.2024 10:36

Всегда ли сериализованные данные кодируют массив byte[]?

Olivier 11.06.2024 10:48

@Оливье Я добавил обновление 3 выше, краткий ответ — да. длинный ответ: код С# для анализа данных использует байт-код, а в PHP мы используем укусы. Когда я конвертирую строку в массив байтов на шаге 2 выше, я получаю те же результаты

Mureithi Maina 11.06.2024 10:56

@Оливье, конечно, но если цель состоит в том, чтобы закодировать изображение в формате Base64, я изо всех сил пытаюсь понять, насколько сериализация в двоичный XML может быть для этого полезным шагом! Но я думаю, что мы находимся там, где находимся, с точки зрения существующего кодекса.

ADyson 11.06.2024 11:06

@ADyson Конечно, это безумие, не говоря уже об этапе сжатия (который бесполезен для изображений, поскольку они уже сжаты).

Olivier 11.06.2024 11:10

«последний вывод — это data:image/png;base64». На самом деле изображение, указанное в вопросе, представляет собой JPEG, а не PNG.

Olivier 11.06.2024 11:21
Стоит ли изучать PHP в 2023-2024 годах?
Стоит ли изучать PHP в 2023-2024 годах?
Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.
Приемы CSS-макетирования - floats и Flexbox
Приемы CSS-макетирования - floats и Flexbox
Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...
Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest
В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...
Концепция локализации и ее применение в приложениях React ⚡️
Концепция локализации и ее применение в приложениях React ⚡️
Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...
Пользовательский скаляр GraphQL
Пользовательский скаляр GraphQL
Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...
1
18
61
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Взглянув на спецификацию двоичного формата .NET XML, вот простой способ извлечь данные из сериализованного массива byte[]:

function extractData($ser)
{
    $pos = 154;
    if ($ser[$pos] != "\xA0")
        throw new Exception('Bytes16Text record not found');
    $a = unpack('vlen', substr($ser, $pos+1, 2));
    $len = $a['len'];
    $data = substr($ser, $pos+3, $len);

    $pos += 3 + $len;
    if ($ser[$pos] != "\x9F")
        throw new Exception('Bytes8TextWithEndElement record not found');
    $a = unpack('Clen', substr($ser, $pos+1, 1));
    $len = $a['len'];
    $data .= substr($ser, $pos+2, $len);

    return $data;
}

$db = file_get_contents('db.txt');
$ser = gzinflate(base64_decode($db));
$image = extractData($ser);
file_put_contents('image.jpg', $image);

Примечание. Этот код будет работать только для массивов размером менее 64 КБ. Вам нужно будет адаптировать его, если у вас большие массивы.

Другие вопросы по теме