Как лучше всего преобразовать слово HTML в слово XML? Я не могу купить инструмент, поэтому мне нужно что-то предпочтительно XSLT, которое является бесплатным и соответствующим образом работает с базовым форматированием, таким как абзацы, списки, полужирный и курсив.





XSLT сам по себе не принесет вам никакой пользы, если вы хотите сохранить любое форматирование вне файла XHTML (например, во внешних таблицах стилей). Кроме того, Word имеет возможность открывать (X) HTML-файлы и имеет это на некоторое время. Он может выглядеть не так хорошо, как оригинал, но он работает.
Фактически, если у вас есть Word и некоторые навыки работы с VB Script, я считаю, что можно написать сценарий, который открывает (X) HTML-файл, а затем сохраняет его как WordML или старый простой Word, если вы используете Word 2003 или старше или как .docx, если у вас 2007.
Стефан Буйон написал об этом блог на MSDN. Она предлагает довольно хорошее преобразование xslt, которое выполнит эту работу. Он разработан для использования с InfoPath и поддерживает только теги XHTML, которые InfoPath создает, поэтому вам может потребоваться изменить его для вашего конкретного приложения. Но, похоже, он работает довольно хорошо и должен дать вам отправную точку для работы.
На самом деле, большинство тегов в шаблоне XSL Стефана Буйона можно использовать для преобразования XHTML-> WordML с очень небольшими изменениями. Мне удалось преобразовать мой собственный html в wordml, используя некоторые теги в файле, и это сэкономило мне огромное количество усилий.