Как я могу ограничить вывод страниц с помощью WordToHtmlConverter и HWPFDocument?

Я конвертирую файл Word / .doc в HTML и хочу получить подмножество страниц. Можно ли ограничить диапазон вывода? Я открыт для создания нового HWPFDocument из оригинала только с подмножеством страниц или после преобразования ограничьте длину там.

File localFile = ...
FileInputStream fis = new FileInputStream(localFile);
HWPFDocument wordDoc = new HWPFDocument(fis);
Document newDoc = DocumentBuilderFactory.newInstance().newDocumentBuilder().newDocument();
WordToHtmlConverter wordToHtmlConverter = new WordToHtmlConverter(newDoc);
wordToHtmlConverter.processDocument(wordDoc);

StringWriter stringWriter = new StringWriter();

Transformer transformer = TransformerFactory.newInstance().newTransformer();
transformer.setOutputProperty(OutputKeys.INDENT, "yes");
transformer.setOutputProperty(OutputKeys.ENCODING, "utf-8");
transformer.setOutputProperty(OutputKeys.METHOD, "html");
transformer.transform(
    new DOMSource(wordToHtmlConverter.getDocument()),
                    new StreamResult(stringWriter));

String htmlString = stringWriter.toString();

BufferedWriter out = new BufferedWriter(new OutputStreamWriter(
    new FileOutputStream(htmlFile), "UTF-8"));
out.write(htmlString);
out.close();

Прочтите это, stackoverflow.com/help/how-to-ask, и обновите свой вопрос.

Adam H 31.07.2018 21:46
Пользовательский скаляр GraphQL
Пользовательский скаляр GraphQL
Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...
Как вычислять биты и понимать побитовые операторы в Java - объяснение с примерами
Как вычислять биты и понимать побитовые операторы в Java - объяснение с примерами
В компьютерном программировании биты играют важнейшую роль в представлении и манипулировании данными на двоичном уровне. Побитовые операции...
Поднятие тревоги для долго выполняющихся методов в Spring Boot
Поднятие тревоги для долго выполняющихся методов в Spring Boot
Приходилось ли вам сталкиваться с требованиями, в которых вас могли попросить поднять тревогу или выдать ошибку, когда метод Java занимает больше...
Полный курс Java для разработчиков веб-сайтов и приложений
Полный курс Java для разработчиков веб-сайтов и приложений
Получите сертификат Java Web и Application Developer, используя наш курс.
0
1
27
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Только не с POI. Нет понятия страницы в формате HWPF. Страницы - это артефакт как потребитель. Страниц нет, пока их не отобразит потребитель, и каждый клиент может отображать страницы немного по-разному, даже в разных версиях Word.

Спасибо, да, я так и думал. Надеялся на другое, или кто-то, возможно, переопределил afterProcess () в WordToHtmlConverter, чтобы как-то обрезать ...

jjaazz 01.08.2018 17:17

Другие вопросы по теме