GNU/Linux, Vim, LaTeX, полезные скрипты, визуализация данных, численные расчёты

20081129

Извлечение изображений из документов MS Word

Увы, иногда приходится получать вместо нормального файла изображения документ Word со вставленной в него картинкой. Короткий рецепт, как эту картинку из документа вытащить и получить в виде файла.

1. Открываем документ Word в OpenOffice Writer
2. Сохраняем в формате OpenDocument (.odt)
3. Переименовываем сохранённый файл, изменяя разрешение .odt на .zip (документы OpenOffice, на самом деле, простые zip-архивы)
4. Раскрываем zip-архив и берём готовые файлы изображений из папки Pictures/

6 коммент.:

vanoc комментирует...

забавно:)

Me комментирует...

Аналогичным образом можно поступать и с новым форматом MS Word 2007, если Open Office по каким-либо причинам под рукой не оказалось :)

Bloody victory комментирует...

Да-да
Где-то я уже подобное решение для Word 2007 видел.
Ещё можно сохранить документ как html и забрать картинки.

massalim комментирует...

интересно. А не собирается ли OpenDocument переходить на LZMA?

hubbitus комментирует...

А зачем вообще 3 шаг, почему сразу не распаковать??

jetxee комментирует...

2 massalim:

Я думаю, это не самый приоритетный вопрос. В данный момент идёт работа над ODF 1.2, но пока ещё окончательного варианта нет. И если верить википедии, работают там над другими вопросами. Менять формат архива в предыдущих версиях формата нельзя, ибо на то и на то он и стандарт (ISO/IEC 26300:2006).

2 hubbitus:

Шаг 3 — на случай, если пост буду читать пользователи альтернативных ОС (напр., виндоус), или пользователи, использующие исключительно графический интерфейс. Пользователи unzip могут этот этап пропустить :)

Отправить комментарий