[user@linux tmp]$ wvVersion book-p1.doc
Version: word8, Encrypted: No
[user@linux tmp]$ wvSummary book-p1.doc
The title is В
The subject is
The author is kos
The keywords are no comments found
The template was Normal.dot
The last author was kos
The rev # was 12
The app name was Microsoft Word 8.0
PageCount is 1
WordCount is 52757
CharCount is 300716
Security is 0
Codepage is 0x4e3 (1251)
Основной утилитой пакета является программа wvWare (или wvConvert), вызов которой осуществляется следующим образом
wvWare [OPTION…] filename.doc › filename.html
Основные опции:
• -x --config=config.xml
Указывает на используемый выходной фильтр.
• -c --charset=charset
Задает кодовую страницу для iconv.
• -p --password=password
Задает пароль для зашифрованных документов Word.
• -d --dir=dir
Задает каталог, в котором будет сохранена создаваемая графика.
• -v -version
Выдает версию пакета wvWare.
• -? -help
Выводит краткую справку по использованию программы.
Выходной фильтр, указываемый опцией -x или -config=, задает формат выходного файла. Если эта опция не задана, то выходной фильтр ищется в текущем каталоге или (если в текущем не нашли) по месту установки пакета. По умолчанию используется фильтр wvHtml.xml, т. е. doc-файл преобразуется в формат HTML.
После преобразования полученный файл можно просмотреть с помощью соответствующей программы просмотра, например, html-файл – с помощью любого Web-браузера. Конечно, при этом некоторые возможности форматирования, имеющиеся в Word, теряются, и это надо иметь в виду, просматривая полученные файлы.
Насколько я могу судить, именно программы пакета wv используются для открытия файлов MS Word в некоторых текстовых редакторах для Linux, например, в AbiWord.
12.2.6 ПРОГРАММЫ-ПЕРЕКОДИРОВЩИКИ КОДОВЫХ СТРАНИЦ
Как известно, для представления символов русского алфавита существует несколько альтернативных кодировок или кодовых страниц.
В Unix-системах наиболее распространенной является кодировка KOI8-R, Microsoft использует CP- 1251 или CP-866 (DOS). Существуют еще ISO8859-5, UTF, Unicode (подробнее о кодировках можно прочитать в разд. 9.3).
Если вы встретили файл, содержимое которого ‘не читается’, то вам потребуется программа перекодировки. Как говорится в RU.LINUX.FAQ: ‘Перекодировщиков CP1251 и CP866 -› KOI8-R просто огромное количество. Не надо писать новых;-). Наиболее широко распространены iconv (входит в поставку glibc) и GNU recode.’