ModernLib.Net

FictionBook 2.1: (beta 4)

ModernLib.Net / / FictionBook 2.1: (beta 4) - (. 2)
:
:

 

 


Гипертекст. Нет.

Возможность редактирования. Абсолютная.

RTF до сих пор широко используется в русскоязычных онлайн-библиотеках. Главным образом, именно из-за его хорошей совместимости с различным программным обеспечением.

Документ Micro$oft Word (.DOC)

Формат DOC — это внутренний формат Micro$oft Word и предназначен для хранения текстовых документов, подготовленных в этой программе. Распространенность Micro$oft Office и Micro$oft Word как его части, обусловила широкое распространение формата DOC.

Полиграфичность. Высокая.

Масштабируемость. Высокая.

Кроссплатформенность. Ниже среднего.

Конвертируемость. Высокая.

Гипертекст. Присутствует.

Возможность редактирования. Абсолютная.

По скромному мнению автора, документы Word используют в качестве e-book только по одной причине — авторам книги (или сканнеристам ;)) ) просто-напросто лень конвертировать его в более удобочитаемый формат.

Документы HTML (.HTM; .CHM; .MHT)

Язык HTML (HyperText Markup Language) используется для отображения информации в сети Интернет.

Полиграфичность.Высокая.

Масштабируемость.Очень высокая.

Кроссплатформенность. Практически абсолютная.

Конвертируемость. Практически абсолютная.

Гипертекст. Разумеется, есть.

Возможность редактирования. Абсолютная.

Хотя НTML позволяет неплохо оформить текстовый документ, он все же не слишком подходит для e-book. Далеко не всем нравится читать книги в браузере. При использовании же программы-ридера, HTML конвертируется в обычный текст и теряет все свои преимущества.

А вот формат CHM, первоначально предназначавшийся для подготовки файлов справки к программному обеспечению, — дело иное. Компактность и высокая интерактивность делают его весьма удобным для различных электронных руководств и справочников.

В частности, очень эффектно смотрятся в CHM компьютерные руководства издательства O'Reily.

Однако, при всех этих достоинствах, у CHM есть и очень большой недостаток. Это формат справкии он жестко привязан к Windows. Решит Micro$oft поменять формат справки в следующей версии «форточек» и с накопленным объемом книг придется попрощаться.

* * *

У всех вышеперечисленных форматов есть один существенный недостаток — они ИЗНАЧАЛЬНО НЕ ПРЕДНАЗНАЧАЛИСЬ для создания электронных книг. Созданные на их основе файлы даже не являются книгами — это просто текстовые документы.

Как ни странно, из этого же недостатка вытекает и достоинство — чтобы читать их не требуется специального программного обеспечения. Достаточно стандартных средств, встроенных в операционную систему.

Форматы, описанные далее, уже требуют установки специальных программных средств для их просмотра.

Adobe Acrobat (.PDF).

Первоначально PDF разрабатывался для нужд полиграфии. В основном для платформенно-независимого переноса макетов. В последние годы интенсивно продвигается как формат для создания e-book.

Полиграфичность.Абсолютная. Для того и был разработан. Как следствие, PDF-файлы могут быть весьма увесистыми.

Масштабируемость.Низкая! На портативных устройствах читать PDF проблематично.

Кроссплатформенность.Cредняя.

Гипертекст. Есть.

Возможность редактирования.Низкая. К тому же, для этого нужно устанавливать громоздкий Adobe Acrobat.

Основной аргумент против массового применения PDF для изготовления e-book — это большой объем файла и неудобство чтения на портативных устройствах.

Впрочем, качественные книги и журналы, сформатированные на страницы размером более A5, трудновато читать даже на 21'' мониторах.

===============================

Вообще, формат PDF предназначен, в первую очередь, ДЛЯ ВЫВОДА НА ПЕЧАТЬ.

===============================

Существуют и другие форматы, аналогичные PDF. Например, формат Zinio, предназначенный специально для выпуска в электронном виде периодических изданий, в частности глянцевых журналов.

DeJaVU (.DJVU)

Формат DJVU был создан компанией АТ&T специально для компактного представления информации в Internet. Подобно MP3 и Divx, он пришелся ко двору и произвел маленькую революцию в деле свободного распространения контента.

Полиграфичность.Высокая.

Масштабируемость.Весьма средняя. Зависит от того, насколько хорошо программа-просмотрщик поддерживает anti-aliasing.

Кроссплатформенность.Средняя.

Конвертируемость.Ниже среднего.

Гипертекст. Есть подобие.

Возможность редактирования. Средняя.

Формально, файлы созданные с использованием DJVU трудно называть книгами. Это, по существу, растровый многостраничный графический файл. При его создании специальные алгоритмы отделяют текст от фона и иллюстраций, после чего они сжимаются с различным разрешением. Что и обеспечивает чрезвычайно высокое сжатие картинки (примерно 1:500) при более чем приемлемом качестве изображения. Эти свойства делают его идеальным для множества сканированных компьютерных (и не только) руководств и пособий, которыми сейчас завалены варезные сайты (такие книги еще называют «освобожденными» ;)) ). Ведь, если книга содержит примеры исходников программ, формулы, схемы или сложные таблицы, то даже незначительные ошибки при OCR могут непоправимо испортить ее. A DJVU позволяет представить книгу «как есть».

Причем интересы читателей, привыкших парой щелчков копировать нужный кусок текста в буфер, тоже учтены. Последние версии формата DJVU могут содержат чисто текстовый слой.

Справедливости ради, следует заметить, что DJVU, более чем хорошо справляющийся с текстами и штриховыми иллюстрациями, пасует перед цветными картинками и глянцевыми журналами. Выглядят такие издания в DJVU весьма непрезентабельно.

Закрытые специализированные форматы

Существует довольно много форматов электронных книг, которые были созданы для одного конкретного устройства или программы.

К ним можно отнести Rocket e-book (.rb), Micro$oft Reader (.lit), PalmDoc, MobiPocket (.prc) Jinke Book Wolf (.wol) и т.д. Плюс некоторые программы для чтения норовят сконвертировать текст в свой собственный, ни с чем не совместимый формат (IceBook Professional на PC, iSilo и Weasel на Palm и прочие). Правда, при близком рассмотрении оказывается, что это все те же HTML, RTF или txt (некоторое исключение составляет формат ExeBook, который конвертирует текст книги в исполняемый файл, содержащий набор растровых картинок), как правило, упакованные для компактности, и снабженные служебной областью, где могут храниться, например, закладки. Также (и чаще, чем хотелось бы) может быть добавлена DRM.

Полиграфичность. Зависит от конкретного формата. Средняя или выше среднего.

Масштабируемость. Средняя или выше среднего.

Кроссплатформенность. Низкая. Обычно такие форматы создаются для одного конкретного устройства или программы. Просмотр на PC или, соответственно, КПК нередко возможен только с помощью программ, написанных энтузиастами.

Конвертируемость. Низкая. Обычно только через софт, опять же написанный энтузиастами.

Гипертекст. Чаще всего есть.

Возможность редактирования. Низкая или вообще никакая.


И, наконец…


Специализированные открытые форматы на основе XML

Что такое XML, подробно описано ниже. Сейчас нас интересуют лишь сравнительные характеристики формата.

Полиграфичность.Высокая. Правда, всецело зависит от программы-ридера.

Масштабируемость.Почти абсолютная.

Кроссплатформенность. Практически абсолютная.

Конвертируемость. Практически абсолютная.

Гипертекст. Есть.

Возможность редактирования. Как правило, абсолютная.

Как видим, язык XML имеет наилучшее сочетание качеств, необходимых для e-book. Поэтому попытки делать e-book на его основе уже предпринимались неоднократно и небезуспешно.

В отличие от txt, RTF, DOC, HTML, PDF, и т.д. которые однозначно ориентированы на отображениеили хранениетекстовых данных, форматы на основе XML позволяют структурироватькнигу.

Известны форматы OEB (Open E-Book), DocBook и другие. Но наиболее популярным (по крайней мере, в Рунете) является FictionBook.

§ 1.3 Несколько слов о XML

Расширяемый язык разметки — eXtensible Markup Language, был создан для хранения структурированных данных в текстовом формате. Теоретически файлы XML должны легко читаться как программным обеспечением, так и человеком.

С использованием технологии XML можно записывать и обрабатывать практически любые данные, вне зависимости от их структуры и сложности.

На базе XML уже создано большое количество подмножеств для решения конкретных задач. Например, есть реализация HTML средствами XML — XHTML, язык для записи математических формул и выражений (MathML), язык для химических формул, для медицинской электронной документации. Новый формат файлов пакета M$ Office 2007 представляет собой не что иное, как пачку XML-документов, которые сохраняются в одном архиве.

Кроме того, поскольку любые данные в XML — это обычный текст, то и работать с ними можно как с текстом: готовить XML-документы в notepad, а в случае потери какой-либо части данных с остальными можно будет по-прежнему работать.

В отличие от HTML, набор средств разметки (тэгов) в XML не фиксирован, и может быть произвольным.

Разумеется, это должно как-то описываться. Поэтому в XML есть такое понятие, как «спецификация», DTD (Document Type Definition — описание типа документа) — документ, в котором описана структура XML-подмножества. В настоящее время на смену DTD пришла XML Schema.

Если возникнет необходимость, XML легко преобразовать в любой другой формат. Для этого существует XSLT — eXtensible Stylesheet Language Transformation — расширяемый язык стилей.

Вот, к примеру, реализация адресной книги на базе XML.

<?xml version="1.0" encoding="UTF-8"?>

 Как правило, это картинки.

§ 2.2 Пример книги в формате FictionBook

Cпецификация (schema) FictionBook находится на сайте Дмитрия Грибова, а также входит в комплект FB Tools. Поэтому размещать ее в электронной версии книги смысла нет.

Но пример книги в формате FictionBook привести необходимо:

<?xml version="1.0" encoding="windows-1251"?>

 

 

   reference

    и .

   

В тексте могут быть картинки.

   

   

  

  

   

    

Вторая вложенная секция

   

   

    

Это цитата.

     Автор цитаты.

   

   

Снова текст.

  

 

 

  

   

Третья секция

  

  

Стихи:

  

   

    

Парус

   

   

     А у дельфина взрезано брюхо винтом.

     Выстрела в спину не ожидает никто.

     На батарее нету снарядов уже.

     Надо быстрее на вираже.

   

   

     Но парус! Порвали парус!

     Каюсь! Каюсь! Каюсь!

   

    Владимир Высоцкий

  

  

Снова обычный текст.

 

 

 

 

  

Примечания

 

 

  

   

1

  

  

Текст сноски.

 

 

 iVBORw0KGgoAAAANSUhEUgAAAAkAAAAICAMAAAAcEyWHAAAABGdBTUEAAK/INwWK6QAAABl0

RVh0U29mdHdhcmUAQWRvYmUgSW1hZ2VSZWFkeXHJZTwAAAAGUExURQEBAf///+tZAq0AAAAY

SURBVHjaYmBAAEZGRjDGzsKvDgYAAgwABR4AH2mwMFgAAAAASUVORK5CYII=

§ 2.3 Элементы описания книги.

Базовые структурные элементы

В самом начале любого файла книги идет признак формата XML

< ?xml version="1.0" encoding="windows-1251"?>

Здесь указана сигнатура принадлежности к формату XML, его версия и кодировка файла. Для русскоязычных FictionBook это обычно windows-1251 или utf-8.

За ним в обязательном порядке следует:

Элемент FictionBook

Корневой элемент.

Cинтаксис: < FictionBook>content< /FictionBook>.

Фактически, всегда используется в виде:

< FictionBook xmlns=" http://www.gribuser.ru/xml/fictionbook/2.0 " xmlns:l=" http://www.w3.org/1999/xlink ">

content

< /FictionBook>.

Используется в элементах: корневой элемент

Вложенные элементы: stylesheet, description, body, binary

Количество вхождений: одно

Атрибуты: xmlns

Версия формата: 2.0

Пример: см. пример книги FictionBook, § 2.2

Элемент stylesheet

Список стилей, позволяющих конкретно определить, как будет выглядеть книга на экране устройства для чтения. До последнего времени читалками не поддерживался и практически не использовался. Лишь в конце 2007 года появился CoolReader 3.09 с экспериментальной поддержкой stylesheet.

Cинтаксис: < stylesheet>content< /stylesheet>.

Используется в элементах: FictionBook

Вложенные элементы: нет

Количество вхождений: одно или отсутствует.

Атрибуты: type

Версия формата: 2.0

Пример:

 

 .body{font-family : Verdana, Geneva, Arial, Helvetica, sans-serif;}

 .p{margin:0.5em 0 0 0.3em; padding:0.2em; text-align:justify;}

 

Элемент description

Заголовок (описание) книги.

Cинтаксис: < description>content< /description>.

Используется в элементах: FictionBook

Вложенные элементы: title-info, src-title-info, document-info, publish-info, custom-info, output

Количество вхождений: одно

Атрибуты: нет

Версия формата: 2.0

Пример:

 

   nonfiction

   элемент author

Элемент sequence

Серия, в которую входит книга. Допускается неограниченное число вложенных серий.

Cинтаксис: < sequence/> или < sequence>< sequence/>< /sequence>

Используется в элементах: title-info, src-title-info

Вложенные элементы: sequence

Количество вхождений: произвольное

Атрибуты: name (обязательный), number

Версия формата: 2.0

Пример:

   

  

Элемент program-used

Программное обеспечение, использовавшееся при создании книги.

Cинтаксис: < program-used>текст< /program-used>

Используется в элементах: document-info

Вложенные элементы: нет

Количество вхождений: одно или отсутствует

Атрибуты: нет

Версия формата: 2.0

Пример:

   FB Tools, EmEditor, hands.drv & brain.sys

Элемент src-url

Ссылка на сайт, если исходный текст книги был скачан из Интернета.

Cинтаксис: < src-url>текст< /src-url>

Используется в элементах: document-info

Вложенные элементы: нет

Количество вхождений: произвольное

Атрибуты: нет

Версия формата: 2.0

Пример:

http://www.natahaus.ru

Элемент src-ocr

Информация о людях, которые сканировали (набирали) и вычитывали книгу.

Cинтаксис: < src-ocr>текст< /src-ocr>

Используется в элементах: document-info

Вложенные элементы: нет

Количество вхождений: одно или отсутствует

Атрибуты: нет

Версия формата: 2.0

Пример:

OCR Zmiy; SpellCheck Юзич

Элемент id

Уникальный идентификационный номер книги.

Cинтаксис: < id>текст< /id>

Используется в элементах: document-info

Вложенные элементы: нет

Количество вхождений: одно

Атрибуты: нет

Версия формата: 2.0

Пример:

B3627A48-7F9C-400E-8CD7-0159B75F1A14

Элемент version

Номер версии файла.

Cинтаксис: < version>число< /version>

Используется в элементах: document-info

Вложенные элементы: нет

Количество вхождений: одно

Атрибуты: нет

Версия формата: 2.0

Пример:

1.0

Элемент history

История изменений,  вносившихся в файл.

Cинтаксис: < history>Content< /history>

Используется в элементах: document-info

Вложенные элементы: p, poem, cite, subtitle, table, empty-line

Количество вхождений: одно или отсутствует

Атрибуты: id

Версия формата: 2.0

Пример:

  

   

v 1.0 — вычитка, конвертация в FB2 (Юзич)

   

v 1.1 — дополнительное форматирование (Faiber)

   

v 1.2 — дополнительная вычитка (Юзич)

   

v 1.3 — дополнительная вычитка  (Юзич)

   

v 1.4 — окончательная (надеюсь!) вычитка  (Юзич)


  • :
    1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14