Вложенные элементы:
a,
code,
emphasis,
strikethrough,
strong,
style,
sub,
sup,
image
Количество вхождений: произвольное
Атрибуты: нет
Версия формата: 2.0
Пример:
Элемент strikethrough
Перечеркнутый шрифт.
На момент написания книги читалками не поддерживается.
Cинтаксис: <
strikethrough>content<
/strikethrough>
Используется в элементах:
code,
emphasis,
p,
strikethrough,
strong,
style,
subtitle,
sub,
sup,
th,
td,
v
Вложенные элементы:
a,
code,
emphasis,
strikethrough,
strong,
style,
sub,
sup,
image
Количество вхождений: произвольное
Атрибуты: нет
Версия формата: 2.1
Пример:
Эта сволочь, этот нехороший человек…
Элемент strong
Полужирный шрифт.
Cинтаксис: <
strong>content<
/strong>
Используется в элементах:
code,
emphasis,
p,
strikethrough,
strong,
style,
subtitle,
sub,
sup,
th,
td,
v
Вложенные элементы:
a,
code,
emphasis,
strikethrough,
strong,
style,
sub,
sup,
image
Количество вхождений: произвольное
Атрибуты: нет
Версия формата: 2.0
Пример:
Элемент style
Заранее определенный стиль для отображения книги.
Cинтаксис: <
style>content<
/style>
Используется в элементах:
code,
emphasis,
p,
strikethrough,
strong,
style,
subtitle,
sub,
sup,
th,
td,
v
Вложенные элементы:
code,
emphasis,
strikethrough,
strong,
style,
sub,
sup,
image
Количество вхождений: произвольное
Атрибуты: name (обязательный)
Версия формата: 2.0
Пример:
—
Элемент sub
Нижний индекс (subscript).
На момент написания книги читалками не поддерживается.
Cинтаксис: <
sub>content<
/sub>
Используется в элементах:
code,
emphasis,
p,
strikethrough,
strong,
style,
subtitle,
sub,
sup,
th,
td,
v
Вложенные элементы:
a,
code,
emphasis,
strikethrough,
strong,
style,
sub,
sup,
image
Количество вхождений: произвольное
Атрибуты: нет
Версия формата: 2.1
Пример:
Элемент sup
Верхний индекс (superscript).
На момент написания книги читалками не поддерживается.
Cинтаксис: <
sup>content<
/sup>
Используется в элементах:
code,
emphasis,
p,
strikethrough,
strong,
style,
subtitle,
sub,
sup,
th,
td,
v
Вложенные элементы:
a,
code,
emphasis,
strikethrough,
strong,
style,
sub,
sup,
image
Количество вхождений: произвольное
Атрибуты: нет
Версия формата: 2.1
Пример:
§ 2.12 Элементы для платных книг
В версию 2.1 были введены специальные элементы для создания платных книг. Поскольку сам формат средств криптозащиты не предусматривает, обрабатывать эти тэги должен исключительно сервер библиотеки.
К сожалению, или, вернее, к счастью, эти элементы до сих пор не нашли применения.
Элемент output
Определяет способ вывода контента книги.
Cинтаксис: <
output>content<
/output>
Используется в элементах:
description
Вложенные элементы:
part,
output-document-class
Количество вхождений: произвольное
Атрибуты: mode (обязательный), currency, incude-all (обязательный)
Версия формата: 2.1
Пример:
Элемент output-document-class
Назначение неясно.
Cинтаксис:<
output-document-class>parts<
/output-document-class>
Используется в элементах:
output
Вложенные элементы:
part
Количество вхождений: произвольное
Атрибуты: name, create, price
Версия формата: 2.1
Пример:
Элемент part
Делит книгу на платные и бесплатные части.
Cинтаксис:<
part/>
Используется в элементах:
output
Вложенные элементы: нет
Количество вхождений: произвольное
Атрибуты: mode, include
Версия формата: 2.1
Пример: см.
элемента output
§ 2.13 Спецсимволы
Некоторые символы в теле книги отображаются особым образом. Это нужно для предотвращения ошибок. Например, «<» и «>» зарезервированы для обозначения границ тэгов. Если их использовать в прямом виде как-то еще, то программа будет считать это ошибкой.
Такие последовательности называются
предопределенными сущностями.
Список таких символов в FictionBook крайне мал. Их, собственно, всего три.
& — &;
< — <;
> ; — >;
Cтандартные сущности XML ' и " в FiсtionBook не используются и конвертируются в символы «'» и «"» соответственно.
§ 2.14 Список атрибутов элементов
Многие элементы в FictionBook имеют дополнительные параметры — атрибуты.
Атрибут aligh
Выравнивание текста в ячейке таблицы.
Используется в элементах:
td,
th,
tr
Значение: фиксированное; left, right, center, justify
Значение по умолчанию: left
Атрибут alt
Назначение аналогично HTML — текст, отображающийся вместо картинки.
Используется в элементах:
image
Значение: произвольная текстовая строка
Атрибут colspan
Позволяет объединять столбцы таблиц.
Используется в элементах:
th,
td
Значение: произвольное целое число
Атрибут content-type
Определяет тип содержимого элемента-контейнера
binary
Используется в элементах:
binary
Значение: фиксированное; image/png, image/jpeg, image/tiff, image/bmp, octet-stream
Атрибут create
Назначение неясно.
Используется в элементах:
output-document-class
Значение:
Атрибут currency
Валюта, в которой определена цена платной книги.
Используется в элементах:
output
Значение: ограниченно-произвольное
Атрибут href
Ссылка. Как правило, внутри документа.
Используется в элементах:
a,
image
Значение: ссылка.
Атрибут id
Метка, позволяющая ссылаться на элемент.
Используется в элементах:
annotation,
binary,
cite,
epigraph,
image,
p,
poem,
section,
subtitle,
table,
td,
text-author,
th
Значение: текстовая строка.
Атрибут info-type
Характеризует произвольную информацию.
Используется в элементах:
custom-info
Значение: произвольная текстовая строка.
Атрибут include
Назначение неясно.
Используется в элементах:
part
Значение:
Атрибут include-all
Назначение неясно.
Используется в элементах:
output
Значение: фиксированное
Атрибут match
Определяет степень соответствия произведения выбранному жанру.
Используется в элементах:
genre
Значение: целое число в диапазоне от 1 до 100
Атрибут mode
Способ вывода платного документа
Используется в элементах: output
Значение:
Атрибут name
Позволяет присвоить элементу имя. В отличие от метки (id), имя элемента используется исключительно программными средствами обработки документа.
Используется в элементах:
body,
sequence,
output-document-class
Значение: произвольное
Атрибут number
Порядковый номер книги в серии.
Используется в элементах:
sequence
Значение: произвольное целое число
Атрибут price
Цена платного документа
Используется в элементах:
output-document-class
Значение: произвольное число c плавающей запятой
Атрибут rowspan
Позволяет объединять строки таблицы.
Используется в элементах:
th,
td
Значение: произвольное целое число
Атрибут style
Позволяет выбрать для элемента предопределенный стиль.
Используется в элементах:
p,
subtitle,
table,
td,
text-author,
th
Значение: произвольное; строка состоящая из латинских букв и цифр.
Пример:
Текст, выровненный по правому краю
Текст: фон черный, цвет шрифта белый, отступы справа и слева 20 процентов, сверху и снизу — 10 пикселей, высота строки 180 процентов
Атрибут title
Позволяет добавить к рисунку заголовок (подпись)
Используется в элементах:
image
Значение: произвольная текстовая строка
Атрибут type
Определяет тип элемента.
Используется в элементах:
a,
stylesheet
Значение: фиксированное
Атрибут value
Дата.
Используется в элементах:
date
Значение: произвольная дата в формате YYYY-MM-DD
Атрибут xmlns
Ссылка на спецификацию формата.
Атрибут value:
FictionBook
Значение: жестко фиксированное
§ 2.15 Алфавитный список всех элементов FictionBook 2.1
a
annotation
author
binary
body
book-name
book-title
cite
city
code
coverpage
custom-info
date
description (
)
document-info
email
emphasis
empty-line
epigraph
FictionBook
)
first-name (
)
genre
history
home-page
id
isbn
image (
)
keywords
lang
last-name
middle-name
nickname
output-document-class
output (
)
p
part (
)
poem
program-used
publish-info
publisher
section
sequence
src-lang
src-ocr
src-title-info
src-url
stanza
strikethrough
strong
style
stylesheet
)
sub
subtitle
sup
table
td
text-author
th
title
title-info
tr
translator
v
version
year
Часть III
Конвертирование книг из других форматов
Cлучаи, когда книга готовится в формате FictionBook
изначально, (как
вот этакнига, :) ) чрезвычайно редки. Обычно имеется готовый текст, который необходимо конвертировать в формат FictionBook.
Вообще, создание книги в формате FictionBook можно разделить на три этапа.
1) подготовка исходного текста;
2) конвертация текста в формат FictionBook;
3) вычитка, структурирование и окончательная доводка книги.
Первый этап включает набор текста или сканирование исходного документа с распознаванием. Или же выдирание текста из PDF, или, какого-нибудь экзотического формата, например, ExeBook. Также сюда входит первичная вычитка текста.
Второй этап — конвертация в формат FB2.
Третий этап — доводка книги. По моему скромному мнению, самый тонкий и важный этап.
Дело в том, существующие программные средства позволяют конвертировать документы txt, html, doc(rtf), что называется «одним кликом». Но, к сожалению, качественный FB2 таким образом создать совершенно невозможно. После конвертации такую книгу приходится загружать в редактор и доводить до ума вручную.
Использование автоматической конвертации без последующей доводки допустимо только в том случае, если текст конвертируется исключительно для того, чтобы закачать на КПК, прочесть и удалить.
Но если книгу планируется выкладывать в Сеть, или распространять еще каким-то образом, то изготавливать ее «одним кликом» совершенно недопустимо. Не забывайте, что в этом случае, как бы еретически это ни звучало, вы фактически являетесь ИЗДАТЕЛЕМ книги. Проявите же уважение к автору и читателям.
Подготовка исходного текста — это тема для отдельной книги, поэтому здесь углубляться в нее не будем. Предположим, что исходный текст у вас уже есть. О редактировании и доводке книги будет подробно рассказано несколько ниже. Сейчас же речь пойдет именно о конвертировании текстов.
§ 3.1 Требования к исходному тексту
Наиболее предпочтительными являются txt и RTF(DOC). Их, как будет сказано ниже, можно перенести в редактор книг, без каких-либо дополнительных программных средств.
HTML в этом отношении гораздо хуже. Они, как правило, содержат кучу лишней информации, которую приходится отсекать.
Если же книга представлена в PDF, вам придется потратить время, чтобы «выковырять» текст оттуда. Бывает, что это не так-то просто сделать, а бывает — вообще невозможно (например, если в PDF собраны сканы страниц без распознавания).
Ну и очень желательно, чтобы текст был максимально качественный.
Автор этой книги сам убил массу времени, при чистке книги В. Вагина «Заяц, стань тигром». И только потом обнаружилось, что в Internet имеются гораздо более качественные тексты книги…
Поэтому, если вы берете текст из Сети, не поленитесь, поищите разные варианты и сравните их.
Для преобразования текстов в FB2 существуют несколько программных пакетов. Рассмотрим их по порядку.
§ 3.2 Any to FB2
Any to FB2 — «штатное» средство для конвертирования текстовых документов в формат FB2
Для нормальной работы программе требуются MSXML 4.0 и Windows Script Host версии 5.6.
Если MSXML можно скачать с сайта Micro$oft без каких-либо проблем, то при попытке загрузить Windows Script Host производится проверка на «подлинность», т.е. лицензионную чистоту вашей копии Windows.
Поэтому проще обновить Internet Explorer до версии 6.0 SP1. Windows Script Host 5.6 входит в его состав.
Посл установки щелкаем по иконке Any to FB2 GUI.
Интерфейс программы представляет собой окошко с несколькими закладками.
Самая первая строчка — путь ко входному файлу. По умолчанию там стоит «http://». Очевидно, программа может брать файлы на обработку прямо из Internet. Пусть вас это не смущает. Нажав кнопочку с многоточием, вы попадете в стандартное окно выбора файла.
Чуть ниже расположено выпадающее меню «Setting». Здесь можно выбрать профиль настроек. Изначально их там всего три: «Last used» (последние использованные) «Default» (по умолчанию) и «Headers+»
Внизу находятся кнопки:
«
Import» — запуск обработки файла. После того, как файл будет успешно преобразован, на месте кнопки «Import» появится кнопочка «Done». Щелкнув по ней, можно сохранить конечный файл.
«
Save settings…» — вызывает окошко управления профилями настроек («Manage export presets»). Можно сохранить текущие настройки. Вводим имя профиля в верхней строчке, например, «My priority» и жмем кнопочку «Save». Здеь же можно удалить ненужные профили, выделив их в списке и щелкнув по кнопочке «Delete…»
«
Cancel» — выход из программы.
И кнопочка «
?» позволяет узнать номер версии программы. Никакого файла помощи или руководства, к сожалению, не предусмотрено…
Если установить галочку напротив расположенной в самом низу рабочего окна опции «
Automatically close this window when finished», то сразу после обработки файла программа закроется.
Теперь рассмотрим закладки.
Первая закладка, «
Document
», содержит важнейшие настройки обработки файла.
«
Text structure» призвана помочь программе разобраться с разбиением текста на абзацы. Предусмотрены три положния радиокнопки.
«
Auto» — предоставляет программе решать этот вопрос самостоятельно.
«
Indented» — в начале каждого абзаца есть отступ.