Релевантность (relevancy) – это мера, определяющая, насколько полно тот или иной документ отвечает критериям, указанным в запросе пользователя. Однако не все документы, признанные поисковой системой наиболее релевантными, будут таковыми по мнению пользователя.
Многие HTML-документы связаны друг с другом, и ссылки от одного документа на другие могут быть абсолютные и относительные, причем последние – формируются относительно того каталога, в котором расположен документ – источник ссылки. Абсолютные ссылки длинные, а относительные, хотя и короче, но перестают работать при перемещении основного документа. В HTML-документы можно включать сразу обе ссылки, чтобы связи между документами не нарушались в любых условиях.
Для формирования ссылок в заголовочной части используется тэг , в котором используется один единственный параметр HREF (Hyper Reference – гиперссылка), в качестве значения которого указывается URL (Universal Resours Locator) – адрес файла, на который производится ссылка. Параметр HREF используется в том же качестве и в некоторых других тэгах, например, тэге-указателе ссылки (см. разд. 2.5). Адрес может быть локальным, т. е. задавать размещение файла в каталогах и подкаталогах на том же самом компьютере, или сетевым, например:
Для организации логической связи и соподчиненности электронных изданий может использоваться тэг (Link – связь). В этом тэге могут использоваться 4 параметра: HREF, REL (от Relarion – отношение), REV (от Reverse – противоположный, обратный) и TYPE (тип). С помощью первого из них задается URL связанного с данным документом. Параметр REL определяет вид отношения между текущим и связанным с ним документом, а REV – обратное отношение (между другим и текущим документами). Последний параметр TYPE задает тип и параметры присоединяемой к документу таблицы стилей. Примеры тэга :
Другими значениями параметра REL могут быть bookmark (закладка), copyright (авторское право), glossary (глоссарий, словарь специальных терминов в конце книги), help (помощь). Значение made параметра REV является признаком обратного отношения. Другие его значения: autor (автор), editor (редактор), publisher (издатель).
Позднее в состав заголовочной части был добавлен специальный тэг , с помощью которого задается метаинформация, связанная с данным электронным изданием, или атрибуты для ускоренного поиска. Частные случаи метаинформации – это имя автора, издателя, редактора, название издательства, время публикации и другие характерные признаки издания. Тэг имеет 2 параметра: NAME, которым задается имя атрибута и CONTENT (содержание), определяющий значение этого атрибута. Например:
Вероятно, приведенные примеры не нуждаются в каких-либо комментариях. Итак, внутри контейнера
и , ограничивающего заголовочную часть HTML-документа, обычно используется один контейнер и
, внутри которого размещается текст заголовка, и могут быть включены тэги , и . Отметим, что HTML-документ, содержащий только заголовочную часть, будет нормально отображаться браузерами как пустой документ. Пример такого документа представлен на рис. 2.1.
Рис. 2.1. Пример отображения в браузере MS Internet Explorer пустого HTML-документа
А ниже показан соответствующий этому документу HTML-код:
Пустой документ
Наличие пробелов между тэгами или внутри контейнеров никак не влияет на отображение HTML-документа.
2.2. Тело документа и оформление его основных фрагментов
2.2.1. Тело документа
Внутри контейнера
(BODY – тело) и размещается содержательная часть электронного документа. Сам тэг содержит ряд параметров, ни один из которых не является обязательным. Параметры данного тэга обеспечивают оформление всего тела документа. Перечислим их:
? LINK – определяет исходный цвет ссылки;
? BACKGROUND (фон) – задает URL изображения, определяющего фон тела документа;
? BOTTOMMARGIN (нижнее поле) и TOPMARGIN (верхнее поле) – задает границу нижнего и верхнего полей документа в пикселах;
? LEFTMARGIN (левое поле) и RIGHTMARGIN (правое поле) – границы левого и правого полей документа в пикселах;
? BGCOLOR (Background Color – цвет фона) – задает цветовой оттенок фона документа (аналог тонирования бумаги, на которой печатается издание);
? BGPROPERTIES (Background Properties – свойства фона) – определяет свойства фона, задаваемого предыдущим параметром;
? LINK – задает цвет еще не просмотренной ссылки;
? SCROLL (прокрутка) – определяет наличие полос прокрутки в документе, отображаемом в окне браузера;
? TEXT – определяет цвет текста;
? VLINK – цвет уже просмотренной ссылки.
Ряд параметров связаны с использованием цветовых оттенков в HTML-документах. Отметим, что по умолчанию в них используется RGB-цветовое пространство, причем значение каждого из основных цветов имеет 256 уровней и задается в виде 2 цифр в 16-ричной системе счисления от 00 до FF. Таким образом, цветовой тон задается последовательностью из шести 16-ричных цифр, которым предшествует символ #, например, последовательность #FFFFFF соответствует белому цвету максимальной интенсивности, а #800080 – фиолетовому тону, интенсивность которого равна половине от максимальной.
Приведем примеры использования параметров в тэге
:
В первом примере задан синий цвет еще не просмотренной ссылки и в качестве фонового изображения используется файл background.gif, причем этот файл указан относительной ссылкой и находится в подкаталоге IMAGE. А во втором примере задан светло-серый фон для документа.
2.2.2. Тэги логического форматирования текста
Тэги логического форматирования текста позволяют выделить определенные типы текстовых фрагментов, т. е. осуществить структурную разметку текста. Их называют также тэгами уровня блока, так как они не применимы к отдельным словам, а воздействуют лишь на фрагменты текста из нескольких слов. Так, два тэга (Abbreviation) и ("акроним", сокращение – заимствование из греческого языка) позволяют выделить аббревиатурные сокращения в пределах текста, причем второй используется для произносимой аббревиатуры. В тэге может использоваться параметр TITLE, значением которого является полный текст сокращения. Например, контейнер:
МГУП
позволяет при указании курсором манипулятора мышь на аббревиатуру выводить во всплывающем окне соответствующий ей полный текст названия этого Университета.
Тэг-контейнер (цитата) используется для выделения цитат, названий книг, газет и журналов. Браузеры обычно выводят текст, находящийся внутри контейнера, курсивом. Тэг-контейнер (код) выводит текст как фрагмент программного кода (строки листинга программы) моноширинным шрифтом, а (Definition – определение) отмечает текстовый фрагмент как определяемый термин. Аналогичным образом тэг-контейнер (сильный, веский) выделяет содержимое как важный фрагмент текста.
Тэг (Insert – вставка) отмечает фрагмент текста, как вставку, т. е. с его помощью можно отслеживать изменения, вносимые в основной текст. Тэг может иметь 2 параметра: CITE (здесь в смысле – ссылаться, не путать с одноименным тэгом) и DATETIME (дата и время). С помощью первого параметра задается URL документа, поясняющего причины вставки, а второй параметр указывает дату и время вставки фрагмента с учетом часового пояса. Тэг-контейнер (Delete – удалять, уничтожать) отмечает текст, как намеченный к удалению. У него имеются параметры CITE и DATETIME, назначение которых точно такое, как и в тэге . Ниже приводятся несколько примеров записи тэгов, которые не требуют каких-либо комментариев.
"Известия" – популярная Российская газета
Netscape Communicator 4.5– версия 4.5 популярного пакета фирмы Netscape, в который, в частности, входит браузер для просмотра HTMLфайлов.
Кроме браузера Netscape Navigator в Netscape Communicator имеется HTML-редактор Netscape Composer и почтовый агент Netscape Messenger.
Ниже, на рис. 2.2, представлен пример отображения гипертекстового документа, в теле которого содержится ряд тэгов логического форматирования текста.
Рис. 2.2. Пример отображения в браузере MS Internet Explorer тэгов логического форматирования текста
2.2.3. Тэги физического форматирования текста
Тэги физического форматирования определяют формат заключенного внутри соответствующих контейнеров текста при отображении на экране монитора. Как уже говорилось в начале этой главы, вместо них желательно использовать тэги логического форматирования, если последние могут выполнить аналогичную функцию.
Так, тэг-контейнер (Bold – жирный) выделяет заключенный внутри его текст полужирным начертанием. Аналогичным образом, тэги (Italic – курсив) и (Underline – подчеркивание) означают курсивное начертание и подчеркивание текста соответственно, а тэг – моноширинный шрифт. Тэги (перечеркнуть) и (аббревиатура от Strike) совпадают по назначению и обеспечивают перечеркивание фрагмента текста горизонтальной линией, как намеченного к удалению. Надо отметить, что все перечисленные тэги относятся к устаревшим и не рекомендуются к применению. Так, вместо тэга предпочтительнее использовать рассмотренный выше тэг логического форматирования текста , вместо или – , а вместо – .
Из других тэгов "шрифтового оформления" отметим (большой) и (малый), которые увеличивают или уменьшают размер шрифта на одну единицу, (приставка, указывающая на положение ниже чеголибо) и (от Super – приставки, переводимой как над– или сверх), размещающие символы выше или ниже уровня строки. Более универсальным в этой группе является тэг (шрифт), который имеет 3 параметра: FACE (рисунок шрифта, гарнитура), SIZE (размер) и COLOR. Первый параметр позволяет указать используемую в текстовом фрагменте гарнитуру, причем, если такая гарнитура не установлена на компьютере, то параметр игнорируется. Можно задавать несколько наименований гарнитур, разделяя их запятыми, тогда будет использоваться первая по списку из имеющихся в наличии. Второй параметр задает размер (но не кегль) шрифта. Всего в языке HTML предусмотрено 7 размеров, из которых номер 3 используется по умолчанию. Последний параметр указывает цвет символов текста и может задаваться в виде группы из 7 символов, как указывалось выше, или в наименованиях цветовых тонов. Приведем несколько примеров:
текст
текст
5 2
В первом примере символы текста, содержащиеся внутри контейнера будут отображаться гарнитурой Arial, если она установлена на компьютере, а в противном случае – гарнитурой Courier. Размер символов будет достаточно велик и они будут красного цвета. Во втором примере будет использована гарнитура Times, размер символов будет на 1 меньше нормального и символы будут того же самого красного цвета. В последнем случае в окне браузера будет отображаться 52, причем размер показателя степени будет на единицу меньше, чем ее основания.
Третий пример иллюстрирует и другое важное свойство тэгов-контейнеров физического форматирования текстовых символов: контейнеры могут быть вложены один в другой, причем глубина вложений формально не ограничена. При написании HTML-документа вручную необходимо только тщательно следить, чтобы контейнеры строго размещались один внутри другого. Действительно, в примере контейнер и расположен внутри и , а последний вложен в контейнер и .
Все рассмотренные выше тэги физического форматирования, если их действие рассматривать подобно функциям текстовых редакторов, относятся к шрифтовому оформлению текстовых фрагментов. Поэтому далее следует остановиться на тэгах, выполняющих функции, подобные форматированию абзаца. К ним, в частности, относится тэг разделения документа на абзацы
(Paragraph – абзац), который помещается перед началом очередного абзаца. Закрывающий тэг
не обязателен, так как абзацы следуют друг за другом и начало следующего абзаца указывает на конец предыдущего. Браузеры (см. главу 4) обычно отделяют абзацы друг от друга пустой строкой. Параметром этого тэга является ALIGN, т. е. выравнивание. Параметры выравнивания: LEFT (влево), CENTER (по центру), RIGHT (вправо) и JUSTIFY (выключка, выравнивание по ширине), причем последний только сравнительно недавно начал поддерживаться браузерами.
При отображении документов в окне браузера место перевода строки определяется автоматически, в соответствии с реальными размерами его окна. В тех случаях, когда требуется выполнить принудительный перевод строки в определенном месте, используется тэг (Break – разрыв), у которого нет закрывающего тэга. Тэг , в частности, используется при работе со стихотворными строками. В отличии от тэга
, при использовании тэга браузер не генерирует на экране пустую строку.
Рис. 2.3. Пример отображения шрифтового оформления документа
Наоборот, в тех случаях, когда перенос на другую строку внутри фрагмента текста недопустим, следует использовать тэг-контейнер (No Break – отсутствие разрыва) и . Находящийся внутри контейнера текст не переносится на другую строку, т. е. не разрывается. Если такая строка получается слишком длинной, то в окне просмотра браузера автоматически появляется полоса прокрутки. В качестве примера на рис. 2.3 показано отображение HTML-документа в окне браузера Internet Explorer, а выше – исходный HTML-код для этого документа.
Размер текста, помещенного внутри HTML-документа формально не ограничен, т. е. он может быть эквивалентен множеству печатных страниц. На практике это обстоятельство приводит к появлению длинных страниц, для просмотра которых требуется вертикальная полоса прокрутки. Поэтому предусмотрена возможность разбивки такого протяженного текста на отдельные главы и параграфы с помощью заголовков различного уровня. Для разметки заголовков служат 6 тэгов-контейнеров
…
(Head – заголовок), причем тэги с меньшими номерами определяют заголовки более высокого уровня. Все перечисленные тэги относятся к уровню блока, т. е. не могут использоваться для разметки отдельных слов. В качестве единственного параметра этих тэгов используется ALIGN, который задает способ выравнивания заголовка (точно так же, как в тэге
). Например,
Заголовок 1-го уровня
Заголовок 3-го уровня
В первом примере заголовок выравнивается по центру и в нем используется наибольший размер кегля шрифта, такой как в тэге . Во втором случае текст заголовка выравнивается по левому краю, а размер шрифта соответствует значению параметра SIZE=5. Во всех случаях заголовки выделяются осветленным пространством в виде пропущенной строки до и после строки заголовка и полужирным шрифтом самого заголовка. Наконец, тэг заголовка аккумулирует в себе функции тэга абзаца, т. е. нет необходимости в использовании одновременно с тэгом
еще и тэга
.
Помимо заголовков, для разделения документа на отдельные разделы могут использоваться горизонтальные линии, играющие ту же роль, что и орнаментальные линейки в печатных изданиях, где такие линейки используются в конце определенных разделов, отделяя предыдущий фрагмент издания от последующего. Для генерации таких линий в электронном документе используется тэг , который не является контейнером. В тэге могут использоваться 5 различных параметров. Параметр выравнивания ALIGN может принимать значения LEFT, CENTER и RIGHT. Параметр WIDTH задает длину линии в пикселах или в процентах от ширины окна браузера, что обычно предпочтительнее, а SIZE определяет толщину линии в пикселах. Параметр COLOR определяет цветовые характеристики линии, т. е. реализует те же функции, что и аналогичный параметр в тэге
. Наконец, параметр NOSHADE отменяет рельефный характер линии, причем у него значение отсутствует, само наличие в тэге этого параметра характеризует отсутствие рельефа. Пример записи тэга:
На практике мы иногда сталкиваемся со случаями, когда в HTML-документ необходимо включить уже отформатированный текст, причем он должен отображаться браузером так, как он был подготовлен в текстовом редакторе. Для этой цели предусмотрен тэг-контейнер
. После этого тэга можно включить предварительно отформатированный текст, который должен в том же виде выводится в окне браузера.
Для включения цитат большой протяженности (много сотен символов) предназначен тэг-контейнер
. Это – тэг уровня блока. Браузеры выделяют текст, размещенный внутри такого контейнера, пустыми строками до и после и небольшим отступом слева по отношению к основной части документа. Поэтому тэг
(цитата большого размера) можно использовать не только для длинных цитат, но и для выделения некоторых блоков текста.
Из других тэгов уровня блока, используемых для выделения фрагментов документа можно отметить
(Division – раздел). Используя контейнер с этим тэгом, можно управлять параметрами данного фрагмента путем задания параметра STYLE – назначения стилей, например:
(Фрагмент документа)
выделит все текстовые элементы указанного фрагмента зеленым цветом. Тэг-контейнер уровня блока
предназначен для горизонтального выравнивания всех заключенных в него элементов посередине окна просмотра браузера. В частности он используется для выравнивания по центру таблиц (см. разд. 2.6). Косвенное отношение ко всем рассмотренным в данном разделе тэгам имеет тэг-контейнер (адрес, обращение), который применяется для указания автора, владельца авторских прав, адреса автора, а иногда и даты создания и последнего обновления электронного издания. Текст внутри такого контейнера обычно отображается браузерами курсивом. Соответствующий пример приведен в конце главы, для сравнения исходного HTML-кода и отображения документа в окне браузера.
Специфическим видом текста, который иногда включают в электронное издание и ценность которого сомнительна – является бегущая строка. Зато на Web-страницах такие фрагменты нередко используются, преимущественно в рекламных целях. Для создания бегущей строки используется тэг-контейнер
2.3. Оформление списков терминов и определений
Списки принадлежат к наиболее употребительным формам, как в электронных, так и в печатных изданиях. Возможность представления списковых структур предусмотрена практически во всех текстовых редакторах, в частности, развитая система для списковых структур имеется в MS Word, весьма популярном редакторе в нашей стране. В HTML-документах наряду с обычными маркированным и нумерованным списками предусмотрен отдельный список определений. Оформление этих списков посредством специальных тэгов составит предмет этого раздела.
2.3.1. Маркированные списки
Маркированные списки создаются с помощью тэга-контейнера
(Unordered List – ненумерованный список). В тэге могут использоваться два параметра: COMPACT (сжатый, компактный), который изначально предназначался для вывода элементов списка в компактной форме (уменьшенным кеглем и расстоянием между строками) и TYPE (тип), который используется для принудительного задания вида маркера. Параметр COMPACT не имеет значений. Современными браузерами он игнорируется. Параметр TYPE может принимать одно из трех значений: disc (круг), circle (окружность) и square (квадрат). В первом случае маркеры (bullets) имеют вид закрашенного круга, во втором – окружности малого диаметра, в третьем – закрашенного квадрата. По умолчанию значение TYPE=disk.
Каждому элементу списка предшествует тэг
(List Item – элемент списка), который необязательно должен быть контейнером. В качестве параметра этого тэга также используется TYPE, который может принимать те же самые 3 значения. Таким образом, в списке принципиально могут использоваться и различные маркеры для представления отдельных элементов.
2.3.2. Создание нумерованных списков
Нумерованный список организуется с помощью тэга-контейнера
(Ordered List – нумерованный список), внутри которого размещаются все элементы списка. Открывающий и закрывающий тэги обеспечивают пропуски строк до и после списка, выделяя его таким образом в документе. В составе тэга могут использоваться 3 параметра: COMPACT, TYPE и START (начало). Смысл первого параметра тот же самый, что и в тэге
. Параметр TYPE по-прежнему определяет тип маркера, причем TYPE=1 определяет маркеры в виде арабских цифр, TYPE=A задает маркеры в виде прописных букв латинского алфавита, TYPE=a – в виде строчных латинских букв, наконец, TYPE=I и TYPE=i определяют маркеры в виде римских цифр, больших и малых соответственно. Параметр TYPE, заданный в форме конкретного числа определяет начало отсчета для первого элемента списка. Начальный номер элемента может быть задан и путем задания значения параметра START.
Каждый элемент нумерованного списка предваряется тэгом
, причем в этом случае в составе тэга может содержаться параметр VALUE (значение), который позволяет изменять номер очередного элемента списка, в результате чего соответственно изменяются и все последующие номера. В качестве примера можно привести фрагмент спортивных новостей, в которых содержатся результаты какого-либо соревнования:
Пример нумерованного списка Результаты чемпионата мира по гандболу 2001
Франция
Румыния
Германия
…
Россия
Украина
При выводе в окне браузера документа, HTML-код которого представлен выше, мы увидим изображение, показанное на рис. 2.4. Название документа, размещенное в тэге-контейнере
в заголовочной части документа, выведено в строке заголовка браузера. Название списка в теле документа показано полужирным шрифтов перед собственно списком. Нумерация списка по умолчанию производится арабскими цифрами, так как параметр TYPE в тэге отсутствует. Нумерация списка начинается по умолчанию с первого номера, так как и параметр START в тэге отсутствует. С помощью параметра VALUE=6 в одном из тэгов
изменен номер очередного элемента списка, а дальнейшая нумерация продолжается с нового номера. Для создания строки, в которой содержится любое заданное количество точек использован тэг принудительного перевода строки .
Рис. 2.4. Пример отображения в браузере MS Internet Explorer нумерованного списка
2.3.3. Списки определений
В научно-технических и учебных изданиях нередко используют списки или словари определений, которые в зарубежных книгах называют глоссариями. В качестве примеров можно сослаться на [32] и [24]. Каждый элемент такого списка начинается с определяемого термина, после которого следует его определение. Для создания списка определений служит тэг-контейнер
(Definition List список определений), внутри которого тэг
(Definition Term определяемое слово, термин) задает определяемый термин в форме единственной строки, а тэг
(Definition Description описание определяемого термина) предшествует абзацу с определением этого термина. В качестве примера приведем фрагмент списка определений для компьютерной графики.
Cписок терминов и определений
Пиксел
Наименьший элемент изображения, который характеризуется постоянством параметров по всей своей поверхности
Разрешение монитора
Разрешение монитора определяется количеством пикселов на единицу длины и составляет около 96 пикселей на дюйм
Линиатура растра
Частота размещения растровых точек в плоскости изображения, измеряется числом линий на дюйм
Отображение этого файла в окне просмотра браузера показано на рис. 2.5. Как следует из записи исходного HTML-документа никаких попыток выравнивания текста и формирования отступов не производилось. Сами тэги
и
так форматируют текст, что обеспечивают оптимальное его восприятие пользователем. Фон документа задается определенным уровнем серого, в соответствии со значением параметра BGCOLOR в тэге . Кстати, язык HTML, как следует из представленного выше фрагмента HTMLкода, нечувствителен к регистру.
Рис. 2.5. Пример отображения в браузере документа – списка определений
2.3.4. Многоуровневые списковые структуры
Многоуровневые списки в HTML-документах могут создаваться путем вложения одного типа списка внутрь другого. Например, фрагменты нумерованного списка могут быть вложены внутрь маркированного или наоборот. Сказанное иллюстрируется простым примером, в котором перечисляются спутники некоторых планет нашей солнечной системы.
Пример двухуровневого списка
Спутники планет
....
ЗЕМЛЯ
Луна
МАРС
Фобос
Деймос
....
Отображение двухуровневого списка в окне браузера показано на рис. 2.6. Внутри тэга-контейнера маркированного списка
размещены 2 контейнера нумерованного списка и со своими тэгами
каждый. Дополнительный отступ слева обеспечивает хорошую читаемость текста. По этой схеме можно создавать и многоуровневые списки.
Рис. 2.6. Пример отображения в браузере двухуровневого списка
2.4. Использование графики при оформлении электронного издания
Известно, что с помощью графики можно точнее передать идеи и назначение любого издания, в том числе и электронного. Без иллюстрации полосы набора выглядят однообразными, а хорошо подобранная и умело размещенная графика делает издание гораздо более привлекательным. Ограничения в использовании графики с позиций эстетики связано с опасностью загромождения документа изображениями, в том числе и фоновыми, и навязчивой анимацией, зачастую не связанной непосредственно с тематикой издания.
С технической точки зрения изображения требуют значительно большего объема информации, чем простой текст, поэтому может возникнуть информационная перегрузка, особенно при использовании сетевых технологий с каналами недостаточной пропускной способности. Известно, что многие пользователи сети Интернет отключают загрузку графических файлов, чтобы быстрее загрузить документ и ознакомиться с ним. Несколько улучшило положение применение компактных форматов графических файлов, таких как JPEG (с частичной потерей информации), GIF и PNG. В качестве иллюстрации сказанного можно привести данные по размеру файлов различного формата, в каждом из которых хранятся одни и те же графические данные, представленные на рис.2.7, а именно TIFF – 46 Кбайт, JPEG – 31 Кбайт, PNG – 8 Кбайт и GIF – около 5 Кбайт.
Мы уже сталкивались с использованием изображения в качестве фонового при знакомстве с тэгом
. Для этого в параметре BACKGROUND указывался URL файла, хранящего изображения. Если в электронных изданиях, распространяемых на носителях, можно использовать практически любые графические файлы, то для сетевых изданий преимущественно используются GIF-файлы, реже файлы в формате JPEG.