Структура текстового документа

Структурные единицы текста

Прежде чем приступить к рассмотрению вопросов связанных с работой в текстовом редакторе необходимо иметь представление о структуре текстового документа и свойствах тех или иных его составляющих.

Понимание структуры документа дает возможность грамотно его оформить и без труда переформатировать в случае необходимости, а представление о свойствах элементов текстового документа и есть основа форматирования.

Любой, даже самый простейший, документ состоит из различных разделов. Под разделом мы понимаем часть текста несущую определенный функциональный смысл.

К примеру, документ "Текстовые редакторы" разбит на разделы "Параграф", каждый из которых разбит на разделы "Пункт". В параграфах рассматриваются различные стороны работы с текстовыми редакторами (примеры параграфа: "Форматирование текста", "Подготовка документа к публикации" и так далее). В пунктах происходит детализация темы парафграфа (пример пунктов: "Свойства символов", "Свойства абзацев" и так далее).

Так как одни разделы являются частями других (документ состоит из параграфов, параграфы состоят из пунктов), то разделы различают по уровням, раздел, входящий в состав другого на уровень его ниже. Проводя обобщение, момжно сказать, что весь текстовый документ - это раздел 1 уровня, разделы из которых он состоит – разделы 2 уровня и так далее.

Такое обязательное свойство разделов, как его название принято называть заголовком по уровню их разделов: заголовок 1 уровня, заголовок 2 уровня и так далее.

Пример: документ "Текстовые редакторы" – раздел1 уровня, параграфы – разделы2 уровня, пункты – разделы 3 уровня.

Примечание: названия разделов разного уровня составляют оглавление документа.

Однако структуру текстового документа формируют не только разделы. Каждый абзац можно классифицировать по тому функциональному смыслу, который он несет.

Пример структурных элементов типа абзац: пример, основной текст, примечание, формула.

Предложения, не являющиеся абзацами, и даже отдельные слова, также можно классифицировать по их функциональному смыслу. Такие функциональные единицы называют сивмольными структурными элементами.

Пример символьных структурных элементов: пример, основной текст, определение, главная мысль.

Таким образом различают три типа функциональных единиц или структурных элементов текстового документа: разделы, абзацные и символьные структурные элементы.

Вычленение структурных элементов текста обеспечивает структуризацию документа, что позволяет более адекватно воспринимать его читателю. Одинаковые структурные элементы (например, название глав книги), естественно, оформляются одинаково. Причем, как создателю, так и читателю документа должно быть понятно, какой из этих элементов, что означает и с каким из них читатель имеет дело в данный момент.

Примечание: специальных элементов оформления к разделам, как правило, не применяют, поэтому в дальнейшем, в вопросах оформления структурных элементов, мы будем подразумевать абзацные и символьные элементы.

Каждый создатель текстового документа имеет право применять к структурным элементам то оформление, которое считает нужным, как он привык или как ему удобно. Однако восприятие других людей данного документа отличается от восприятия автора, но они тоже имеют право читать данный документ в той форме, которая для них более удобна. Таким образом текстовый редактор должен обладать возможностью создавать и применять к структуриванному текстовому документу свое оформление. Однако в настоящий момент это еще не реализовано.

Помимо вкусов различных читателей и авторов существуют ряд требований по оформлению официальных документов (ГОСТы), независящих от вкусов конкретного человека.

Каким образом можно одновременно предоставить максимальную свободу по оформлению документов его создателю, и одновременно с этим сделать его удобным для читателя или удовлетворить формальным требованиям? И в этом нам на помощь приходит текстовой редактор.

При грамотной структуризации документа все структурные элементы текста должны быть четко определены. Каждый из них имеет собственное форматирование (стиль), которое описывается всего один раз.

Примечание. Разные текстовые редакторы реализуют это по-разному, но для понимания того, как работают стили удобно рассмотреть технологию СSS, применяемую для написания Web-страничек, как одного из примеров текстовых документов. В начале документа (или в отдельном файле) перечисляются стили, используемые в документе и описание элементов их форматирования. К примеру: Стиль "Заголовок" имеет 12 размер, полужирное начертание, выровнен по центру; стиль "Основной текст" имеет 10 размер, нормальное начертание, основное выравнивание. После описания стилей идет собственно содержание документа с указанием какой участок текста каким элементом является (и, естественно, какой стиль применяется к данному элементу).

Таким образом, каждый пользователь имеет возможность создавать стили, которые ему кажутся удобными (или которые от него требуют формальные правила), применять их к чужому (но, структурированному) документу, и получать на выходе документ оформленный в соответствии с собственными требованиями.

Примечание. В большинстве развитых текстовых редакторов понятие "стиль" и "структурный элемент документа" отожествляют, однако это не совсем так. Под "структурным элементом документа" следует понимать функционально определенную часть текста, а под "стилем" набор элементов форматирования. То есть различные стили можно применять к различным элементам (по желанию автора).

К примеру: пользователь описал десять различных стилей, в его текущем документе два раздела, причем ему необходимо оформить его в двух видах: для собственного архива и для передачи своему начальнику; пользователь описывает структурные элементы, сохраняет две копии документа, причем в одной копии он связывает элементы текста с одними стилями (применяет одни стили), а в другой – с другими.

Но если в текстовом редакторе не предусмотрено раздельное описание стилей и элементов документа, то под под стилем, как раз, и следует понимать структурный элемент. В некоторых текстовых редакторах стили имеют название структурных элементов. К примеру: Заголовок, Основной текст, Подпись и др.

Примеры типов структурных единиц

Заголовок

Под заголовком, как правило понимают название (или заглавие) документа или какой-либо его части. Хотя заголовок – это свойство раздела, однако, когда он визуализирован, то по своим свойствам отностся к абзацным структурным элементам.

К примеру название книги - это заголовок. Книга состоит из глав, главы из параграфов. Название глав и параграфов - также заголовки. Однако нзвание книги, название глав и название параграфов имеют различный "вес", то есть название параграфа определяет более узкую и конкретную информацию, чем название книги. В связи с этим заголовки делят на уровни, чем более общую информацию (в данном документе) описывает заголовок тем выше его уровень.

Например: название книги - это заголовок первого уровня, а название параграфа - заголовок третьего уровня.

Заголовки, как правило делают крупнее, чем основной текст документа, и более плотным (жирным) начертанием (это позволяет более быстро находить заголовки в тексте). Выравнивают заголовки обычно по центру, хотя это и не правило. Заголовки более высокого уровня оформляются более весомо (крупнее кегль, более жирное начертание и т.д.) чем заголовки менее высокого уровня.

Основной текст

Под основным текстом понимают наиболее информативную часть документа. Этих элементов, как правило, больше, чем всех остальных, поэтому основной текст делают неплотным (в целях экономии чернил) и простым (не фигурным), что позволяет не утомлять глаза читателя. Основной текст обычно выравнивают основным выравниванием, что позволяет документу выглядеть более красиво.

Подпись (или Автор)

Это тоже одно из свойств раздела. Размещают этот элемент сразу под заголовком или в конце раздела (в зависимости от типа документа). Относится к разряду абзацных структурных элементов. В отдельных случаях, на пример, в цитатах, может быть и символьным элементом.

Автор" – это сопроводительная информация к названию раздела, поэтому она должна отличаться от основного текста, но быть менее броской, чем заголовок. Как правило этот раздел выделяют курсивом и правым выравниванием. Если подпись стоит вверху документа, то возможно увеличение размера, по отношению к основному тексту.

Вспомогательная информация

Вспомогательной информацией могут быть сноски, примечания, пояснения, заметки и т.д. Так как информация вспомогательная, то читатель имеет право ее пропустить, не опасаясь потерять смысловую линию, которую ведет автор. Вследствие этого данный элемент оформляется более мелким размером, чем основной текст. Иногда к вспомогательной информации применяют большие отступы, чем к основному тексту.

Важная информация

Это может быть определение, вывод, предупреждение или любая другая информация, на которую стоит обратить внимание. Исходя из своего функционала данный элемент должен обращать на себя внимание читателя, поэтому его выделяют или более крупным шрифтом (в случаях абзацных элементов) или более плотным начертанием.

Цитаты, адреса и ссылки на другие документы

Как правило относятся к символьнм структурным элементам. Выделяют их обычно курсивным начертанием.

Заключение

Правильная структуризация документа важна не только для пользователей непосредственно работающих с ними, но и для людей пользующихся поисковыми системами и системами автоматического учета электронной документации, которые все больше и больше входят в повседневную жизнь. При правильно построенной структуре поисковый робот может более адекватно классифицировать Ваш документ и внести в каталог учета ресурсов корректную информацию.

Пример. Робот поисковик вносит в каталог название документа и его аннотацию. В случае отсутствия аннотации он будет использовать введение или первые несколько абзацев основного текста. Если Вы правильно структурировали документ, то робот найдет первый заголовок и первый основной текст и запишет к себе в каталог, но если Вы оформили весь основной текст, как вспомогательную информацию, или как заголовок более низкого уровня, то в каталог робота попадет только название документа без описания.