You are on page 1of 384

Загуменов А. П.

Как раскрутить и
разрекламировать
Webсайт
в сети Интернет

Москва, 2005
УДК 004.4’234
ББК 32.973.26 018.2
314

Загуменов А. П.
314 Как раскрутить и разрекламировать Webсайт в сети Интернет. – М.: ДМК
Пресс, 2005. – 384 с., ил.

ISBN 5 94074 027 8

Настоящая книга заинтересует всех, кто столкнулся с вопросами подготовки,


размещения в Сети и популяризации Internetресурсов различного уровня: от до
машней странички до корпоративного сайта. В ней вы найдете все, что необходимо
для оптимизации Webсайтов под поисковые системы: приемы написания Web
страниц, описание множества самых популярных специализированных программ,
предназначенных для подготовки сайта и его раскрутки, создания удачного HTML
кода страниц с правильными метаданными.
Книга является практическим руководством для разработчиков Webсайтов и
всех, занимающихся их продвижением. Автор приводит множество советов, касаю
щихся создания и анонсирования Webстраниц. Рассмотрены средства автоматиза
ции для повышения эффективности разработки и маркетинга при создании и обслу
живании сайта. Описание программных и сетевых средств, автоматизирующих
процессы тестирования и отладки сайта, обеспечивающих проверку работоспособ
ности и корректности гиперссылок, синтаксиса HTMLкода и грамматики разме
щенного на странице текста, занимает центральное место в книге. Подробно излага
ются возможности таких программ, как Linkbot Developer Edition, Domain Name
Checker, Retrieve, CyberSpyder Link Test, HTML Link Validator, CSE HTML Validator,
A Real Validator, MetaTag ToolKit, MetaMan, WebQA.
Отдельная глава посвящена регистрации Webресурсов в поисковых системах
и каталогах. Описываются программы автоматической регистрации (WebPosition,
Page Promoter, WebРегистратор), способы взаимодействия с индексирующими
роботами поисковых машин, правила применения метаданных. Рассматриваются
приемы и методы рекламы сайтов в Internet, указаны критерии ее эффективности.
Издание рассчитано на широкий круг читателей и будет полезно как начинаю
щим создателям Webсайтов, так и профессионалам, которые хотят научиться бо
лее качественно продвигать в Сети свой Webпродукт.

УДК 004.4’234
ББК 32.973.26018.2

Все права защищены. Любая часть этой книги не может быть воспроизведена в какой бы то
ни было форме и какими бы то ни было средствами без письменного разрешения владельцев
авторских прав.
Материал, изложенный в данной книге, многократно проверен. Но, поскольку вероятность
технических ошибок все равно существует, издательство не может гарантировать абсолютную
точность и правильность приводимых сведений. В связи с этим издательство не несет ответ
ственности за возможные ошибки, связанные с использованием книги.

© Загуменов А. П., 2005


ISBN 5940740278 © Оформление ДМК Пресс, 2005
Краткое содержание
Глава 1
ЭТАПЫ БОЛЬШОГО ПУТИ ............................................... 11
Глава 2
АВТОМАТИЗАЦИЯ ................................................................ 99
Глава 3
РАБОТА С ПОИСКОВЫМИ СИСТЕМАМИ
И КАТАЛОГАМ И .................................................................. 279
Глава 4
СТАТИСТИКА ......................................................................... 369
Содержание
Введение .................................................................................... 9
Глава 1
Этапы большого пути ......................................................... 11
Собственное доменное имя ...................................................... 13
Разработка семантического ядра ............................................ 15
Обновление информации ......................................................... 15
Заголовки ................................................................................... 16
Метаданные ............................................................................... 17
Метатэги – эквиваленты HTTPзаголовков ................................ 18
Свойство Expires ..................................................................... 18
Свойство Pragma .................................................................... 19
Свойство ContentType ............................................................ 19
Немного о кодировках ............................................................. 20
Свойство Contentlanguage ...................................................... 21
Свойство Refresh .................................................................... 22
Свойство Windowtarget ........................................................... 22
Свойство ContentScriptType ................................................... 22
Свойство ContentStyleType .................................................... 23
Метатэги для поисковых машин ................................................ 23
Ключевые слова и описания ..................................................... 24
Язык документа ...................................................................... 28
Языковые варианты документа ................................................. 28
Начало набора ........................................................................ 29
Инструкции для роботов – файл robots.txt .................................. 29
Тэг META для роботов .............................................................. 32
Другие метатэги ..................................................................... 33
Проверка ссылок ....................................................................... 33
Проверка ошибок кода в HTMLдокументах ............................ 34
Задание типа документа ............................................................ 35
Шрифтовое оформление .......................................................... 37
Время загрузки страниц ........................................................... 38
Использование фреймов .......................................................... 39
Содержание 5
Проверка правописания ............................................................ 39
Ошибки правописания – какая от них польза ............................. 39
Навигация по сайту .................................................................... 40
Появление новых окон ............................................................... 40
Нестандартное использование элементов управления ............. 40
Сведения об авторах ................................................................. 41
Отсутствие архивов ................................................................... 42
Улучшение посещаемости сайта
за счет обработки ошибок ........................................................ 42
Перевод на другие языки .......................................................... 43
Анонсирование в поисковых системах .................................... 44
Информационнопоисковые системы ....................................... 45
Индекс поисковой системы ...................................................... 46
Полнотекстовый поиск ............................................................. 47
Учет морфологии .................................................................... 48
Релевантность ........................................................................ 49
Методы регистрации ................................................................. 50
Подготовка к регистрации ........................................................ 52
Адреса регистрационных форм ................................................ 55
Особенности регистрации в поисковой системе Яndex ................ 55
Особенности регистрации в поисковой системе Апорт ................ 57
Особенности регистрации в поисковой системе Rambler ............. 57
Что не надо делать при регистрации ......................................... 58
Как управлять индексированием ............................................. 58
Индекс цитирования .................................................................. 59
Контроль наличия документов в индексе поисковых машин ...... 63
Поисковая система AltaVista ..................................................... 63
Поисковая система Go.com ...................................................... 63
Поисковая система HotBot ....................................................... 63
Поисковая система Lycos ......................................................... 64
Поисковая система Google ....................................................... 65
Поисковая система Яndex ........................................................ 65
Поисковая система Апорт ........................................................ 65
Поисковая система Rambler ..................................................... 65
Поисковая система Поиск@Mail.Ru ........................................... 65
Регистрация в каталогах ........................................................... 66
Как выяснить популярность каталога ......................................... 67
Оценка популярности в поисковой системе AltaVista ................... 67
Оценка популярности в поисковой системе Go.com .................... 68
Оценка популярности в поисковой системе Excite ....................... 68
Оценка популярности в поисковой системе HotBot ..................... 68
6 Как раскрутить Webсайт

Оценка популярности в поисковой системе Lycos ....................... 68


Оценка популярности в поисковой системе Google ..................... 68
Оценка популярности в поисковой системе Яndex ...................... 69
Оценка популярности в поисковой системе Rambler ................... 70
Оценка популярности в поисковой системе Поиск@Mail.Ru ......... 70
Баннерная реклама ................................................................... 71
Требования к баннеру ................................................................ 74
Эффективность баннера ............................................................ 75
Тенденции ................................................................................. 76
Рекламные сети ......................................................................... 76
Российская баннерная сеть RLE Banner Network ......................... 77
Рекламная сеть AdRiver ............................................................ 81
Рекламная сеть ИнтерРеклама ................................................. 82
Баннерная сеть RB2 ................................................................ 82
Контекстная реклама ................................................................ 84
Бегун ......................................................................................... 85
Директ ....................................................................................... 86
Система контекстной рекламы Mail.Ru ...................................... 87
Google AdWords ......................................................................... 87
Обмен ссылками ........................................................................ 89
Сервисы по обмену ссылками ................................................... 92
Автоматизированная система обмена ссылками AddWeb ............ 92
Почтовые рассылки ................................................................... 93
Реклама вне WWW ..................................................................... 96
Другие технологии .................................................................... 96
Анализатор продвижения сайта Stat .......................................... 96
Клуб Mnogo.ru ............................................................................ 98
Глава 2
Автоматизация ...................................................................... 99
Сетевые средства .................................................................... 100
Комплексная автоматизация ................................................... 100
NetMechanic HTML Toolbox ..................................................... 100
Проверка доменных имен ........................................................ 109
Whoisсервис РосНИИРОС ..................................................... 109
Служба Whois InterNIC ............................................................ 112
Проверка доменных имен на сайтах Internetпровайдеров ......... 112
Проверка гиперссылок ............................................................ 114
W3C Link Checker .................................................................. 114
Содержание 7

Проверка HTMLкода ............................................................... 117


Сервис проверки HTMLдокументов Markup Validation Service .... 117
Сервис WDG HTML Validator .................................................... 121
Проверка метатэгов ................................................................ 125
Анализатор SpiderView Density Analyzer .................................... 125
Служба подбора ключевых слов Wordtracker ............................ 129
Служба проверки файла исключений Robots.txt Validator ........... 137
Анализатор Keyword Density Analyzer ....................................... 139
Украинский Генератор метатэгов ............................................ 140
Проверка правописания .......................................................... 142
Фотиния – проверка грамотности Webсайтов .......................... 142
Другие службы русского языка ............................................... 144
Программы ............................................................................... 145
Комплексные решения ............................................................ 145
Linkbot Developer Edition 6.0 ................................................... 145
WebQA 3.0 ............................................................................ 180
Поиск свободных доменных имен ............................................ 190
Domain Name Checker ............................................................ 190
Проверка ссылок ..................................................................... 199
Retrieve 1.0 ........................................................................... 199
CyberSpyder Link Test 2.2.0 ..................................................... 209
HTML Link Validator 4.21 .......................................................... 230
Проверка HTMLкода ............................................................... 236
CSE HTML Validator ................................................................ 236
A Real Validator ...................................................................... 244
Программы для работы с метатэгами ...................................... 245
Программа построения метатэгов MetaTag ToolKit .................... 245
Программа для создания и модификации метатэгов MetaMan ... 248
Компонент WebQA Tag программы WebQA ............................... 257
Программа для работы с метатэгами TagPromoter .................... 273
Программы для проверки правописания ................................. 276
Текстовый редактор Microsoft Word ......................................... 276
Глава 3
Работа с поисковыми системами
и каталогами ......................................................................... 279
Обзор поисковых систем ........................................................ 280
Российские поисковые системы .............................................. 280
Яndex ................................................................................... 280
Поисковая система Rambler ................................................... 287
Поисковая система Апорт ...................................................... 292
8 Как раскрутить Webсайт

Поиск@Mail.ru ....................................................................... 297


Tela ...................................................................................... 300
Rundex ................................................................................. 301
Специализированные российские поисковые системы ........... 303
Файловая поисковая система FileSearch.ru .............................. 303
Поиск музыкальных файлов .................................................... 305
Поисковые системы по ценам на электронику .......................... 305
Поиск по серверам Удмуртии UdmSearch ................................. 305
Поисковые системы ближнего зарубежья ................................ 305
Поисковые ресурсы Украины .................................................. 305
Поисковые ресурсы Армении ................................................. 306
Поисковые ресурсы Киргизии ................................................. 307
Поисковые ресурсы Латвии .................................................... 307
Поисковые ресурсы Эстонии .................................................. 307
Зарубежные поисковые системы ............................................. 307
Поисковая система AltaVista ................................................... 308
Поисковая система GO.com ................................................... 310
Поисковая система Excite ....................................................... 310
Поисковая система HotBot ..................................................... 311
Поисковая система Lycos ....................................................... 311
Поисковая система Google ..................................................... 311
Обзор наиболее известных каталогов ................................... 313
Русскоязычные каталоги .......................................................... 313
Каталог List.Mail.ru ................................................................ 313
Каталог Улитка ...................................................................... 315
Каталог Optime ..................................................................... 316
Каталог портала Российская Информационная Сеть ................. 317
Каталог Russia on the Net ........................................................ 319
Каталог WebList.Ru ................................................................ 320
Каталог Iван Sусанин ............................................................. 320
Адреса регистрационных форм ............................................... 321
Зарубежные каталоги .............................................................. 322
Программы для автоматического заполнения форм ........... 323
Программа для заполнения форм AI RoboForm 6.1.1 .............. 323
Пасскарты ............................................................................ 327
Заметки ............................................................................... 330
Персоны .............................................................................. 330
Защита паролем ................................................................... 333
Генератор паролей ................................................................ 334
Браузер Mozilla ........................................................................ 334
Браузер Netscape 7.2 ............................................................... 337
Сетевые средства регистрации ............................................. 338
Регистратура ........................................................................... 338
Служба Submitter.ru ................................................................. 340
Содержание 9
Авторегистрация The Best Free ................................................ 340
Служба Add Me! ....................................................................... 341
Сервис SelfPromotion.com ....................................................... 345
Система регистрации Internetресурсов 1PS.RU ..................... 348
Служба регистрации Submit Plus ............................................. 354
Программырегистраторы ...................................................... 354
WebPosition 3 ........................................................................... 354
Page Promoter 6.3 .................................................................... 358
WebРегистратор ..................................................................... 366
Глава 4
Статистика ............................................................................. 369
Системы статистики в Internet ............................................... 370
Счетчики и рейтинги ................................................................ 370
Анализ файлов посещений ..................................................... 370
Программы .............................................................................. 372
Программа анализа серверных файлов A nalog 5.32 .................. 372
Время загрузки страниц ......................................................... 375
Программы .............................................................................. 375
HTMLSizer 3.0 ....................................................................... 375
HTML оптимизатор 2.0 ........................................................... 376
Краткий бюллетень Internet .......................................... 379
Организации............................................................................ 379
HTML ....................................................................................... 381
JavaScript ................................................................................. 380
Java ......................................................................................... 380
CGI ........................................................................................... 380
Perl .......................................................................................... 380
PHP .......................................................................................... 381
Электронные издания .............................................................. 381
Советы Webмастеру ............................................................... 382
Каскадные (иерархические) таблицы стилей ........................... 382
Программное обеспечение...................................................... 382
Литература ............................................................................ 383
Введение
Настоящее издание заинтересует всех, кто разместил в Internet Webстраницу или
целый сайт и стремится привлечь к ним посетителей или своих клиентов. В книге
рассматриваются подготовка и проведение рекламной кампании Webресурсов, ана
лиз ее результатов. Особое внимание уделено оценке популярности Internetстра
ниц, исправлению ошибок и поддержке посещаемости на высоком уровне. Указанные
задачи вполне поддаются автоматизации при помощи программного обеспечения,
а также средствами Internet, чему и посвящена большая часть страниц издания.
В главе 1 рассказывается обо всех аспектах раскрутки сайтов, выборе доменного
имени, разработке семантического ядра запросов, о том, как управлять индексирова
нием страниц в поисковых системах, о пользе регистрации в каталогах и обмена
ссылками с партнерами, о почтовых рассылках, о влиянии баннерной и контекстной
рекламы на посещаемость сайта. Большое внимание уделено описанию метаданных,
применяемых для оптимизации Webсайтов под поисковые системы Internet. Опи
саны различные методы обнаружения технических ошибок при размещении сайтов
в Сети, – неверных ссылок, погрешностей HTMLкода, ошибок правописания.
Предлагаются разнообразные способы всесторонней проверки страниц.
Глава 2 посвящена автоматизации всех этапов работы над сайтом по его про
движению в Internet. То, о чем написано в главе 1, здесь подкреплено описанием
возможностей ресурсов Internet и таких программ, как Linkbot Developer Edition,
Domain Name Checker, Retrieve, CyberSpyder Link Test, HTML Link Validator,
CSE HTML Validator, A Real Validator, MetaTag ToolKit, MetaMan, WebQA.
В главе 3 рассмотрены методы и средства анонсирования сайта в поисковых
системах, благодаря которому сайт при поиске по ключевым словам попадает
в первую десятку найденных. Подробно описываются наиболее популярные отече
ственные и зарубежные поисковые машины. Поиск в каталогах часто обеспечи
вает лучшие результаты, нежели в автоматических поисковых системах, поэтому
и они не обойдены вниманием, описаны способы добавления сайта в разнообраз
ные каталоги, приведены методы работы с соответствующим программным обес
печением: AI RoboForm, WebPosition, Page Promoter, WebРегистратор.
Прочитав первую главу книги и воспользовавшись какимилибо средствами,
представленными во второй и третьей ее главах, вы можете и не читать книгу
дальше, так как у вас будет информация и инструменты для практической рабо
ты. Однако если вы хотите увидеть не только направление, в котором движетесь,
но и результаты своей работы, вам потребуется ознакомиться с главой 4, которая
повествует о том, какую важную и интересную информацию можно узнать из
журнальных файлов сервера, и посвящена методам их обработки с помощью со
ответствующего программного обеспечения.
В приложении к книге приводится список полезных ссылок на сайты, реко
мендуемые к посещению.
Книга предназначена для лиц, столкнувшихся с вопросами размещения и про
движения Webресурсов независимо от их уровня: будь то домашняя страничка
или корпоративный сайт.
Вопросы к автору присылайте по электронному адресу: www@inotec.ru, посе
тите его сайт http://promote.inotec.ru.
Глава 1

Этапы большого пути

Собственное доменное имя ........... 13


Разработка семантического ядра ... 15
Обновление информации ............... 15
Заголовки ....................................... 16
Метаданные ................................... 17
Проверка ссылок ............................ 33
Проверка ошибок кода
в HTMLдокументах ........................ 34
Шрифтовое оформление ................ 37
Время загрузки страниц ................. 38
Использование фреймов ................ 39
Проверка правописания ................. 39
Навигация по сайту ........................ 40
Улучшение посещаемости сайта
за счет обработки ошибок .............. 42
Перевод на другие языки ................ 43
Анонсирование
в поисковых системах ..................... 44
Как управлять индексированием .... 58
Регистрация в каталогах ................. 66
Баннерная реклама ........................ 71
Контекстная реклама ...................... 84
Обмен ссылками ............................ 89
Почтовые рассылки ........................ 93
Реклама вне WWW ........................... 96
Другие технологии ......................... 96
12 Этапы большого пути

Хороший webсайт – это не просто набор страниц, связанных гиперссылками, и


далеко не только то, что видит пользователь на экране монитора. Его внутреннее
устройство довольно сложно. Ведь требуется обеспечить максимум удобств, как
для посетителей, так и для его владельцев, которые будут управлять сайтом. По
этому при его создании должны быть учтены тысячи мелочей, что, собственно,
и отличает хороший webсайт от плохого.
Но самое главное – сайт должны найти люди, он не должен затеряться на бес
крайних просторах Сети. А иначе, какой от него толк, если сайт никто не увидит?
Пусть он даже фантастически красив.
Грамотно построенный webсайт – довольно сложная конструкция, прони
занная многочисленными внутренними и внешними связями, с четкой и жесткой
логикой. Уже в процессе разработки сайта должны быть заложены механизмы,
работающие на его будущую популярность.
Internet – мощный и стремительно развивающийся канал для продвижения
информации, товаров и услуг. Однако чтобы добиться успеха, недостаточно
лишь разместить в Сети свой сайт. Его необходимо разрекламировать или, как
говорят, «раскрутить». Вот этим мы с вами и займемся.
Чтобы сайт работал, и с его помощью появлялись новые клиенты, его следу
ет правильно спроектировать, учтя все детали, которые важны для поисковых
систем, ведь основной поток целевых посетителей идет именно через них. Если
считать основной задачей сайта привлечение новых клиентов или читателей,
следует начинать работу с анализа ключевых слов, по которым будут искать
сайт. На его основе строится так называемое семантическое ядро возможных зап
росов, с учетом которого проводится разработка страниц и подготовка исходных
данных.
Далее выполняются следующие работы по оптимизации сайта для поисковых
систем:
¾ формируются заголовки HTMLстраниц, которые видны в заголовочной
части окна браузера;
¾ создаются метатэги с описаниями и ключевыми словами. Их не видят по
сетители сайта, но учитывают многие поисковые системы;
¾ изготавливается карта сайта, которая очень важна для поисковых машин,
так как она позволяет быстрее и с большим весом проиндексировать стра
ницы сайта. Иногда карта сайта не виднапосетителям;
¾ вырабатываются альтернативные подписи ко всем иллюстрациям. Альтер
нативная подпись возникает на экране при наведении мыши на изображе
ние. Так как эти подписи также индексируются поисковыми системами, их
следует насыщать ключевыми словами;
¾ создаются дублирующие переходы. Многие поисковые системы не пони
мают переходов по формам с выпадающими списками, поэтому нужно сде
лать дополнительные переходы в виде обычных ссылок;
¾ специальным образом организуется архив новостей. Появление новой ин
формации должно приводить к обновлению всех страниц архива, что очень
привлекательно для поисковых машин;
Собственное доменное имя 13
¾ формируется дублирующая навигация в виде цепочки гиперссылок, если
дизайн сайта допускает такой подход, что не только улучшает удобство
пользования сайтом, но и позволяет увеличить количество ключевых слов;
¾ навигационные элементы сайта по возможности делаются текстовыми.
При этом используются слова из семантического ядра запросов;
¾ новости выводятся на главную страницу, в результате чего информация на
главной странице постоянно обновляется, а это благоприятно сказывается
на результатах поиска;
¾ на всех страницах, включая главную, организуются информационные бло
ки. Они не являются обязательными, но заполнение их информацией и пе
риодическая ее смена очень полезна для повышения рейтинга в результа
тах поиска;
¾ организуются места для баннеров каталогов и счетчиков. При продвиже
нии сайта обязательно придется прописывать его в различных каталогах.
Чтобы не пришлось делать крупных доработок, заранее следует заклады
вать эту возможность;
¾ ссылки с сайта делаются такими, чтобы в них присутствовали ключевые
слова.
Конечно, это не все приемы, которые используются при оптимизации сайта
для того, чтобы он занимал первые места в результатах поиска. Поэтому, рассмат
ривая вышеназванные приемы, мы поговорим и о других.

Собственное доменное имя


Доменное имя наряду с логотипом и торговой маркой является частью бизнесиден
тичности компании. При правильном выборе оно ассоциируется у покупателей
именно с вашей компанией, ее продуктами, услугами и т. д. Часто доменные имена
используются для нескольких целей, включая имя webсайта, адрес электронной по
чты, имя FTP или другого сервера. Собственное доменное имя придаст вам допол
нительную солидность и доверие. Доверие – это одна из основ вашего сайта.
Если доменное имя легко запоминается, вы сможете привлечь больше покупа
телей. Люди будут использовать сайт или адрес электронной почты для быстрого
и удобного доступа к информации или услуге, которую вы предлагаете.
Доменные имена мобильны. Вы можете сменить адрес, номера телефонов,
провайдера Internetуслуг, но доменное имя не изменится. Это дает возможность
постоянно поддерживать контакты с клиентами и пользователями ваших услуг.
Полная длина доменного имени, как правило, составляет от 2 до 67 символов,
включая точку и имя домена первого уровня. Имя может состоять из следующих
символов:
¾ латинские буквы (от a до z);
¾ арабские цифры (от 0 до 9);
¾ дефис (), если доменное имя не начинается и не оканчивается этим сим
волом.
14 Этапы большого пути

Доменные имена не чувствительны к регистру букв, так что часто удобно ис
пользовать в рекламе прописные буквы. Например, www.ShoppingWorld.com.
В настоящее время можно регистрировать и многоязычные доменные имена.
При выборе имени ориентируйтесь на свою целевую аудиторию. В зависимо
сти от этого имя может быть популярным, веселым, строгим, составляться из
профессиональных терминов и т. д.
Доменное имя должно быть простым и коротким. Как правило, чем оно коро
че, тем легче его запомнить или записать, и тем меньше вероятность того, что его
воспроизведут неправильно. При остальных равных условиях отдавайте пред
почтение словам с меньшим количеством слогов и словам, которые легко произ
носить. Не используйте сложные для запоминания акронимы, такие как qmxf.
Чтобы получить более высокий рейтинг у некоторых поисковых машин, реги
стрируйте доменные имена, составленные из ключевых слов вашего webсайта.
В этом случае лучше разделять слова дефисами. Можно создать и зарегистриро
вать отдельную страницу с таким длинным именем и автоматически переводить
посетителей на основной сайт.
Употребляйте подходящие слова во множественном числе. Например,
searchengines.com (поисковые машины) лучше, чем searchengine.com (поисковая
машина), если только webсайт не имеет отношения к какойто отдельной поис
ковой машине.
Не забывайте о перспективе. Если в будущем вы планируете выпускать новые
продукты, позаботьтесь, чтобы доменное имя соответствовало как новым, так
и первоначальным продуктам и услугам. Эксперты по Internetмаркетингу ут
верждают, что webсайт должен иметь только одну тематику. Cайт широкого про
филя не очень привлекает посетителей, которые ищут конкретную информацию.
Регистрируйте доменное имя в правильном домене – глобальном или регио
нальном. Для глобальных сайтов используйте домены .com, .org или .net. Для ре
гиональных – соответствующие домены страны, для России – .ru или .org.ru.
Расширения .com и .net предпочтительны для бизнессайтов. Доменные имена
.org традиционно используются некоммерческими организациями. Обратите
внимание, что многие домены имеют ограничения по выбору имен. В некоторых
доменах можно использовать только имя, производное от названия организации
или зарегистрированной торговой марки. Можно зарегистрировать несколько
доменных имен в разных доменах и направлять их на один и тот же сайт.
Проверяйте, не посягаете ли вы на торговую марку или имя, которое по праву
принадлежит другой компании или отдельному человеку. Не всякое доступное
доменное имя следует регистрировать и использовать.
По возможности не используйте доменные имена, похожие на другие. Ведь
нужно, чтобы посещали именно ваш сайт, а не конкурента! Исключением из это
го правила будет ситуация, когда с целью привлечения дополнительных покупа
телей вы регистрируете доменное имя, состоящее из слов с распространенными
орфографическими ошибками.
Чтобы проверить доступность конкретного доменного имени, можно восполь
зоваться сетевыми сервисами или специализированными программами, которые
мы рассмотрим в следующей главе.
Обновление информации 15

Разработка семантического ядра


Процедура проработки семантического ядра запросов не вполне технологична
и зиждется, скорее, на интуитивных догадках исследователя, чем на строгих вык
ладках. Существуют способы получения данных о популярности того или иного
слова, но нет четкого механизма определения, являются ли люди, воспользовав
шиеся им, вашими целевыми посетителями. Кроме того, далеко не всегда ясно,
а какие, собственно, слова нужно рассмотреть. То, что кажется очевидным про
давцу, может совсем иначе представляться покупателю.
При анализе семантического ядра особое внимание следует уделить запросам
с низкой частотой появления. Очень часто практически невозможно позициони
ровать сайт по запросам, имеющим высокую популярность, зато это достаточно
просто делается по большому количеству запросов низкочастотных. А по общей
сумме удачных запросов результат продвижения может оказаться и лучше.
В итоге работы над семантическим ядром должна быть составлена таблица,
в которой отражается:
¾ запрос (слово или выражение);
¾ частота запроса (его популярность);
¾ количество сайтов, найденных по запросу;
¾ место в результатах поиска первого реального конкурента.
Такие таблицы составляются на основании данных, по крайней мере, трех ос
новных российских поисковых систем Яndex, Рамблер и Апорт, а также Google и
Yahoo!. После этого отбираются те ключевые слова, по которым имеет смысл бо
роться за место на первых трех страницах результатов поиска: многочисленные
исследования показывают, что пользователи редко заглядывают дальше.
Старайтесь использовать эти слова, где только возможно (но не злоупотреб
ляйте). Этот прием действенен и очень важен. Лучше уделить больше внимания
продумыванию ключевых слов на начальной стадии разработки сайта, чем ис
правлять их позже, теряя гораздо больше драгоценного времени.

Обновление информации
Устаревшая информация – это очень серьезная проблема для владельца сайта.
Ведь множество сайтов, сходных по тематике с вашим, продолжают постоянно об
новляться. Сейчас же, с развитием электронной торговли, особенно важно не поте
рять доверия посетителей, а показать им устаревшую информацию – верный спо
соб дать понять, чего стоят ваш сайт и ваши услуги. Обратите внимание на то, что
архивы и информация о старом товаре или продукте – как раз достоинство сайта,
а не недостаток, и они очень сильно отличаются от устаревшей информации.
Если вы описываете в документе некую сложную часть системы или чувству
ете, что читатели рады иметь хоть какието сведения о данном предмете, нет
смысла в детальной проверке такого документа. Если есть люди, действительно
нуждающиеся в этой информации, они могут смириться с некоторыми недочета
ми и просмотреть весь материал, чтобы понять ваши идеи. Такой путь может
16 Этапы большого пути

быть весьма эффективным. Обратите на это внимание, потому что существует


определенный слой информации, предназначенной для быстрого ознакомления
или создания новых файлов на ее основе, и она важна для будущих читателей.
Лучше, чтобы эта информация была доступна хотя бы в незаконченной форме,
чем отсутствовала вовсе. До появления электронных технологий усилия на пуб
ликацию «сырого» материала приводили к браку и могли быть приняты за оскор
бление читателя, так как выглядели как издание низкого качества. В настоящее
время публикации идут на всех уровнях, и имеют свою ценность, как документы
высокого качества, так и недоработанные. Поэтому обратите внимание читателей
на текущий уровень подготовки документа, дабы избежать разочарования.

Заголовки
Корректные заголовки, кратко отражающие общую тематику, облегчают поиск
Internetресурсов. Использование каждого слова в названиях страниц следует тща
тельно обдумать. Очень важно грамотно составить начальные фразы; это требова
ние особенно касается текста внутри тэгов <HEAD><TITLE> ... </TITLE > ...
</HEAD>, так поисковые системы, отвечающие на запросы пользователей, рабо
тают в первую очередь с этой лексикой. У всех документов может быть только
один заголовок – он должен идентифицировать содержание в довольно широком
контексте. Обычно именно эти фразеологические единицы видны в результатах
запросов, и именно по ним читатели будут определять, стоит ли щелкнуть по
ссылке или продолжить поиск.
Заголовок не является частью текста документа. Он не может содержать ссы
лок, знаков параграфа или подчеркивания. Идеальная длина заголовка – не бо
лее 64 символов. Как и прочие смысловые элементы текста Webстраницы, заго
ловки должны быть написаны иначе, нежели для других средств массовой
информации: ведь это часть пользовательского интерфейса и навигационный
элемент сервера. Если вы учитываете данный фактор, то многие приложения мо
гут показать заголовки ваших документов в соответствующем окне, в меню, зак
ладках, – другими словами, там, где место ограничено. Специальных ограниче
ний на длину заголовков не существует, они легко генерируются автоматически,
но слишком длинные могут быть обрезаны.
Заголовок страницы должен содержать как можно больше ключевых слов и
в то же время не выглядеть тяжеловесным.
Часто заголовки вырезают из контекста, чтобы составить оглавление, краткий
обзор сервера и т. п. Кроме того, именно эти элементы в первую очередь считыва
ются роботами поисковых машин. В любом случае писать заголовки текстов для
Internet нужно, ставя перед собой две задачи:
¾ дать пользователю точную информация о содержании документа, чтобы
ему не приходилось строить догадки;
¾ не ввести пользователя в заблуждение привлекательным, но дезинформи
рующим заголовком. Сиюминутный успех обернется в дальнейшем резким
снижением посещаемости вашего сайта изза подрыва доверия.
Метаданные 17

Метаданные
Метаданными (от греч. metб – после, за; между, среди) называют информацию
о документе, служащую дополнением к его содержимому.
Язык гипертекстовой разметки HTML позволяет авторам указывать подоб
ные сведения множеством способов. С этой целью используют метатэги – дан
ные, размещаемые за словом <META … >. Если обычные тэги языка HTML при
меняются для разметки страниц, то есть для придания им определенного
внешнего вида, то назначение метатэгов совсем другое. Они несут в себе справоч
ную и управляющую информацию, которая предназначена для различных аген
тов (клиентских приложений, поисковых роботов). Включение метатэгов в доку
мент, как правило, обусловливает следующие основные цели:
¾ управление процессом индексации документа или всего сайта в целом по
исковыми роботами;
¾ описание содержимого документа (также для поисковых роботов);
¾ управление некоторыми функциями браузеров.
Многие из метатэгов довольно абстрактны, то есть не содержат никаких по
лезных сведений и не заслуживают внимания с точки зрения агентов. Сами мета
тэги и их содержание скрыты от посетителя сайта. Однако поисковые машины их
находят, а содержащиеся там данные играют не последнюю роль при определе
нии рейтинга страницы. Однако не следует забывать, что некоторые поисковые
машины не придают им значения.
Метатэги не несут никакой визуальной информации и располагаются в заго
ловочной части HTMLдокумента между тэгами <HEAD> и </HEAD>. В любом
другом месте они будут проигнорированы. Особенно важны они для страниц, ис
пользующих фреймы.
Существует два вида метатэгов:
¾ метатэги – эквиваленты HTTPзаголовков, имеющие формат записи:
<META HTTP-EQUIV=“ñâîéñòâî” CONTENT=“çíà÷åíèå”>
¾ информационноуказательные, записываемые следующим образом:
<META NAME=“ñâîéñòâî” CONTENT=“çíà÷åíèå”>
Элементом META задается свойство, которому присваивается значение. Мета
тэги первого вида эквивалентны HTTPзаголовкам и обычно управляют дей
ствиями браузеров. Они используются, чтобы оптимизировать информацию, ко
торую содержат обычные заголовки, и особенно важны, если документы
загружаются по протоколу HTTP (протоколу передачи гипертекста – ftp://
ftp.nsc.ru/pub/rfc/rfc2068.txt). Серверы HTTP могут использовать имя свойства,
указанное в атрибуте HTTP-EQUIV, для создания заголовка в ответе HTTP. Мета
тэги второго вида чрезвычайно важны для работы поисковых машин.
Элемент META лежит в основе механизма введения метаданных. Существуют,
однако, некоторые тэги и атрибуты тэгов языка HTML, которые обрабатывают
часть метаданных и могут использоваться авторами вместо элементов META: тэги
TITLE, ADDRESS, INS и DEL, атрибуты тэгов TITLE и CITE.
18 Этапы большого пути

Метатэги – эквиваленты HTTPзаголовков


Для метатэгов этого вида могут быть использованы следующие свойства:
¾ Expires;
¾ Pragma;
¾ Content-Type;
¾ Content-language;
¾ Refresh;
¾ Window-target;
¾ Content-Script-Type;
¾ Content-Style-Type.
Рассмотрим их применение.

Свойство Expires
В примере ниже показано, как выглядит формат метатэга со свойством Expires
(Дата устаревания):
<META HTTP-EQUIV=“Expires” CONTENT=“Mon, 29 Nov 2004 08:21:57 GMT”>
Клиенту будет возвращен такой заголовок HTTP:
Expires: Mon, 29 Nov 2004 08:21:57 GMT
Заголовок данного вида используется для управления кэшированием. Если
указанный в метатэге срок устаревания истек, то при запросе документа он будет
доставлен по сети, а не загружен из кэша.
Нулевое значение даты (CONTENT=“0” ) приводит к тому, что браузер проверя
ет при каждом запросе, не изменился ли документ. Поисковые роботы могут либо
совсем не индексировать его, либо постоянно отслеживать изменения в документе.
Формат даты описан в стандарте RFC850 (ftp://ftp.nsc.ru/pub/rfc/rfc850.txt).
Для решения ряда задач требуется, чтобы при каждом запросе документ заг
ружался не из кэша браузера, а с сервера. Обычно это необходимо для сайтов,
которые поставляют динамически изменяющееся содержание. В качестве приме
ра можно привести результат какоголибо поиска (информация о курсе доллара
в реальном режиме, электронный магазин или обычный чат). В таких случаях
страница в кэше не обязательно соответствует реальной.
В подобной ситуации можно запретить браузеру кэшировать страницы при
помощи свойства метатэга Expires, которое указывает дату устаревания содер
жимого страницы. Для того чтобы она не кэшировалась, достаточно установить
прошедшую дату – например, вот так:
<META HTTP-EQUIV=“Expires” CONTENT=“Mon, 01 Jan 2000 00:00:00 GMT”>
Если страница содержит постоянные данные и не требует регенерации при
каждом запросе, то вам не следует отключать кэширование для браузера. Это по
зволит браузерам использовать сохраненную в кэше копию страницы в течение
некоторого отрезка времени, которым вы можете управлять. Кэширование может
значительно снизить нагрузку на вашем сервере.
Метаданные 19
Обычно имеет смысл отключать кэширование лишь для динамических стра
ниц, которые содержат информацию, изменяющуюся со временем. И то далеко не
всегда. Какие же из динамических страниц могут быть кандидатами на кэширо
вание? Например, страница с прогнозом погоды, где информация обновляется
каждые 5 минут. Или начальная страница сайта, которая содержит список мате
риалов на сервере или официальные сообщения для печати, которые модифици
руются два раза в день. Другие подобные страницы, где обновления происходят
раз в несколько часов.
Заметьте, что с кэшированием в браузере вы получите меньшее количество
посетителей, зарегистрированных на вашем сервере. Поэтому, если вы хотите
точно измерять количество просмотров страниц или показов баннеров, то, скорее
всего, вы откажетесь от кэширования.

Свойство Pragma
Свойство Pragma (Контроль кэширования) применяется для отказа от кэширо
вания и задается следующим образом:
<META HTTP-EQUIV=“Pragma” CONTENT=“no-cache”>
Отказ от кэширования означает, что при запросе документа он будет достав
лен по сети, а не загружен из кэша. Обратите внимание, что неразумное запреще
ние кэширования усложняет навигацию по сайту и увеличивает время ожидания.
Так, при нажатии в браузере кнопки Back (Назад) происходит новый запрос сер
вера и приходится ждать загрузки страницы, которая минутой ранее была от
правлена клиенту и уже есть у него в компьютере.

Свойство ContentType
Свойство Contenttype (Тип содержимого) служит для указания типов содер
жимого (типов MIME), к которым относятся “text/html”, “image/png”,
“image/gif”, “video/mpeg”, “audio/basic”, “text/tcl”, “text/
javascript” и “text/vbscript” (с учетом регистра). Текущий список за
регистрированных типов MIME можно найти по адресу ftp://ftp.isi.edu/in
notes/iana/assignments/mediatypes/. Тип содержимого “text/css”, хотя он
и не зарегистрирован, используется для иерархических, или каскадных, таблиц
стилей (CSS).
Тип документа “text/html” дополнительно расширяется указанием коди
ровки страницы charset (набор символов) – тогда браузер выводит ее сразу
в заданной кодировке. Однако обратите внимание: если текст документа написан
в windows1251, а значение указано charset=KOI8-r, то изменить кодировку
в браузере невозможно и текст совершенно не читается.
Формат метатэга следующий (для типа содержимого “text/html” и набора
символов windows1251):
<META HTTP-EQUIV=“Content-type” CONTENT=“text/html; charset=
windows-1251”>
20 Этапы большого пути

Немного о кодировках
Кодировка представляет собой таблицу, где каждому символу – буквам алфави
та, цифрам и специальным знакам – соответствует свой уникальный номер, код
символа.
Полностью стандартизирована лишь первая часть таблицы, так называемый
ASCIIкод – первые 128 символов, включающих цифры и буквы латинского ал
фавита. Поэтому с ними никогда не бывает проблем. Вторая же часть таблицы
(всего в ней 256 символов – по числу состояний, которые может принять один
байт) отведена под специальные символы. Она используется для кодировки сим
волов национальных алфавитов, причем для каждого языка и в каждой стране
она различна. При этом для букв русского языка создано пять различных кодиро
вок, то есть одному символу соответствуют разные цифровые коды. Таким обра
зом, при неправильной кодировке мы получим совершенно нечитаемый текст.
На заре развития вычислительной техники очень широко использовалась ко
дировка с кириллицей KOI8. Она появилась в семидесятые годы при адаптации
операционной системы UNIX к русскому языку – персональных компьютеров
тогда еще не было. KOI8 – до сих пор основная кодировка в UNIX. Потом нача
лось победное шествие персональных компьютеров IBM, а с ними – операцион
ных систем MS DOS, имевших DOSкодировку (или кодовую страницу 866).
Параллельно развивались компьютеры Macintosh, и, разумеется, была придума
на еще одна кодировка – MAC. Наконец, с появлением операционной системы
Microsoft Windows появилась и новая windowsкодировка (кодовая страница 1251).
Онато и стала самой распространенной в России.
Еще один вариант связан с попытками стандартизации кодировок на уровне
всей планеты. Разработчики из ISO, международной организации по стандартам, ,
создали еще одну кодировку и назвали ее ISO88595. В настоящее время она прак
тически не применяется (повидимому, ее используют лишь в базе данных Oracle),
однако поддержка данной кодировки предусмотрена во всех браузерах.
В настоящее время создана универсальная кодировка UNICODE, в которую
вошли все языки мира, поэтому на каждый символ в ней отведено по два байта.
Таким образом, максимальное число знаков в таблице расширилось до 65 535.
Сейчас UNICODE находит свое применение, но пока не слишком широкое.
Правильное отображение символов национальных алфавитов касается как Web
серверов, так и браузеров. Они должны осуществлять информационный обмен на
одном языке и в одной кодировке, и только в этом случае сообщения будут доступны.
Сервер должен иметь эффективную систему предварительного оповещения
о том, в какой кодировке будет прислана страница. Клиентской программе (брау
зеру) необходимо принять такое сообщение и, соответственно, настроиться на
нужное отображение. Если все сделать правильно, то никаких трудностей не воз
никнет. Однако при некорректной настройке Webсервера он сообщает об одной
кодировке (например, windows1251), а страницу пересылает в другой (напри
мер, в KOI8). Пользуясь указаниями сервера, браузер, естественно, ошибается
и отображает страницу неверно.
Метаданные 21
Как показано выше, можно задать кодировку документа не на сервере, а непо
средственно в HTMLкоде – с помощью метатэга со свойством Content-type. Но
не все так просто. В России распространен способ, при котором сервер автомати
чески определяет, в какой кодировке приходит запрос от клиента, и пересылает
страницу Webбраузеру уже перекодированной. Вот тутто использование ука
занного метатэга и может сыграть с вами злую шутку. Дело в том, что указания на
странице имеют приоритет над командами, присылаемыми Webсервером, и, пра
вильно перекодировав страницу, сервер не может изменить содержимое метатэга.
Происходит несовпадение реальной кодировки, в которой пришел документ,
и указаний в тэге META. Такую страницу нельзя будет нормально просмотреть
и перекодировать средствами браузера. Выбор кодировки вручную в данном слу
чае не поможет, так как метатэг имеет приоритет и над установками браузера.
Единственный способ прочитать документ – это сохранить страницу и удалить
злосчастный тэг.
Учитывая все вышесказанное, данный тэг можно вообще не применять. Тогда
просмотр будет вестись в той кодировке, на которую настроен браузер, если сервер
не пришлет уведомление о другой кодировке документа. В этом случае клиент смо
жет легко ее переключить. У подавляющего большинства ваших посетителей из
России по умолчанию выставлена кодировка windows1251, поэтому у них стра
ница сразу же будет показана правильно.

Свойство Contentlanguage
Язык документа, указанный в метатэге со свойством Contentlanguage (Язык со
держимого), может использоваться поисковыми машинами при индексировании
страниц.
Метатэг имеет следующий формат:
<META HTTP-EQUIV=“Content-language” CONTENT=“en-GB” >
Язык задается комбинацией двух значений языкдиалект (при этом значение
диалект может отсутствовать), в данном примере – английскийВеликобрита
ния. Язык представляет собой двухбуквенный код, зарезервированный для со
кращений типа fr – французский, de – немецкий, ru – русский.
Спецификация HTML 4.0 допускает явное указание автором языка в самом
документе:
<HTML LANG=“en” >
Подобная информация может пригодиться:
¾ поисковым машинам;
¾ синтезаторам речи;
¾ агентам пользователей (клиентским программам) при выборе вариантов
глифов для типографской печати высокого качества;
¾ агенту пользователя при выборе набора кавычек;
¾ агенту пользователя при настройке переноса, лигатур и интервалов;
¾ программам проверки грамматики и орфографии.
22 Этапы большого пути

Все коды языков, которые должны использоваться в документах на языке


HTML, определены и описаны в стандарте RFC1766 (ftp://ftp.nsc.ru/pub/rfc/
rfc1766.txt).
Реализовывать рассмотренную возможность следует крайне осторожно, по
скольку могут возникнуть проблемы, изза которых текст на странице станет не
читаемым.

Свойство Refresh
Свойством Refresh (Период обновления) определяется время задержки, после
которой браузер автоматически обновляет документ. Метатэг часто использует
ся для автоматической загрузки другого документа (или, как говорят, переадре
сации, перенаправления).
Формат метатэга таков:
<META HTTP-EQUIV=“Refresh” CONTENT=“3, URL=http://www.name.ru/
page.html”>
CONTENT – число, указывающее время задержки в секундах; далее следует адрес,
который нужно загрузить по прошествии этого времени. Подобный способ широко
используется для создания кратковременных заставок. Но, поскольку некоторые
браузеры его не поддерживают, в заставке, чтобы она не «зависала», необходимо пре
дусмотреть возможность перехода на следующую страницу. Кроме того, применение
данного способа затрудняет возврат на предыдущие страницы стандартными сред
ствами. При переадресации (то есть при значении 0) пользователь не может вернуть
ся на предыдущую страницу с помощью кнопки Назад (Back), так как его в ту же
секунду пересылают на страницу, с которой он пытается уйти.
Как известно, изменение адреса сайта влечет за собой потерю его посетителей.
Поэтому обычно по старому адресу размещают информацию, которая поможет
найти сайт. Но можно сделать и так, чтобы в дополнение к этому браузер сам
перешел на использование нового адреса – благодаря метатэгу со свойством
Refresh.

Свойство Windowtarget
Свойство Windowtarget (Окно текущей страницы) служит для определения окна
текущей страницы. Его можно использовать, чтобы исключить появление новых
окон во время применения фреймовых структур.
Вид метатэга может быть, например, таким:
<META HTTP-EQUIV=“Window-target” CONTENT=“_top”>

Свойство ContentScriptType
Поскольку в документах HTML не предполагается использовать определенный
язык сценариев, авторы должны указывать его непосредственно в каждом фраг
менте кода. Это можно сделать с помощью объявления скрипта по умолчанию
для всего документа или с помощью локального объявления.
Метаданные 23
Чтобы объявить скрипт по умолчанию, в текст HTMLдокумента необходимо
включить следующий метатэг:
<META HTTP-EQUIV=“Content-Script-Type” CONTENT=“type”>
Здесь “type” – тип содержимого, указывающий язык скрипта. Примеры
значений – “text/tcl”, “text/javascript”, “text/vbscript”.

Свойство ContentStyleType
Чтобы установить для документа язык таблицы стилей по умолчанию, надо ис
пользовать следующую строку:
<META HTTP-EQUIV=“Content-Style-Type” CONTENT=“text/css”>
Документы, в которых применен тэг STYLE, но не определен язык таблиц сти
лей по умолчанию, являются некорректными.

Метатэги для поисковых машин


Метатэги, которые помогают поисковым машинам индексировать сайт, делают
документы для них более доступными.
Представители большинства поисковых систем уже сошлись во мнении, что
применение метатэгов способствует повышению релевантности отклика при об
работке запросов. Но есть и прямо противоположная точка зрения, которой при
держиваются, например, эксперты российской поисковой машины Rambler.
Если ваша компания широко известна и связана с производством уникальной
продукции или оказанием услуг повышенного спроса, то проблем с локализаци
ей ваших узлов в Internet у пользователя, скорее всего, не возникнет.
Другое дело, если вы пытаетесь предоставить клиентам или читателям сервис
или материал, не отличающийся оригинальностью, например, связанный с разра
боткой Webстраниц. В этом случае даже в первую сотню ссылок из списка от
клика в глобальной поисковой системе попасть не просто. Способов повышения
доступности узла из поисковых машин – и оправданных, и сомнительных с точки
зрения этики – немало. Важно помнить о том, что универсальных рецептов пока
не существует: слишком многое зависит от специфики работы отдельного поис
кового сервиса. Проблема заключается еще и в том, что фактически существует
два подхода к решению рассматриваемого вопроса. Один предлагается в реко
мендациях по созданию документов экспертами самой поисковой системы, дру
гой используется разработчиками, чтобы достичь высокого рейтинга.
Повидимому, самый полезный совет заключается в следующем: анализируй
те HTMLкод тех документов, которые добились в интересующей вас сфере дея
тельности и поисковой системе наивысших рейтинговых результатов. Это отно
сится и к метатэгам, и к остальному содержимому страниц. Естественно, такой
анализ требует специальных навыков и отличается трудоемкостью, что может
послужить веским доводом для обращения к профессионалу.
Оптимальный результат обеспечила бы компанияпосредник, имеющая прямой
контакт с разработчиками поисковых систем. Если нечто подобное и существует,
24 Этапы большого пути

информация об этом по понятным причинам вряд ли когдалибо будет предана


огласке. Есть, однако, косвенные, хотя и медленно действующие приемы, кото
рые позволяют провести анализ работы поисковых систем и доступны каждому:
речь идет о тестировании. Известны примеры создания целых тестовых Webуз
лов, единственная задача которых – определить, насколько чувствительна работа
алгоритма отдельной поисковой машины к тому, как размещена информация на
Webстраницах. Широкое распространение в Internet получила и разработка так
называемых страницмостиков, которые оптимально нацелены на конкретную
поисковую систему. Добраться с них до основной страницы узла адресатам ин
формации позволяют гиперссылки.
В целом ситуация, когда материалы сайта в первую очередь ориентированы на
поискового робота, а не на конечного пользователя, не может не вызывать опасе
ний. Так, например, одно время AltaVista особенно высоко оценивала содержи
мое заголовка страницы, помещаемое в контейнер TITLE. В результате список
отклика этого индекса возглавили сотни документов, имеющих вместо связного
заголовка набор ключевых слов и фраз. Именно этот набор становился по умол
чанию именем закладки на документ при работе с большинством браузеров.
Как оказалось, даже такая «прецизионная» настройка на систему не дает дол
говременных гарантий: после того как AltaVista изменила характер ранжирова
ния документов, рейтинг многих фаворитов катастрофически снизился.

Ключевые слова и описания


Чтобы получить высокий рейтинг в поисковых системах, требуется выбрать для
передачи им основные ключевые слова и фразы сайта. В общей сложности их
должно быть не меньше десяти (желательно – несколько десятков), и они долж
ны соответствовать содержанию сайта. Кроме того, требуется составить краткое
описание сайта – абзац длиной не более 1 000 знаков (для некоторых поисковых
машин – не более 700).
Ваш сайт для поисковых систем – один из многих, поэтому текст описания,
который обычно появляется на страницах с результатами поиска, должен быть
интересным, привлекающим внимание, чтобы у читателя возникло сразу жела
ние посетить сайт. Ключевые слова в нем необходимо использовать как можно
чаще – от этого зависит высота рейтинга.
Вообще, к подбору ключевых слов следует подойти очень серьезно. Правиль
ный их выбор позволяет сильно повысить позицию сайта при запросах.
Какие же слова следует выбирать? Разумеется, те, которые наиболее точно
отражают специфику именно вашего проекта. При этом следует избегать случай
ных и общих фраз. Представьте себя на месте человека, который пытается найти
ваш сайт. С каких слов вы начнете поиск? Что наберете в поле запроса поисковой
системы?
Каждый вариант следует проверить в какойлибо поисковой системе (луч
ше – в нескольких). Оцените, насколько список найденных сайтов связан с тема
тикой вашего. Если такая связь не вызывает сомнений, то выбранные вами слова
подходят на роль ключевых; в противном случае стоит поискать другие. Для на
Метаданные 25
глядности не мешает посмотреть, какие ключевые слова используются на первых
страницах результата поиска.
Многие индексирующие машины проводят поиск элементов тэга META, в ко
торых задан разделенный запятыми список ключевых слов и фраз или дается
краткое описание. Поисковые машины могут представлять их как итог поиска
или использовать для улучшения его результатов.
Формат указанных метатэгов иллюстрируют следующие примеры:
<META NAME=“keywords” CONTENT=“îòïóñê, Ãðåöèÿ, ñîëíöå”>
<META NAME=“description” CONTENT=“Èäèëëè÷åñêèé îòïóñê â Åâðîïå”>
В поле CONTENT не должно быть знаков конца строки, кавычек и других спе
циальных символов; регистр символов значения не имеет.
Не рекомендуется повторять несколько раз одни и те же ключевые слова, так
как это может быть воспринято как спам, в результате чего страница может быть
удалена из индекса поисковой машины. Обычно спамом называют несанкциони
рованную рассылку электронной почты. К ней зачастую прибегают недобросове
стные рекламодатели, распространители вирусов и т. д. Однако здесь и далее по
тексту под спамом будет подразумеваться намеренное злоупотребление ключе
выми словами в заголовках, комментариях и тексте самого документа.
Не стоит использовать одинаковые списки ключевых слов для разных стра
ниц сайта. Конечно, так проще, но содержимое документов различное, да и поиск
ведется поразному. Если вам хочется автоматизировать эту работу (действи
тельно, довольно трудоемкую, ведь общий объем ключевых слов одного докумен
та может достигать 50% от его объема), напишите программу, которая выбирала
бы текст из определенных блоков документа, например, из контейнеров, заклю
ченных в тэгах H, I и B. Задача не кажется сложной, да и можно найти подобную
программу в архивах программного обеспечения в Internet.
Если строка в поле CONTENT получается слишком длинной, не возбраняется
разбить ее на несколько конструкций этого вида.
Указание ключевых слов – это основной способ использования тэга META.
Информация о документе, составленном с использованием различных языков,
может быть представлена в нескольких таких тэгах. Тогда поисковые машины
могут фильтровать атрибут LANG и отображать результаты поиска с применени
ем выбранного пользователем языка – например, так:
<— Äëÿ ãîâîðÿùèõ íà àíãëèéñêîì â àìåðèêàíñêîé âåðñèè—>
<META NAME=“keywords” LANG=“en-us” CONTENT=“vacation, Greece,
sunshine”>
<— Äëÿ ãîâîðÿùèõ íà áðèòàíñêîì àíãëèéñêîì —>
<META NAME=“keywords” LANG=“en” CONTENT=“holiday, Greece, sunshine”>
<— äëÿ ðóññêîÿçû÷íûõ ïîëüçîâàòåëåé —>
<META NAME=“keywords” LANG=“ru” CONTENT=“îòïóñê, Ãðåöèÿ, ñîëíöå”>
Эффективность обращения к поисковым машинам можно повысить также за
счет использования тэга LINK для создания ссылок на разноязычные переводы
страницы, на версии документа для другого носителя (например, PDF) и, если
26 Этапы большого пути

документ является частью набора, ссылок на соответствующую начальную точку


для просмотра набора.
Метатэг NAME=“keywords” позволяет автору документа самостоятельно со
здать адекватный содержанию набор ключевых слов и фраз. Допустимая для вос
приятия роботом длина перечня варьируется от 874 до 1 000 символов. При от
сутствии указанного метатэга робот формирует набор автоматически на основе
своего алгоритма. Если индексируется все содержимое документа, то он будет
участвовать в отклике и по тем терминам, которые входят в текст страницы, но
отсутствуют в метатэге. Автоматический индекс при создании поискового образа
документа может комбинировать содержимое метатэгов и текста, должным обра
зом взвешивая термины из разных полей Webстраницы. При этом далеко не все
системы, которые поддерживают метатэги, отдают явное предпочтение входя
щим в них терминам.
Отметим также, что метатэг ключевых слов стоит размещать в одну строку,
поскольку некоторые роботы не умеют переходить к новой строке.
Ключевые слова лучше не повторять более двух раз, иначе поисковая система
может расценить это как спам. Нежелательно, например, задавать последователь
ности вида «free, free, free, free, free, free», но вполне допустимы такие, как «free,
free web, free stuff, internet for free».
Большего успеха можно добиться, если использовать не ключевые слова,
а ключевые фразы. Если вы подберете их удачно, то, возможно, при запросе ваша
ссылка окажется одной из первых. Есть еще один, не вполне серьезный прием,
основанный на известной ошибке. Многие забывают переключать языковую рас
кладку клавиатуры, и тогда, допустим, вместо запроса «free» возникает запрос:
«акуу», то есть английское слово, введенное буквами кириллицы, расположен
ными на соответствующих клавишах. Как ни странно, результат бывает положи
тельным: поисковая система выдает ссылку на ваш сайт!
Для хорошего индексирования документа поисковыми системами рекоменду
ется в первом абзаце текста на каждой странице использовать как можно больше
отобранных для нее ключевых слов.
Как известно, основную смысловую нагрузку несут в языке имена существи
тельные. Поэтому именно они составляют большую часть ключевых поисковых
слов. Значительно реже используются прилагательные, совсем редко – глаголы,
наречия, предлоги, союзы. Имена прилагательные просто незаменимы, если требу
ется индексировать «голландский сыр» с «баварским пивом» в «ночном клубе».
Очень эффективно использование редких слов. К таковым можно отнести спе
циальные термины, названия местностей, организаций, имена людей и т. п. Приме
нение подобной лексики позволяет максимально конкретизировать тематику.
Существует целый ряд слов, которые поисковая система будет игнорировать
при запросе; их поиск невозможен. Это так называемые стопслова, например: на,
что, это, для и др. Они настолько часто встречаются в текстах, что искать по ним
чтолибо крайне затруднительно. Интересно, что в списки стопслов для некото
рых поисковых машин уже входят такие, как Internet, компьютер, Сеть. Они ста
ли настолько распространенными, что утратили свое значение (с точки зрения
Метаданные 27
поиска, конечно). Очевидно, что использовать стопслова в качестве ключевых
нет смысла.
Метатэг NAME=“description” позволяет включить в поле CONTENT крат
кое описание документа. В зависимости от робота воспринимаемая длина текста
составляет от 150 до 250 символов. После индексирования поисковой машиной
описание должно появиться рядом со ссылкой на документ при попадании его
в список отклика.
Если ресурс ориентирован не только на русскоязычную публику, целесооб
разно сделать отдельные описания на разных языках. Следует создавать лако
ничные и привлекающие внимание тексты; суть должна быть ясна с первого
взгляда, поскольку на страницах с результатами поиска в поисковой системе ин
формацию о каждом найденном сайте приводят в одном небольшом абзаце.
При составлении описания не нужно указывать в нем название сайта – оно
и так будет проиндексировано. С точки зрения индексирования сайта не имеют
смысла общие фразы типа: «Здесь есть все», «Вам будет интересно», «Заходи, не
пожалеешь!» и т. п. Обратите внимание посетителя именно общее содержание,
а он сам разберется, нужна ли ему ваша страница или нет. Стоит ли заманивать
читателей, если они сразу же покинут сайт, убедившись, что он не соответствует
описанию?
Если в документе нет описания, то в качестве такового поисковые машины
приводят несколько начальных строк документа. Поэтому случается, что если
в самом начале документа есть фрагмент, написанный на языке JavaScript, то вмес
то нормального описания выдается «абракадабра» в виде фрагмента скрипта.
Словом, необходимо, чтобы описание имело вид аннотации, состоящей из не
скольких ясных предложений, и тогда пользователь поисковой машины сможет
легко понять смысл документа.
При подборе ключевых слов для метатэга документа необходимо учитывать
различные нюансы. Многие алгоритмы придают больший вес тому термину или
фразе, которые расположены ближе к началу перечня. Число повторений ключе
вых слов не должно превышать определенного количества (как правило, двух
трех), во избежание применения санкций против спама: иначе страница не будет
проиндексирована и включена в базу данных поисковой системы. Неплохую по
мощь могут оказать системы, которые отслеживают запросы, поступающие от
пользователей на поисковые машины. Важно найти не просто адекватные содер
жанию ключевые слова и фразы, а именно те, которые часто применяются
пользователями на практике.
Итак, поисковые роботы берут ключевые слова и описание сайта непос
редственно из кода страницы и содержимого метатэгов NAME=“keywords”
и NAME=“description”. Однако не все системы придерживаются такой мето
дики. Многие проверяют соответствие ключевых слов основному тексту страни
цы, а полнотекстовые поисковые машины анализируют все ее содержимое, хотя
ключевые слова в ней при поиске являются приоритетными.
Для более широкого охвата потенциальной аудитории ключевые слова и опи
сание сайта, которые вы стремитесь вставить в большинство документов, реко
28 Этапы большого пути

мендуется корректировать в соответствии со смыслом конкретной страницы. Это


повысит вероятность попадания на ваш сайт. Общее же его описание пригодится
для страниц с «нейтральным» содержанием.
Большинство поисковых машин придает большое значение титулу страницы
и метатэгам с ее описанием и ключевыми словами. Однако стоит подумать не
только о поисковых системах, но и о тех, кто увидит эти ссылки, – ведь в конеч
ном итоге ссылки будут выведены на экран, а решать, переходить по ним или нет,
будет пользователь.
Допустим, вы сделали запрос program. Появились результаты, в числе кото
рых, например, такие:
Free program, program, free, program free, free program
Free program, program, free, program free, free program, free
program, program, free, program free, free program, free program,
program, free, program free, free program, free program, program,
free, program free, free program
Воспользоваться такими ссылками уже не тянет – возникает предубеждение
к сайту и его хитрому создателю. Современные поисковые роботы определяют
спам и не индексируют страницу, но машина – это всего лишь машина.
Можно просто вписывать в титул метатэги, ключевые выражения, результат
будет тот же: бессмысленные ссылки! Пожалуй, не зря считается, что оформле
ние страниц для поисковых систем – это наука и искусство. Ваша задача – не
только правильно подобрать ключевые фразы и слова, но и составить из них ло
гичные предложения для титула и описания, которые и выводятся в результатах
поиска. При этом еще надо уложиться в отведенное количество символов.
Подбор ключевых выражений начинает походить на некое таинство, особенно
это касается иностранных поисковых систем: некоторые расхожие слова уже
«проданы», и вы, как ни бейтесь, на первое место по ним не попадете.
Появилась даже платная услуга по подбору ключевых слов и оформлению до
кументов под них, осуществляемая профессионалами. Если вы полагаете, что вам
это не нужно, – готовьтесь постоянно следить за своим рейтингом в поисковых
машинах и определять положение ваших ссылок по заданным ключевым словам,
ведь поисковики действительно могут обеспечить вам существенный приток по
сетителей.

Язык документа
В глобальном контексте Internet важно знать, на каком языке создается страница.
Определите язык документа, как описано выше, в разделе «Свойство Content
language».

Языковые варианты документа


Если вы подготовили переводы документа на другие языки, используйте тэг
LINK для ссылки на эти тексты. Такой подход повысит эффективность поиско
вых машин и позволит им предлагать результаты поиска на языке, предпочитае
Метаданные 29
мом пользователем, независимо от построения запроса. Например, следующие
ссылки предлагают поисковой машине французскую и немецкую версии:
<LINK rel=“alternate”
type=“text/html”
href=“mydoc-fr.html” hreflang=“fr”
lang=“fr” title=“La vie souterraine” >
<LINK rel=“alternate”
type=“text/html”
href=“mydoc-de.html” hreflang=“de”
lang=“de” title=“Das Leben im Untergrund” >
Указанным тэгом определяется связь. Хотя он может быть представлен неогра
ниченное число раз, его присутствие допускается только в разделе HEAD докумен
та. Несмотря на то, что тэг LINK не имеет содержимого, он является носителем ин
формации об отношениях, которая может представляться агентами пользователей
(браузерами) различными способами, например, в виде панели с выпадающим
списком ссылок.
Таким же способом с помощью тэга LINK задаются ссылки на версии доку
мента для другого носителя (например, PDF) и, если документ является частью
набора, ссылки на соответствующую начальную точку для просмотра набора.

Начало набора
Наборы документов, или представлений систем обработки текстов, часто перево
дятся в наборы документов HTML. Для поисковых машин полезно указать ссыл
ку на начало набора в дополнение к тому, что страница попала в результаты поис
ка. Вы можете помочь поисковым системам, применив тэг LINK, имеющий
атрибуты REL=“begin” и TITLE=, как показано в следующем примере:
<LINK REL=“begin”
TYPE=“text/html”
HREF=“page1.html”
TITLE=“Îáùàÿ òåîðèÿ îòíîñèòåëüíîñòè” >

Инструкции для роботов – файл robots.txt


Алгоритмы работы многих поисковых машин предусматривают возможности ог
раничения действий роботов. Это достигается с помощью файла robots.txt и тэга
META в документах HTML.
Файл robots.txt объясняет роботу поисковой машины, что надо индексировать,
а что не стоит. Зачем, например, индексировать служебные файлы, скажем, ста
тистические отчеты?
Файл содержит набор команд, которые позволяют закрыть от индексирова
ния отдельные каталоги узла. Обычно закрываются каталоги, содержащие
скрипты, служебную информацию и т. п. Отчасти это повышает контрастность
значимых документов узла в поисковой системе. К тому же поисковые машины
нередко вводят ограничение на число ресурсов, регистрируемых для одного сер
30 Этапы большого пути

вера. Некоторые – так, например, действовал робот поисковой системы Lycos, –


вообще не проводят индексирования, если указанный файл отсутствует.
Итак, если вы поддерживаете работу сервера с доменным именем www.mysite.ru,
то содержимое файла robots.txt должно быть доступно по адресу: http://
www.mysite.ru/robots.txt, то есть данный файл следует загрузить в корневой ката
лог вашего сайта. Когда робот просматривает Webсайт, сначала он проверяет
наличие документа http://www.mysite.ru/robots.txt. Если таковой обнаружен, ана
лизируется его содержимое и выясняется, позволено ли загрузить документ. Вы
можете настроить файл robots.txt для конкретных роботов и запретить доступ
к определенным каталогам или файлам.
На одном сайте может быть только один файл robots.txt. Не следует помещать
файлы с данным именем в каталоги, поскольку робот их не найдет. Обратите вни
мание, что при адресации в Internet учитывается регистр, поэтому название
robots.txt должно быть задано в нижнем регистре.
Файл robots.txt – это обычный текстовый документ, содержащий одну или
несколько записей, разделенных пустыми строками, как показано в следующем
примере:
# robots.txt for http://www.mysite.ru
User-agent: *
Disallow: /cgi-bin/maillist/
Disallow: /tmp/
Disallow: /product1.html
User-agent: aport
User-agent: scooter
Disallow:
Вот пример файла robots.txt, полностью запрещающего доступ к сайту всем
роботам:
User-agent: * # Ïðèìåíÿåòñÿ êî âñåì ðîáîòàì.
Disallow: / # Çàïðåòèòü èíäåêñàöèþ âñåõ ñòðàíèö.
Каждая запись должна начинаться с указания переменной User-agent от
дельной строкой. Таких строк может быть и несколько. Значением переменной
User-agent задается оригинальное имя программыробота соответствующей
поисковой системы, для которой предназначена информация.
Согласно спецификации на файл robots.txt, текст в нем чувствителен к регис
тру, так что следует записать именно User-agent, а не User-Agent. Трудно
сказать, вызывает ли неверное написание проблемы у роботов поисковых систем,
но для надежности лучше соблюсти требования спецификации.
Имя робота может быть похоже на название соответствующей поисковой систе
мы, а может и сильно отличаться от него. Далеко не всегда оно соответствует наз
ванию механизма поиска. Поэтому нельзя просто написать AltaVista в User-
agent и ожидать, что AltaVista исключит указанные вами страницы. Имя робота
указывается без учета регистра и не включает информацию о версии. Можно пе
Метаданные 31
речислить несколько имен через пробел. Символ * является маской и означает:
«для всех роботов». В этом случае запись описывает режим доступа по умолча
нию для любого робота, неупомянутого явно в других записях. В файле robots.txt
не может быть нескольких таких записей.
В табл. 1 приведены имена роботов некоторых поисковых систем.

Таблица 1. Имена роботов поисковых систем


Поисковая система или сервис проверки ссылок Имя робота
AltaVista (http://www.altavista.com/) Scooter
AOL (http://search.aol.com/) Slurp
EuroSeek (http://www.euroseek.com/) Arachnoidea
Excite (http://www.excite.com/) ArchitextSpider
EZResult (http://www.ezresult.com/) Mozilla
Fast (http://www.fastsearch.com/) Fast
Google (http://www.google.com/) Googlebot
Hotbot (http://www.hotbot.com/) Slurp
Infoseek (http://www.infoseek.com/) – GO.com (http://go.com/) Infoseek Sidewinder;
Ultraseek
iWon (http://www.iwon.com/) Slurp
LookSmart (http://www.looksmart.com/) Slurp
Lycos (http://www.lycos.com/) Lycos
MSN (http://www.msn.com/) Slurp
Netscape Search (http://search.netscape.com/) Googlebot
Northern Light (http://www.northernlight.com/) Gulliver
Teoma (http://www.directhit.com/) Grabber
W3C Link Checker (http://validator.w3.org/checklink/) W3Cchecklink
WebCrawler (http://www.webcrawler.com/) ArchitextSpider
Yahoo! (http://www.yahoo.com/) Googlebot
Rambler (http://www.rambler.ru/) StackRambler
Апорт (http://www.aport.ru/) Aport
Яndex (http://www.yandex.ru/) Yandex

Начиная со следующей строки после указания переменной User-agent, оп


ределяются собственно правила поведения робота в виде задания значений пере
менным Allow (Разрешить) и Disallow (Запретить).
В поле Allow задается перечень разрешенных для посещения роботами поис
ковых машин каталогов и файлов, а в поле Disallow – перечень закрываемых
каталогов и файлов. Это может быть полный или частичный путь. Любой URL
адрес, начинающийся с этого значения, нельзя будет загрузить. Например, за
пись Disallow: /help запрещает доступ к /help.html и /help/index.html, в то
время как запись Disallow: /help/ запретит доступ к /help/index.html, но
разрешит доступ к /help.html.
Если файл находится в корневом каталоге, обязательно включите перед его
именем символ «слеш» – косую черту вправо.
Пустое значение параметра Disallow означает, что все URL сайта могут быть
проиндексированы. Частая ошибка при написании robots.txt состоит в том, автор
32 Этапы большого пути

ставит *, чтобы указать, что хочет исключить все файлы в каталоге. Однако пра
вильным будет не включать никаких звездочек в поле Disallow.
В файле robots.txt должно быть, по крайней мере, одно поле Disallow. Сим
вол # предваряет комментарии, необрабатываемые роботами.
В примере, рассмотренном выше, первая запись запрещает индексирова
ние двух каталогов и файла product1.html. Роботу Scooter поисковой системы
AltaVista и роботу Aport поисковой системы Апорт для доступа открываются
все каталоги (поле Disallow пусто). При необходимости закрыть все катало
ги следовало бы написать: Disallow: /. Пустая строка между записями не
обходима.
Очень важно не допускать ошибок в файле robots.txt. В противном случае
конструкции могут не работать, а вы даже не будете знать об этом. Возможно,
некоторые поисковые системы без затруднений разрешат проблемы, возникаю
щие изза различий в синтаксисе, однако абсолютной гарантии нет. Поэтому,
если вы обнаружите ошибку в синтаксисе, исправьте ее и повторно зарегистри
руйте ресурс в поисковых системах. Роботы поисковых машин снова проиндек
сируют ваш сайт и выполнят все указания, имеющиеся в файле robots.txt.
Обратите внимание, что недопустимы строки вида:
Disallow: /tmp/*
или
Disallow: *.gif
Подробное описание стандарта исключений и синтаксиса команд файла
robots.txt вместе с другой полезной информацией о роботах (на английском язы
ке) можно найти по адресу http://www.robotstxt.org/wc/robots.html.

Тэг META для роботов


Файл robots.txt поддерживается практически всеми роботами, однако корневой
каталог сервера может быть недоступен вам. В этом случае для аналогичных це
лей, но лишь в пределах одного документа можно использовать специальные ме
татэги. Они не только решают проблему запрета, но и предоставляют позитивные
возможности для управления индексированием. Это более гибкое средство уп
равления индексацией, чем robots.txt. В частности, в тэге можно дать роботу по
исковой машины предписание не уходить по ссылкам на чужие серверы, напри
мер, в документах со списками ссылок:
<META NAME=“robots” CONTENT=“index, follow” >
Из данного примера видно, что все управление в метатэге сводится к указа
нию двух переменных, а именно NAME и CONTENT. Для переменной CONTENT
в контексте NAME=“robots” допустимо использовать следующие значения
(они могут быть записаны как строчными, так и прописными буквами):
¾ index – разрешено индексировать документ;
¾ follow – разрешено следовать по ссылкам;
¾ all – эквивалентно употреблению index и follow одновременно (запи
сывается через запятую), то есть разрешено индексировать данную страни
Проверка ссылок 33
цу и все ссылки, исходящие из нее. Когда обнаружено слово all, все дру
гие слова, если они указаны, игнорируются;
¾ noindex – не индексировать сам документ, но следовать по его ссылкам;
¾ nofollow – индексировать, но не идти по ссылкам;
¾ none – эквивалентно одновременному употреблению noindex и nofollow
через запятую, то есть всем роботам предложено игнорировать данную
страницу при индексации.
Если указанный метатэг пропущен или не задано значение переменной
CONTENT, то по умолчанию поисковый робот действует, как при значении
CONTENT=“index,follow” (или CONTENT=“all”, что равноценно).
Если в переменной CONTENT содержатся противоположные по смыслу ключе
вые слова (например, follow и nofollow), то робот поступает по своему усмот
рению; в данном случае выбрано follow).
В приведенном выше примере свойство NAME=“robots” дает роботам пред
писание индексировать и саму страницу (CONTENT=“index”), и документы,
ссылки на которые она содержит (CONTENT=“follow”). Вместо двух этих зна
чений, приведенных через запятую, можно было бы написать одно –
CONTENT=“all” – с тем же результатом.
Указанный метатэг позволяет авторам HTMLдокументов сообщать роботам
о том, может ли документ быть проиндексирован или его следует использовать,
чтобы получить дополнительные ссылки. Для этого не требуется вмешательства
администратора сервера.
В следующем примере роботу не предписано ни индексировать сайт, ни ана
лизировать ссылки:
<META NAME=“robots” content=“noindex, nofollow” >

Другие метатэги
Другие метатэги также могут использоваться роботами при сканировании. На
пример, тэг с параметром NAME=“author” позволяет ввести имя автора доку
мента и учитывается некоторыми поисковыми системами, что иногда может су
щественно помочь при поиске.
Похожий метатэг с параметром NAME=“generator” часто автоматически
проставляется различными HTMLредакторами и содержит информацию о про
грамме, в которой был сделан документ. Некоторые авторы в его описании дуб
лируют информацию метатэга “author”.
Метатэг с параметром NAME=“copyright” служит для указания принад
лежности авторских прав.
Справедливости ради следует отметить, что поисковые системы все же редко
используют указанные метатэги в своей работе.

Проверка ссылок
До начала рекламной кампании стоит убедиться в том, что в текстах страниц,
размещенных на сайте, нет технических ошибок. К таковым относятся непра
34 Этапы большого пути

вильно расставленные ссылки, отсутствие какихлибо файлов и собственно по


грешности в HTMLкоде, а также грамматические и орфографические ошибки
в текстах документов. Напомним, кстати, что сайтом называют набор докумен
тов, которые в установленном порядке размещены на определенной машине и до
ступ к которым через сеть обеспечивается HTTPсервером.
Реакция пользователя на ошибки такого рода может иметь самые печальные
последствия для автора. Замечая их, посетитель испытывает досаду, раздраже
ние и быстро уходит с сайта. Уговорить «обиженных» вернуться будет крайне
трудно.
Формальную проверку сайта можно провести как сетевыми средствами, так и
при помощи различных программ. Кроме того, необходимо обратить особое вни
мание на смысловые элементы, играющие немаловажную роль при «раскрутке»
Webресурса:
¾ заголовки;
¾ использование фреймов;
¾ метатэги;
¾ навигацию по Internetстраничкам.
В качестве дополнительной проверки понадобится исследование времени заг
рузки ваших страниц. Кроме того, очень важно иметь доступ к файлам посеще
ний, что позволит вести постоянный анализ жизнедеятельности сайта в самых
разнообразных аспектах.
В какомто смысле созданный вами гипертекст похож одновременно и на кни
гу, которую вы должны откорректировать, и на программу, которую необходимо
отладить. По крайней мере, следует дать прочитать его комунибудь из той груп
пы людей, для которой он написан, и проанализировать замечания. Но одного
этого недостаточно, требуется протестировать документ. Просмотрите его в не
скольких различных обозревателях (браузерах), чтобы убедиться, что его вид не
зависит от средства вывода.
Проверка занимает время. Сколько времени отводить на тест? Все зависит от
того, какое качество документа вас устраивает.
Есть сведения, что в Internet около 5% имеющихся ссылок недоступны. Необ
ходимо предотвратить подобные проблемы.

Проверка ошибок кода


в HTMLдокументах
Если вы используете программное обеспечение для редактирования гипертекста,
ваши файлы будут соответствовать действующему стандарту HTML. Многие
разработчики редактируют HTMLфайлы как обычные текстовые и должны са
мостоятельно контролировать соответствие написанного правилам HTML. Если
вы поступаете именно так, будет уместно проверять файлы при помощи про
грамм и сетевых ресурсов, специально предназначенных для этого.
Проверка ошибок кода в HTMLдокументах 35
Проверка HTMLкода гарантирует, что все посетители, каким бы браузером
они ни пользовались, увидят ваши страницы именно такими, какими видите их вы.
Ошибки, определяемые программами или сетевыми сервисами проверки пра
вильности HTMLкода, обычно относятся к двум категориям: неправильное при
менение тэгов и использование нестандартных расширений. HTMLстандарты
задают некий минимальный уровень требований, соблюдение которых дает сход
ные результаты при обработке тэгов языка HTML различными программами
просмотра HTMLдокументов. На практике требования браузеров несколько от
личаются от этого уровня в ту или иную сторону, однако в любом случае испра
вить ошибки первого рода легко, и это не займет много времени.
Со вторыми дело обстоит не так просто. На вашей странице могут оказаться
тэги, поддерживаемые только одним из браузеров и неработающие в других. Стоит
взвесить, что дает их применение – оправдает ли оно потерю посетителей, исполь
зующих несовместимые программы просмотра. При профессиональном проекти
ровании сайта обычно отслеживают, какими браузерами пользуются посетители,
чтобы придти к разумному компромиссу при выборе тех или иных решений. Если
у 98% ваших посетителей браузеры могут обрабатывать тэг, который действитель
но позволяет сделать страницу более красивой и удобной, – можно его сохранить.
Проверку синтаксиса HTMLдокументов невозможно выполнить с помощью
обычных браузеров, так как они предназначены только для просмотра HTML
страниц. Если в документе имеются синтаксические ошибки, браузер пытается,
игнорируя их, какимлибо образом показать страницу на экране. Однако решает
ся такая задача каждый раз поновому – в зависимости от типа браузера и даже от
его версии. Если ошибок на странице слишком много, она может быть не отобра
жена в окне браузера или отображена лишь частично. Программные и сетевые
средства проверки HTMLдокументов позволяют предупредить такое поведение
браузеров, выявляя допущенные при разработке страниц ошибки. Отметим, что
сделать это довольно просто. Выявив ошибки до размещения HTMLдокументов
в Internet, вы заметите, что страницы будут загружаться быстрее, а проблем ста
нет значительно меньше.

Задание типа документа


В соответствии со стандартом каждый HTMLдокумент предполагает наличие
объявления типа документа. В семействе языков разметки HTML является всего
лишь одним из многих, хотя и самым популярным. Он имеет уже многолетнюю
историю и был за это время нормирован различными версиями. Заданием типа
документа указывается используемый язык разметки и его версия. Программы,
читающие эти указания (например, обозреватели Internet и программы проверки
синтаксиса HTMLкода), придерживаются таких указаний. В частности, декла
рация типа документа дает возможность программам проверки определить, ка
кую версию HTML следует использовать для контроля.
Каждое указание типа документа связано с так называемыми определениями
типа документа (DTD, Document type declaration). И для HTML существуют та
36 Этапы большого пути

кие DTD. В них оговорено, какие элементы (тэги) может содержать документ
типа HTML, какие элементы могут располагаться внутри других элементов, ка
кие атрибуты принадлежат тому или иному элементу, является ли задание того
или иного атрибута обязательным и т. д.
Рекомендуется начинать любой HTMLдокумент со строки, содержащей оп
ределение типа документа – тэг DOCTYPE. Для этого обычно используются ни
жеперечисленные конструкции.
<!DOCTYPE HTML PUBLIC “-//W3C//DTD HTML 4.01//EN”
“http://www.w3.org/TR/html4/strict.dtd”>
Такое объявление служит указанием, что используется тип документа HTML
4.01 Strict (Строгий). Строгое следование стандартам повышает ранг документа
в рейтингах поисковых машин. Если стандарт полностью соблюден – пользуй
тесь этим определением.
Задавайте тип документа первой строкой HTMLфайла перед открывающим
тэгом <HTML>. Обратите внимание, что за угловой скобкой следует восклица
тельный знак. Запись DOCTYPE HTML PUBLIC означает, что вы ссылаетесь на
всем доступный HTMLDTD. Заключенные в кавычки данные расшифровыва
ются следующим образом:
¾ W3C – издатель DTD: в данном случае, W3консорциум;
¾ DTD HTML 4.01 – указание типа: в файле применен документ типа HTML
в версии 4.01 и варианте Strict (по умолчанию);
¾ EN – сокращение, указывающее на язык (в данном случае – английский)
написания элементов (тэгов) и их атрибутов, но не содержания файла.
Применяйте всегда EN, так как имена элементов и атрибутов HTML осно
ваны на английском языке.
Последним параметром в объявлении является адрес в Internet DTDфайла, ко
торый дает возможность программам загрузить его и прочитать определенные в нем
правила. Заметим, что, в отличие от программ проверки синтаксиса, большинство
браузеров при представлении HTMLдокументов этого не делают. Такой подход ос
нован на желании разработчиков Internetобозревателей отображать даже те страни
цы, которые написаны с большими отклонениями от правил правописания HTML.
<!DOCTYPE HTML PUBLIC “-//W3C//DTD HTML 4.01 Transitional//EN”
“http://www.w3.org/TR/html4/loose.dtd”>
Используется тип документа HTML 4.01 Transitional (Переходный). Имеется
в виду HTML «переходного периода», то есть разрешается применять устарев
шие элементы из HTML 3.2.
<!DOCTYPE HTML PUBLIC “-//W3C//DTD HTML 4.01 Frameset//EN”
“http://www.w3.org/TR/html4/frameset.dtd”>
Тип документа HTML 4.01 Frameset – это HTML 4.01 Transitional с добавле
нием фреймовых элементов.
<!DOCTYPE HTML PUBLIC “-//W3C//DTD HTML 3.2 Final//EN”>
Шрифтовое оформление 37

Эта форма задания типа документа применима, если вы хотите сослаться на


версию HTML 3.2.
<!DOCTYPE html PUBLIC “-//IETF//DTD HTML 2.0//EN”>
То же – на версию HTML 2.0.

Шрифтовое оформление
Всего лишь десять лет назад в дизайне ощущалась острая нехватка компьютер
ных шрифтов (как по количеству, так и по качеству). Однако в настоящее время
эта ситуация резко изменилась – появилась масса разнообразнейшего шрифто
вого материала любых стилей. Internetтехнологии накладывают специфические
ограничения на использование шрифтов в оформлении webдокументов. B част
ности, межплатформенный характер Сети не позволяет однозначно определять
шрифт для вывода текста документа на экран монитора клиента. Применение
тэга <FONT FACE=…> не является панацеей от этой проблемы. На клиентской
машине, возможно, не окажется нужного шрифта, а замена его другим, выбран
ным системой по умолчанию, может привести к появлению нечитаемого доку
мента. Поэтому считается правилом хорошего тона не употреблять указанный
тэг при проектировании HTMLдокументов.
Это заставляет изыскивать другие пути для оформления текста страниц.
B частности, выделение необходимых его частей цветом, применением строч
ных символов, их курсивного и полужирного начертания, а также манипуляции
с кеглем шрифта, выводимого на экран. Немаловажным для удобства восприя
тия информации оказывается цветовое соотношение текста и фона. Если пред
полагается передача клиенту достаточно большого объема информации, то
с точки зрения удобства для чтения желательно, чтобы текст был выполнен
темным цветом на светлом фоне и был достаточно контрастным. Применение
ярких подложек под текст (задний фон) является сильным выразительным
средством, но, необходимо помнить, что читать текст по яркому, а тем более
неоднородному, фону трудно, а иногда просто невозможно, так как символы те
ряются в пестроте подложки.
Конкретный шрифт, который будет применен для отображения текста, позво
ляет задавать также каскадные таблицы стилей (CSS). Но и в этом случае шриф
ты берутся из набора, установленного на компьютере пользователя. Поэтому сле
дует учитывать ряд ограничений. Первое, и основное, заключается в том, чтобы
использовать только стандартные шрифты, поставляемые с операционной систе
мой MS Windows и гарантированно находящиеся на машине клиента. А этих
шрифтов всего три: Arial, Times New Roman и Courier.
Второе – корректное описание шрифта в таблице стилей и перечисление так
же и других заменяющих шрифтов. В конце списка должно быть обязательное
указание общего семейства шрифта (с засечками – без засечек, моноширинный –
пропорциональный и т. д.). При помощи такого описания мы увеличиваем по
38 Этапы большого пути

тенциальную аудиторию нашего сайта. Пример корректного описания шрифтов


в таблице стилей приведен ниже:
<style type=“text/css” >
<!—
.serif { font-family : “Times New Roman” , “Geneva” , “serif” ;
}
.sanserif { font-family : “Arial” , “Helvetica” , “sans-serif” ; }
.mono { font-family : “Courier” , “monospace” ; }
—>
</style>
Почему нежелательно использовать другие шрифты? В этом случае недоста
ющий шрифт будет подменен ближайшим подходящим по умолчанию. Для
уменьшения вероятности такой замены и используется в CSS список заменяю
щих шрифтов. Но еще хуже, если нужный шрифт будет установлен на компьюте
ре, но окажется нерусифицированной версией. Тогда текст будет отображен не
кими спецсимволами – всевозможными знаками с умляутами, апострофами,
тильдами и т. п.
Одним из показателей удобочитаемости является ширина строки документа.
С появлением мониторов, поддерживающих большое разрешение экрана, стало
возможным уместить в одной строке до нескольких сотен символов, однако едва
ли следует увеличивать это число более 50–70, так как при большем количестве
скорость чтения замедляется, а утомляемость значительно возрастает.
В современном «информационном обществе» очень важна способность
шрифта привлекать или останавливать внимание. Поэтому из вышесказанного
следует вывод – со шрифтами следует работать осторожно, дабы не потерять сво
их посетителей.

Время загрузки страниц


Медленная загрузка страниц сайта зачастую раздражает пользователей и, как
следствие, снижает посещаемость сервера. Не желая убивать время, многие пред
почитают искать информацию в других источниках. Поэтому крайне важно не
жалеть материальных затрат на быстрый сервер и специалиста, который проана
лизирует архитектуру сайта и исходные коды страниц, поможет максимально
уменьшить время их загрузки.
Посетителям нет дела до причины медленной работы сайта. Все, что они отме
чают, – это плохая работа сервера.
Изначально основной причиной медленной загрузки страниц было чрезмерное
увлечение графикой. Многие сайты перегружены ею, тогда как те же самые эффек
ты можно было бы получить при помощи DHTML или даже простого HTML.
С увеличением количества разнообразных программных приложений, осно
ванных на современных Internetтехнологиях, и развитием электронной коммер
ции возникла необходимость настраивать каждую страницу узла на запрос от
Проверка правописания 39
дельного пользователя. Таким образом, длительная загрузка может объясняться
не только пропускной способностью канала, но и внутренней архитектурой сай
та. Иногда конструкция страницы предусматривает обращения к базе данных,
находящейся на удаленном сервере, что опять же увеличивает время загрузки.
Исследованию времени, в течение которого происходит загрузка страниц сай
та, стоит уделить особое внимание при разработке.

Использование фреймов
В современных браузерах навигация по сайтам с фреймами осуществляется без
особых затруднений. Однако некоторые поисковые системы не индексируют
фреймы, поэтому при их использовании на запускающей странице обязательно
нужно поместить фрагмент кода:
<NOFRAMES> … </NOFRAMES>
Текст между указанными тэгами и будет использован поисковыми роботами
для создания индексов. Кроме того, это дань уважения тем, кто пользуется брау
зерами, неработающими с фреймами, или отключает такую возможность, если
позволяет программаобозреватель. Не пренебрегайте частью вашей аудитории.

Проверка правописания
Пользователи не любят опечаток и грамматических ошибок и изза них могут от
казаться от посещения вашего сайта. Если вас плохо владеете орфографией и
пунктуацией, попросите когонибудь сведущего проверить правописание текста,
либо воспользуйтесь специальными сервисами в Internet. Как именно – будет
показано далее.

Ошибки правописания – какая от них польза


Не все люди, пользующиеся поисковыми системами, хорошо учились в школе.
Составляя запросы, они допускают грамматические ошибки. Некоторые из оши
бок носят хронический характер. Создается впечатление, будто большинство
твердо уверено, что «агенство» (результат поиска в Яndex: слов – 2 732 174, стра
ниц – 1 515 338, сайтов – не менее 4 126, запросов за месяц – 98 355), «пожайлу
ста» (соответственно, 1 034 863, 211 855, 1 384, 270), «можите» (260 518, 211 660,
1 670, 482), «интеренет» (175 538, 132 533, 1 697, 3 166) и «координальное»
(39 321, 33 341, 1 958, 47) – это правильно и так и надо.
Коекакие опечатки легко спрогнозировать, глядя на клавиатуру компьютера.
Если в списки ключевых слов добавить слова с ошибками, можно иногда из
влечь из этого пользу: получить не только дополнительный трафик, но и, что бо
лее важно, целевых посетителей, которые легко выйдут на искомый сайт. Причем
все останутся довольны: пользователь найдет то, что искал, а вы получите, воз
можно, покупателя своих товаров или услуг.
40 Этапы большого пути

Навигация по сайту
В настоящее время люди уделяют Internetадресам меньше внимания, нежели
несколько лет назад. Большинство сайтов сейчас имеют хорошую навигацион
ную поддержку, и пользователи полагаются при определении тематики сайта
именно на нее, а не на адрес. Тем не менее, все каталоги и названия страниц долж
ны быть связаны с тематикой и понятно названы, чтобы пользователь мог рас
сматривать сам адрес как дополнительную помощь в навигации.
Подавляющее большинство пользователей не прокручивают навигационный
блок, а выбирают несколько из видимых на первом экране опций. На всех сайтах
чаще всего используются те элементы навигации, которые расположены на пер
вой странице. Особенно это заметно, если первые несколько ссылок навигацион
ного блока описывают главную тематику сайта – пользователь, как правило,
стремится найти нужную информацию, а не изучать оставшиеся ссылки, поэтому
на остальные элементы навигации может даже не обратить внимания.
А вот малопонятная навигация по сайту представляет серьезную проблему,
хотя встречается не так уж часто. Люди уже привыкли к определенным канонам
в дизайне и навигации: логотип – он же ссылка на начальную страницу – слева
вверху; ясное указание на то, к какой части сайта относится данная страница, на
личие ссылки на главную страницу этого раздела и т. д. Если такие базовые эле
менты навигации отсутствуют, пользователь может попросту «заблудиться».
Нестандартные цвета ссылок могут затруднить навигацию, поскольку пользо
ватели полагаются на них, чтобы понять, какие страницы сайта они уже посети
ли. Когда же стандартные цвета игнорируются, пользователь начинает автомати
чески щелкать мышью подряд по всем подчеркнутым словам в тексте, которые
далеко не всегда являются ссылками, и, конечно же, в итоге раздражается.

Появление новых окон


Если при щелчке по ссылке открывается новое окно браузера, а такое решение
никоим образом не оправдано логикой перемещений по сайту, то это может сби
вать с толку пользователей. Большая часть из них обычно максимизирует окно
браузера, так что они иногда могут просто не заметить, что открылось еще одно
окно. Кроме того, как правило, пользователь исследует сайт, нажимая на кнопку
Back (Назад). В новом окне его может смутить дезактированный Back, и он про
сто закроет окно вместо того, чтобы разбираться, почему ему не дают вернуться
на предыдущую страницу обычным способом.

Нестандартное использование
элементов управления
Постоянство – основа удобства сайта. Когда элементы интерфейса ведут себя
однозначно, посетителю не приходится гадать, что произойдет, если он нажмет
Навигация по сайту 41

вот на эту кнопку или ссылку. У него есть убежденность, что этот конкретный
элемент ведет себя именно так, как известно из предыдущего опыта. Чем полнее
оправдываются ожидания пользователя, тем лучше. Он будет чувствовать себя
уверенней, и ваш сайт понравится ему еще больше. С другой стороны, необычно
работающая система внушает пользователю страх и неуверенность. Постоянство
действий – еще одна причина, по которой не стоит открывать новые окна в брау
зере. Стандартное следствие нажатия на гиперссылку – появление новой страни
цы в том же окне браузера. Любой другой результат не оправдывает ожиданий
пользователя, а значит, заставляет его усомниться в своей способности работать
в Internet.
Часто закон постоянства нарушают при использовании графических эле
ментов управления, например, кнопокселекторов и флажков. Так, по правилам
действия селекторов нужно выбрать одну из нескольких предложенных опций,
однако никаких операций не производится, пока пользователь не нажмет кноп
ку ОК, подтверждая выбор. Но нередко встречаются сайты, на которых это ба
зовое правило нарушено – действие происходит сразу после выбора опции.
При всей своей кажущейся незначительности именно такие нарушения правил
работы элементов пользовательского интерфейса затрудняют путешествия по
сайту.

Сведения об авторах
Из результатов первых исследований WWW десятилетней давности следовало,
что пользователю интересно, кто стоит за информацией, представленной в Сети.
Так, например, фотографии и биографии авторов сайта могут существенно под
нять рейтинг ресурса и сделать Internet менее безличной и непонятной средой,
увеличить доверие к информации. Показывая пользователю конкретную лич
ность и ее мнение, вы окажетесь в более выигрышном положении, чем те, кто
предпочитает давать анонимные сведения.
Тем не менее, многие разработчики не используют в информационных ресур
сах ни авторских колонок, ни даже развернутых подписей. А те, кто использует
подписи, нередко забывают ставить в них ссылки на биографию и другие работы
автора.
Также плохо, когда вместо ссылок на работы и биографию имя автора стано
вится ссылкой на его, автора, электронную почту (mailto: autor@server.com).
Вопервых, читателю свойственно, скорее, желание узнать об авторе больше,
нежели напрямую с ним контактировать. Конечно, дать электронный адрес ав
тора очень важно, но лучше делать это в конце биографии или списка работ, но
никак не в начале, при первом знакомстве. Вовторых, это опять нарушает при
нятые в Internet стандарты: когда вы щелкаете по имениссылке, вы ожидаете
увидеть страницу с информацией об авторе. Вместо этого вам предлагается тут
же написать ему письмо. Такие ссылки существенно уменьшают удобство ре
сурса, так как делают Internet менее предсказуемым.
42 Этапы большого пути

Отсутствие архивов
Старая информация – не значит плохая. Читателям она может оказаться необхо
димой. Даже если новая информация оказывается гораздо полезней, у старой
тоже найдется свой потребитель. Ктото подсчитал, что поддержка архивных
данных на сервере увеличивает расходы приблизительно на 10%, в то время как
полезность и посещаемость ресурса возрастают при этом на все 50%.
Архивы также помогают избежать появления на сервере ошибки 404 (о ней да
лее), дают преимущество при создании ссылок на ваш ресурс на других серверах.

Улучшение посещаемости сайта


за счет обработки ошибок
Существуют очень простые, но почемуто не всегда используемые методы увели
чения числа посетителей сайта за счет тех, кто стремится попасть к вам по уста
ревшей ссылке. Ясно, что любой сайт подвергается постоянной доработке и пере
работке. Вы изменяете дизайн, содержание, добавляете новые страницы, иногда
удаляете или переименовываете старые. Последние две операции крайне нежела
тельны, но, бывает, и без них не обойтись.
Скорее всего, посетители сайта не застрянут на такой «исчезнувшей» страни
це, так как большинство знает, что нужно просто «отсечь» конец адреса – и попа
дешь на главную страницу сервера. Правда, этот способ не всегда известен нео
пытным пользователям и раздражает опытных.
Как правило, при обращении к документу, не существующему на сайте, сервер
формирует сообщение об ошибке. Интересно, что в этой ситуации очень легко
привести посетителя на любую из ваших страниц, обычно – на главную или стра
ницу поиска по сайту. Вот как это делается:
1. Создайте новую чистую страницу, соответствующую дизайну вашего сай
та. Сохраните ее в корневом каталоге сайта под именем 404.html.
2. Между тэгами <HEAD> и </HEAD> включите следующую строку:
<META NAME=“robots” CONTENT=“noindex,nofollow” >
Так выглядит, как вам известно, указание роботам поисковых машин не
индексировать страницу в своих базах данных. Следовательно, метатэги
KEYWORDS и DESCRIPTION здесь не нужны.
3. Теперь добавьте на страницу содержание, например, такое:
Äîêóìåíò íå îáíàðóæåí.
We recently redesigned our website, replacing many of our pages,
updating information and making it more convenient for you to
find what you are looking for. It seems that the page you are
looking for is one that has been replaced.
Please visit our new Home Page, or use the links on this page to
find your way around our new website.
We apologize for any inconvenience this may have caused you.
Перевод на другие языки 43
(Сайт был изменен, некоторые страницы перемещены, информация обнов
лена, с тем, чтобы Вам было удобнее осуществлять поиск. Видимо, страни
ца, которую вы ищете, теперь находится в другом месте.
Пожалуйста, зайдите на обновленную домашнюю страничку или восполь
зуйтесь ссылками на этой странице для навигации по сайту.
Извините за временные неудобства.)
И не забудьте дать ссылку на нужную страницу (главную или страницу поиска).
4. Закончив работу с файлом 404.html, создайте обычный текстовый документ
и назовите его .htaccess.txt (с точкой в начале). Впишите в него строку:
ErrorDocument 404 /404.html
5. Скопируйте оба файла в коревой каталог вашего сайта в Internet.
В зависимости от конфигурации сервера файл .htaccess.txt может не иметь
расширения (.htaccess). Кроме того, он может уже существовать на сайте. В пос
леднем случае просто добавьте указанную выше строку в конец файла.
Теперь спокойно обновляйте дизайн вашего сайта, и можете быть уверены,
что посетителей вы не потеряете. Теперь при любом обращении к несуществую
щей странице посетитель получит вежливое извинение и доступ к сайту через
ссылку, а не досадное извещение: 404 – Page not found (Ошибка 404 – Документ
не найден).
Более того, вам становится доступно то, что раньше безвозвратно терялось –
статистика посещений через страницу 404.html. Ее содержание, конечно, может
быть любым, сделайте хоть копию главной страницы. Важно, что вы пригласили
на свой сайт людей, которые не нашли желаемое, и привлекли посетителей, кото
рые бы к вам заведомо не попали.

Перевод на другие языки


Увеличение количества посетителей – одна из приоритетных задач любого Web
сайта. Расширить аудиторию за счет иностранных клиентов позволяет перевод
Webстраниц на другой язык. Для некоторых сайтов, которые ориентированы на
многоязычных пользователей, перевод текстов на иностранные языки становит
ся насущной необходимостью. Однако поддержание таких страниц сопряжено со
значительными затратами на оплату услуг переводчиков и редакторов. Наиболь
шую трудность в этом случае представляет обновление регулярно меняющейся
информации – новостей, прессрелизов, описаний и т. д.
Решить указанную проблему отчасти позволяет использование онлайнового
машинного перевода. Компания ПРОМТ (http://www.promt.ru/), ведущий раз
работчик технологий машинного перевода и лингвистического программного
обеспечения, предлагает подобный сервис. С его помощью любой владелец Web
сайта может обеспечить онлайновый перевод своих страниц с русского языка на
английский, немецкий, французский и испанский. Установив специальную фор
му для выбора языка перевода, один из вариантов которой показан на рис. 1.1,
владелец Webресурса дает возможность своим посетителям открыть любую
44 Этапы большого пути

Рис. 1.1. Одна из форм


для выбора языка перевода

страницу сайта на том языке, который они предпоч


тут. Сервис бесплатный; он реализован на основе сер
вера онлайнового перевода компании ПРОМТ (http://www.translate.ru/).
Чтобы воспользоваться данной услугой, необходимо зайти на страницу http://
www.translate.ru/webmaster.asp, получить HTMLкод и установить его на страни
цы своего сайта.

Анонсирование в поисковых системах


По содержанию Internet представляет собой кладезь информации, а по способу
ее организации – огромную свалку. Но, к счастью, положение не столь безнадеж
но – найти необходимую информацию помогают каталоги и поисковые машины.
Работа поисковых систем, к которым часто и при этом ошибочно относят и ка
талоги, полностью автоматизирована и ведется по следующей схеме: сканирование
ресурсов с помощью программыробота, формирование индексной базы данных и,
наконец, обслуживание запросов по ключевым словам. Как бы ни были популярны
каталоги, должно быть понятно, что реальную доступность информации в Internet
во всем ее объеме могут обеспечить только автоматические индексы.
Каким же поисковым машинам отдают предпочтение пользователи?
По различным электронным опросам на тему «Какими поисковыми система
ми Вы пользуетесь?» в России распределение результатов примерно таково:
¾ Яndex – 47%;
¾ Rambler – 21%;
¾ Апорт – 10%;
¾ Google – 6%;
¾ Altavista – 5%;
¾ Mail.Ru – 4%;
¾ Yahoo! – 4%.
Каким же образом пользуются поисковыми машинами для популяризации сай
та? До сорока процентов посетителей переходят к нужным ресурсам по ссылкам из
поисковых систем. Поэтому правильное индексирование в них сайта, то есть соот
ветствие его содержания запросу, должно быть предметом особой заботы.
Как происходит индексирование? Либо робот поисковой машины добирается
до вашего сайта по ссылкам, либо вы сами отмечаете его на странице регистрации,
которая существует в любой поисковой системе. В первом случае процесс индекси
рования может затянуться, во втором вам потребуется затратить свое время.
Для правильной индексации сайта требуется учесть следующее:
¾ страницы сайта должны быть текстовыми. Текст на графических изобра
жениях поисковые машины не распознают. Правда, текст в атрибуте ALT
тэга IMG обычно индексируется;
Анонсирование в поисковых системах 45
¾ в каждом документе сайта обязательно должны присутствовать вразумитель
ный заголовок (тэг TITLE), ключевые слова (метатэг NAME=“keywords”)
и краткое описание (метатэг NAME=“description”);
¾ следует подготовить файл robots.txt, а также ввести в документы метатэг
NAME=“robots”;
¾ желательно регистрировать сайт в каждой интересующей вас поисковой
машине вручную и в дальнейшем контролировать его индексирование.
После регистрации сайта в различных поисковых системах следует добиваться
того, чтобы ссылка на него при поиске входила хотя бы в первый десяток (а лучше,
если в этом десятке будет несколько ссылок на ваши документы).

Информационнопоисковые системы
Каталог – это, как правило, база данных, в которой хранятся адрес ресурса и его
описание. Описание ресурса делается либо составителями каталога (как, напри
мер, на Yahoo!), либо тем, кто хочет включить его в каталог. В поисковой системе
все происходит иначе.
Поисковые машины – это полностью автоматизированные системы, сканиру
ющие сеть Internet. Ее сетевой агент (робот, «паук», «червяк») обходит все задан
ные ему серверы и собирает у себя индекс, то есть информацию о том, что и на
какой странице было найдено. Сетевые агенты – это, по сути, программы, кото
рые исследуют структуру гипертекста в Internet. Переходя от одного документа
к другому, роботы передают собранную информацию поисковой системе, кото
рая заносит ее в свою базу данных.
Основными функциями поисковых систем являются следующие:
¾ сбор статистики. Первые роботы были созданы именно для этого и опреде
ляли число страниц на сервере, типы присутствующих на нем файлов, их
соотношения, средний размер страницы и т. д.;
¾ обслуживание. Имеются в виду такие функции, как сбор информации
о неисправных ссылках и обновленных документах, проверка ссылок
сайтов, авторы которые самостоятельно подали регистрационную заяв
ку, и др.;
¾ поиск новых ресурсов. Необязательно регистрировать сайт собственно
ручно – это может сделать робот, поскольку он постоянно ищет новые ре
сурсы. Однако может уйти много времени.
Полнотекстовые поисковые машины индексируют все слова, найденные на
Webстранице, за исключением стопслов (обычно малоинформативных и имею
щих незначительную частоту употребления, например, союзов и предлогов).
Каждый день поисковые системы «прочесывают» Webсайты и сохраняют
текстовую информацию в своих огромных каталогах, чтобы завсегдатаи Internet
могли по ключевым словам получить список Webстраниц. Как правило, в ре
зультате находятся сотни соответствующих запросу ресурсов, но отображаются
они на экране «порциями» по 10–25 записей. В первую очередь выведены наибо
лее подходящие, согласно оценке поисковой системы, страницы.
46 Этапы большого пути

В связи с этим становится понятным нарастание интереса разработчиков


Webузлов к поисковым службам, которые оказываются в состоянии обеспечить
до 40%, а в некоторых случаях, и до 70% обращений к сайту.
Использование поисковых систем для продвижения Webузла не может га
рантировать успеха, если разработчик не учел целый ряд тонкостей этой проце
дуры. Так, далеко не всегда очевидно, какие из поисковых систем наиболее зна
чимы для увеличения посещаемости. Исчерпывающий ответ на этот вопрос может
дать только анализ статистики посещений узла после регистрации. Кроме того,
чтобы обеспечить практическую, а не только теоретическую доступность своего
сайта из списка отклика по тому или иному запросу, необходимо учитывать осо
бенности функционирования отдельных сервисов.
Поиск информации в русскоязычной части Internet облегчает существование
специальных поисковых средств. Принцип их действия аналогичен работе тра
диционных баз данных, когда в ответ на ввод ключевого слова выдается перечень
документов, содержащих искомое понятие. Эти системы являются, по сути, база
ми таких слов, пополняемыми при периодическом сканировании содержимого
серверов Internet. С помощью специальных программроботов поисковые систе
мы регулярно обследуют Internet, фиксируя, как вновь появившиеся, так и об
новленные ресурсы, и удаляя сведения о ресурсах, вышедших из употребления.
Этот колоссальный материал с указанием ссылок на то, где хранится каждое сло
во, содержится в виде гигантских индексных файлов, к которым и обращаются
поисковые системы при конкретном запросе.
Достоинства и недостатки поисковых машин определяются различными ха
рактеристиками. Принципиальным является то, насколько полно система обсле
дует документы: все ли слова заносятся в индексные файлы или же только терми
ны из названий, заголовков, первых нескольких строк или страниц текста, и т. д.
Важна также периодичность обновления данных и критерии оценки понятий при
определении степени их соответствия запросу. Не последнюю роль играют про
стота и удобство интерфейса, возможность использовать булевы операторы (опе
раторы математической логики) и операторы расстояния между словами в тексте
документа, а также дополнительные сервисные функции, например, поиск ново
стей, музыкальных файлов, товаров, и т. д.
В обслуживание, осуществляемое информационнопоисковой системой, входит
предварительная обработка текста, в том числе составление индекса, по которому
затем происходит поиск. Такая поисковая система может быть организована как база
данных с текстовыми полями. Другой вариант организации – работа с внешними
текстами. В этом случае тексты сохраняют первоначальный вид, то есть остаются
файлами в файловой системе, страницами на сервере или полями какойто другой
базы данных, а индекс снабжается лишь ссылками на соответствующие источники.
Работа с поисковыми средствами требует от пользователя определенного
опыта и навыков.

Индекс поисковой системы


Простейший способ организации индекса для поисковой системы таков: по опре
деленным правилам (используя пробелы, знаки препинания) выделяется и хра
Анонсирование в поисковых системах 47
нится некоторая последовательность из букв и цифр. При этом в качестве адрес
ной информации можно применять путь и имя файла, адрес Webстраницы. По
такой схеме действуют разработчики многих поисковых систем, например, одной
из самых известных в Интернет – AltaVista компании Dec.
Недостатки указанного способа очевидны при использовании любых языков,
в которых слова имеют словоформы, то есть изменяются по числам, родам, паде
жам, временам и др. Пользователь, начиная поиск, вынужден либо вспоминать,
как точно выглядела искомая лексическая единица, либо добросовестно скло
нять и спрягать слова, чтобы получить полную парадигму.
Частичное решение проблемы – применение шаблонов, например, символа *
(астериск) в конце слова. Такой шаблон неплохо подходит для английского язы
ка, где большинство словоформ образуется за счет добавления окончаний s, ed
и ing; впрочем, но эта уловка полностью не спасает от «мусора» в результате по
иска. С русским языком все обстоит гораздо сложнее. Найти с помощью шаблона
многие слова невозможно в принципе, а именно:
¾ слова, у которых в разных формах меняется основа: идти – шел, плохо –
хуже, он – его, человек – люди, ребенок – дети;
¾ слова с большим количеством словоформ. Привести список всех слово
форм русского глагола (с причастиями и деепричастиями – до 250 различ
ных форм) человеку, у которого нет лингвистического образования, очень
трудно. Понять, все ли словоформы из этого списка охватываются шабло
ном * – еще труднее;
¾ слова с беглыми гласными и чередованиями (искать – ищу, окно – окон,
расти – рос);
¾ короткие слова (из трехчетырех букв): дом, хор и т. п. Во всех языках, в том
числе и в русском, существует общая закономерность: чем короче слово,
тем чаще оно используется. Применение шаблона * для поиска такой лек
сики приводит к большому количеству ненужных ссылок в списке найден
ных документов.
Существует два противоположных подхода к реализации поиска. Первый –
«демократический», при котором поиск должен быть настолько прост, чтобы лю
бой неподготовленный человек мог, не испытывая затруднений, сформулировать
вопрос и вскоре получить на него приемлемый ответ. Второй – «элитарный», при
котором поиск является тонким инструментом, требующим квалифицированно
го обращения. Оба подхода справедливы, чем и обусловлено наличие у всех круп
ных поисковых машин в Internet двух поисковых страниц – для обычного и рас
ширенного поиска.

Полнотекстовый поиск
Когда говорят о полнотекстовом поиске, имеют в виду поиск по всем текстовым
полям документа. Под текстом подразумевается набор слов (выделенная по неко
торым правилам последовательность букв), чисел и меток (комбинации букв и
цифр или букв разных алфавитов). Текстовый документ, как правило, имеет
внутреннюю структуру – деление на параграфы, отступ для заголовка, подписи,
48 Этапы большого пути

таблицы. Текстовые редакторы позволяют делать эту структуру достаточно


сложной: разбивать текст на колонки, выравнивать его, создавать списки и т. д.
Часто структуру документа при отсутствии жесткой регламентации опреде
ляет внутренняя логика. Так, вверху делового письма обычно стоят реквизиты
адресата, внизу – подпись и число. Несколько иначе дело обстоит с бланками –
в них поля заданы строго. Язык HTML, принятый в Internet как стандарт, поми
мо разметки информации, предусматривает разметку внутренней структуры: за
головка, тела документа, ключевых слов.
В задачу полнотекстового поиска наряду с дешифровкой разных форматов
(это могут быть текстовые поля баз данных, файлы стандартных форматов –
TXT, DOC, HTML, RTF, XLS) входит понимание внутренней структуры текста.
В идеальном случае поисковая система должна подчиняться настройке на опре
деленные текстовые структуры. Эта настройка может производиться как фор
мальным описанием данных, так и самообучением системы с обратной связью.

Учет морфологии
Системы, разработанные с учетом морфологии языка, способны дифференциро
вать слова по формам и выполнять анализ с использованием всего спектра слово
изменений.
По способу образования словоформ русский язык – флективный, то есть в нем
существуют флексии (от лат. flexio – сгибание), или окончания, выражающие грам
матическое значение при словоизменении (склонении, спряжении). Русский язык
относится также к классу синтетических языков: в слове объединено и лексиче
ское, и грамматическое значение.
Слово во всей совокупности его лексических значений называется лексемой (от
греч. lexis – слово, выражение). Лексема – это единица лексического уровня язы
`

ка; система словоформ, относящихся к одной лексеме, называется ее парадигмой.


Другими словами, парадигма слова – это образец типа склонения или спряжения,
совокупность всех словоформ, полученных при изменении слова по числам, паде
жам, родам и временам. Наиболее сложную парадигму в русском языке имеют гла
голы. У неизменяемых слов лексема и словоформа совпадают. В словарях каждая
лексема представлена одной из словоформ, которая называется словарной или ис
ходной. В русском языке словарными формами являются следующие:
¾ для существительных – именительный падеж единственного числа;
¾ для прилагательных – именительный падеж единственного числа мужско
го рода;
¾ для глаголов, причастий и деепричастий – глагол в инфинитиве.
Все современные поисковые системы, работающие с учетом морфологии рус
ского языка, базируются на «Грамматическом словаре русского языка», состав
ленном А. А. Зализняком. Основное назначение этого словаря – отразить русское
словоизменение, то есть для каждого входящего в словарь слова дать сведения
о том, изменяемо ли оно, а если да, то как именно это слово склоняется или спря
гается. В ранней редакции этот словарь был назван «Обратный словарь русского
Анонсирование в поисковых системах 49

языка», так как в нем принят не обычный алфавитный порядок расположения


слов, а инверсионный (от конца слова к началу). Это обусловлено тем, что одина
ковый или похожий тип словоизменения в русском языке имеют слова со сход
ным концом, а не со сходным началом. Таким образом, при инверсионном алфа
витном расположении слова с одинаковым или сходным типом словоизменения
обычно оказываются рядом и образуют большие массивы.
Работы по формальному описанию естественного языка тесно связаны с идея
ми автоматического перевода, появление которых относится к 30м годам XX века.
Первые эксперименты в этой области начались в 1954 году в Джорджтаунском
университете (США). До сих пор все существующие автоматические переводчи
ки, как отечественные, так и зарубежные, хотя и умеют делать болееменее гру
бый подстрочник, даже близко не подошли к уровню профессионального худо
жественного перевода.
Важная часть морфологической обработки – выделение основы слова. Осно
вой называется часть, которая остается после отсечения окончания слова и с ко
торой связано его лексическое значение.
Одна из сложностей формального анализа русского языка – наличие в нем омо
нимов. Омонимы (от греч. homуs –одинаковый и уnyma –имя) – разные по значе
нию, но одинаково звучащие и пишущиеся слова, например: «рысь» – способ бега и
«рысь» – животное. С точки зрения автоматического разбора особенно сложны не
полные омонимы (поскольку они имеют одинаковую словоизменительную схему),
а омоформы. Это разные слова, часто являющиеся и разными частями речи, но со
впадающие по звучанию в отдельных формах, например: существительное «печь»
(печи, печью) и глагол «печь» (пеку, печешь); существительное «раздел» (раздел
книги) и глагол «раздел» (раздел донага). Очевидно, что определение семантики
в таких случаях можно произвести только по контексту.
Упомянутый выше словарь А. А. Зализняка включает 90 000 слов. Однако
в русском языке их больше, кроме того, постоянно появляются новые. Некоторые
системы, работающие с учетом морфологии русского языка (например, Яndex),
умеют обрабатывать эти слова, используя описанные в словаре Зализняка слово
образовательные типы. Результат обработки будет тем лучше, чем больше новое
слово похоже на обычные слова языка.

Релевантность
Релевантность – это мера соответствия получаемого результата желаемому, или,
в терминах поисковых систем, соответствие ответа запросу.
Релевантность можно представить как способ сортировки найденных по зап
росу документов. Каждая поисковая машина имеет свой алгоритм сортировки
результатов поиска. Чем больше документ соответствует запросу, тем выше он
должен находиться в списке отклика. Для достижения хорошего результата
обычно учитывают следующие параметры: количество найденных слов, «контра
стность» слова (относительную частоту его использования в данном документе),
расстояние между словами, положение слова в документе и в его зонах.
50 Этапы большого пути

Насколько ответ поисковой системы удовлетворяет интересы пользовате


ля, зависит не только от ее свойств, но и от того, насколько удачно сформули
рован запрос. Практика показывает, что люди не любят читать справочную
информацию и пользоваться операторами языка запросов. Для большинства
пользователей Internet более естественно задавать вопрос прямо, как при
обычном общении. Поэтому в современных поисковых машинах реализуется
естественноязыковый запрос, при котором читатель определяет примерную
область своих интересов. Кроме того, применяются функции «Искать в най
денном» и «Найти похожие документы», назначение которых понятно из их
названий.

Методы регистрации
Регистрация узла в поисковых системах Internet – процедура, трудоемкость ко
торой зависит от поставленной задачи и используемых инструментов. Неплохо
с самого начала разработки Webсайта определиться с двумя его важными компо
нентами: доменным именем и структурой.
Смысловая нагрузка на доменное имя сервера, будь то название компании,
продукта или профиля деятельности, весьма велика, а его изменение бывает рав
носильно смерти узла. Использование одногодвух ключевых терминов, фигури
рующих в доменном имени, для многих становится самым быстрым способом
локализовать искомый ресурс. Этому способствует и то, что все больше поиско
вых систем поддерживают поиск по URLадресу сайта.
Как известно, наиболее значительная функция поисковых систем – продви
жение крупных информационных сайтов с десятками и сотнями документов.
При создании узла такого типа следует заранее убедиться в том, что в дальней
шем не придется менять его структуру. Изменение системы навигации на узле,
имен файлов и каталогов, их перемещение нередко перечеркивает все предыду
щие усилия по регистрации ресурсов. Если становление узла или его реконструк
ция еще не завершены, стоит не только подождать с его «пропиской» в поисковых
сервисах, но и предотвратить преждевременную регистрацию, которая может
быть выполнена программойроботом автоматически.
После того как принято решение о начале регистрации, необходимо опреде
литься с планом ее проведения. Выбор здесь оказывается достаточно широким.
Прежде всего, сами поисковые службы могут различаться по типу функциониро
вания, организации и профилю, иметь разный уровень доступности для ваших
потенциальных клиентов и читателей.
Желание зарегистрировать сайт везде, где можно, пропадает по мере осозна
ния трудоемкости и низкой эффективности такого подхода. Впрочем, нельзя от
рицать, что он дает свои результаты, особенно если параллельно идет «раскрут
ка» узла альтернативными средствами – баннерной рекламой, рассылкой,
публикациями в прессе и др. Максимально широкий охват поисковых систем
обычно целесообразен при первоначальной, а также разовой, не предполагающей
дальнейшего сопровождения регистрации.
Анонсирование в поисковых системах 51
Если владельца сайта интересует не столько высокое положение в рейтингах
поисковых систем, сколько посещаемость, целесообразно создавать побольше
так называемых входных страниц, направляющих посетителей на нужный сайт,
и регистрировать именно их.
За вопросом «где регистрировать ресурс?» кроется проблема выбора между
поисковыми машинами, то есть автоматическими индексами, и каталогами, рус
скими сервисами и зарубежными, службами общего назначения и специализиро
ванными системами. Наконец, важно определиться: если регистрировать ресурс
не везде, то где именно.
Решающим фактором, конечно, является то, в какой степени интересующая
вас аудитория готова к использованию поисковых служб, выбранных вами, – как
в профессиональном, так и в географическом отношении.
Роботы поисковых машин сканируют Webстраницы, фиксируя гипертексто
вые связи, ведущие за пределы стартового документа. Ресурсы, на которые ука
зывают гиперссылки, включаются в план ближайшего ознакомления и служат
источником пополнения индекса. Таким образом, наличия хотя бы одной ссылки
на страницу вашего сайта достаточно для начала его сканирования роботом даже
без вашего желания. При этом сроки появления ресурсов узла в индексных базах
данных растянуты и неопределенны. Если вы сами оставляете заявку на индекси
рование, что аналогично регистрации в каталогах – и даже проще, – то сроки
в большей степени фиксированы и существенно сокращаются. После регистра
ции Webузла его страницы начинают появляться в списке отклика поисковой
машины на запрос из ключевых слов, введенных пользователем. Если ваш сайт не
попадает в первые 10–50 пунктов списка, вероятность того, что до странички до
берутся посетители, невелика. Стремление занять высокое положение в рейтин
гах поисковых систем и становится причиной конкурентной борьбы Webсайтов
и сопровождающего ее ажиотажа.
Допустим, мы ввели в шаблон одной из поисковых машин запрос, состоя
щий из двух терминов. Алгоритм поисковой программы присвоит более высо
кий ранг тому документу, в котором эти термины используются следующим
образом:
¾ включены в заголовок Webстраницы;
¾ содержатся в заголовках различного уровня в документе;
¾ расположены близко к началу документа;
¾ часто употребляются;
¾ расположены в тексте поблизости друг от друга.
Таковы критерии ранжирования. Какой документ окажется в списке отклика
выше: тот, что содержит ключевое слово в заголовке, или тот, в котором оно
встречается сто раз, но в поле обычного текста? От ответа на этот вопрос может
напрямую зависеть число обращений на ваш узел через поисковую систему. Если
добавить к этому, что правила игры, по которым работают поисковые машины,
меняются постоянно и без широкого уведомления пользователей, то появление
в Internet нового круга специалистов и направлений бизнеса – Search Engine
52 Этапы большого пути

Promotion (Продвижение в поисковых системах) и Search Engine Optimization, SEO


(Оптимизация для поисковых систем) – кажется в порядке вещей.
Речь идет о поиске, при котором используются специальные методы и сред
ства воздействия на работу автоматического индекса с целью получения высоко
го места в списке отклика по ключевым словам, наиболее ярко отражающим про
филь узла. Успех применения таких методов базируется на знании принципов
регистрации и использовании специального программного обеспечения. Посто
янный мониторинг реальных запросов к поисковым системам позволяет отби
рать именно те слова и словосочетания, которые привлекут внимание необходи
мого количества пользователей.

Подготовка к регистрации
Информация, которую запрашивают каталоги и поисковые системы при регист
рации ресурса, практически одинакова. При этом поисковые машины обычно
(хотя и не всегда) учитывают совсем немногое. Посмотрите на регистрационные
формы, предлагаемые для заполнения, например, поисковыми системами Яndex
и Апорт. Форма для регистрации поисковой системы Яndex, показанная на рис.
1.2, требует заполнения лишь одного поля: адреса ресурса.

Рис. 1.2. Форма для регистрации сайта в поисковой системе Яndex

Регистрация в поисковой машине Апорт намного сложнее и выполняется по


этапно. Если заявка, заполняемая на первом этапе, весьма проста (она представ
лена на рис. 1.3), то в дальнейшем предлагается заполнить довольно объемную
форму (рис. 1.4), указать рубрику (рис. 1.5) и т. д.

Рис. 1.3. Форма первого этапа регистрации сайта в поисковой системе Апорт
Анонсирование в поисковых системах 53

Рис. 1.4. Форма второго этапа регистрации сайта в поисковой системе Апорт

Вводить каждый раз при регистрации ресурса всю информацию – занятие до
статочно долгое и утомительное. Ускорить процесс можно, если заранее соста
вить краткий паспорт сайта, который может включать следующие сведения:
¾ название сайта;
¾ URLадрес;
¾ описание сайта;
¾ ключевые слова;
¾ контактное лицо;
¾ электронный адрес регистратора.
54 Этапы большого пути

Рис. 1.5. Форма третьего этапа регистрации сайта в поисковой системе Апорт

Если имеются версии сайта на других языках, необходимо составить подоб


ный паспорт для каждой из них.
Благодаря приведенной схеме можно заполнять поля в формах, используя
обычные операции копирования и вставки, что значительно ускоряет работу.
Итак, остается лишь взять список поисковых систем и приступить к регистрации.
После выбора конкретной поисковой системы найдите в ней ссылку типа До
бавить сайт, или Предложить ресурс, или Add URL. Отметим, что подчас прихо
дится проявить недюжинную смекалку, чтобы отыскать такую надпись в некото
рых каталогах и поисковых системах. Ну, а далее все просто – следуйте
появляющимся на экране инструкциям, которые в разных системах немного от
личаются друг от друга.
Анонсирование в поисковых системах 55

Адреса регистрационных форм


Яndex http://www.yandex.ru/addurl.html
Апорт http://www.aport.ru/addurl.php
Rambler http://www.rambler.ru/doc/add_site.shtml
Поиск@Mail.ru http://poisk.mail.ru/cgibin/add_url.cgi
UAport http://uaport.net/cgibin/add_new
Sesna http://uazone.net/go/addurl.cgi
META http://metaukraine.com/pages/addurl.asp
Uniarts http://www.armenian.com/links.html
www.KYRGYZSTAN.kg http://search.kyrgyzstan.kg/cgibin/search/add.cgi
DELFI (Латвия) http://rus.delfi.lv/directory/index.php?add=1
DELFI (Эстония) http://rus.delfi.ee/directory/index.php?add=1
AltaVista http://www.altavista.com/addurl/default
Excite https://secure.ahha.com/guaranteed_inclusion/teaser.aspx
HotBot http://insite.lycos.com/
Lycos http://insite.lycos.com/
Google http://www.google.com/addurl.html
Если после регистрации вы не увидели свой сайт в поисковой системе, не удив
ляйтесь. Изза большой перегруженности робота поисковой машины ваш сайт
может стоять в очереди от одного дня до двух недель.
В дальнейшем робот будет самостоятельно (автоматически) находить новые
и измененные документы. И чем чаще будет меняться страница, тем чаще робот
будет на нее заходить.

Особенности регистрации
в поисковой системе Яndex
В поисковой машине Яndex допускается регистрация только русскоязычных сайтов.
Для добавления ресурса введите адрес его главной страницы в форму Яndex:
Добавить сайт (http://www.yandex.ru/addurl.html) – остальные страницы Яndex
найдет самостоятельно по ссылкам.
Робот работает со стандартными ссылками языка HTML (HREF, LINK и FRAME),
то есть так, как работал бы пользователь с отключенной в браузере поддержкой
Java и JavaScript. Если ссылки на страницы вашего сайта сделаны с помощью
скриптов, надо добавить адреса этих страниц через форму Яndex: Добавить сайт.
Запрещения на индексацию отслеживаются системой Яndex обычным обра
зом – через файл robots.txt, находящийся в корневом каталоге сервера.
Яndex контролирует намеренное злоупотребление ключевыми словами в за
головках, комментариях и тексте самого документа и при обнаружении подоб
ных фактов снижает место документа на странице результатов. В случаях зло
стного использования таких приемов администрация Яndex может исключить
документы и сайты из базы. Страницы со временем перенаправления на другие
страницы, равным нулю, не подлежат индексированию.
56 Этапы большого пути

Индексация одних и тех же документов, выдаваемых Webсерверами в разных


кодировках, лишена особого смысла. При этом русские поисковые системы дер
жат в базах документы только в одной из кодировок, другие рекомендуется ис
ключать из индексирования. Если кодировки распределяются по портам серве
ром, на разных портах (серверах) следует выдавать разный robots.txt. Это значит,
что во всех портах/серверах, кроме основного, должно быть написано:
disallow: /
Если кодировки выдаются, например, по директориям, необходимо сделать
один файл robots.txt следующего содержания:
disallow: /alt
disallow: /mac
disallow: /koi
В уникальные заголовки документов, вкратце описывающие сайт и текущий
документ, не следует включать более 20–25 слов. Слова в заголовках имеют боль
ший вес, чем остальные.
Система учитывает описания и ключевые выражения, указанные в соответ
ствующих метатэгах, а также подписи к картинкам в тэге ALT. Яndex работает
только с текстами и не умеет распознавать графические изображения. Поэтому,
если название выполнено средствами графики, стоит продублировать его в тек
стовом виде.
Чем длиннее документ, тем менее заметны в нем слова, заданные в запросе,
и, следовательно, тем ниже будет находиться ваша страница в результатах поиска
при прочих равных условиях. Поэтому старайтесь разбивать длинные документы
на более короткие – это правило важно для любых поисковых систем.
При оформлении документов надо придерживаться следующих требований:
¾ не следует набирать слова в р а з р я д к у – система не воспримет их;
¾ без особой необходимости не стоит набирать слова ПРОПИСНЫМИ бук
вами, если только это не аббревиатура;
¾ точки и запятые не отделяются от слова пробелом, иначе Яndex определит
их как отдельные слова. После них пробел ставится.
Проверять, проиндексирован ли ресурс, нужно не сразу, а через несколько
дней после его добавления в базу Яndex. Обычно страницы появляются в поиско
вой базе в течение недели после их создания или изменения. Новые страницы,
внесенные в базу самостоятельно с помощью механизма добавления ресурса, по
явятся быстрее.
Если Вы не находите свою страницу, проверьте с помощью формы Яndex:
Добавить сайт, включена ли она в базу Яndex; другими словами, попробуйте до
бавить ее еще раз.
Если вы получите сообщение «Ваш URL … был только что внесен в нашу базу
данных», это значит, что адрес вашего ресурса системе ранее не был известен.
Теперь он добавлен и в ближайшее время будет проиндексирован.
Если поступило сообщение «Ваш URL … уже известен роботу Яndex. Данный
ресурс будет проиндексирован в ближайшее время», подождите еще пару дней.
Анонсирование в поисковых системах 57
Сообщение «Ваш URL … уже проиндексирован. Вы можете посмотреть, какие
страницы Вашего сайта проиндексированы в Яndex.Ru к настоящему времени»
означает, что по имеющейся здесь же ссылке вы можете перейти ко всему списку
документов вашего ресурса, проиндексированных в поисковой машине Яndex.
В дальнейшем робот будет самостоятельно (автоматически) находить новые
и измененные документы. Причем частота обхода конкретного сервера зависит
от зафиксированной роботом частоты изменения его страниц.

Особенности регистрации
в поисковой системе Апорт
Пополнение базы ресурсов Апорта происходит двумя путями.
Вопервых, при индексировании новых страниц проверяются все имеющиеся
там ссылки; те, которые отвечают определенным требованиям, добавляются в базу
ресурсов. В основном, конечно же, проверяется принадлежность к России и стра
нам ближнего зарубежья. Ресурсы других доменов могут быть добавлены только
вручную.
Вовторых, любой пользователь может добавить ресурс вручную на странице,
которая доступна по ссылке Добавить URL (http://www.aport.ru/addurl.php) по
чти с любой страницы Апорта. При указании ресурса вручную проверяется его
наличие и корректность. Сразу после нажатия кнопки Добавить Апорт пытается
получить корневую страницу ресурса и определяет, является ли страница рус
скоязычной. При этом простого использования кириллицы недостаточно: Апорт
ищет закрепленные в языке русские слова. Если оба условия выполнены, то ре
сурс добавляется в базу и будет проиндексирован.
Прибегать к помощи страницы Добавить URL следует, если добавляемый ре
сурс – это сервер и есть вероятность, что он еще не известен Апорту, или если
новый ресурс – это часть сервера и вы предполагаете, что на него нет ссылок
с других страниц сервера.

Особенности регистрации
в поисковой системе Rambler
Регистрационная анкета в поисковой системе Rambler находится по адресу http:/
/www.rambler.ru/doc/add_site.shtml. Ее заполнение гарантирует, что, по крайней
мере, эта анкета будет найдена при соответствующем поиске, и по ссылке с нее
пользователь сможет попасть на ваш сайт. Рекомендуется также воспользоваться
регистрацией в случае, если ваши страницы располагаются на зарубежных сай
тах. Роботы сканируют ресурсы, находящиеся в странах ближнего зарубежья,
и игнорируют остальные иностранные сайты.
Если ваш сайт находится за рубежом, но существенная его часть содержит
русскоязычные материалы, или если он расположен в пределах ближнего зарубежья,
но входит в иные домены первого уровня (.com, .org, .net и пр.), вы можете ото
слать письмо с просьбой включить сайт в число сканируемых. Сотрудники
Rambler рассмотрят ее и примут решение о целесообразности такого включения.
58 Этапы большого пути

Что не надо делать при регистрации


Не надо регистрировать ваш сайт в одной и той же поисковой системе слишком
часто. Излишняя активность чревата не только отказом в очередной регистра
ции, но и удалением всех имеющихся в базе данных сведений о вашем ресурсе.
Вводите только те ключевые слова, которые соответствуют вашему сайту, и не
используйте заведомо чужеродных.

Как управлять индексированием


На сегодняшний день разработчик Webузла располагает скромным арсеналом
технических средств, которые позволяют управлять роботами поисковых машин,
занятых индексированием. Основных способов всего два: размещение файла со
специальным именем robots.txt в корневом каталоге сервера и применение мета
тэгов в секции HEAD отдельного документа. Оба метода рассматривались выше.
Еще раз подчеркнем, так как это очень важно, что метатэги, по возможности уни
кальные, следует применять в каждом документе.
Существует ряд простых правил, которых стоит придерживаться, если вы хо
тите, чтобы поисковые системы находили ваш ресурс.
На входных страницах сайта обязательно должен быть текст. Если вся инфор
мация представлена в виде графических файлов, весьма велика вероятность того,
что ни одна поисковая система не найдет сайт. Правда, большинство поисковых
машин индексирует текст, содержащийся в тэге ALT и в метатэгах, а также текст
комментариев (<!— … —>), но не надо забывать о системах, которые этого не
делают.
При этом намеренное злоупотребление ключевыми словами в заголовках, ком
ментариях и тексте самого документа может быть расценено поисковой системой
как попытка регистрации ресурса с несоответствующим содержанием. В качестве
защитной меры система попросту не станет индексировать ваши страницы.
Кроме того, довольно трудно применить выбранное ключевое слово много
кратно в самом документе, не превратив его в нечто громоздкое и неуклюжее.
Очень важная часть страницы – заголовок, то есть ее титул, который располо
жен между тэгами <TITLE> и </TITLE>. Лучше сделать его информативным и
внести в него ключевые слова. Возможно, имеет смысл использовать в заголов
ках, даже для полностью русскоязычных документов, английский язык. Опти
мальная длина заголовка – не более 50 символов.
Очевидно, что заголовок следующего содержания, размещенный на странице
index.htm, является неинформативным для поиска:
<TITLE>www.inotec.ru</TITLE>
Целесообразнее заменить его, например, таким:
<TITLE>Ïðîãðàììû äëÿ áóõãàëòåðñêîãî è ñêëàäñêîãî ó÷åòà</TITLE>
Заметим кстати, что текст этого заголовка, гораздо более наглядный, чем пре
дыдущий вариант, будет оставаться и в закладках посетителей.
Как управлять индексированием 59
Многие поисковые системы для индексирования и построения списка ключе
вых слов используют первые по положению в документе 200–300 слов из текстов
страниц Webузла.
Чем длиннее документ, тем менее заметны в нем слова, заданные в запросе,
и, следовательно, тем ниже будет ваша страница в результатах поиска. Поэтому
старайтесь разбивать длинные документы на несколько коротких.

Индекс цитирования
Изначально индекс цитирования (CI, Citation Index) – это принятый в научном
мире «показатель значимости» трудов какоголибо ученого. Величина индекса оп
ределяется количеством ссылок на этот труд (или автора) в работах других ученых.
Популярность сайта в Internet определяется числом ссылок на него. Таким
образом, индекс цитирования здесь – это число внешних ссылок в сети Internet,
которые ведут на сайт. Так, если 205 страниц с других доменов содержат ссылки
на страницы вашего сайта, то ваш индекс цитирования – именно 205. В англо
язычных источниках данному термину соответствуют названия Link popularity
(Популярность ссылки), PageRank (Ранг страниц) – торговая марка Google.
Применительно к WWW индекс цитирования – это показатель популярно
сти Webстраницы или Webсайта среди создателей аналогичных «творений», то
есть среди «писателей». Этим он принципиально отличается от счетчиков и рей
тингов посещений Webстраниц или Webсайтов, являющихся, по сути, показате
лями популярности среди «читателей».
Попутно отметим, что одна из проблем рейтингов – положительная обратная
связь. Чем выше ресурс в рейтинге, тем больше посетителей обращаются к нему,
и, соответственно, тем выше он поднимается в рейтинге.
Идея, оправдывающая применение индекса цитирования, проста: как прави
ло, люди, создающие свой сайт в Internet, со вниманием и ответственностью от
носятся к его содержанию, а также к содержанию того, на что они ссылаются,
и что тем самым рекомендуют своим посетителям.
Индекс цитирования не может быть увеличен ни за счет внутренних (с одних
страниц ресурса на другие), ни за счет внешних ссылок, когда один и тот же ре
сурс имеет их несколько.
Разработчики поисковой машины Яndex ввели показатель индекса цитирова
ния в свой каталог ресурсов (http://yaca.yandex.ru/), что было призвано обеспе
чить авторитетность расположения ресурсов в рубриках этой поисковой системы.
При определении величины индекса цитирования Яndex учитывает ссылки
только с тех ресурсов, которые Яndex проиндексировал и которые содержатся
в его поисковой базе, то есть только «русский» Internet. Это означает, что ссылки
на русские ресурсы, например, из каталога Yahoo!, не могут быть учтены при ус
тановке индекса цитирования Яndex.
С другой стороны, этот показатель можно определить для всех ресурсов, на
которые ктолибо ссылался с сайтов, просканированных поисковой машиной
Яndex, даже если это произошло всего один раз. Поэтому для каталога Yahoo!
60 Этапы большого пути

индекс цитирования Яndex определить можно, несмотря на то, что Yahoo! не проин
дексирован в Яndex. Кстати, он для каталога Yahoo! довольно высок (на 23 октября
2004 года – 6300), поскольку Yahoo! весьма популярен в русской части Internet.
В индекс цитирования включаются все ресурсы, ссылки на которые Яndex на
шел в русском Internet, при условии, что значение индекса цитирования для них
не меньше 10.
Чтобы выяснить число ссылок на сайт из русскоязычного сектора сети, можно
воспользоваться также средствами, предоставляемыми ресурсом, расположен
ным по адресу http://www.registratura.ru/service/. Форма, имеющаяся на страни
це по указанному адресу, представлена на рис. 1.6.

Рис. 1.6. Форма для определения индекса цитирования

В поле URL введите адрес ресурса. Отметьте системы, которые будут использо
ваны для подсчета: Яndex, Апорт, Rambler, AltaVista или рейтинг Rambler Top 100.
Список в поле Ссылки предназначен для настройки поиска следующим обра
зом. Пункт Чужие используется для поиска ресурсов, ссылающихся на данный
Как управлять индексированием 61
(возможно только в поисковой машине Яndex). Свои – для собственных страниц,
ссылающихся на данный ресурс, Все – для поиска как собственных, так и чужих
страниц.
Индексы цитирования каждого ресурса в разных поисковых системах отлича
ются друг от друга, поскольку эти системы имеют неодинаковые базы данных.
Величина Link popularity легко проверяется, например, с помощью сервиса Link
Popularity Checker, расположенного по адресу http://www.webmastertoolkit.com/
linkpopularitychecker.shtml. Его страница показана на рис. 1.7.

Рис. 1.7. Страница сервиса Link Popularity Check

С помощью данного сервиса вы быстро узнаете Link popularity вашего сайта


в пяти основных поисковых системах – Google, AltaVista, MSN, All the Web и Yahoo.
В поле Your URL (Ваш URLадрес) введите адрес проверяемого сайта и
щелкните по кнопке Check Popularity (Проверить популярность). Результа
ты проверки будут представлены в таблице, изображенной на рис. 1.8. Здесь
величина Link popularity указана в колонке Number of Links (Количество
ссылок).
62 Этапы большого пути

Рис. 1.8. Таблица с результатами проверки

В чем смысл увеличения числа ссылок на ваш сайт в Internet, то есть увеличе
ния показателя Link popularity?
Вопервых, чем больше ссылок на ваши страницы, тем больше посетителей вы
можете ожидать на своем сайте. Переходы по ссылкам так же популярны, как
и использование поисковых систем. Удачно расположенные ссылки на ваш сайт
могут быть хорошими «генераторами» притока пользователей.
Вовторых, чем выше величина Link popularity, тем выше ранг ваших страниц
в основных поисковых машинах, что, конечно же, обеспечит вам дополнитель
ную клиентуру.
Втретьих, чем больше ссылок на сайт, тем больше открывается входов на ваш
ресурс для роботов поисковых систем. Поэтому ваши страницы чаще включают
ся в очередь на индексацию.
Таким образом, можно рекомендовать следующую стратегию увеличения
Link popularity:
¾ количество ссылок на ваш сайт должно постоянно расти;
¾ поскольку некоторые поисковые системы при определении рейтинга положи
тельно оценивают ссылки с популярных сайтов, следует обеспечить их наличие;
Как управлять индексированием 63
¾ необходимо чаще использовать ключевые слова, которым при определе
нии ранга сайта поисковые системы отдают предпочтение.
Возникает вопрос: чему соответствует величина Link popularity – числу ссы
лок на домен или на определенную страницу в домене? Есть основания утверж
дать, что скорее на первое, чем на второе, – хотя поисковые системы, кажется,
делают исключение из этого правила для доменов, обеспечивающих так называе
мый бесплатный хостинг, то есть размещение сайтов в рекламных целях в бес
численных подкаталогах своего сервера. Например, домен www.geocities.com име
ет чрезвычайно высокую величину Link popularity. Однако наличие сайта в каталоге
www.geocities.com/mywebsite/ не поможет извлечь из этого выгоду. Иначе вы ви
дели бы в результатах поиска гораздо больше сайтов, расположенных на подоб
ных серверах. Ведь известно, что в некоторых поисковых машинах при прочих
равных условиях многие бесплатные сайты или сайты, совместно использующие
одно доменное имя, ранжированы ниже ресурсов с уникальным доменным име
нем. Видимо, поисковые системы имеют список доменов, согласно которому сле
дует либо полностью исключать Link popularity, либо игнорировать этот показа
тель для любого адреса, который включает подкаталог. Поэтому собственное
доменное имя может дать определенные преимущества при поиске.

Контроль наличия документов


в индексе поисковых машин
Регулярно проверять наличие документов в индексе поисковых машин необхо
димо хотя бы потому, что временами из них исчезают отдельные страницы.
Обычно поисковые системы позволяют узнать, какие документы на данный мо
мент находятся в индексе и сколько их. Вот как это делается.

Поисковая система AltaVista


Для проверки статуса URL следует набрать в строке запроса следующую строку:
host:www.inotec.ru
В окно браузера будут выданы все проиндексированные страницы сайта. Та
ким образом, мы узнаем, есть ли в индексе AltaVista файлы указанного домена.

Поисковая система Go.com


В поисковой машине Go.com для проверки статуса URL используется следующая
команда:
site:abcnews.com
Здесь указывается доменное имя сайта или часть имени.

Поисковая система HotBot


В поисковой машине HotBot статус URL проверяется подругому. С помощью
ссылки Advanced Search (Расширенный поиск) перейдите на соответствующую
64 Этапы большого пути

страницу. В ваш браузер загрузится форма, фрагмент которой показан на рис. 1.9.
В поле запроса введите адрес (например, www.inotec.ru) и, кроме того, наберите
его же в поле Include (Включая) раздела Domain/Site (Домен/Сайт).

Рис. 1.9. Фрагмент формы расширенного поиска поисковой системы HotBot

Строки, аналогичные приведенным выше для других поисковых машин, так


же воспринимаются системой нормально:
site:www.inotec.ru
А вот если в форме расширенного поиска в разделе Domain/Site поле Include
оставить незаполненным, а в поле Exclude (Исключая) указать то же имя, что и в
строке поиска, то в результате получим величину Link popularity со ссылками на
сайты, указывающими на наш сайт.

Поисковая система Lycos


В поисковой машине Lycos статус URL проверяется со страницы расширенного
поиска (http://search.lycos.com/adv.asp), на которую можно перейти по ссылке
Advanced Search (Расширенный поиск).
Как управлять индексированием 65
В строке запроса введите адрес (например, www.inotec.ru) и, кроме того, наберите
его же в поле Only Include (Только включая) раздела URL/SITE (URLадрес/Сайт).
Если в форме расширенного поиска поле Only Include оставить незаполненным,
а в поле Exclude (Исключая) указать то же имя, что и в строке поиска, то в резуль
тате получим величину Link popularity со ссылками на сайты, указывающими на
наш сайт.
Строки, аналогичные приведенным выше для других поисковых машин, так
же работают в Lycos:
site:www.inotec.ru

Поисковая система Google


В поисковой машине Google статус URL проверяется, как и в Lycos, со страницы
расширенного поиска.
В поле Домен введите адрес ресурса (например, www.inotec.ru), а из раскрыва
ющегося списка выберите Только. В строке запроса укажите тот же ресурс. По
добный поиск можно осуществить и с основной страницы системы. Для этого
следует набрать запрос следующего вида:
site:www.inotec.ru
Для поиска ссылающихся сайтов в форме расширенного поиска выберите из
раскрывающегося списка вместо слова Только слово Не.

Поисковая система Яndex


В поисковой машине Яndex статус URL можно проверить двумя способами:
1. В поле запроса наберите строку вида #url=“www.inotec.ru”;
2. Воспользуйтесь формой на странице Расширенный поиск и в разделе Стра
ницы введите требуемый адрес в поле Находятся на сайте.
Для поиска ссылающихся сайтов в форме расширенного поиска в разделе
Страницы введите требуемый адрес в поле Содержат ссылку.

Поисковая система Апорт


Для проверки статуса URL в поисковой машине Апорт представлен специаль
ный запрос следующего вида:
url=www.inotec.ru/*

Поисковая система Rambler


Чтобы проверить статус URL в поисковой машине Rambler, в обычном поле зап
роса наберите строку типа $URL:www.inotec.ru.

Поисковая система Поиск@Mail.Ru


В поисковой машине Поиск@Mail.Ru статус URL можно проверить со страницы
расширенного поиска. Для этого укажите в поле раздела Принадлежность к до
66 Этапы большого пути

менам то же доменное имя, что и в разделе Найти результаты. При этом в рас
крывающемся списке первого раздела выберите значение Показать.
Для поиска ссылающихся сайтов введите требуемый адрес в поле Ссылающиеся
страницы раздела Поиск по странице.

Регистрация в каталогах
Каталог – это, как правило, база данных, в которой хранится ссылка на ресурс
(адрес) и его описание. Обычно каталоги имеют иерархическую структуру, а их
содержимое классифицировано по темам; при этом тексты – описания включен
ных в каталоги ресурсов – позволяют осуществлять их поиск. Классификацию
выполняют либо авторы каталога, либо авторы ресурсов. Несмотря на то, что в пер
вом случае этот процесс занимает определенное время, он гарантирует правиль
ное размещение ссылки в соответствующем тематическом разделе, что не всегда
происходит во втором случае, когда ответственность за точность рубрикации ло
жится на самого автора ресурса. Описание сайта также выполняется либо соста
вителями каталога (как на Yahoo!), либо принимается от того, кто хочет вклю
чить ресурс в каталог (как на dmoz.org). Каталоги ресурсов представляют собой
солидные собрания ссылок, организованных по определенному принципу. В от
личие от поисковых систем каталоги заполняют информацией вручную. Это осу
ществляют составители или ведущие каталогов либо, если это предусмотрено,
сами владельцы сайтов при заполнении ими специальных форм в соответствии
со структурой каталога. Владелец сайта вводит данные в регистрационную фор
му, отсылает ее, а персонал, поддерживающий каталог, решает, в какую катего
рию внести ссылку на заявленный сайт.
Вследствие такой технологии поиск в каталогах часто приводит к лучшим ре
зультатам, чем поиск с помощью автоматических поисковых систем.
Каталоги традиционно предлагают удобный и понятный интерфейс для поис
ка ресурсов. Источником их пополнения может быть работа экспертов и самосто
ятельная регистрация пользователей. Приглашение к регистрации можно быст
ро найти на главной странице каталога по ссылкам типа Add URL, Добавить или
аналогичным. В самом простом случае в предлагаемую форму требуется ввести
URLадрес главной страницы вашего сайта и дополнительные сведения (ключе
вые слова, краткую аннотацию и информацию для контактов с человеком, сопро
вождающим ресурс).
В некоторых случаях материалы необходимо представить на двух языках: на
английском и на языке региона, который имеет отношение к каталогу.
Поскольку пополнение каталогов часто происходит не автоматически, а требует
работы сотрудников, число записей здесь, как правило, уступает количеству ресур
сов, проиндексированных поисковыми машинами. Несмотря на явный проигрыш
в количестве записей, каталоги достаточно успешно конкурируют с поисковыми си
стемами на информационном рынке. Причина их популярности не только в простоте
эксплуатации. Так, небезызвестный каталог Yahoo! побил все рекорды по частоте
цитирования в книжной литературе об Internet. Одна из причин такого успеха – чет
Регистрация в каталогах 67
кая и достаточно стабильная классификационная схема, которая позволяет авторам
ссылаться на существующие годами разделы (категории) каталога Yahoo!.
Хотя регистрация в Yahoo! и предполагает длительную экспертизу со стороны
сотрудников каталога, она не является гарантированной. Этот процесс уже оброс
легендами, равно как и посредниками, предлагающими содействие в регистрации
за круглые суммы.
Пытаясь отыскать свою нишу в информационном пространстве, многие раз
работчики каталогов и поисковых систем делают ставку на специализацию свое
го сервиса в какойнибудь области, например, в бизнесе. Регистрация сервера
компании в таких профильных каталогах бывает крайне полезной, если речь идет
о какомто популярном сервисе. Как же искать нужные каталоги? Один из воз
можных способов таков: посмотрите, кто ссылается на узлы ваших конкурентов,
и предложите им разместить ссылку на ваш сайт.
При поиске деловых связей часто бывает целесообразной регистрация узла
в соответствующем региональном каталоге. Эксперты таких служб обычно прини
мают заявки лишь от компаний, которые имеют представительства на данной тер
ритории. Тем не менее, в каждом конкретном случае возможны и обходные пути.
Если ваш сайт имеет тематические разделы, есть смысл зарегистрировать их
как отдельные ресурсы. В этом случае число посещений возрастет благодаря мно
гократному размещению в каталоге ссылок на ресурс.
В глобальном масштабе Сети любая специализированная система, конечно,
уступает по популярности поисковым сервисам общего назначения, таким как
автоматические индексы AltaVista, HotBot, каталог Yahoo!. Выяснить популяр
ность каталога можно с помощью специальных запросов к поисковым системам.

Как выяснить популярность каталога


Число ссылок на каталог в индексе поисковых машин не дает правильного пред
ставления о его рейтинге. Определение индексов популярности, о которых гово
рилось в главе, посвященной поисковым машинам, точнее было бы охарактери
зовать как определение популярности ресурса. Во многих поисковых системах
можно посмотреть, какие именно источники ссылаются на каталог и сколько их.
Вот как это делается.

Оценка популярности
в поисковой системе AltaVista
Для того чтобы найти документы, ссылающиеся на некий URLадрес, следует
набрать в строке запроса одну из строк типа:
link:www.inotec.ru
link:www.inotec.ru/promote/index.htm
В первом случае в окне браузера будут представлены все источники, указыва
ющие на сайт с именем www.inotec.ru. Во втором – мы найдем в индексе AltaVista
источники, ссылающиеся на файл index.htm из каталога promote.
68 Этапы большого пути

Оценка популярности
в поисковой системе Go.com
В поисковой машине Go.com для оценки популярности ресурса используется сле
дующее выражение:
link:www.inotec.ru

Оценка популярности
в поисковой системе Excite
Так же просто, как в AltaVista или в Go.com, проверяется статус URL в поисковой
машине Excite – достаточно набрать в поле запроса:
link:www.yandex.ru

Оценка популярности
в поисковой системе HotBot
В поисковой машине HotBot популярность ресурса проверяется подругому. Перей
дите на страницу расширенного поиска. Введите адрес (например, www.inotec.ru)
в поле запроса и в поле Exclude раздела Domain/Site. Система исключит из ре
зультатов поиска внутренние ссылки сайта, оставив только ссылающиеся на него
извне.

Оценка популярности
в поисковой системе Lycos
В Lycos популярность ресурса проверяется со страницы расширенного поиска
(http://search.lycos.com/adv.asp), на которую следует перейти по ссылке Advanced
Search (Расширенный поиск).
На странице, которая будет загружена в браузер (см. рис. 1.10), в строке зап
роса введите адрес ресурса, на который вы ищете ссылки. В поле Only Include
(Только включая) раздела URL/SITE (URLадрес/Сайт) введите доменное имя
узла или его часть, например: .ru, если хотите определить, имеются ли там ссылки
на требуемый ресурс. Чтобы исключить какиелибо источники ссылок – обычно
внутренние ссылки со своего сайта, – введите его доменное имя в поле Exclude
(Исключая).

Оценка популярности
в поисковой системе Google
В поисковой машине Google популярность ресурса проверяется, как и в Lycos, со
страницы расширенного поиска. Эта страница представлена на рис. 1.11.
Для поиска документов со ссылками заполните поле Ссылки, расположенное
в разделе Поиск по странице, и нажмите на кнопку Поиск рядом с указанным полем.
Регистрация в каталогах 69

Рис. 1.10. Страница поисковой машины Lycos для поиска источников ссылок

Подобный поиск можно осуществить и с основной страницы системы. Для


этого следует набрать запрос следующего вида:
link:www.inotec.ru

Оценка популярности в поисковой системе Яndex


В поисковой машине Яndex ссылки на ресурс можно найти двумя способами:
1. В поле запроса наберите строку типа #link=“www.inotec.ru”;
2. Воспользуйтесь формой на странице Расширенный поиск.
В последнем случае введите следующие данные в форму, фрагмент кото
рой изображен на рис. 1.12: в разделе Страницы заполните поле Содержат
ссылку.
Кроме указанных возможностей, система Яndex, как отмечалось в главе, посвя
щенной поисковым машинам, рассчитывает индекс цитирования, который служит
определенным критерием популярности ресурса в русскоязычной части Internet.
Для его определения зайдите на страницу по адресу http://yaca.yandex.ru/. В окно
70 Этапы большого пути

Рис. 1.11. Страница расширенного поиска поисковой машины Google

браузера будет загружена заглавная страница каталога ресурсов с рассчитывае


мыми для каждого из них индексами цитирования.
Чтобы найти нужный ресурс, в строке запроса наберите его адрес и щелкните
по кнопке Найти. Если искомый ресурс представлен в каталоге, откроется стра
ница с его описанием (рис. 1.13), где, в числе прочего, будет присутствовать стро
ка Цитируемость, в которой и будет указана величина индекса цитирования.

Оценка популярности
в поисковой системе Rambler
Чтобы найти ссылки на ресурс, в поисковой машине Rambler в поле запроса набе
рите строку типа $LINK:www.inotec.ru.

Оценка популярности
в поисковой системе Поиск@Mail.Ru
В поисковой машине Поиск@Mail.Ru популярность ресурса можно проверить со
страницы расширенного поиска. Для этого задайте в поле раздела Принадлеж
ность к доменам то же доменное имя, что и в разделе Найти результаты. При
этом в раскрывающемся списке первого из указанных разделов выберите значе
Баннерная реклама 71

Рис. 1.12. Фрагмент формы расширенного поиска Яndex

ние Исключить. Кроме того, в разделе Упоминание поисковых слов выберите из


списка значение в ссылках на данную страницу.
Для поиска всех ссылающихся сайтов введите требуемый адрес в поле Ссыла
ющиеся страницы раздела Поиск по странице.

Баннерная реклама
Баннер – это прямоугольный или квадратный блок, иногда текстовый, а чаще
графический, одного из стандартных размеров. Наиболее распространенные из
них – 468×60 (см. рис. 1.14), 100×100; реже встречаются 88×31, 120×60, 125×125,
400×40 пикселов и т.д (см. рис. 1.15). Баннер используется, как правило, в рек
ламноинформационных целях. Графический формат – JPG или GIF, в после
днее время – иногда и PNG. Кроме того, как отдельное направление, применя
ются Flashбаннеры. Формат GIF, как и Flashтехнология, позволяет создавать
анимированные баннеры, то есть изображения с движущимися объектами. Ис
пользуются текстовые баннеры (без графического изображения). Кроме того,
существуют HTMLбаннеры, а также баннеры, написанные с использованием
языка Java.
72 Этапы большого пути

Рис. 1.13. Страница с описанием ресурса и указанием его индекса цитирования

Рис. 1.14. Пример баннера формата 468ґ60

Рис. 1.15. Пример баннера другого формата

Баннер служит ссылкой на сайт, который он рекламирует. Щелкнув по нему


мышью, заинтересованный пользователь сразу же попадает на рекламируемый
сайт. В этом, собственно, и состоит основная задача баннера.
Один из способов привлечения посетителей к сайту – обмен баннерами с дру
гими Webсерверами или регистрация в программах баннерного обмена (иногда
Баннерная реклама 73
называемых баннерными сетями). При этом происходит взаимовыгодный обмен:
вы размещаете баннеры партнеров, а они – ваши.
При регистрации в баннерной сети вы получаете специальный код, который,
будучи встроен в ваши страницы, позволяет показывать баннеры сети на вашем
сайте. В свою очередь, баннерная сеть обязуется показывать ваши баннеры на
сайтах своих партнеров, оставляя себе «комиссионные». Например, показу у вас
на сайте 100 сетевых баннеров будет соответствовать показ на других сайтах от
50 до 90 ваших.
Процент комиссионных зависит от службы регистрации и ряда условий, на
пример, количества показов. Наиболее распространенное значение комиссион
ных – 10%.
При размещении баннеров следует учитывать, что многократный показ одно
го баннера постоянному пользователю не ведет к увеличению отклика. Каждый
баннер имеет «срок жизни», после которого он устаревает, и дальнейшая его де
монстрация становится неэффективной.
Результативность показов оценивается соотношением числа щелчков по бан
неру с общим числом его показов и называется CTR (Click/Through Ratio – коэф
фициент переходов по щелчку). Это своеобразный коэффициент полезного дейст
вия баннера. Хорошим уровнем CTR считается значение 2–3%. Значит, в лучшем
случае к вам будут приходить 2–3 человека на каждые сто показов вашего банне
ра. И, как это ни печально, за последнее время средний CTR стал ниже: по некото
рым данным – от 0,4 до 1%.
При размещении баннеров рекомендуется использовать так называемый тар
гетинг (от англ. targeting – планирование, нацеливание), то есть показ рекламно
го баннера только целевой аудитории. Солидные службы обмена баннерами предо
ставляют возможность выбирать тематику серверов, на которых будет показана
ваша реклама, или, наоборот, исключать нежелательные, вплоть до выбора доме
нов и отдельных страниц. Таким образом, вы сможете добиться наибольшего от
клика на баннер.
Кажущаяся эффективность баннерных показов весьма невысока. Однако,
судя по среднему уровню CTR, не столь уж она и плоха, а потому не следует счи
тать, что ваши усилия в 98 случаях из 100 пропадают даром. Вопервых, люди
видят ваш баннер, и у них складывается определенный образ вашего сайта
(имидж). Вовторых, даже если вы добились высокого отклика на баннер, это не
значит, что достигнут конечный результат: пользователь, попавший к вам только
под наплывом эмоций, вызванных баннером, может больше никогда не вернуть
ся, разочаровавшись в том, что увидел на сайте (как зачастую и бывает).
Поэтому для того, чтобы щелчки по баннеру служили свидетельством под
линного интереса к теме, а показы баннеров никогда не пропадали даром, реко
мендуется соблюдать два условия:
¾ баннер должен соответствовать содержанию сайта. Тогда щелчок по нему бу
дет вызван не только эстетическим воздействием, но и интересом к тематике;
¾ баннер должен содержать ваш логотип или адрес в Internet. Тогда пользо
ватель подсознательно будет запоминать вашу рекламу и впоследствии
74 Этапы большого пути

соотнесет свои потребности в услугах или информации подобного рода


именно с вашим сайтом.

Требования к баннеру
Для успешной рекламы сайта баннер должен отвечать следующим требованиям.
1. Красочное оформление.
Рекомендуются яркие, привлекающие внимание цвета. Психологи советуют
применять синий цвет для привлечения внимания мужчин, которых, по статис
тике, большинство в русскоязычной части Internet. Рекомендации психологов
основаны на тесте Макса Люшера, применяемого в медицине и при подборе кадров.
Тест Люшера считается классическим – одним из наиболее достоверных, приме
няемых в психологии.
На каких же принципах он основан? Испытуемый располагает в порядке
предпочтения восемь карточек различных цветов. Вопервых, каждый цвет ха
рактеризует определенную человеческую потребность, ассоциируется с ней, яв
ляется ее символом. Вовторых, иерархия цветовых предпочтений человека по
зволяет выявить значимость этих потребностей.
Наибольшей эмоциональной окрашенностью отличаются следующие цвета: си
ний, синезеленый, оранжевокрасный, светложелтый, коричневый, фиолетовый,
черный. Каждый цвет в комбинации с другими соответствует определенному со
стоянию человека, как показано в табл. 2 (первый цвет в паре – преобладающий):

Таблица 2. Соответствие цветовой гаммы эмоциональному состоянию человека


Гамма Эмоции
Синий + красный Потребность во внимании со стороны других
Синий + черный (серый) Потребность в отдыхе
Синезеленый + желтый Желание произвести впечатление
Красный + желтый Стремление к контактам
Красный + синий Деловое возбуждение
Красный + черный Стремление устраниться из негативной ситуации
Желтый + синий Стремление к позитивным эмоциям
Желтый + фиолетовый Потребность в ярких событиях
Фиолетовый + серый Желание уйти от проблем или стресса
Коричневый + синий Страх одиночества
Черный + синий Желание остаться одному
Черный + зеленый Гневное отношение к окружающим
Черный + фиолетовый Мечты о гармонии
Черный + красный Сильное возбуждение

Конечно, эта таблица не является директивой для выбора цветовой гаммы ва
шего баннера, но принять информацию к сведению не помешает.
2. Профессиональный дизайн.
При рекламировании в Internet товаров или услуг, у которых уже сложился
определенный имидж, важно, чтобы реклама его не нарушала. Качество художест
Баннерная реклама 75
венного исполнения баннера не должно вызывать нареканий, иначе пострадает
имидж фирмы, и вы получите антирекламу. Лучше обратиться к дизайнерам
профессионалам.
3. Активно используемая анимация.
Движущиеся объекты привлекают зрение, поэтому даже неяркий баннер с ани
мацией предпочтительнее раскрашенного статического. Анимированный баннер
в среднем имеет на 30–50% больший CTR по сравнению с обычным. Кроме того,
анимация расширяет возможности баннерной рекламы.
4. Максимальный визуальный размер при минимальном объеме в байтах.
Чем больше размер баннера, тем больше шансов, что его заметят и не примут
за элемент оформления сайта. Рекомендуемый размер – 468×60 пикселов. Одна
ко сам баннер не должен занимать более 15 Кб. Для уменьшения объема исполь
зуйте меньшее количество цветов. Некоторые службы обмена баннерами уста
навливают свои лимиты, но в любом случае, чем меньше килобайтов занимает
ваш баннер, тем быстрее он загрузится и тем больше шансов, что пользователь
увидит его прежде, чем покинет страницу.
5. Запоминаемость, а, следовательно, оригинальность.
6. Интригующее содержание и некоторая недосказанность, вызывающие лю
бопытство и желание познакомиться с сайтом поближе.
Считается, что полосы прокрутки и кнопки, присутствующие на баннере, ока
зывают положительное влияние на CTR. Однако злоупотребление ими приводит
к тому, что они вызывают лишь раздражение у пользователя. Кроме того, многие
службы обмена баннерами запрещают использование таких эффектов, справед
ливо считая их дурным тоном. Особенно эффективны имитаторы полосы про
крутки, если интригующий текст уходит за пределы баннера: в этом случае про
является обычный рефлекс, и вы непроизвольно нажимаете на скроллер.
Размещение большого количества баннеров на одной странице недопустимо,
так как вызывает у посетителей негативную реакцию. На одну страницу следует
помещать максимум два баннера (сверху и снизу).

Эффективность баннера
Давайте определим несколько правил, следование которым позволит повысить
эффективность использования баннеров.
¾ Самое главное – не следует делать баннер очень громоздким. Объем ста
тичных баннеров должен варьироваться от 5 до 8 Кб, анимированных – от
9 до 12 Кб.
¾ Цветовая гамма не должна быть слишком пестрой, оптимальный вариант –
не более трех–четырех цветов.
¾ Не делайте баннер с прозрачным фоном, так как на некоторых страницах
текст не будет виден.
¾ Используйте оригинальные надписи. Текст типа «Это моя страничка – там
много всего» никого не привлечет, и показы такого баннера не принесут
никакого результата.
76 Этапы большого пути

¾ Прибегая к услугам рекламной сети, сделайте несколько видов одного и того


же баннера; даже незначительное изменение дизайна в некоторых случаях
существенно повышает отклик посетителей.
¾ Старайтесь чаще менять баннер в сети, создавайте новые варианты хотя бы
один раз в месяц.
¾ Если CTR вашего баннера ниже 2% – не стоит его показывать, CTR обыч
ного графического баннера должен быть от 2 до 5%.
¾ Если вы пользуетесь услугами рекламных баннерных сетей, не полагайтесь
на один хорошо выполненный баннер, всегда используйте сразу несколько
баннеров, оценивайте их CTR, редактируйте, меняйте текст и цветовую
гамму, пока не добьетесь наилучшего результата.
Хороший эффект дает сотрудничество с популярными сайтами. Например, мож
но договориться о размещении на главных страницах рекламных баннеров сроком до
одного месяца. Размещение на больший срок не имеет смысла. Прошел месяц – ищи
те другого партнера. Таким образом, вы будете привлекать постоянных посетителей
сайтапартнера, которые, возможно, станут и вашими постоянными посетителями.

Тенденции
По данным еCommerce.Ru (http://www.ecommerce.ru/), приведенным еще в 2000 го
ду, результаты исследований показывают: посетители Internet обращают внима
ние на рекламные баннеры, даже если пользуются ссылками без их помощи.
В отчете Online Advertising Report, посвященном онлайновой рекламе и со
ставленном маркетинговой компанией Engage на основе данных системы Engage
AdKnowledge, утверждается, что количество пользователей, совершающих он
лайновые покупки благодаря рекламе в Internet, увеличивается.
В отчете сообщается, что за последнее время существенно возросло влияние
рекламных баннеров. Основная часть (99%) пользователей Сети посещают рек
ламируемые на баннерах Webресурсы, и многие совершают покупки. По мнению
исследователей, это обязывает специалистов по маркетингу уделять больше вни
мания таким клиентам: в результате ценность Internet как носителя рекламной
информации значительно повысится.
Отмечено появление еще двух тенденций в Internetрекламе. Почти 75% пользо
вателей, привлеченных рекламными баннерами, совершают покупки на реклами
руемом ресурсе только один раз. Поэтому маркетологам необходимо разрабаты
вать не только средства привлечения покупателей, но и технологии, которые
помогут сделать их постоянными клиентами. Кроме того, увеличивается количе
ство Webсайтов, владельцы которых хотели бы разместить у себя рекламные
материалы, а стоимость их размещения при этом снижается.

Рекламные сети
Баннерная реклама зффективна, если баннер имеет CTR свыше 4%.
Если на ваш сайт указывают меньше тысячи баннеров в день, то поток посети
телей, приходящих к вам благодаря такой рекламе, будет минимален. Поскольку
Баннерная реклама 77
средний CTR в рекламных сетях составляет 0,5–1,5%, получается, что после каж
дой тысячи показов баннера на ваш сайт будет попадать 5–15 человек. Впрочем,
показы можно накапливать, то есть придерживать до определенного времени,
чтобы в нужный момент организовать крупную рекламную акцию.
Среди «обменных» рекламных проектов есть демократичные, где особо не
придираются к содержанию и внешнему виду сайта, а есть и элитарные, куда
можно проникнуть лишь по рекомендации влиятельных друзей.
Можно дать несколько рекомендаций по работе с рекламными сетями.
Можно использовать узел с высокой посещаемостью для показа баннеров из
рекламной сети, а свой баннер направить на раскрутку другого узла.
Учтите, что попытки раскрутить узел с низким уровнем посещаемости при
помощи участия в баннерных сетях малоэффективны. Давайте посчитаем. Пред
положим, вы можете показывать 20 баннеров в сутки. При комиссионных бан
нерной системы в размере 15% ваш баннер будет показан 17 раз. Если принять
CTR равным 2%, вы можете рассчитывать в сутки на 0,34 щелчка по вашему бан
неру, то есть реально – один переход за трое суток, или 10 – за месяц. Если рекла
мируется страница с неким товаром и допустить, что 2% посетителей купят его,
то вы получите одного покупателя за пять месяцев (10 . 2% = 0,2 покупателя
в месяц). Вряд ли такую рекламную игру можно считать перспективной.
При дополнительной раскрутке узла с высокой посещаемостью картина пред
ставляется совсем другой. Допустим, число показов в сутки здесь составляет 10 000.
В таком случае при тех же условиях работы баннерной системы за сутки будет
показано 8 500 баннеров (10 000 – 10 000 . 15%), и на страницу с рекламируемым
товаром придет 170 человек (8 500 . 2%), из которых трое (170 . 2%) могут ока
заться реальными покупателями.
Узлам с низким уровнем посещаемости можно рекомендовать проведение ин
тенсивной рекламной кампании, которая организуется следующим простым спо
собом: вы показываете баннеры из сети, а свои баннеры придерживаете. Накопив
кредиты, начинаете показывать и свои баннеры.
Так как число участников баннерных сетей конечно, эффективность отдель
ного баннера через некоторое время сильно снижается и, в конце концов, падает
до нуля. Тогда следует создать и разместить в рекламной сети новый баннер.
Обзор отечественных баннерных сетей мы выполним, как и ранее обзор катало
гов, с учетом индексов цитирования Яндекс, расположенных в порядке убывания.

Российская баннерная сеть RLE Banner Network

Суточный баннерный трафик сети RLE (http://www.rle.ru/), или Russian Link


Exchange, на момент подготовки книги к печати составлял до 45 000 000 показов;
число зарегистрированных участников – более 25 000. Индекс цитирования Ян
декс – самый высокий из отечественных баннерных сетей – в октябре 2004 года
составлял 15 000, что почти в три раза выше, чем у любой другой сети.
78 Этапы большого пути

В сети RLE используются разные баннерные стандарты: 468×60, 120×240,


100×100, 120×60. Географически распределенные «зеркала» способствуют быст
рой загрузке баннеров: она происходит с ближайшего к пользователю сервера.
Таких серверов в сети RLE на данный момент четыре. Расположены они таким
образом, чтобы максимально сократить время загрузки рекламы. В настоящее
время действуют следующие «зеркала» системы:
¾ датацентр HostWay.ru (СанктПетербург, http://www.eltel.net/) – основ
ной баннерный массив;
¾ Зенон Н.С.П. (Москва, http://hosting.zenon.net/) – вспомогательное «зер
кало» (регионы: Россия, СНГ);
¾ Demos (Москва, http://www.dol.ru/) – вспомогательное «зеркало» (регио
ны: Россия, СНГ, Прибалтика);
¾ Петерлинк (http://hosting.peterlink.ru/, регион: СанктПетербург).
В зависимости от рекламной активности участника сети выполняется гибкий
расчет процента комиссии; существует возможность перевода накопленных по
казов от одного партнера к другому без взимания дополнительной платы. Участ
ники сети обеспечиваются подробной статистикой в режиме реального времени.
Главная страница сайта баннерной сети RLE показана на рис. 1.16.

Рис. 1.16. Главная страница сайта баннерной сети RLE Banner Network
Баннерная реклама 79
Сеть RLE одной из первых в России создала систему фокусировки (таргетин
га) рекламной кампании. Разработанные механизмы позволяют управлять пока
зами баннеров одновременно по нескольким критериям, характеризующим целе
вую Internetаудиторию.
RLE Banner Network – единственная рекламная сеть, ориентированная на
русскоязычные ресурсы, которая имеет возможность показывать HTMLбанне
ры. Они дают больший простор для творчества, чем простые графические банне
ры, лучше привлекают внимание и хорошо запоминаются, а значит, способны
обеспечить большую эффективность рекламной кампании. HTMLбаннеры по
зволяют использовать элементы интерактивности (взаимодействия с пользова
телем). Отличие HTMLбаннера от простого графического заключается в том,
что он может включать не только графические изображения, но и дополнитель
ные элементы, например, HTMLинструкции, интерактивные CGIформы, фраг
менты, написанные на языке JavaScript и Java (Javaапплеты), а также фрагменты
с использованием технологии Shockwave Flash.
Рекламодателям и участникам сети доступна подробная статистика показа
баннеров, на основании чего можно делать оперативные выводы о ходе конкрет
ной рекламной кампании и быстро менять ее правила, регулируя настройки.
Пользователи, перемещаясь по сайту издателя, разместившего баннеры сети
RLE, при просмотре страниц вызывают загрузку очередного баннера. Вся инфор
мация, описывающая данное событие, сохраняется в базе данных сети RLE, обоб
щается и является основой для составления подробной статистики о посещениях
пользователями сайта, численности и динамике изменения его аудитории, наи
более часто повторяющихся маршрутах и сведениях, дающих представление
о поведении пользователей.
Организаторы сети RLE предъявляют довольно жесткие требования к сайтам,
входящим в сеть. Не позволяется размещать баннеры на страницах, нарушающих
действующее Российское законодательство и сетевой этикет, пропагандирующих
насилие, игнорирующих авторские права, а также на эротических страницах и про
чих сайтах, предназначенных только для лиц «старше восемнадцати». Таким обра
зом, размещая рекламу в сети RLE, вы даете ее только на пристойных сайтах.
Все баннеры, предлагаемые участниками сети, проходят стопроцентный конт
роль со стороны ее администраторов. Не допускается использование баннеров,
которые могут нанести урон владельцам сайтов при появлении на их страницах.
Сеть RLE разделена на три части: RLE Classic, RLE Gold и RLE Platinum.
В общедоступную часть сети RLE Classic входит более 23 000 сайтов, которые
представлены в тематическом каталоге.
Лучшие сайты, входящие в сеть RLE, имеющие высокую посещаемость и хоро
шую рекламную эффективность, помещены в отдельную категорию – RLE Gold.
Именно на этих сайтах дают рекламу своих клиентов организаторы сети. В разде
ле статистики RLE представлен список сайтов RLE Gold. Подсеть оптимально
подходит для проведения массовых рекламных кампаний.
RLE Platinum – наиболее выгодная для webиздателей сеть с максимальными
требованиями к своим участникам. За баннерообмен в этой сети комиссия не
80 Этапы большого пути

взимается. Эта подсеть оптимально подходит для проведения адресных реклам


ных кампаний, требующих охвата узких сегментов аудитории.
Рекламодателям доступны следующие типы фокусировки (таргетинга):
¾ по месту размещения баннера на странице;
¾ по тематике;
¾ по географии;
¾ по организации;
¾ по Internetпровайдеру;
¾ по дням недели;
¾ по времени суток;
¾ по локальному времени пользователя;
¾ по числам месяца;
¾ по типам браузеров;
¾ по операционным системам;
¾ по определенным сайтам.
Сеть RLE Banner Network предоставляет рекламодателям и участникам об
ширную статистику показов баннеров в виде следующих отчетов:
¾ подсчет уникальных пользователей, которым демонстрировался баннер;
¾ расчет частоты показов баннера;
¾ график зависимости CTR от частоты показов;
¾ число показов баннера за каждый из 30 дней, в течение которых он демон
стрировался;
¾ CTR баннера за каждый из 30 дней;
¾ среднее число показов по дням недели;
¾ средний CTR баннера за каждый день недели;
¾ среднее число показов по времени суток;
¾ средний CTR баннера за каждый час суток;
¾ сводная таблица числа показов, щелчков по баннеру и CTR по тематиче
ским группам;
¾ сводная таблица числа показов, щелчков по баннеру и CTR по географи
ческим регионам.
Кроме того, участники сети получают отчеты о количестве и характере посе
щений своих страниц. На основании этих данных Webиздатель может составить
более полное представление о посетителях своего сайта, оценить динамику изме
нения их численности, определить страницы, обеспечивающие наибольшую рек
ламную эффективность при размещении баннеров, и т. д.
В список отчетов о посещениях страниц входят следующие:
¾ общее число сессий;
¾ общее число запросов страниц;
¾ среднее число сессий за сутки;
¾ среднее число запросов страниц за сутки;
¾ средняя продолжительность сессии;
¾ средняя продолжительность просмотра одной страницы;
Баннерная реклама 81
¾ среднее число загружаемых страниц за сессию;
¾ общее число уникальных пользователей;
¾ среднее число уникальных пользователей за сутки;
¾ прирост новых пользователей за предыдущий день;
¾ число уникальных пользователей, побывавших на сайте за каждый из 30 дней;
¾ скорость роста числа уникальных пользователей по дням (за 30 дней);
¾ число новых пользователей, пришедших впервые на сайт за каждый из 30 дней;
¾ наиболее часто запрашиваемые документы (число запросов, их доля в про
центах, продолжительность просмотра);
¾ наиболее популярные входы (число сессий, их доля в процентах);
¾ наиболее популярные выходы с сайта (число сессий, их доля в процентах);
¾ наиболее популярные маршруты пользователей по сайту;
¾ статистика запросов по географии (страны, города и регионы России);
¾ график числа запросов за 30 дней;
¾ график активности по дням недели;
¾ график активности по времени суток;
¾ список ста наиболее популярных страниц с числом запросов и CTR.

Рекламная сеть AdRiver

Рекламная сеть AdRiver (http://www.adriver.ru/) обеспечивает управление рек


ламными потоками на сайтах или группах сайтов любого размера и сложности –
от недавно возникших проектов до крупнейших порталов. Обладая высокой про
изводительностью, система обслуживает более 60 миллионов показов в сутки.
Величина индекса цитирования по данным Яндекс на 29 октября 2004 года со
ставляла 3 500.
AdRiver поддерживает любые типы и форматы рекламных модулей, содержит
средства оценки взаимодействия с посетителями и управления показами. В сис
тему интегрирован модуль, частично автоматизирующий взаимодействие рек
ламных агентств с сетью, что экономит время по работе с ней.
В предоставляемых статистических отчетах основные показатели – показы, пере
ходы, CTR, уникальные посетители – сгруппированы по следующим параметрам:
¾ сайтам издателя (включая отдельные отчеты по каждой из зон сайтов);
¾ рекламным кампаниям;
¾ сценариям показа баннеров;
¾ отдельным баннерам;
¾ переданным рекламным местам.
Каждый из отчетов включает в себя данные за текущие и предыдущие сутки,
за последние неделю и месяц, а также за любой иной промежуток времени.
82 Этапы большого пути

Система AdRiver позволяет осуществлять управление рекламными показами


в режиме реального времени. Любые изменения, вносимые в настройки сайта,
вступают в действие сразу после щелчка по соответствующей кнопке в интерфей
се системы.

Рекламная сеть ИнтерРеклама

Рекламная сеть ИнтерРеклама (http://www.ir.ru/) была основана в 1997 году.


Она в числе первых предоставила пользователям возможность осуществлять
бесплатный обмен показами (со всеми видами таргетинга). Отсутствие ограниче
ний на регистрацию и разделения пользователей на элитарных и рядовых, мини
мальные комиссионные и аккуратное следование пожеланиям участников позво
ляют ИнтерРекламе считаться самой демократичной и открытой баннерной
сетью русской части Internet. Величина индекса цитирования по данным Яндекс
на 29 октября 2004 года составляла 2 400.
В настоящее время ИнтерРеклама – одна из крупнейших российских баннер
ных сетей.
Различные виды таргетинга и статистики, возможность перевода показов
между участниками сети, настройка профайлов для групп баннеров, организация
гостевых заходов с регулируемыми правами доступа, различные режимы показа
баннеров (в том числе возможность их резервирования) делают ИнтерРекламу
удобной баннерной сетью.
С показов взимается комиссия 10%. Используются баннеры формата 468×60 пик
селов, размер файла не должен превышать 12 Кб. Вступить в сеть могут любые
ресурсы, кроме эротических, независимо от трафика.

Баннерная сеть RB2

Баннерная сеть RB2 (http://rb2.design.ru/) – это первая и самая крупная в рус


скоязычной части Internet сеть с форматом баннеров 100×100 пикселов. По ее
правилам разрешается размещать два баннера на одной странице. Индекс цити
рования Яндекс – 350 (октябрь 2004 года).
Как уверяют разработчики, система RB2 – это клуб для владельцев лучших
российских сайтов: участвовать в обмене могут только те из них, которые были
Баннерная реклама 83
специально приглашены, или те, кого рекомендовали участники. Если такой ре
комендации нет, можно заполнить заявку на вступление; в этом случае цензор
системы рассмотрит ее и примет решение о допуске в RB2. Главная страница сай
та баннерной сети RLE показана на рис. 1.17.

Рис. 1.17. Главная страница сайта баннерной сети RB2

Каждому клиенту сети доступны все виды таргетинга – по времени, по геогра


фии, по зрителям и т. д. Комиссионные взимаются в размере 15%.
Участие в обмене является добровольным и бесплатным. Каждый новый участ
ник получает «подъемные» в размере двадцати тысяч показов.
Все баннеры в сети RB2 подвергаются цензуре. Цензоры регулярно проверя
ют баннеры и могут запрещать их. При этом на баннере участник увидит надпись:
«Запрещено цензурой». Если он снова запустит такой баннер в обмен, то получит
предупреждение (при четвертом предупреждении клиент исключается из сети).
Запрещены следующие баннеры:
¾ часто и интенсивно «моргающие», раздражающие глаз;
¾ с элементами интерфейса операционных систем (кнопки, выпадающие меню,
титульные строки окон и т. д.);
84 Этапы большого пути

¾ использующие эротическую или сексуальную тематику;


¾ пропагандирующие наркотики;
¾ противоречащие российскому законодательству;
¾ содержащие ненормативную лексику.
В системе RB2 участники никаким образом не могут продавать свои показы.
Отсутствует возможность перевода показов (кроме перевода на благотворитель
ные аккаунты). Показы нельзя дарить другому сайту или аккаунту. На каждом
аккаунте могут крутиться только те баннеры, которые имеют отношение к одно
му зарегистрированному сайту.
Если у одного человека несколько сайтов, он должен зарегистрировать каж
дый из них и, при желании, объединить в так называемый Сет. При этом нет ни
какой гарантии со стороны RB2, что все сайты будут приняты (так как некоторые
из них могут не удовлетворять требованиям системы). Перевод показов внутри
одного Сета возможен, но добавить туда сайт, не имеющий отношения к другим
аккаунтам в Сете, нельзя.
Так, если участник является владельцем сайта анекдотов и одновременно, на
пример, руководителем компьютерной фирмы, он не может потратить свои пока
зы, заработанные на юмористическом сайте, на рекламу коммерческого предпри
ятия. Для коммерческой фирмы (если ее сайт не является участником RB2)
реклама должна приобретаться через рекламное агентство.

Контекстная реклама
В последнее время в Internet все более популярным становится довольно эффек
тивный способ продвижения сайтов – контекстная реклама. Не секрет, что боль
шая часть новых посетителей приходит на сайт обычно из поисковых систем.
Контекстная реклама – это платная текстовая реклама, которая появляется на
страницах с результатами какоголибо поиска и соответствующая содержанию
(«контексту») страницы, на которой она размещена. Основными игроками на рын
ке контекстной рекламы являются поисковые сервисы, где платные сообщения де
монстрируются пользователю вместе с результатами поиска по соответствующим
ключевым словам. Вы задаете конкретные ключевые слова и словосочетания,
и ваше объявление будет показано именно тогда, когда поисковый запрос включает
выбранные вами слова. Таким образом, первое несомненное преимущество кон
текстной рекламы в том, что она привлекает целевую аудиторию.
Вторым большим плюсом контекстной рекламы является то, что вы платите не
за показы объявлений, а за реальных посетителей, то есть за переходы на ваш сайт
по соответствующей рекламе. При этом вы сами устанавливаете цену за каждый
такой переход. Существует простое правило: чем выше ваша цена по сравнению
с ценой конкурентов по тому же поисковому запросу, тем на более выгодном месте
будет ваше объявление. Если же конкурентов по выбранным словам нет, то вы име
ете возможность воспользоваться минимальной стоимостью.
Идея создания рекламных инструментов, позволяющих проводить широко
масштабные контекстные кампании, витала на рынке не один год. В сущности,
Контекстная реклама 85
сама модель не нова: практически любая популярная западная поисковая систе
ма выдает перед результатами поиска рекламные объявления. В российской час
ти Сети дальше локальных решений идея использования контекстной рекламы дол
гое время не развивалась, хотя высокая эффективность такого рода рекламы горячо
поддерживалась многими участниками рынка. Действительно, что может быть ло
гичнее: предложить товар или услугу тогда, когда пользователь этого ищет?
На сегодняшний день на рынке Internetрекламы контекстная реклама явля
ется одним из самых активно развивающихся сегментов. Давайте познакомимся
с некоторыми системами контекстной рекламы, которые функционируют в Сети.

Бегун
Система контекстной рекламы Бегун (http://www.begun.ru/) – пионер российской
контекстной рекламы – действует с февраля 2002 года. В настоящее время система
работает с такими крупными сайтами как www.aport.ru, www.mail.ru, www.refer.ru,
www.subscribe.ru, www.km.ru, «За рулем» (http://www.zr.ru/), «Известия» (http://
www.izvestia.ru/) и многими другими.
Рекламодатель соотносит рекламное объявление с набором ключевых слов и та
ким образом через систему Бегун может привлечь посетителей, которые с очень вы
сокой вероятностью станут его клиентами, поскольку заинтересованы в предлагае
мых товарах и услугах. Множество функций управления делают систему простой
в использовании, а наличие разнообразной статистики с возможностью выгрузки дан
ных в Excel позволяют подготавливать отчеты о проведенной рекламной кампании.
Существует возможность автоматического перевода объявлений на опти
мальные позиции: по вашему желанию система будет самостоятельно поднимать
цену за переход до того уровня, которое необходимо для того, чтобы объявление
размещалось на лучшем месте. Таким образом, расходы на рекламу могут быть
жестко привязаны к специфике бизнеса рекламодателя. За целевого посетителя
автосалон может заплатить и несколько долларов, а книжный магазин – значи
тельно меньше. Создается некое подобие аукциона – объявление, за переход по
которому назначено больше, выше объявления с низкой ставкой. Так что рекла
модатель никогда не заплатит больше, чем сочтет нужным, и при этом получит то
количество посетителей, которое заказал.
В системе используется механизм, позволяющий рекламодателю контролиро
вать эффективность рекламных объявлений. Показ тех из них, которые не пользу
ются вниманием, автоматически приостанавливается. Оптимизировать кампа
нию помогает система автоматического подбора ассоциирующихся слов, советы
по составлению текстов и рейтинг лучших объявлений в системе.
Пополнить счет можно любой кредитной картой, при помощи ряда популяр
ных платежных систем, банковским переводом для физических или юридиче
ских лиц с автоматической генерацией всех необходимых документов. Словом,
уровень автоматизации системы таков, что можно зарегистрироваться, попол
нить счет и уже через несколько минут начать рекламную кампанию. Этому спо
собствует и отсутствие входного порога: рекламодатель может работать и с серь
езным бюджетом, и с 20долларовым.
86 Этапы большого пути

Технически система распределена по нескольким серверам, в случае сбоя одного


из них рекламная площадка автоматически переключается на другой. Сервер, обес
печивающий показ объявлений, может быть установлен на стороне площадки, что
значительно ускорит вывод объявлений за счет использования локального трафика.

Директ
Система Директ (http://direct.yandex.ru/), разработанная и запущенная в действие
компанией «Яндекс», как контекстная реклама с оплатой за переход начала действо
вать в ноябре 2003 года; до этого она работала с оплатой за показы. Объявления вы
водятся в поисковой выдаче Яндекса и дополнительно – в результатах поиска по
конференциям на популярном портале auto.ru. Это такой же поиск, как и на Яндексе,
только точкой входа на него является страница http://wwwboards.auto.ru/search,
и ведется он по страницам форума автолюбителей. А для тех рекламодателей, ко
торые считают, что посетители с auto.ru им заведомо не нужны, в Директе преду
смотрена возможность отказа от этих показов.
В системе присутствует уникальная и очень полезная возможность – указа
ние нужных регионов (таргетинг). Хотите, чтобы ваше объявление было показа
но только жителям вашего города – просто укажите это в настройках. Конечно,
посетителей будет меньше, зато рекламная кампания – эффективнее.
Весьма удобна опция «Подбор слов». В предлагаемой форме введите требуе
мое слово или словосочетание и нажмите кнопку Подобрать. Результат подбора
будет поделен на два столбца.
В левом столбце приведены запросы пользователей, включающие заданное
вами слово или словосочетание, с указанием приблизительного числа таких запро
сов в месяц. Данные о числе запросов обновляются каждые 2–3 недели. Эти слово
сочетания покажут вам сферу интересов, для обозначения которой пользователи
употребляли заданное вами ключевое слово. Если эти интересы заметно шире, чем
специфика вашего бизнеса, ограничьте аудиторию одним из двух способов:
¾ Добавьте в ключевое словосочетание еще слово или слова. Например, если
вы торгуете телефонами, бывшими в употреблении, возможно, лучше по
казывать объявления не просто по словосочетанию «мобильный телефон»,
а по фразе «подержанный мобильный телефон»;
¾ Используйте «минусслова», то есть слова, по запросам с которыми ваше
объявление показано не будет. Например, если из словосочетания «мо
бильные телефоны» «вычесть» слово «мелодия», объявление не будет по
казано на популярный запрос «мелодии для мобильных телефонов».
В правом столбце расположены запросы, ассоциированные с вашим ключе
вым словосочетанием, но не включающие его. Этот список поможет расширить
аудиторию.
На странице результатов поиска Яндекса может быть выведено одновременно
до пяти объявлений Директа. На первых четырех позициях они представлены
«статически» – каждый раз, когда поступает запрос с указанными рекламодателем
ключевыми словами или словосочетаниям. Этим четырем местам всегда соответ
Контекстная реклама 87
ствует не более четырех объявлений. На пятой позиции объявления выводятся
«динамически», то есть по очереди. Количество объявлений, появляющихся в этой
позиции, практически не ограничено. Чем их больше, тем меньше у каждого из них
шансов на показ.
Отбор объявлений для показа на первых четырех позициях осуществляется
с учетом их коэффициентов переходов по щелчку CTR и заявленных цен за пере
ход. Четыре объявления с наилучшими показателями по этим признакам попада
ют в гарантированные показы на первых четырех позициях и располагаются
в порядке убывания цены за переход. Остальные будут показаны по очереди на
пятой позиции. По ходу рекламной кампании у объявлений будут автоматически
отключаться ключевые слова или словосочетания, CTR по которым не превысит
0,5%. По остальным ключевым словам показы будут продолжаться.

Система контекстной рекламы Mail.Ru


27 апреля 2004 г. компания Mail.ru (http://www.mail.ru/) официально объявила
о начале продажи контекстной рекламы на своем поисковом сервисе Поиск@mail.ru.
Количество клиентов на размещение этого вида услуг за три месяца со дня начала
продаж превысило 150.
Поиск@Mail.ru – сравнительно новый проект компании Mail.Ru, одного из ли
деров российского Internetрынка. Новый поисковый сервис на портале @Mail.ru
был запущен летом 2003 г. и все это время демонстрировал ежемесячный прирост
количества пользователей. На сегодняшний день аудитория поисковой системы
составляет не менее 600 тыс. пользователей в неделю, которые просматривают
около 4 млн. страниц с результатами поиска.
В системе контекстной рекламы Mail.Ru к продаже предлагаются два реклам
ных места: баннер формата 468×60 пикселов, располагающийся прямо над ре
зультатами поиска, и рекламное место (баннер или текстовый блок) размером
200×300 пикселов справа от результатов поиска. Рекламные места продаются по
ценовой модели «за тысячу показов».

Google AdWords
Объявления Google AdWords (https://adwords.google.com/select/?hl=ru) пред
ставляют собой систему контекстной рекламы, предлагаемую пользователям тог
да, когда они ищут какието определенные продукты или услуги. Объявления
Google AdWords появляются на Google и в сети партнерских сайтов.
Пользуясь Google AdWords, вы сами создаете объявления и выбираете ключе
вые слова, с помощью которых ваши объявления найдут свою аудиторию; при
этом оплата производится с учетом реальных переходов по вашей рекламе.
Объявления появляются в правой и верхней части страниц результатов поис
ка Google, а также в каталоге Google. Дополнительно они могут появиться на по
исковых и содержательных сайтах и продуктах в рекламной сети Google. Реклам
ная сеть Google – это сеть интерактивной рекламы, которая охватывает более
80% американских пользователей Internet.
88 Этапы большого пути

Для регулирования показов используются четыре варианта определения со


ответствия ключевых слов запросам:
¾ широкое соответствие (вариант по умолчанию). Если вы включаете в спи
сок обобщенное ключевое слово или фразу (например, «зимняя одежда»),
ваши объявления будут показаны пользователям, указавшим в своих зап
росах слова «зимняя» и «одежда» в любом порядке, возможно, наряду
с другими терминами. Ваши объявления будут также автоматически пока
заны для расширенных соответствий, включая множественное число и ре
левантные вариации;
¾ точное соответствие. Если заключить ключевые слова в квадратные скобки
(«[зимняя одежда]»), объявления будут появляться, когда пользователи
ищут по фразе «зимняя одежда», именно в указанном порядке и без каких
либо других слов в запросе. Так, ваше объявление не будет показано при
запросе «красная зимняя одежда». Точное соответствие – это наиболее на
целенный вариант. Хотя вы и не получите много показов, но вам понравит
ся большинство переходов по ним, потому что пользователи, ищущие по
этим терминам, обычно хотят как раз то, что вы им и предлагаете;
¾ соответствие фразе. Если задать ключевое слово в кавычках («»зимняя одеж
да»»), ваше объявление будет появляться тогда, когда пользователь ищет по
словосочетанию «зимняя одежда», в заданном порядке слов и, возможно, вме
сте с другими терминами в запросе. Например, при запросе «красная зимняя
одежда» ваше объявление будет показано, но не будет при запросе «одежда
для зимы»;
¾ «отрицательное» ключевое слово. Если вы задали ключевую фразу «зим
няя одежда» и добавляете отрицательное ключевое слово «красная», ваше
объявление не будет показано, когда пользователь ищет красную зимнюю
одежду.
Эти варианты способствуют улучшению нацеливания вашего объявления на
поисковые страницы Google.
Порядок вывода объявления на страницах результатов поиска зависит от ком
бинации максимальной цены за переход и рейтинга щелчков CTR. Чем они
выше, тем выше будет его позиция.
Помимо текстовых, система Google AdWords предлагает размещение графичес
ких объявлений. На момент написания книги их показ отсутствовал в поисковой
системе Google, а предлагался лишь в рекламной сети компании на выбранных
вами контентных сайтах. В отличие от традиционных баннерных объявлений
графические соответствуют содержанию страницы, что делает их более привле
кательными и уместными для показа любому посетителю, просматривающему
сайт. Таким образом, графические объявления могут служить еще одним эффек
тивным способом рекламы товаров и услуг.
Система Google AdWords дает возможность отслеживать результаты реклам
ной кампании, автоматически вычисляя производительность выбранных ключе
вых слов и оценивая их поисковый статус. Если CTR низкий или ниже требуемо
го минимума, Вы будете знать немедленно.
Обмен ссылками 89

Обмен ссылками
Обмен ссылками – это самый старый и наиболее известный метод улучшения
индекса цитирования. Суть метода состоит в том, что вы связываетесь по элект
ронной почте или любым другим доступным способом с вебмастером сайта, кото
рый в какойто степени соответствует тематике ваших страниц, но в целом не яв
ляется вашим конкурентом. Вы договариваетесь о том, чтобы он поставил ссылку
или баннеркнопку формата 88×31, указывающие на ваш сайт, объясняя, какие
это сулит преимущества. В обмен на эту любезность вы, в свою очередь, устано
вите ссылку на сайт нового партнера.
Вообще говоря, Сеть тем и славна, что существуют гипертекстовые ссылки. Исти
на вроде прописная, а под раскруткой узла зачастую понимается баннерная или даже
традиционная, а не Internetреклама. Однако следует обязательно провести – а затем
регулярно повторять – специальный этап Internetрекламных кампаний, посвящен
ный обмену ссылками. После нескольких месяцев присутствия вашей ссылки на ка
комлибо узле можно оценить, имеет ли смысл продолжать сотрудничество.
С вебмастерами, согласившимися на обмен ссылками, взаимодействуйте сле
дующим образом. Первыми поставьте ссылку на сайт партнера, отправьте письмо
с указанием адреса, где она размещена, и с просьбой поставить ответную ссылку
на ваш сайт. Дополнительно можно выслать HTMLкод ссылки. Попросите ука
зать URL страницы, на которой вебмастер поставит его. Включите сайт партнера
в специальный реестр, который вы будете вести для фиксации ваших контактов.
Недостаток у этого метода, пожалуй, лишь один: на него тратится время. Кро
ме того, большая часть людей из тех, к кому вы обратитесь, скорее всего, проигно
рирует или отвергнет ваш запрос. Многие из них постоянно получают подобные
просьбы. Да и отдавать комуто заработанный свой тяжким трудом поток посети
телей им не оченьто хочется. Большинство откажется меняться с вами ссылка
ми, пока не убедятся, что получат большее количество читателей от вас, чем пре
доставят сами, или вы найдете какието иные преимущества для них.
На практике часто встречается желание обмена ссылками с сайтами, имеющи
ми большую посещаемость. Однако это не так важно, как кажется. В этом случае
велика вероятность, что ваша ссылка будет расположена на одной из труднодос
тупных страниц, куда дойдет не каждый посетитель, а возможно, и не каждый
робот поисковых систем. А если сайт невелик, то можно говорить о размещении
ссылки на главной странице.
Тем, кто не ответит вам, спустя 1–2 месяца рекомендуется отправить повтор
ное письмо, составив другой текст. Обратите внимание, что правильно состав
ленный текст письма во многом сыграет положительную роль. Фактически, от
него зависит все. Если вам не ответят и на второе письмо, еще через пару месяцев
отошлите новое: многие вебмастера со временем понимают необходимость взаи
мообмена ссылками, и если они оставили без внимания ваше первое письмо, то
второе (или третье) может оказаться как раз кстати.
Тех адресатов, которые четко и ясно откажут вам, сразу пометьте соответству
ющим образом в своем реестре и забудьте о них. Исключение могут составить те,
90 Этапы большого пути

кто сказал «нет» именно вашему сайту, то есть, в принципе, обмен с другими сай
тами допустим. Таких адресатов можно пометить как «нет для моего сайта 1».
В дальнейшем, если у вас будет (или уже есть) сайт 2, вы всегда сможете легко
отобрать этих адресатов из списка и отправить им новые письма.
Основная сложность в рассматриваемом способе – очень редко удается дос
тичь равноценного обмена. Если все же вы хотите воспользоваться им, последуй
те следующим советам:
¾ убедитесь еще раз, что содержание вашего сайта имеет уникальные свой
ства, представляющие интерес для будущего партнера;
¾ объясните преимущества, которые получают они и их посетители, ставя
ссылку на вас;
¾ если вы планируете ставить ссылку на них, обсудите заранее, где ее лучше
разместить, или поставьте ее авансом и спросите их мнение;
¾ потратьте время на просмотр их сайта, чтобы найти наиболее подходящее
место для ссылки;
¾ разнообразьте свои письма. Они должны отличаться от рекламы виагры,
которая регулярно засылается им в почтовый ящик. Если ссылка на их сай
те действительно важна для вас, свяжитесь с ними по телефону, пошлите
факс, чтобы показать свою заинтересованность.
В любом случае проверьте, чтобы страница, куда будет выложена ваша ссыл
ка, была бы проиндексирована поисковыми машинами. Если они проигнорируют
ее, индекс цитирования ваших страниц не улучшится. Для этого постоянно изу
чайте статистику сайта, используя либо файлы посещений сервера, либо, если
у вас нет такой возможности, счетчики, которые позволяют определить источни
ки ваших посетителей. Одним из наиболее полезных в этом отношении является
SpyLog.ru. Обязательно разместите его на каждой странице, в этом случае стати
стика будет более точной. Ваша задача определить, какие ссылки дают эффект,
а какие – нет и просто занимают место. Если ссылка не работает более месяца,
можно ее удалить, но при этом обязательно следует известить владельца сайта
партнера о вашем решении.
Каковы реальные преимущества подобного обмена ссылками? Их достаточ
но много:
¾ Большое количество внешних ссылок заведомо ведет к увеличению индек
са цитирования вашего сайта в поисковых машинах, а значит, повышению
положения вашего сайта в результатах поиска.
¾ Если вы ставите ссылки на родственные по тематике ресурсы, то ваш сайт
получает дополнительную информационную ценность в глазах посетите
лей. Если читатель чтото нашел на вашем сайте, пусть даже и ссылку на
другой сайт, то велика вероятность того, что он вернется еще раз.
¾ Вы получаете качественный поток посетителей на свой сайт, так как туда
приходят люди, заинтересованные в тематике вашего сайта.
¾ Отклик на текстовую ссылку гораздо больше, чем на баннерную, так как
зачастую она сопровождается описанием, которое ассоциируется с реко
мендацией автора сайта.
Обмен ссылками 91
Размещая ссылки на другие ресурсы Сети, продумайте их местоположение на
сайте – это может быть и главная страница, и специальная. Если решено исполь
зовать специальную страницу, не прячьте ее слишком далеко: посетитель должен
легко ее найти.
Не стоит обмениваться ссылками с сайтами, в репутации которых вы не уверены.
Так как ссылка часто действует как рекомендация, вы ставите под удар репутацию и
своего сайта. Во многом именно она будет определять отношение посетителей к ва
шему сайту, что выразится в увеличении или снижении числа повторных визитов.
В Internet действует целый ряд служб, предлагающих автоматизировать про
цесс обмена ссылками. В большинстве из них вы можете принимать участие бес
платно. Эффективность работы таких систем неодинакова, но они дают возмож
ность в какойто степени сэкономить время. Единственное неудобство состоит
в том, что один или два раза в месяц вы должны загружать страницу со ссылками,
чтобы оставаться в списке. Однако обычно это занимает лишь пятьдесять минут.
Технология работы такой системы очень проста. Каждый участник соглаша
ется хранить на своем сайте страницу, которая содержит ссылки на каждый сайт
сети. Если вы не будете периодически модифицировать эту страницу, то при оче
редном обновлении ваш сайт исчезнет из списка. В некоторых сервисах разреша
ется ставить ссылки только на некоторые сайты системы.
Другим недостатком таких услуг является то, что обычно требуется поставить
на вашей странице видимую ссылку или эмблему со ссылкой на список. Поэтому
потенциально есть шанс, что посетитель по этой ссылке уйдет с вашего сайта.
Можно уменьшить риск, пряча ссылку в труднодоступном месте или используя
скрытую ссылку, однако система должна допускать подобное решение.
Выбирая такую систему, ищите следующие особенности:
¾ Сервис должен требовать, чтобы каждый участник ставил ссылки на дру
гие сайты. Если ктолибо не станет делать этого, сайт участника должен
быть удален из страницы ссылок при следующем обновлении системы.
¾ В системе должно быть, по крайней мере, две сотни членов. Чем их больше,
тем больше ссылок вы можете получить на свой сайт. Однако не рассчиты
вайте на обязательное увеличение количества ссылок до общего числа уча
стников, так как неизвестен уровень индексации их страниц поисковыми
машинами.
¾ Сервис должен обязывать участников регистрироваться в основных по
исковых системах. В идеале – обеспечение автоматической регистрации
системой.
¾ Размещение указателя на страницу со ссылками требуется на главной
странице сайта. Так обеспечивается доступность этой страницы для робо
тов поисковых систем и повышается вероятность ее переиндексации, что
поможет ей долго оставаться в базе. Это, кстати, – главное преимущество
рассматриваемых сервисов перед FFA, где ссылки постоянно выталкива
ются из листа новыми поступлениями.
¾ На каждом из сайтовучастников страницы со ссылками должны иметь
собственный заголовок, чтобы они не выглядели одинаково и не игнори
92 Этапы большого пути

ровались поисковыми машинами. По той же причине необходима перета


совка ссылок в листе.
Если сервис позволяет вводить заголовок для сайта, убедитесь, что включили
в него лучшие ключевые слова, а не только название сайта. Многие поисковые
машины улучшат ранг ваших страниц, когда найдут сайты, указывающие на ваш
сервер и применяющие при этом ваши ключевые слова.
Эффективность работы любой системы обмена ссылками легко проверить,
оценивая индекс цитирования любого из сайтов, в нее входящих, и исследуя,
сколько ссылок на такой сайт сгенерировано самой службой. Если не удается
найти ссылки, обеспеченные системой, или их слишком мало, то весьма вероят
но, что система работает не очень хорошо.
Обратите внимание, что сети обмена баннерами не улучшают индекс цитиро
вания сайта, так как там непосредственной ссылки именно на ваш сайт не уста
навливается. Ссылка указывается на сервер баннерообмена, который переназна
чает ее адресату, чтобы отметить щелчок по баннеру или его показ. Очень часто
такая ссылка содержит параметры CGI, которые не читаются большинством по
исковых систем. Поэтому не следует ожидать, что в результате участия в системе
обмена баннерами улучшится индекс цитирования.

Сервисы по обмену ссылками


Автоматизированная система обмена ссылками
AddWeb
Сервис AddWeb (http://addweb.ru/) позволяет автоматизировать обмен ссылка
ми, предоставляя следующие возможности:
¾ отправку предложений по обмену ссылками;
¾ получение аналогичных предложений от других участников системы пос
ле проверки факта, что пользователь установил ссылку или баннер, указы
вающие на ваш сервер;
¾ обмен ссылками с сообществами сайтов, входящих в ту или иную рубрику;
¾ самостоятельное добавление и удаление ссылок со своего сайта, используя
систему управления AddWeb;
¾ проверку обмена и авторизации, получение уведомления при авторизации;
¾ добавление новых баннеров и их удаление.
Кроме того, система AddWeb предоставляет место на своем сайте для публи
кации объявлений, служащих ссылками на ваш сайт. Для участия в работе систе
мы требуется зарегистрироваться, перейти на страницу настройки и следовать
приведенным инструкциям.
На момент написания материала на странице ссылок системы отмечалось
566 участников.
Кроме обмена ссылками, служба AddWeb предлагает следующие услуги:
¾ автоматический поиск дружественных ресурсов;
¾ систему обмена посетителями;
Почтовые рассылки 93
¾ генерацию описания сайта для поисковых машин;
¾ анализ метатэгов;
¾ поиск неработающих ссылок;
¾ контроль информации на сайтах партнеров;
¾ анализ webсайта на количество ссылок и величину индекса цитирования.
Система автоматического поиска дружественных ресурсов позволяет искать
тематически схожие сайты. Результатом поиска является их список с электрон
ными адресами для связи. Система позволяет сэкономить время на отказе от изу
чения ресурсов. Она удобна, если вы желаете самостоятельно искать партнеров
в узкой специализированной области. Для поиска большого числа партнеров
предлагается аналогичная платная услуга.
Система обмена посетителями работает за счет установки на ваш сайт ссылок
на близкие по тематике сайты, которые, в свою очередь, размещают ответные
ссылки. При этом, рассчитывая свою комиссию, система учитывает только реаль
ные посещения.
Автоматическая генерация описания сайта для поисковых систем позволяет
быстро генерировать HTMLкод метатэгов. А с помощью анализа метатэгов вы
сможете проанализировать правильность описания страниц сайта. При этом рас
считывается частота повторения ключевых слов, проводится поэлементный раз
бор каждого метатэга и т. д.
С помощью поиска неработающих ссылок вы сможете обнаружить на своем
сайте некорректные ссылки, если таковые имеются.
Система AddWeb позволяет контролировать информацию на сайтах партне
ров. Вы можете воспользоваться данным сервисом, например, разместив на сайте
партнера свой баннер. Если указанная вами информация будет удалена, в тече
ние 3 дней вы получите от сервиса уведомление об этом.
В любой момент при поиске сайтов для обмена ссылками в системе AddWeb
существует возможность проверить индекс цитирования и количество ссылок
того или иного сайта в поисковой системе Google (см. рис. 1.18).

Почтовые рассылки
Электронные рассылки – один из мощнейших способов продвижения своего
Internetузла. Однако он требует наибольшей аккуратности при использовании.
Очевидно, что для приятного общения в сети Internet следует соблюдать некото
рые правила так называемого сетевого этикета:
¾ придерживаться определенного стиля сообщений. Стиль, отличающий
ваши послания, позволяет читателю сразу понять их суть и – главное – ав
торство;
¾ всегда обращаться на «вы». Никогда нельзя определить, не скрывается ли
за подписью «Люда» пятидесятилетняя женщина, да еще и генеральный
директор крупной корпорации;
¾ писать лаконично, но понятно. Длинные письма редко дочитываются до
конца. Если же письмо маловразумительно – это просто раздражает;
94 Этапы большого пути

Рис. 1.18. Список участников системы обмена ссылками AddWeb

¾ проверять свои письма на наличие грамматических и орфографических


ошибок. Не поленитесь, перечитайте письмо перед отправкой. Скорее все
го, вам самим не нравится получать письма без запятых, точек и заглавных
букв в именах.
На практике используются как регулярные, так и одноразовые рассылки.
Регулярные рассылки весьма эффективны для оповещения большого числа
подписчиков и обеспечения повторного посещения ими вашего узла. Их можно
производить только для людей, добровольно согласившихся на это, то есть тех,
кто сам подписался на рассылку. Работать с каждым подписчиком надо очень ак
куратно, за ним надо ухаживать, как за ребенком, молниеносно реагировать на
любое пожелание и никогда не злоупотреблять его вниманием. Отправлять пись
ма следует точно по расписанию и только того содержания, которое было заявле
но при подписке, очень осторожно и лишь понемногу включать в них рекламу.
Очень полезно рассылать именные письма: людям нравится, когда к ним обра
щаются по имени–отчеству. Вот чего не стоит делать, так это отправлять письма
списком – хотя бы потому, что любой из подписчиков сможет взять из письма
длинный список адресов, по которым вы разослали письмо, и использовать его
для собственных нужд.
Почтовые рассылки 95
Одноразовые рассылки представляют собой метод генерации первого посеще
ния. Для них требуется подготовить тщательно составленное короткое сообщение
с аннотацией рекламируемого ресурса и собрать некоторое количество адресов, раз
битых по категориям, допустим, учебных институтов или туристических компаний.
Содержание письма обязательно должно отвечать интересам той группы людей,
которой оно предназначено, иначе оно будет расценено как нежелательная рекла
ма (спам, от англ. spam, spamming – рассылка не по адресу). Отправлять такие
письма нужно с адреса, доступного для восприятия человеком, поскольку пись
ма, исходящие с адресов роботов, без размышления будут отправлены в корзину.
При проведении одноразовых рассылок учтите следующие рекомендации:
¾ используйте собранные списки редко – не чаще двух раз за полгода;
¾ если ктолибо из адресатов станет возмущаться, извинитесь;
¾ не добавляйте извинения по поводу непрошеной почты в текст сообщения.
Для автоматизации почтовых сервисов на сервере размещается форма под
писки, ведется либо база данных с адресами, либо текстовый файл со списком
подписчиков и устанавливается скрипт (программа) для рассылки писем.
В форме подписки не делайте много полей, так как людям попросту будет лень
их заполнять. Охотнее подписываются с корневой страницы сайта, хотя необхо
димо предусмотреть и отдельную страницу с такой же формой. Обязательно на
пишите, что в любой момент подписчик может отказаться от получения рассылок
в дальнейшем. Предусмотрите выбор форматов сообщений (HTML или обыч
ный текст); проверяйте корректность ввода электронного адреса.
Если вы ведете поименную базу данных, проверяйте, что вводят пользовате
ли; регулярно вычищайте ошибочные адреса; если приходит отказ от рассылки,
сразу же обрабатывайте такой запрос.
При увеличении числа подписчиков длительность работы скрипта рассылки
может значительно возрасти. Для уменьшения нагрузки на сервер он должен
быть написан таким образом, чтобы отправка писем происходила небольшими
порциями, с обязательными паузами между ними. И он должен вести подробные
logфайлы рассылки, которые помогут в случае возникновения ошибок – тогда
можно будет уверенно досылать письма, не боясь отправить повторное письмо
трем тысячам адресатов.
Регулярные почтовые рассылки, будучи хорошим способом поддержки посе
щаемости сайта своими подписчиками, еще и великолепный сервис для них. Рас
сылка поможет своевременно донести до всех пользователей новости сайта и
анонсировать те или иные события. Полезно дублировать письма специальной
страницей типа «Новости сайта» и вести архив рассылок.
Подписчики очень любят, когда с большими праздниками их поздравляют заранее.
Если собирать при подписке и затем анализировать переменную REMOTE_
HOST, содержащую адрес удаленного узла, можно больше узнать о характере по
сещений сайта и интересах групп пользователей.
С точки зрения реализации существуют два варианта рассылок, которые вполне
можно совмещать. В первом случае можно самостоятельно заниматься рассылкой
с помощью специальных программ. Основным достоинством этого метода является
полный контроль над содержанием анонсов. При втором варианте вы возлагаете всю
96 Этапы большого пути

техническую сторону – хранение адресов, ведение статистики и архива, анонсирова


ние в назначенное время – на платные или бесплатные сервисы. Основным недо
статком бесплатных сервисов является то, что вам придется поделиться рекламой,
при этом иногда у вас просто забирают все рекламное пространство.
Несмотря на такой существенный минус, здесь есть и плюсы. Взамен за рек
ламное пространство вы получаете огромную аудиторию. Так, например, офор
мив рассылку на Subcribe.Ru (http://subscribe.ru/), вы получаете удобный дос
туп к ведению подписки и архиву. Реклама о вашей рассылке помещается на
главную страницу сервера и идет в новости информационного канала, которые
получают около трех миллионов человек.

Реклама вне WWW


Вне Internet реклама сайта подчиняется обычным правилам рекламных кампа
ний и, по существу, оказывается их составной частью. Не забывайте указывать
адрес сайта на визитках, проспектах, листовках, плакатах, в журнальной рекламе,
наряду со всеми остальными реквизитами вашей фирмы. В России такой способ
раскрутки сайта все чаще оказывается не менее эффективным, чем раскрутка
внутри Сети, а за рубежом любые серьезные рекламные кампании Internetре
сурсов уже давно обязательно включают внесетевую компоненту. Итак, не надо
пренебрегать ни малейшей возможностью опубликовать гделибо свой URLад
рес, хотя и платить дорого за нее пока не следует.
Отдельно можно рассматривать рекламу в традиционных СМИ конкретных
Internetпроектов, а не компаний, имеющих свое представительство в сети.
Необходимо обратить внимание на первичный анонс, извещающий об открытии
сайта. Всегда есть смысл сообщать пользователям об открытии ресурса через не
сколько источников одновременно. Если вы будете высылать новость каждый раз
в новое издание, то вероятность того, что информация будет опубликована, умень
шается. Главное, чтобы в информации была новость, а не чистой воды реклама.
Если вы хотите подойти к раскрутке грамотно, то садитесь и пишите пресс
релиз – небольшую статью о своем сайте. Расскажите, для кого создан этот сайт,
что отличает его от других, как будет он развиваться в дальнейшем. Прессрелиз
необходимо разослать в подходящие издания, список которых можно найти
в любом рейтинге СМИ.

Другие технологии
Анализатор продвижения сайта Stat
Как известно, продвижение сайта в Internet – процесс длительный. В зависимо
сти от разнообразных факторов, в том числе и от сил, вложенных webмастером
в раскрутку, различные сайты достигают неодинаковых результатов как в объеме
привлеченных на сайт посетителей, так и в количестве заказчиков, которые дейст
вительно воспользовались услугами или товарами. Каждый применяет свои собст
венные методы для раскрутки и продвижения сайта: ктото оптимизирует сайт
Другие технологии 97
для поисковых систем, ктото меняется ссылками, ктото покупает рекламу
в Internet, а ктото пользуется всеми доступными средствами. Бесплатный сервис
Stat (http://www.be1.ru/services/stat/) позволяет получить итоговую статистику
продвижения любого Internetресурса в сети, указав всего лишь его адрес. Вам
станет доступна следующая информация (см. рис. 1.19):
¾ тематический индекс цитирования по версии Яndex, Page Rank по версии
Google, индекс цитирования по Апорт;
¾ ссылки на анализируемый сайт по версиям разных поисковых систем;
¾ быстрый доступ к статистике счетчиков, установленных на сайте;
¾ текст метатэгов TITLE, KEYWORDS, DESCRIPTION на странице;
¾ проиндексированные страницы и источники ссылок по версии различных
поисковых систем;
¾ текст файла robots.txt;
¾ текст HTTPзаголовков, которые выдает сервер на запрос.

Рис. 1.19. Статистика, предоставляемая сервисом Stat

Для быстроты доступа к информации существует возможность установки на па


нель браузера специальной кнопки и таким образом, находясь на странице любого
сайта, одним щелчком мыши получить весь перечень информации о данном сайте.
98 Этапы большого пути

В настоящее время поддеживается автоматическое определение счетчиков


Рамблер Top100, TopShop, SpyLOG, Hotlog, TopLIST, BigMir, One, KmIndex, Topping,
Extremedm, topcto. Рядом с каждым определенным счетчиком указывается ссыл
ка на статистику анализируемого сайта.
Обратите внимание на тот факт, что вы можете использовать анализатор Stat
не только для продвижения своего узла, но и для анализа сайтовконкурентов.

Клуб Mnogo.ru
Клуб Mnogo.ru (http://www.mnogo.ru/) – это объединение более 250 организаций
самых различных сфер деятельности: магазинов, автозаправочных станций, ком
паний индустрии развлечений, ресторанов, кафе, предприятий бытового обслужи
вания, салонов красоты, туристических компаний и многих других. Пользуясь ус
лугами этих компаний, уже более полумиллиона членов клуба не только делают
полезные покупки или приятно проводят время, но и собирают бонусы – призо
вые очки, за которые можно получить подарки в Клубе Mnogo.ru.
Бонусная система позволяет владельцам предприятий, участвующих в проек
те, привлечь и удержать новых клиентов и тем самым увеличить свою прибыль.
Каждому предприятиюпартнеру Клуба бесплатно создается персональная стра
ничка и публикуются новости компании на сайте Клуба. Кроме того, члены Клу
ба регулярно получают рассылки с информацией о специальных предложениях
предприятийпартнеров. Потребитель, привлеченный с помощью бонусной сис
темы, становится постоянным клиентом компании, которая дает бонусы.
Покупатель вовлекается в интересную игру – накопление бонусов для получения
подарка. Для этого ему нужно совершать покупки в предприятихпартнерах Клуба.
У человека возникает подсознательная схема: «Больше трачу – больше получаю».
Каждый член Клуба заполняет специальную анкету, где указывает свой пол,
возраст, социальное положение и другую полезную информацию. После совер
шения покупки он регистрирует свои бонусы на бонусном счете, таким образом,
появляется возможность отследить, где и как часто он совершает покупки. В за
висимости от этой информации компания может строить с ним свои дальнейшие
взаимоотношения. В базе данных Клуба более 500 000 зарегистрированных чле
нов с подробной информацией о месте жительства, доходах и т. п.
Создание собственной бонусной системы требует много времени и большого
вложения средств. Mnogo.ru – это готовая система бонусного поощрения для
привлечения клиентов. Вы заключаете договор, по которому вам предоставляют
все необходимое: полиграфическую продукцию для оформления торговой точки,
бонусные карточки, кроме того, информация о вашей компании размещается на
самых популярных тематических сайтах в интернете. Бонусная система Клуба –
готовое решение проблемы привлечения новых потребителей и работы с самыми
прибыльными клиентами.
Бонусная система была создана за рубежом, где уже давно ведется активная ра
бота с клиентами, именно поэтому она получила там широкое распространение.
В России для работы с постоянными клиентами бонусные программы используют
«Аэрофлот», «Мегафон», «РосИнтер», «Би Лайн», партнеры Клуба Mnogo.ru.
Глава 2

Автоматизация

Сетевые средства ......................... 100


Программы ................................... 145
100 Автоматизация

Сетевые средства
Комплексная автоматизация
В сети Internet существует множество сервисов, предназначенных как для про
верки webсайтов, так и для их рекламирования различными методами. Есть спе
циализированные службы, применяемые для анализа какоголибо одного аспек
та работы узла, но имеются и комплексные решения, служащие для всесторонней
проверки жизнедеятельности сайта.

NetMechanic HTML Toolbox


NetMechanic HTML Toolbox – это сетевое средство компании NetMechanic Inc. (http://
www.netmechanic.com/), предназначенное, в частности, для проверки работоспо
собности ссылок на вашем сайте и правильности HTMLкода.
Проверка ссылок
Для проверки работоспособности ссылок зайдите в Internet по адресу http://
www.netmechanic.com/toolbox/htmlcode.htm. В ваш браузер будет загружена фор
ма, показанная на рис. 2.1.
Данный ресурс предназначен для исследо
вания ссылок сайта, указываемого в форме.
Бесплатно можно проверить до пяти страниц.
После работы поискового робота готовится
отчет о каждой найденной ссылке и описыва
ется ее состояние.
Для проверки выполните следующие дей
ствия.
1. В поле URL введите адрес сайта или
страницы.
2. Переключатель Scope (Возможности)
установите в положение 1 Page (1 стра
ница) или 5 Pages (5 страниц). В лю
бом случае бесплатный сервис ограни
чен проверкой 25 ссылок на каждой из
страниц. При выборе варианта 1 Page
результаты проверки выводятся на эк
ран, в окно браузера; при выборе 5 Pages
Рис. 2.1. Форма сервиса HTML отчет будет выслан вам по электронно
Toolbox для проверки ссылок
му адресу.
3. В поле Email (Электронная почта) укажите ваш электронный адрес. По
нему будет высылаться отчет, если вы заказали проверку пяти страниц или
ежемесячное тестирование.
4. По завершении всех установок нажмите на кнопку Test Now (Начать тес
тирование).
Сетевые средства 101
Декларируется, что поисковый робот между каждым обращением к вашему
серверу делает паузу, чтобы уменьшить нагрузку на него. Размеры проверяемых
страниц ограничены двумя тысячами строк и 125 Кб.
Если проверка ссылок происходит в режиме реального времени – иными сло
вами, вы проверяете лишь одну страницу – то в окне браузера отражается ход ее
выполнения, как показано на рис. 2.2. Для преждевременной остановки процесса
нажмите на кнопку Cancel (Отмена).

Рис. 2.2. Проверка ссылок в режиме реального времени

Если проверка ссылок на сайте выполняется в фоновом режиме, то есть вы


заказали обработку пяти страниц, появится сообщение: Our robot is checking
your site. Testing may take anywhere from a few seconds to several minutes,
depending on the size of your site. We will notify you by e mail when testing is
complete. (Наш робот проверяет ваш сайт. В зависимости от его размеров тести
рование может занять от нескольких секунд до нескольких минут. По окончании
проверки мы отправим вам уведомление.)
Уведомление выглядит так:
NetMechanic has completed the tests you requested for:
http://www.inotec.ru
Job Configuration: 5 Pages, Local Links, Remote Links, Images
You can find your results at:
http://results.netmechanic.com/aps1/summary.cgi?f=004/0406/49-
12129&s=NetMechanic&fv=5
Reports will be stored at this URL for the next 2 days.
102 Автоматизация

(NetMechanic завершил тесты, запрошенные вами для адреса http://www.


inotec.ru. Конфигурация: 5 страниц, локальные ссылки, изображения. Результаты
находятся по адресу: http://results.netmechanic.com/aps1/summary.cgi?f=004/0406/
4912129&s=NetMechanic&fv=5, где они будут храниться в течение двух дней.)
Отчет о проверке одной страницы вы получите на экране браузера (рис. 2.3).

Рис. 2.3. Отчет о проверке ссылок одной страницы

В поле URL указан проверенный адрес с прямой ссылкой на него. Результаты


проверки сведены в таблицу (первая строка – Link Check, Проверка ссылок).
В колонке Rating (Оценка) звездочками обозначен уровень доступности ссылок
на странице. Число недоступных ссылок указано в графе Summary (Итоги). Пос
ледняя колонка (без заглавия) предназначена для уточнения результатов тести
рования. По ссылке View a Detailed Report (Показать подробный отчет) можно
перейти на страницу с описанием всех найденных ссылок (рис. 2.4).
Таблица отчета включает в себя пять колонок:
¾ Line (Строка) – номер строки исходной страницы, где обнаружена данная
ссылка;
¾ Tag (Тэг) – вид тэга (например: IMG, HREF);
¾ Links to…… (Ссылка на…) – адрес ссылки;
¾ Image Size (Размер изображения) – размер изображения, на которое ука
зывает ссылка. Надпись –1 выводится, если робот не смог определить этот
параметр. По ссылкам из колонки Image Size вы попадаете на страницу оп
тимизации изображений (рис. 1.5);
Сетевые средства 103
· Status (Состояние) – состояние ссылки, например: Ok (Доступно), Access
denied for robots (Нет доступа для роботов), Remote link (Внешняя ссыл
ка), No response from host (Узел не ответил).

Рис. 2.4. Таблица с описанием всех найденных ссылок

Рис. 2.5. Страница оптимизации изображений


104 Автоматизация

На странице, представленной на рис. 2.5, вы имеете возможность оптимизиро


вать картинку, то есть уменьшить ее размер, что сокращает время загрузки. Для
этого сравните предложенные варианты изображений с оригиналом (первая кар
тинка), выберите подходящий, учитывая соотношения размера и качества, и со
храните графический файл на компьютере так же, как вы это обычно делаете
в браузере.
Слева у каждой картинки указаны следующие параметры:
¾ Type (Тип) – графический формат;
¾ Colors (Цветность) – число цветов в палитре рисунка;
¾ Size (Размер) – размер файла, в байтах;
¾ DL Time (28.8) (Время загрузки) – время загрузки при модемном соеди
нении со скоростью 28 800 бит/с;
¾ Savings (Оптимизация) – показывает, насколько уменьшены размеры изоб
ражения по сравнению с оригиналом (в процентах).
Для того, чтобы сравнить оптимизированную картинку с исходной, достаточ
но поместить курсор мыши на любое изображение, и оно будет мгновенно заме
нено оригиналом.
Если переключатель Scope в форме на первоначальной странице (рис. 2.1)
был установлен в положение 5 Pages, таблица отчета содержит сведения о пер
вых встреченных пяти страницах, как показано на рис. 2.6. В остальном нет ника
ких отличий от отчета для одной страницы.

Рис. 2.6. Отчет о проверке ссылок для пяти страниц

Сервис проверки HTMLкода


Расширенный сервис HTML Toolbox, предоставляемый компанией NetMechanic
Inc., подразумевает проверку правильности HTMLкода. Данный сервис пред
ставляет собой экспертную систему, которая может не только сообщить
пользователю об ошибках в HTMLдокументах, но и подсказать, как сделать,
чтобы страницы загружались быстрее и выглядели одинаково в различных
браузерах.
Сетевые средства 105
Другими словами, рассматриваемый сервис, кроме непосредственной провер
ки, предлагает варианты исправления найденных ошибок, то есть действия, кото
рые следует предпринять для устранения погрешностей. Случается, что для уст
ранения одной ошибки требуется внести несколько исправлений в HTMLкод,
а иногда наоборот – одно исправление, например, удаление тэга, может привести
к дополнительным ошибкам, которые также потребуется исправить. В отчете, ко
торый генерирует система, отражены лишь существенные коррективы. Исправ
ления, которые предписывает практика профессиональной верстки в HTML, на
пример, наличие закрывающих тэгов для элементов списка </LI> или для ячеек
таблицы </TD>, не предлагаются. Такие предложения привнесли бы излишний
беспорядок в отчет и затенили существенную правку. Заметим, что исправления
не входят в бесплатный сервис.
При проверке обращают внимание на совместимость кода страниц с различны
ми версиями браузеров, наличие ошибок в коде, отсутствие определенных тэгов и
соответствие последней версии спецификации HTML. Бесплатно можно прове
рить до пяти страниц; размер каждой ограничен двумя тысячами строк и 125 Кб.
Зайдите в Internet по адресу: http://www.netmechanic.com/toolbox/power_
user.htm. В браузер будет загружена форма, первые три пункта которой показаны
на рис. 2.7. Она представляет собой инструкцию по выполнению поэтапной про
верки.
1. В поле URL введите адрес страницы, которую требуется обработать. Для тес
тирования страниц, защищенных паролем (с обычным методом аутентифика
ции, когда для защиты используется файл .htaccess), запишите адрес в форме:
http://username:password@www.name.ru
При этом не забывайте, что пароль будет передан в открытом виде без при
менения специальных защищающих протоколов.
2. В разделе What tools would you like to use? (Какие инструменты вы хотите
использовать?) можно отключить все флажки, кроме HTML Check & Repair
(Проверка и исправление HTML).
3. Переключатель Scope (Возможно
сти) установите в положение 1 Page
(1 страница) или 5 Page (5 страниц).
В первом случае результат будет вы
веден в окне браузера, во втором –
выслан по вашему электронному ад
ресу. Так или иначе, бесплатный сер
вис ограничен проверкой 25 ссылок
на каждой из страниц.
4. В поле Email (продолжение формы
показано на рис. 2.8) введите элект

Рис. 2.7. Форма расширенного сервиса


HTML Toolbox
106 Автоматизация

ронный адрес для отчетов (сюда же, возможно, время от времени будет по
ступать ненавязчивая реклама услуг компании NetMechanic).
5. Если вы хотите дополнительно проверить страницу на совместимость
с браузерами, используйте опцию Tell me if my page is friendly to disabled
visitors (Сообщать, подходит ли моя страница клиентам с несовместимы
ми программами просмотра). Имеются в виду браузеры, которые не под
держивают загрузку изображений, и браузеры, допускающие ее блокиров
ку. Чтобы такие клиенты могли просматривать страницу, она должна
содержать специальные атрибуты: SUMMARY в тэгах таблиц и ALT – в тэгах
изображений.
6. Заполните поля таблицы Browser Types (Типы браузеров), как показано
на рис. 2.9. Укажите процентное соотношение посетителей, пользующихся
различными версиями браузеров, если эта информация вам известна. По
добные сведения важны, поскольку у посетителей, применяющих старые
версии, даже обычные в настоящее время конструкции могут не работать.

Рис. 2.8. Продолжение формы


расширенного сервиса HTML Toolbox

Рис. 2.9. Окончание формы расширенного


сервиса HTML Toolbox

7. Для проверки правописания в тексте страниц в сервисе используется


пользовательский словарь. Сюда можно внести имена и названия, техни
ческие термины, устойчивые словосочетания, иностранные слова. Для это
Сетевые средства 107
го создайте текстовый файл (назовите его, например, dictionary.txt), в кото
ром каждое слово или словосочетание следует набрать отдельной строкой.
С формами словоизменения в русском языке, естественно, неизбежны про
блемы. Если такой словарь существует, поместите его на сервере в Internet
и задайте адрес словаря в поле Custom Dictionary (Специальный словарь).
Чтобы не проверять в тексте страниц слова, записанные прописными бук
вами, отметьте опцию Ignore words in UPPER CASE (Пропускать слова,
состоящие из ПРОПИСНЫХ БУКВ).
8. Чтобы начать проверку, нажмите на кнопку Test Now (Запуск теста).
В результате проверки создается страница, состоящая из трех основных час
тей: общие итоги, код проверяемой страницы со вставленными в него предупреж
дениями и сообщениями об ошибках и список замеченных проблем, которые не
поддаются автоматическому исправлению в данном сервисе.
В первой части отчета – см. рис. 2.10 – указано общее число ошибок (поле Total
Errors), предупреждений (поле Total Warnings) и проблем, которые не поддаются
автоматическому исправлению (поле Total Problems HTML Repair Cannot Fix).

Рис. 2.10. Первая часть отчета сервиса HTML Check & Repair

Фрагмент второй части отчета приведен на рис. 2.11. Сообщения об ошибках


и предупреждения размещены на отдельных строках и выделены цветом, а также
символами ——:[n]^Error: (для ошибок) или ——:[n]^Warning: (для предупреж
дений) в начале строки. При этом n – порядковый номер ошибки. За двоеточием
следует описание ошибки. В строках, помеченных символами ——:[n]^Hint: и
также выделенных цветом, даются краткие рекомендации, как избегать подоб
ных ошибок.
В третьей части отчета, представленной на рис. 2.12, перечислены проблемы,
с которыми столкнулся сервис в ходе проверки, и даны рекомендации авторам по
самостоятельному устранению погрешностей. Ссылки указывают на строки ис
ходного кода документа.
108 Автоматизация

Рис. 2.11. Вторая часть отчета сервиса HTML Check & Repair

Рис. 2.12. Третья часть отчета сервиса HTML Check & Repair
Сетевые средства 109

Проверка доменных имен


Whoisсервис РосНИИРОС
РосНИИРОС (Российский НаучноИсследовательский Институт Развития Об
щественных Сетей) является администратором российского национального до
мена верхнего уровня RU, обеспечивая регистрацию в нем доменов второго уров
ня. Заметим попутно, что на момент написания книги в домене RU было
зарегистрировано свыше 205 тысяч доменов второго уровня.
Сервис Whois (http://www.ripn.net/nic/whois/index.html) предоставляется
РосНИИРОС в информационных целях и может быть использован только для
получения информации о доменном имени и контактных лицах. Основным усло
вием его предоставления является обязательство не производить массовых выбо
рок информации, превышающих разрешенные пределы: с одного IPадреса до
пускается делать ограниченное количество запросов в минуту. В противном
случае вместо обработки запросов возможна выдача предупредительного сооб
щения. Если в течение часа пользователь неоднократно превысит частоту по
ступления запросов, то предоставление Whoisсервиса ему прекращается, а на
каждый последующий запрос выдается извещение об отказе в услуге:
Для получения информации о домене требуется заполнить лишь строку зап
роса (см. рис. 2.13), в которой указывается имя интересующего вас домена, и
щелкнуть по кнопке Search (Поиск). В результате работы сервиса будет выдана
страница, содержащая полную информацию по домену (рис. 2.14).

Рис. 2.13. Служба Whois РосНИИРОС


110 Автоматизация

Рис. 2.14. Страница ответа службы Whois РосНИИРОС

Приведем в алфавитном порядке все возможные поля, встречающиеся в отве


тах Whoisсервиса РосНИИРОС:
¾ address – контактный адрес физического лица (на английском языке, нео
бязательное поле);
¾ admin c – идентификатор представителя организации для администра
тивного контакта с РосНИИРОС;
¾ admin o – идентификатор администратора домена;
¾ bill c – идентификатор представителя организации, ответственного за оп
лату услуг по домену;
¾ changed – дата последнего изменения клиентом информации в объекте
(приводит к запуску процесса тестирования зоны). Для доменов треть
его уровня может указывать дату, когда начнется ежегодное автомати
ческое тестирование зоны, если не будет прислан запрос на обновление
зоны;
Сетевые средства 111

¾ created – дата регистрации домена; не изменяется при продлении срока ре


гистрации, смене администратора или регистратора домена;
¾ descr – краткое описание объекта в произвольной текстовой форме (не
обязательное поле);
¾ domain – доменное имя;
¾ e mail – электронный адрес;
¾ fax no – номер факса (с международным кодом и кодом города);
¾ free date – дата освобождения домена (указывается для доменов с прибли
жающимся сроком аннулирования регистрации);
¾ mnt adm – организация или физическое лицо, которому принадлежит
служба технической поддержки;
¾ mnt by – идентификатор службы технической поддержки (службы авто
ризации), отвечающей за корректность информации о домене в базе дан
ных РосНИИРОС;
¾ mntner – идентификатор службы технической поддержки в базе данных
РосНИИРОС;
¾ nic hdl – идентификатор объекта базы данных;
¾ nserver – список DNSсерверов, поддерживающих домен (если имя серве
ра содержит имя домена, то указываются также его IPадреса);
¾ org – название организации;
¾ paid till – дата, по которую оплачена регистрация домена;
¾ person – полное имя физического лица (на английском языке), являюще
гося администратором домена;
¾ phone – телефоны с международным кодом и кодом города;
¾ reg ch – идентификатор регистратора, которому передается домен (при
смене регистратора);
¾ registrar – идентификатор регистратора;
¾ remark – произвольные текстовые комментарии (необязательное поле);
¾ source – источник информации;
¾ state – состояние объекта;
¾ tech c – идентификатор контактного лица по техническим вопросам;
¾ type – тип домена;
¾ whois – Whoisсервис регистратора;
¾ www – URLадрес сайта регистратора;
¾ x freeing – домен подлежит удалению из реестра в течение часа.
Поле State является одним из обязательных полей в ответах Whoisсервиса
РосНИИРОС при запросе по доменным именам второго уровня в зонах RU и SU
и третьего уровня в зонах COM.RU, NET.RU, ORG.RU, PP.RU. Оно показывает
состояние зарегистрированного домена: делегирован он или нет. Значение поля
зависит от объекта, по которому делается запрос: домен второго или третьего
уровня, кем зарегистрирован (РосНИИРОС или другой регистратор). Значения,
которые может принимать поле State, представлены в таблице 3.
112 Автоматизация

Таблица 3. Описание поля State


в ответах Whoisсервиса РосНИИРОС
Значение Описание Запрашиваемый домен
Delegated Домен делегирован Домен третьего уровня;
регистратор – РосНИИРОС
Delegated till [дата] Домен делегирован Домен второго уровня;
до указанной даты окончания регистратор – РосНИИРОС
срока регистрации
Not delegated Домен не делегирован Домены второго и третьего
уровней;
регистратор – РосНИИРОС
Not delegated Домен не делегирован Домен второго уровня;
freeing date [дата] в связи с окончанием срока регистратор – РосНИИРОС
регистрации; если до указанной
даты срок регистрации домена
не будет продлен, регистрация
домена аннулируется
REGISTERED, Домен делегирован Домен второго уровня;
DELEGATED регистратор – не РосНИИРОС
REGISTERED,
NOT DELEGATED Домен не делегирован Домен второго уровня;
регистратор – не РосНИИРОС

Служба Whois InterNIC


Чтобы получить информацию по доменным именам, зарегистрированным в зонах
верхнего уровня AERO, ARPA, BIZ, COM, COOP, EDU, INFO, INT, MUSEUM,
NAME, NET или ORG, можно воспользоваться сервисом Whois InterNIC (http://
www.internic.net/whois.html). В строке запроса (рис. 2.15) укажите искомое
доменное имя, а переключателем, расположенным под ней, определите его
статус:
¾ Domain (Домен);
¾ Registrar (Регистратор);
¾ Nameserver (Сервер имен).
Ответ службы не столь подробный, как у Whois РосНИИРОС, но необходи
мая информация о владельцах и датах регистрации и ее окончания содержится.

Проверка доменных имен


на сайтах Internetпровайдеров
Многие компании, предоставляющие услуги по размещению серверов в Internet,
(провайдеры услуг Internet) обеспечивают пользователей сервисом проверки до
менного имени. Обычно это простая форма со строкой поиска, как, например, на
странице проверки домена (http://ropnet.ru/services/hosting/check/) на сайте
компании RopNet (см. рис.2.16).
Сетевые средства 113

Рис. 2.15. Служба Whois InterNIC

Рис. 2.16. Страница проверки домена на сайте компании RopNet

Для работы с формой введите имя интересующего вас домена. Затем отметь
те зоны, в которых нужно его проверить, и нажмите на кнопку Проверить!.
В результате будет получен ответ о том, свободен или занят домен. Если он сво
боден, его можно будет сразу же и заказать.
114 Автоматизация

Проверка гиперссылок
Разработаны и применяются автоматические роботы, которые могут «зайти» на
сайт и проверить все ссылки (в том числе и внешние).

W3C Link Checker

W3C Link Checker – это мощный сетевой ресурс для всестороннего тестирова
ния ссылок на сайте, предоставляемый организацией W3C (консорциумом
World Wide Web; http://www.w3.org/). Первая версия тестера была разработана
в августе 1998 года, а в ноябре 1999 года вышла новая, которая регулярно дора
батывается. Исходный код программы, написанный на языке программирова
ния Perl, доступен на сайте консорциума. Если вы зайдете в Internet по адресу
http://validator.w3.org/checklink/, в окне браузера появится форма, показанная
на рис. 2.17.

Рис. 2.17. Форма W3C Link Checker


Сетевые средства 115
В поле Enter the address (URL) of a document that you would like to check
(Введите адрес документа, который хотите проверить) впишите URL страницы,
предназначенной для тестирования, или начальный адрес, если будет проверять
ся несколько документов. Напомним, что аббревиатура URL (сокращение от
англ. Universal Resource Locator, Универсальный указатель на ресурс) означает
принятый в Internet адрес ресурса, имеющий определенный формат, а именно:
протокол://адрес. Нажмите на кнопку Check (Проверить).
Тестер проверяет HTML или XHTMLдокументы, строит список ссылок на
метки и адреса, сообщает в своем отчете о найденных ошибках. Проверяется, не
повторена ли одна и та же метка дважды. Затем тестируются все обнаруженные
ссылки (включая переходы на метки внутри документов) – с тем, чтобы опреде
лить их доступность.
Отчет о проверке выглядит, как показано на рис. 2.18.
Для дополнительной проверки отметьте, если требуется, нужные поля в сек
ции Options (Параметры):
¾ Summary only (Только итоги) – формируется общий отчет без подробного
описания хода проверки: проверяемых адресов и страниц, времени ответа
и т. д.;
¾ Hide redirects (Не показывать перенаправленные) – обнаруженные ссыл
ки с переадресацией показаны в обычном отчете в следующем виде:
http://counter.rambler.ru/top100/ redirected to
http://top100.rambler.ru/top100/
What to do: Usually nothing.
HTTP Code returned: 302 -> 200
HTTP Message: Found -> OK
Lines: 193
Если выключатель Hide redirects включен, подобные ошибки не фиксируются.
Изображенный выше фрагмент отчета формируется при положении рас
положенного рядом переключателя в состоянии All (Все). При этом обна
руженные в ходе проверки ссылки с переадресацией каталогов, если тако
вые имеются, показаны в обычном отчете следующим образом:
List of directory redirects:
The links below are not broken, but the document does not
use the exact URL.
http://www.homeincome.com/websearch/bizsearch redirected to
http://www.homeincome.com/websearch/bizsearch/
What to do: Add a trailing slash to the URL.
HTTP Code returned: 301 -> 200
HTTP Message: Moved Permanently -> OK
Lines: 221
При фиксации дополнительного переключателя в положении For directories
only (Только для каталогов) подобные ошибки не фиксируются;
116 Автоматизация

Рис. 2.18. Отчет о проверке ссылок

¾ Don’t send the Accept Language header (Не отправлять заголовок Accept
Language) – не посылать заголовок о предпочитаемом языке.
¾ Check linked documents recursively, recursion depth __ (Рекурсивно про
верять документы по ссылкам, глубина рекурсии __). Можно проверить
часть сайта рекурсивно, то есть от ссылки к ссылке – и это, пожалуй, самая
Сетевые средства 117
сильная сторона проекта. В этом случае в отчет включаются страница за
страницей сайта, и для каждой из них сообщаются результаты проверки.
Однако такое тестирование может занять довольно много времени. Указа
ние небольшой глубины рекурсии, то есть количества проверяемых доку
ментов, позволяет уменьшить время проверки;
¾ Save options in a cookie (Сохранить опции в файле cookie). Выбранные
вами опции будут сохранены на вашем компьютере в файле cookie, и при
последующей проверке будут сразу использованы.
Обратите внимание, что программа не поддерживает так называемый стандарт
исключений для роботов, то есть содержимое файла robots.txt не анализируется.

Проверка HTMLкода
Сервис проверки HTMLдокументов
Markup Validation Service

Сервис Markup Validation Service (Сервис проверки синтаксиса разметки), предлагае


мый организацией W3C – World Wide Web консорциумом (http://www.w3.org/) –
по адресу http://validator.w3.org/, предназначен для проверки HTMLдокумен
тов на соответствие рекомендациям W3C HTML и XHTML, а также другим
HTMLстандартам. Данный сервис представляет собой шлюз к известному
синтаксическому анализатору SGML (Standard Generalized Markup Language –
Обобщенный стандартный язык разметки) – программному модулю SP (http://
www.jclark.com/sp/). Markup Validation Service переправляет указанный посети
телем адрес модулю SP, получает результат, форматирует его в HTMLстраницу
и выдает ее в браузер пользователя. Сам по себе рассматриваемый сервис не гене
рирует никаких сообщений об ошибках.
SGML – это международный стандарт на определение не зависящих от ком
пьютерных платформ и систем методов представления текстов в электронной
форме. Точнее, SGML является метаязыком, то есть средством формального опи
сания языка, в данном случае, языка разметки.
Исторически слово разметка использовалось для описания аннотаций или
других отметок в тексте, предназначенных для указания машинистке или набор
щику, как именно должна быть напечатана или набрана определенная фраза.
Примерами служат волнистое подчеркивание для обозначения жирного шрифта,
специальные символы для обозначения пропуска отдельных предложений или
их печати определенным шрифтом, и т. п. С автоматизацией форматирования и
печати текстов термин был расширен, охватывая сейчас всяческие коды разметки,
вставляемые в электронные тексты для управления форматированием, печатью
или иной обработкой.
118 Автоматизация

В определенном смысле все печатные тексты размечены: знаки пунктуации, ис


пользование заглавных букв, размещение букв на странице, даже пробелы между
словами можно считать своеобразным кодированием, функция которого – помочь
читателю определить, где заканчивается одно слово и начинается другое, как отде
лить структурные элементы, например, заголовки или подчиненные предложения.
Кодирование текста для компьютерной обработки можно считать выявлением неяв
ного или предположительного, указанием пользователю, как интерпретировать со
держимое текста. Таким образом, язык разметки – это набор соглашений о разметке,
используемых в комплексе для кодирования текстов. Язык разметки должен опреде
лять, какая разметка является допустимой, какая – необходимой, как различаются
разметка и текст, и что разметка означает. SGML предоставляет средства решения
первых трех задач; последняя требует описательных документов – руководств.
Форма Validate Your Markup (Проверка синтаксиса разметки), загружаемая
в окно браузера, представлена на рис. 2.19.

Рис. 2.19. Форма Validate Your Markup сервиса Markup Validation Service

Введите в поле Address (Адрес) раздела Validate by URL (Проверка по URL)


адрес страницы в Internet, которая должна быть протестирована, и нажмите на
кнопку Check (Проверить). Рассматриваемый сервис имеет дополнительные
Сетевые средства 119
возможности, которые становятся доступны при переходе по ссылке Extended
Interface (Расширенный интерфейс). В этом случае откроется страница, изобра
женная на рис. 2.20.

Рис. 2.20. Страница дополнительных возможностей сервиса Markup Validation Service

Если нужно, воспользуйтесь здесь следующими опциями:


¾ Encoding (Кодировка). Установленное по умолчанию значение Detect
automatically (Автоопределение) подойдет для большинства случаев, но
иногда с целью тестирования может понадобиться его изменение и выбор
конкретной кодировки;
¾ Use Fallback instead of Override (Использовать как аварийный режим
вместо полной отмены). Если флажок установлен, кодировка, указанная
в пункте Encoding, будет применена лишь тогда, когда документ не содер
жит информации о кодировке символов;
¾ Doctype (Тип документа). Служит для принудительного задания типа до
кумента, не зависящего от имеющейся в нем информации. Размещенная
рядом опция Use Fallback instead of Override, как и в предыдущем пункте,
нужна для принудительного включения типа документа в том случае, если
он не задан на странице явно;
120 Автоматизация

¾ Show Source (Показывать исходный код). В отчет выводится исходный


HTMLкод документа с привязанными к нему сообщениями об ошибках;
¾ Show Outline (Показать иерархическую структуру). Выдается наглядная
структура документа, начиная с тэгов <H1> –– <H6>;
¾ Show Parse Tree (Показать дерево синтаксического анализа). Отображает
ся точная последовательность прочтения документа SGMLанализатором;
¾ …exclude attributes (…исключая атрибуты). Для наглядности из дерева
синтаксического анализа будут удалены атрибуты;
¾ Validate error pages (Проверять правильность страниц с ошибками). Когда
страница недоступна (ошибка 404), выдается сообщение об ошибке. В не
которых случаях требуется оттестировать такую страницу с сообщением –
тогда и включается опция;
¾ Verbose Output (Подробный отчет). Флажок ставится, если необходимо
получить дополнительную информацию о найденных ошибках.
Для проверки нажмите на кнопку Validate this page (Проверить эту страницу).
После тестирования документа, расположенного по указанному вами адресу,
на экран выводится листинг результатов.
Существует возможность альтернативной проверки – посредством загрузки
документов, требующие исследования, на сервер. Для этого предназначен раз
дел Validate by File Upload (Проверка загруженного файла) формы Validate Your
Markup (рис. 2.19). Нажмите на кнопку Browse (Обзор), расположенную рядом
с полем Local File (Локальный файл), и выберите на своем компьютере нужный
файл. Для его загрузки на удаленный сервер и начала проверки щелкните по
кнопке Check. Как и при проверке по URL, можно воспользоваться дополнитель
ными опциями, если перейти по ссылке Extended File Upload Interface (Расши
ренный интерфейс для загруженного файла). В этом случае вам будет предложе
но заполнить форму, аналогичную представленной на рис. 2.20. С той же целью
можно набрать в строке браузера адрес: http://validator.w3.org/fileupload.html.
Кроме описанных проверок, рассматриваемый сервис позволяет тестировать
таблицы CSS (так называемые каскадные или иерархические таблицы стилей).
Для этого наберите в строке браузера адрес: http://jigsaw.w3.org/cssvalidator/.
На экране отобразится страница с формой Validate Your Style Sheet (Проверка
таблицы стилей), представленной на рис. 2.21.
Как и при проверке HTMLстраницы, существует возможность исследовать
таблицу CSS по ее адресу в Internet (поле Address в разделе Validate by URI) и
с помощью загрузки требуемого файла на сервер (поле Local CSS file (Локаль
ный файл CSS) в разделе Validate by File Upload). Кроме того, в разделе Validate
by direct input (Проверка прямого ввода) вы можете просто ввести текст таб
лицы CSS. В любом случае тестирование начнется после щелчка по кнопке
Check, соответствующей выбранному разделу. В каждом из рассмотренных
разделов имеются ссылки на формы с дополнительными параметрами провер
ки (Advanced Interface – Расширенный интерфейс), одна из которых представ
лена на рис. 2.22.
Сетевые средства 121

Рис. 2.21. Форма Validate Your Style Sheet

В этот форме добавлена возможность выбора уровня предупреждений (так,


можно вовсе от них отказаться), версии CSS и среды, для которой предназначены
описания в таблицах (например, презентация, карманный компьютер, экран, пе
чать, проектор и т. д.).

Сервис WDG HTML Validator

Сетевой сервис WDG HTML Validator (http://www.htmlhelp.com/tools/validator/),


предлагаемый группой разработчиков, объединившихся под названием Web Design
Group (http://www.htmlhelp.com/), предназначен для проверки синтаксиса HTML
страниц, а также таблиц CSS. Форма для задания адреса исследуемой страницы
представлена на рис. 2.23. Введите его в поле URL и нажмите на кнопку Validate it!
(Проверить!).
122 Автоматизация

Рис. 2.22. Форма Validate Your Style Sheet с расширенными возможностями проверки

Рис. 2.23. Форма сервиса WDG HTML Validator


Сетевые средства 123

Для настройки вида отчета воспользуйтесь следующими флажками:


¾ Include warnings (Включить предупреждения);
¾ Show input (Показывать исходный код);
¾ Validate entire site (Проверить весь сайт);
¾ Hide valid results (Скрыть допустимые результаты).
Если включена опция Validate entire site, WDG HTML Validator следует пра
вилам исключений для роботов (заданным в файле robots.txt), что позволяет ис
ключить из проверки отдельные части сайта. Для указания правил специально
для робота сервиса WDG HTML Validator используйте в качестве Useragent
имя: WDG_SiteValidator.
WDG HTML Validator поддерживает протоколы HTTP, HTTPS и FTP. Для
анонимного входа на FTPсервер вводится URL вида ftp://ftp.yourdomain.ru/
foo/bar.html. Если для доступа требуются имя пользователя и пароль, адрес ука
зывается в форме: ftp://user:pass@ftp.yourdomain.ru/foo/bar.html.
Для обработки страниц XHTML и XML требуется добавить в поле URL к ука
зываемому адресу (справа) конструкцию: &xml=yes.
Если вы хотите обработать несколько страниц одновременно, задайте их адреса
в форме по адресу: http://www.htmlhelp.com/tools/validator/batch.html (рис. 2.24).
Учтите, что каждый адрес следует вводить отдельной строкой.

Рис. 2.24. Форма сервиса WDG HTML Validator


для одновременной проверки нескольких страниц
124 Автоматизация

Чтобы протестировать отдельные файлы, находящиеся на локальном компь


ютере, воспользуйтесь формой (рис. 2.25), расположенной по адресу: http://
www.htmlhelp.com/tools/validator/upload.html.

Рис. 2.25. Форма сервиса WDG HTML Validator для проверки локальных файлов

Щелкните по кнопке Browse (Обзор), находящейся рядом с полем (Выбе


рите на своем компьютере HTMLдокумент, который следует загрузить для
проверки), и найдите интересующий вас файл. В поле Character encoding
(Кодировка символов) определите нужную кодировку для обрабатываемого
документа. Если требуется, отметьте флажками опции Include warnings и
Show input. Для загрузки выбранного файла и запуска проверки щелкните по
кнопке Validate it!.
Еще одна форма рассматриваемого сервиса (http://www.htmlhelp.com/tools/
validator/direct.html) служит для тестирования HTMLкода, непосредственно
введенного в ее поле (см. рис. 2.26). Как и в рассмотренных ранее формах, здесь
также можно определить кодировку в поле Character encoding, а также приме
нить настройки Include warnings и Show input. Дополнительно добавлена кноп
ка Clear form (Очистить форму).
Для проверки таблиц CSS разработчики Web Design Group предлагают два
сервиса: обработка по указанному адресу в Internet (http://www.htmlhelp.com/
Сетевые средства 125

Рис. 2.26. Форма сервиса WDG HTML Validator для проверки HTMLкода

tools/csscheck/) и с помощью загрузки файла с локального компьютера на уда


ленный сервер (http://www.htmlhelp.com/tools/csscheck/upload.html). Формы,
используемые для данных сервисов, аналогичны приведенным выше.

Проверка метатэгов
Существуют сетевые службы, позволяющие бесплатно проверить корректность
метатэгов Webстраницы.

Анализатор SpiderView Density Analyzer

Служба SpiderView Density Analyzer (http://www.northernwebs.com/set/spider_view_


da.html) компании Northern Webs (http://www.northernwebs.com/) представляет
собой анализатор, который исследует текст HTMLдокумента, определяет часто
126 Автоматизация

ту появления в нем отдельных слов, создает частотный словарь и предлагает спи


сок ключевых слов. При конструировании метатэгов наибольшие сложности воз
никают именно при подборе ключевых слов для страницы, а рассматриваемый
сервис позволяет легко получить их перечень. Для этого достаточно ввести адрес
документа в соответствующее поле Enter a complete URL, including the http://
(Введите полный URLадрес, включая http://), показанное на рис. 2.27, и служба
сформирует отчет об имеющихся в нем словах.

Рис. 2.27. Поле Enter a complete URL службы SpiderView Density A nalyzer

При этом существует возможность настроить отчет на показ всего частотного


словаря страницы, а не только сформированных ключевых слов, для чего следует
отметить флажок Show all words? (Показывать все слова?). По умолчанию фла
жок снят, и на экран выводится только слова, неоднократно употребленные в тек
сте. При формировании метатэга NAME=“keywords” учитывается специфика
ция на разрешенную длину его параметра.
Если вы вводите адрес каталога сайта, а не отдельной страницы, следует до
бавлять справа символ / (замыкающий слэш), то есть писать, например, http://
www.myprovider/~myname/, а не http://www.myprovider/~myname. Такое напи
сание, кстати, всегда предпочтительнее. Без замыкающего слэша браузер сначала
делает запрос к серверу только для того, чтобы сообщить, что он спрашивает о
каталоге. Затем производится второй запрос, но уже со слэшем, и лишь после это
го сервер отправит главный (индексный) документ каталога или выдаст список
файлов каталога, если в нем нет главного документа, но просмотр разрешен. До
бавление к URLадресу замыкающего слэша позволяет избежать лишнего запро
са к серверу, благодаря чему ускоряется переход по ссылке. Обратите внимание,
что рассматриваемым сервисом обрабатывается только одна страница – незави
симо от того, указана ли ссылка на файл, каталог или весь сайт, – а именно та,
которая будет загружена сервером.
Давайте введем в поле Enter a complete URL адрес страницы, для которой
хотим получить список ключевых слов. Чтобы сформировать отчет, щелкните
по кнопке Submit (Подготовить). После обработки в браузер будет загружен
отчет, состоящий из нескольких частей. Его первая часть показана на
рис. 2.28.
В отчете указаны:
¾ данные проверяемой страницы, время обработки;
¾ Header data returned (Возвращенная заголовочная информация) – сооб
щение, которое сервер пересылает браузеру;
¾ HTML Code Returned (Возвращенный HTMLкод) – исходный код стра
ницы с пронумерованными строками.
Сетевые средства 127

Рис. 2.28. Первая часть отчета SpiderView Density A nalyzer


128 Автоматизация

Вторая часть отчета Density Analysis (Анализ плотности) – см. рис. 2.29 – со
стоит из таблицы с вычлененными из текста исследуемой страницы словами и
рассчитанной для каждого из них частоты появления. Колонки таблицы имеют
следующее назначение:
¾ Word (Слово) – перечень найденных в тексте слов;
¾ Repeats (Повторы) – количество повторений каждого слова;
¾ Frequency (Частота) – частота появления каждого слова.

Рис. 2.29. Вторая часть отчета SpiderView Density A nalyzer


Сетевые средства 129
Ячейки таблицы, относящиеся к определенным словам, выделены цветом, ко
торым сообщается следующее:
¾ красный – указывает на элементы, превышающие рекомендованную час
тоту;
¾ черный – в пределах рекомендованной частоты;
¾ зеленый – ниже;
¾ синий – слова встречаются реже 0,1% от рекомендованной частоты. Воз
можно, следует чаще пользоваться такими словами.
Отметим, что для достижения оптимальных результатов рекомендуется дли
на тэга ключевых слов от 300 до 500 символов.
В третьей части отчета (рис. 2.30) приведен сгенерированный системой мета
тэг (он размещен под заголовком Possible meta tag – Возможный метатэг), ука
зано количество элементов тэга Tag Elements и длина его содержимого Content
Length в символах, включая пробелы. Кроме того, дается оценка сформирован
ного тэга, в данном случае: The tag is oversized, consider adjusting the text (Раз
мер тэга превышен, рекомендуется сократить текст). Отнеситесь к автоматически
полученному метатэгу с должной долей иронии и поправьте его самостоятельно:
расставьте кавычки (meta name=“ keywords” content=“ …” ); уберите малозна
чимые для поиска слова (для, наши, наших, других, следующие) и лишние пробе
лы; проверьте, имеются ли в списке слова с высокой частотностью; для порядка
приведите слова в нижний регистр, хотя роботы поисковых машин проверяют
метатэги вне зависимости от регистра букв; потрудитесь над склонениями (окна –
окон, профиль – профилем, сады – садов, сайт – сайтов). Изображенный на рис. 2.30
пример должен приобрести, по меньшей мере, такой вид:
<meta name=“keywords” content=“êîìïàíèÿ âûçâàòü ñêèäêè ôîòîãàëåðåÿ
2004 4235 copyright daily proplex provedal ãåðìàíèÿ äîáðî çèìíèå
çîëîòîé èñïàíèÿ êàòàëîã îêíà îñòåêëåíèå ïîæàëîâàòü ôîòîãàëåðåÿ
àëþìèíèåâûé àëþìèíèåâûì àëþìèíèÿ áàëêîíîâ ãîðîä çàìåðùèêà çàùèòíûõ
çèìíèõ èçãîòîâëåíèå èñïîëüçóåì êîìïàíèè êîíñòðóêöèé ëîäæèé
ìåòàëëè÷åñêèõ ìîíòàæ íà÷àëî îñòåêëåíèå ïîæàëîâàòü ïîñëåäíèå
ïðåäîñòàâëÿåò ïðîåêòèðîâàíèå ïðîôèëü ðàáîò ðåøåòîê ñàäû ñàéò
ñëîæíûõ òåïëèö óñëóãè ÷èñëå ýòàæè”>

Служба подбора ключевых слов Wordtracker

Служба Wordtracker (http://www.wordtracker.com/) компании Rivergold Associates


Ltd. позволяет подобрать для вашего сайта такие ключевые слова и их комбина
ции, которые чаще всего используются для поиска в Internet. В браузер загрузит
ся страница, показанная на рис. 2.31.
130 Автоматизация

Рис. 2.30. Третья часть отчета службы SpiderView Density A nalyzer

Рис. 2.31. Страница службы Wordtracker в окне браузера


Сетевые средства 131

Щелкните по ссылке Trial (Проба), расположенной в верхней части окна, или


введите в браузере адрес http://www.wordtracker.com/trial/index.php3. Загрузит
ся регистрационная форма, показанная на рис. 2.32.

Рис. 2.32. Регистрационная форма

Введите соответствующие данные в поля Your name (Ваше имя) и Your e mail
address (Ваш электронный адрес), затем щелкните по кнопке Start the trial (На
чать пробу). Загрузится страница с заголовком Welcome… (Добро пожало
вать…), показанная на рис. 2.33. Нажмите стрелку с надписью Click here to start
the trial (Нажмите здесь, чтобы начать) в правом нижнем углу страницы. Загру
зится страница с заголовком Step 1 (Пункт 1), показанная на рис. 2.34.
В поле Enter your search term below (Введите поисковую фразу) наберите два
или три ключевых слова, составляющие фразу, которая описывает ваш бизнес
или услугу.
Если отмечен флажок Lateral (Боковой), со ста Webстраниц выбираются
ключевые слова из заголовков, метатэгов и самого текста. Наиболее часто встре
чающиеся, тематически более близкие запросу слова и фразы, найденные таким
образом, располагаются ближе к началу списка.
Если отмечен флажок Thesaurus (Словарь), для поиска будут дополнительно
использованы близкие по смыслу слова, синонимы.
132 Автоматизация

Рис. 2.33. Страница с заголовком Welcome…

Рис. 2.34. Страница с заголовком Step 1


Сетевые средства 133
Нажмите кнопку Proceed (Далее). Загрузится страница с заголовком Step 2
(Пункт 2), показанная на рис. 2.35. Здесь перечислены ключевые слова и слово
сочетания, которые нашла система в своей базе данных, составленной из
303 000 000 различных запросов, сделанных за последние 60 дней. Щелкните по
любому из этих слов или словосочетаний – на экран будет выведена страница,
показанная на рис. 2.36. В ее правой части находится таблица, где представлены
различные запросы, в которых было использовано выбранное вами выражение.

Рис. 2.35. Страница с заголовком Step 2

Данная таблица содержит следующую информацию:


¾ Keyword (Ключевое слово) – ключевое слово или словосочетание;
¾ Count (Количество) – число появлений в базе данных отдельно взятого
ключевого слова или словосочетания;
¾ Predict (Предположительно) – расчетное максимальное число посетите
лей (за сутки), которые пришли бы к вам по ссылкам, соответствующим
указанному слову или словосочетанию, из восьми основных поисковых
машин: Google, Yahoo, MSN, Go Network, AOL, Lycos, Altavista и Excite;
¾ Dig (Копнуть) – ключевые слова следующего уровня. Имеется в виду, что
для словосочетания «free accounting software», вы получите, например, и
такие выражения: «free accounting software downloads», «free business
accounting software» и т. д.
134 Автоматизация

Рис. 2.36. Вид страницы после выбора слова или словосочетания

В базе данных службы Wordtracker на момент написания материала содержа


лось свыше 332 000 000 ключевых слов. Обновление базы данных производится
один раз в две недели, в ночь с воскресенья на понедельник.
Таблица в правой части окна браузера предназначена
для оценки частоты запросов по соответствующим словам
и словосочетаниям, а также их отбора в «корзину». Стоит
Рис. 2.37. Счетчик только щелкнуть мышью по ссылке, и счетчик в нижней
Keywords in basket части окна Keywords in basket (Ключевые слова в корзи
не), показанный на рис. 2.37, изменит свое значение.
Воспользуйтесь полосой прокрутки в левой части окна браузера, чтобы
стала видна вторая таблица: Thesaurus (Словарь) – см. рис. 2.38. Работа
с ней и отбор слов в правой части окна аналогичны рассмотренным выше опе
рациям.
Отобрав слова, щелкните по стрелке с надписью Click here for step 3 (Нажми
те для перехода к пункту 3), расположенной в правом нижнем углу окна. Загру
зится страница с заголовком Step 3 (Пункт 3), показанная на рис. 2.39. Здесь пе
речислены ключевые слова и словосочетания, отобранные вами на предыдущем
шаге, с указанием значения Count (Счетчик), соответствующего числу появле
ний в базе данных отдельно взятого ключевого слова или словосочетания. Для
удаления из списка какоголибо из этих слов или словосочетаний щелкните по
надписи Delete (Удалить) в соответствующей строке.
Сетевые средства 135

Рис. 2.38. Таблица Thesaurus

Рис. 2.39. Страница с заголовком Step 3


136 Автоматизация

Теперь щелкните по стрелке с надписью Click here for step 4 (Нажмите для
перехода к пункту 4), расположенной в правом нижнем углу окна. Загрузится
страница с заголовком Step 4 (Пункт 4), где представлена таблица с итоговыми
результатами, показанная на рис. 2.40. Все цифры приведены для работы с поис
ковой системой Altavista.

Рис. 2.40. Таблица с итоговыми результатами

Те же результаты будут отправлены и по электронному адресу, который вы


указали при регистрации в системе. Основное внимание следует уделить колонке
KEI Analysis (Keyword Effectiveness Index – Индекс эффективности ключевого
слова). Чем выше в ней значение, тем популярнее ваше ключевое слово и тем бо
лее оно, если можно так выразиться, конкурентоспособно. Или, иными словами,
тем ближе к началу списка будет находиться ссылка на ваш документ.
Трудное для поиска ключевое слово имеет значение KEI от 0 до 10. В этом
случае число соперничающих страниц возрастает, и ваша ссылка имеет шанс ока
заться на странице результатов поиска, скажем, номер 30 или 40, где ее, конечно,
никто не найдет.
Хорошо обнаруживаемые ключевые слова имеют значение KEI от 10 до 100,
очень хорошие – от 100 до 400, и самые удачные слова – свыше 400. Диаграмма,
расположенная над таблицей, наглядно демонстрирует сказанное.
Сетевые средства 137
Служба Wordtracker обеспечивает дополнительным бесплатным сервисом,
если в регистрационной форме (рис. 2.40) отметить флажком опцию Keyword
report (Отчет о ключевых словах): производится еженедельная почтовая рассыл
ка – 500 самых популярных в Internet поисковых запросов.

Служба проверки файла исключений Robots.txt


Validator

Создав файл robots.txt, вы можете проверить его с помощью бесплатного сервиса


Robots.txt Validator, расположенного по адресу http://www.searchengineworld.com/
cgibin/robotcheck.cgi.
В поле robots.txt URL (URLадрес файла robots.txt) простой формы, показан
ной на рис. 2.41, введите полный адрес к проверяемому файлу robots.txt, и нажмите

Рис. 2.41. Форма для проверки на сайте Robots.txt Validator


138 Автоматизация

кнопку Check It (Проверить). Разработчики рекомендуют – вполне справедли


во – указывать не адрес сайта, а именно полную ссылку к файлу, чтобы при со
здании сайта можно было тестировать файлы с альтернативными именами. Та
ким способом можно избежать нежелательного использования роботами
поисковых машин файла robots.txt, имеющего незавершенный вид или содер
жащего ошибки.
По результатам проверки в окно браузера будет загружен отчет, один из вари
антов которого представлен на рис. 2.42. Исправьте ошибки в файле robots.txt,
загрузите его на сервер и вновь проверьте при помощи службы Robots.txt Validator.
В конце концов, получаемый вами отчет должен состоять всего из двух фраз:
No errors detected! This Robots.txt validates to the robots exclusion standard! (Оши
бок не обнаружено! Данный файл соответствует стандартам исключений для
роботов!).

Рис. 2.42. Отчет службы Robots.txt Validator


Сетевые средства 139

Анализатор Keyword Density Analyzer

Служба Keyword Density Analyzer (http://www.searchengineworld.com/cgibin/


kwda.cgi) компании PHD Software Systems (http://www.netins.net/showcase/
phdss/) представляет собой анализатор текста HTMLдокумента, рассчитываю
щий частоту появления в нем отдельных слов. Во многом он подобен рассмотрен
ному выше SpiderView Density Analyzer. Для работы службы требуется запол
нить форму, представленную на рис. 2.43.

Рис. 2.43. Форма ввода данных службы Keyword Density Analyzer

В поле URL (including the http://) (URLадрес, включая http://) введите адрес
исследуемого документа. Раздел Include the following (Включить следующее) со
стоит из трех флажков, которые позволяют вести анализ, используя дополни
тельно, кроме текста, тэги:
¾ заголовка TITLE – флажок Include Page Title;
¾ ключевых слов NAME=“keywords” – флажок Include Meta tag Keywords;
¾ описания NAME=“description” – флажок Include Meta tag Description.
В разделе Word Length (Длина слова) укажите параметр Ignore words of …
characters in length or less (Игнорировать слова, состоящие из … и менее символов).
140 Автоматизация

Раздел Word Filters (Фильтры слов) дает возможность воспользоваться сле


дующими настройками:
¾ отметить опцию Use our default stop word list (Использовать наш список
стопслов);
¾ ввести в самом нижнем поле формы перечень слов (разделенных пробела
ми или расположенных каждое на отдельной строке), которые, в зависимо
сти от положения переключателя, будут или исключены из рассмотрения
(Ignore the following word list – Игнорировать следующий список слов),
или, наоборот, будут анализироваться только эти слова (Include only the
following word list – Включить список только следующих слов).
Отметьте, что рассматриваемым сервисом, как и сервисом SpiderView Density
Analyzer, обрабатывается только одна страница – независимо от того, указана ли
ссылка на файл, каталог или весь сайт, – та, которая будет загружена сервером по
умолчанию.
Ссылка в правом нижнем углу формы [reset] (Сброс) предназначена для очи
стки полей формы.
Чтобы сформировать отчет, щелкните по кнопке Analyze It (Провести анализ).
После обработки в браузер будет загружен отчет, состоящий из нескольких частей.
Его первая часть показана на рис. 2.44. В нее включены три таблицы со списками:
¾ всех выбранных из текста слов (Total Words);
¾ словосочетаний из двух слов (2 Word Phrases);
¾ фраз, составленных из трех слов (3 Word Phrases).
Колонки таблицы имеют следующее назначение:
¾ Count (Счетчик) – количество повторений каждого слова;
¾ Word (Слово) – перечень найденных в тексте слов;
¾ Density (Плотность) – частота появления каждого слова.
Во второй части отчета Filtered Page Entities (Объекты страницы по фильт
рам) – см. рис. 2.45 – отображено содержание существующих метатэгов: заголов
ка, ключевых слов, описания.

Украинский Генератор метатэгов

Генератор метатегов (http://www.pcdigest.net/free_web_service/ru/metamaker.


shtml) украинской метапоисковой системы Metaseek (http://www.pcdigest.net/)
представляет собой простой инструмент для быстрого написания метатэгов. За
полните требуемые поля формы (рис. 2.46), каждое из которых соответствует со
держимому соответствующего тэга, щелкните по кнопке Создать теги! – и копи
руйте с открывшейся страницы текст поля, расположенного между тэгами <HEAD>
и </HEAD> (рис. 2.47). Работа выполнена! Комментарии системы подскажут вам,
как улучшить метатэги.
Сетевые средства 141

Рис. 2.44. Первая часть отчета Keyword Density Analyzer

Рис. 2.45. Вторая часть отчета Keyword Density Analyzer


142 Автоматизация

Рис. 2.46. Форма ввода данных украинского Генератора метатегов

Проверка правописания
Фотиния – проверка грамотности Webсайтов

С февраля 1999 года в Internet действует сервис, позволяющий проверить грам


матические и орфографические ошибки на сайте или странице (на русском и ан
глийском языках). Наберите в браузере адрес http://foty.ru/, и откроется сайт,
названный по имени его автора – Фотиния (рис. 2.48).
Сетевые средства 143

Рис. 2.47. Результат работы Генератора метатегов

Рис. 2.48. Фотиния


144 Автоматизация

Работа ведется следующим образом. Если вы хотите, чтобы ваш сайт не содер
жал грамматических и орфографических ошибок, вышлите электронной почтой
по указанному адресу свои тексты или сообщите адрес вашего сайта. Фотиния
поставит вас на очередь и через какоето время (от 3 до 30 дней) проверит тексты.
При этом она обязуется обратить внимание автора только на ошибки, связанные
с правильным использованием русского или английского языка, и не придирать
ся по мелочам.
Конечно, такой сайт никак не назовешь средством автоматизации, но согласи
тесь, что сделать подобную работу на должном уровне никакая машинная про
грамма и не сможет. В итоге вы получите полный отчет обо всех замеченных
ошибках и опечатках. О качестве работы можно судить по текстам уже проверен
ных сайтов, на которые имеются ссылки.
На http://foty.ru/ есть орфографический словарь, так что, если написание каких
либо слов вызывает сомнения, вы можете быстро проверить здесь свою грамотность.
Завершить описание сайта можно объемной цитатой, взятой у его автора:
«“Святая мученица Фотиния у простого народа считается целительницею от
трясавичной болезни, и в Сказании о том, каким святым в каких болезнях долж
но молиться, полагается ей особая молитва от лихорадки. Во многих городах и
селах этой угоднице служат молебны о страждущих трясавицей, а иные выписы
вают на лоскутке бумаги тропарь мученице Фотинии и, завязав эту выпись в ве
тошку, дают больному носить ее на шее известное время – дня три или девять,
а потом заставляют его или проглотить самую записочку, или сжечь ее вместе
с ветошкою на страстной свече и съесть оставшийся от нее пепел.
На каком основании у нас мученице Фотинии усвояется дар исцеления от
трясавичной болезни, на это не находим определенного и ясного свидетельства
в церковных описаниях ее жизни”.
Но это – не про меня. Я бы написала так:
Фотиния у сетевого народа считается целительницею от распространенной бо
лезни Рунета. Во многих городах и селах этой угоднице служат молебны о страж
дущих безграмотностью, а иные выписывают по email’у тропарь мученице Фоти
нии и, отправив эту выпись по адресу fotinia@au.ru, ждут известное время – дня
три или тридцать, и никто не заставляет их ни глотать клавиатуру, ни сжигать
свой компьютер вместе с мышкою и другими периферийными устройствами и
съедать оставшийся от них пепел.
На каком основании у нас мученице Фотинии усвояется дар исцеления от
упомянутой болезни, на это не находим определенного и ясного свидетельства
в сетевых описаниях ее жизни – по причине их отсутствия.
А отец Александр, давший некоторое время назад мне это имя, возможно,
знал – как оно повлияет на мою судьбу. Но не предупредил…»

Другие службы русского языка


Наличие подобных служб русского языка в Internet автору неизвестно. Поэтому
остается перечислить сайты, где можно воспользоваться какимилибо словарями
или получить справку по интересующему вас языковому вопросу:
Программы 145
¾ ГРАМОТА.РУ. Справочноинформационный портал (http://www.gramo
ta.ru/);
¾ Справочная служба русского языка (http://rusyaz.ru/);
¾ Правила русской орфографии и пунктуации (http://rusyaz.ru/pr/);
¾ Культура письменной речи (http://www.gramma.ru/);
¾ Русские словари. Служба русского языка (http://www.slovari.ru/);
¾ Толковый словарь русского языка С. И. Ожегова и Н. ⇒. Шведовой (http://
mega.km.ru/ojigov/);
¾ Пособие по орфографии русского языка (http://www.yamal.org/ook/);
¾ Записки корректора (http://www.bronenosets.narod.ru/);
¾ Русское письмо (http://character.webzone.ru/);
¾ Форум RU.SPELLING (http://www.spelling.spb.ru/);
¾ Форум «Русский язык в Интернете» (http://klyaksa.country.ru/wtboard/).

Программы
Комплексные решения
Linkbot Developer Edition 6.0

Linkbot Developer Edition – это программа, предназначенная для всестороннего


тестирования Webсайтов. Автоматически сканируя вебсайт, она способна про
верить в его структуре до 100 000 ссылок и выявить более пятидесяти недочетов,
способных вызвать сбои в работе сайта. Linkbot анализируют достижимость,
функциональность и работоспособность вебсайта и генерирует графические и
текстовые отчеты, где подробно перечислены найденные ошибки.
Программа перестала существовать под названием Linkbot и теперь стала частью
программы WebQA (http://www.watchfire.com/products/desktop/webqa/default.aspx),
которая выпускается фирмой Watchfire Corporation (:http://www.watchfire.com/).
Однако ее можно найти во многих архивах программ (например: ftp://ftp.pczone.co.uk/
pub/pcpro/essentials/internet/linkbot.zip, http://www.greenbox.ru/dl/?id_file=
11858&id_area=225), поэтому мы сначала опишем работу с Linkbot, а затем – с WebQA.
Программа работает в пяти режимах: основное сопровождение, отображение
структуры (карты) сайта, ремонт, автоматизация, отчеты.
Режим основного сопровождения предназначен для выполнения следующих
задач:
¾ проверка внутренних и внешних ссылок;
¾ выявление файлов, на которые отсутствуют ссылки;
¾ определение новых, старых и медленно загружающихся страниц;
146 Автоматизация

¾ выявление страниц с пропущенным тэгом <TITLE> и атрибутами в тэгах


изображений;
¾ проверка синтаксиса адресов электронной почты.
Фильтры, запускаемые нажатием соответствующих кнопок на панели инстру
ментов, позволяют изолировать файлы, для которых характерна любая из упомя
нутых погрешностей. После внесения исправлений можно снова проверить отме
ченные файлы, чтобы убедиться в достижении положительного результата.
Режим построения карты сайта позволяет исследовать его структуру и орга
низацию. Карта сайта может быть показана графически в правой части окна про
екта. Используя указанный режим, можно сделать следующее:
¾ построить связи, которые ведут к выбранному URLадресу или исходят из
него;
¾ отсортировать адреса по заголовку, описанию, автору, размеру, дате после
днего изменения, типу;
¾ выделить специфические файлы или создать условия для их выделения
с помощью фильтров. Это позволяет просматривать подмножества сайта,
например, со ссылками по FTP или со всеми недоступными ссылками;
¾ распечатать графическое представление сайта.
Linkbot находит недоступные («плохие») адреса и исправляетих благодаря
функции интеллектуального поиска и замены. Редактировать файлы можно, не
выходя из программы с помощью любого HTMLредактора.
Чтобы автоматизировать сканирование адресов, разработчики предусмотрели
функцию планирования. Например, вы можете настроить программу таким обра
зом, чтобы каждое воскресенье в 0 часов сканировался адрес http://www.mysite.ru,
и в понедельник утром к началу рабочего дня результаты просмотра будут готовы.
Для всестороннего анализа итогов сканирования создаются разнообразные
отчеты. Сообщения об обнаруженных проблемах выделены в них цветом и сгруп
пированы под пятью основными заголовками:
¾ Summary (Резюме). Включает в себя отчеты: Overview (Обзор), Site Statistics
(Статистика сайта), Scan Statistics (Статистика сканирования), Recom
mendations (Рекомендации) и Quality Rating (Оценка качества);
¾ Errors (Ошибки). Включает в себя отчеты: Broken Links (Недоступные ссыл
ки), Broken Anchors (Недоступные метки), Problem Pages (Страницы
с ошибками) и Local Files (Локальные файлы);
¾ Usability (Доступность). Включает отчеты: Slow Pages (Медленно загружае
мые страницы) и Deep Pages (Страницы с глубокой вложенностью ссылок);
¾ Maintenance (Сопровождение). Включает в себя отчеты: Orphan Files
(Файлы, на которые нет ссылок), Warnings (Предупреждения), Missing
Titles (Пропущенные заголовки), New Pages (Новые страницы), Old
Pages (Старые страницы), Small Pages (Страницы малого размера),
Missing Attributes (Пропущенные атрибуты) и Metadata (Метаданные).
Кроме того, создаются Site Map (Карта сайта) и Image Catalog (Каталог
изображений);
Программы 147
¾ Editor Reports (Отчеты редактора). Обеспечивается оперативная подсвет
ка ключевых характеристик выбранной страницы: недоступных ссылок,
синтаксиса HTML, размера страницы, пропущенных атрибутов и уже ис
пользованных метаданных.

Системные требования
Для работы программы к системе предъявляются следующие минимальные тре
бования:
¾ IBMсовместимый компьютер с процессором класса Pentium;
¾ разрешение экрана 800×600 пикселов при 16разрядной цветовой гамме;
¾ операционная система Windows 98/2000/NT 4.0 SP6;
¾ оперативная память 64 Мб (для сканирования сайтов с количеством ссы
лок, приближающимся к предельному для программы числу 100 000, реко
мендуется 128 Мб);
¾ 15 Мб свободного пространства на жестком диске для установки программы;
¾ установленный на компьютере браузер Microsoft Internet Explorer 4.0 или
выше (для встроенного просмотра страниц).

Краткий обзор возможностей программы


Чтобы начать сканирование сайта, выберите один из следующих методов:
¾ введите нужный адрес в поле URL (рис. 2.49) на панели инструментов про
граммы, как обычно делается в браузерах. Это стартовый адрес, с которого
начнется сканирование сайта. Здесь же можно задать и путь к файлу в ло
кальной системе. Программа автоматически приведет его к необходимому
формату. При щелчке по кнопке , расположенной справа от поля, откро
ется список недавно вводившихся адресов;

Рис. 2.49. Поле URL на панели инструментов программы

¾ воспользуйтесь пунктом меню File ⇒ Project ⇒ New (Файл ⇒ Проект ⇒


Создать) и введите адрес в открывшемся окне New Project (Новый про
ект), показанном на рис. 2.50;
¾ для выбора файла на диске вашего компьютера или в локальной сети щелкни
те по кнопке Browse… (Обзор), расположенной в том же окне New Project,
или по кнопке Open HTML File
(Открыть HTMLфайл) ,
размещенной на панели инст

Рис. 2.50. Окно New Project


148 Автоматизация

рументов справа от поля URL. Нажмите на клавишу Enter. Программа


начнет сканирование страниц сайта с указанного адреса и не остановится
до тех пор, пока не произойдет одно из следующих событий:
¾ вы щелкнете по кнопке Stop (Стоп) или выберете пункт меню Scan ⇒
Stop (Сканирование ⇒ Стоп);
¾ будут проверены все ссылки;
¾ число проверенных ссылок достигнет значения, указанного в настрой
ках Scan Options (Параметры сканирования), или 100 000 – предела,
установленного в программе Linkbot Developer Edition.
Во время сканирования вращается цепочка на пиктограмме в верхнем правом
углу окна. При этом анализируются все ссылки, связанные со стартовым доку
ментом (базовым URLадресом). В зависимости от объема сайта и скорости со
единения с Internet на такую обработку может уйти от нескольких секунд до не
скольких минут. По умолчанию программа сканирует весь сайт, однако заметим,
что в ней существует возможность настроить параметры просмотра и тем самым
ограничить число проверяемых страниц.
Обратите внимание, что внешние ссылки также проверяются, а ссылки вне
шних сайтов – нет.
Если на проверяемом сайте обнаружены формы, требующие ввода данных,
программа сделает запрос на их исследование. Для продолжения ответьте Да,
введите информацию для формы и выберите Scan ⇒ Check Current List (Скани
рование ⇒ Проверить текущий список).
После сканирования результаты выводятся в левой и правой панелях окна
Project (Проект) – см. рис. 2.51.

Рис. 2.51. Окно Project с результатами сканирования


Программы 149
Интерфейс программы
Доступ к богатым функциональным возможностям программы обеспечивается
хорошо продуманным, удобно организованным пользовательским интерфейсом.
Рассмотрим его подробнее.
Меню
Главное меню программы состоит из шести пунктов: File (Файл), Edit (Правка),
View (Вид), Tools (Инструменты), Scan (Сканирование) и Help (Помощь). Об
ратите внимание, что не все пункты меню доступны, пока не открыт проект.
Пункт меню File ⇒ Project (Файл ⇒ Проект) предназначен для создания, от
крытия, закрытия и сохранения проектов Linkbot. Сюда включены следующие
команды:
¾ File ⇒ Project ⇒ New (Файл ⇒ Проект ⇒ Создать);
¾ File ⇒ Project ⇒ Open (Файл ⇒ Проект ⇒ Открыть);
¾ File ⇒ Project ⇒ Close (Файл ⇒ Проект ⇒ Закрыть);
¾ File ⇒ Project ⇒ Save (Файл ⇒ Проект ⇒ Сохранить);
¾ File ⇒ Project ⇒ Save As (Файл ⇒ Проект ⇒ Сохранить как).
Пункт меню File ⇒ Import (Файл ⇒ Импорт) служит для загрузки файла па
раметров (файла с расширением .ini) из другого проекта Linkbot.
С помощью команды File ⇒ Export (Файл ⇒ Экспорт) содержимое правой
панели окна экспортируется в HTML или текстовый файл с разделителями для
использования в электронных таблицах. Кроме того, можно экспортировать
файл параметров (INIфайл) для использования в проекте программы Linkbot
Enterprise Server. В пункт Export включены следующие команды: HTML Index
(HTML индексный), Delimited Text (Текстовый файл с разделителями) и Options
(Параметры).
Пункты меню File ⇒ Print (Файл ⇒ Печать) и File ⇒ Print Setup (Файл ⇒ На
стройка печати) предназначены для распечатки содержимого правой панели.
Команда File ⇒ Recent Projects (Файл ⇒ Последние проекты) служит для
быстрого открытия последних из открывавшихся проектов.
Выполнив операцию File ⇒ Exit (Файл ⇒ Выход), вы завершите работу с про
граммой и закроете ее окно.
Пункты меню Edit ⇒ Cut (Правка ⇒ Вырезать), Edit ⇒ Copy (Правка ⇒ Ко
пировать) и Edit ⇒ Paste (Правка ⇒ Вставить) предназначены для редактирова
ния файлов в правой панели окна на вкладке HTML.
Команда Edit ⇒ Find (Правка ⇒ Найти) применяется для поиска файлов или
каталогов в правой панели окна по заданному фрагменту текста.
Часть команд в пункте меню View (Вид) служит для выбора способа отобра
жения файлов в левой панели окна:
¾ View ⇒ Link URL (Вид ⇒ Ссылка по URL) – показан полный URLадрес
каждого файла;
¾ View ⇒ Link Description (Вид ⇒ Ссылка по описанию) – на экран выво
дится описание каждого файла;
150 Автоматизация

¾ View ⇒ Link Title (Вид ⇒ Ссылка по заголовку) – для каждого файла по
казан заголовок; а если таковой отсутствует, – URLадрес;
¾ View ⇒ Link File Path (Вид ⇒ Ссылка по пути к файлу) – отображается
путь к файлу.
Пункт меню View ⇒ Toolbars (Вид ⇒ Панели инструментов) используется
для настройки имеющихся панелей инструментов или создания новых.
Опция View ⇒ Suggestion Window (Вид ⇒ Окно возможных решений) пред
назначена для вывода на экран окна с советами, основанными на результатах ска
нирования.
Командой Tools ⇒ Scheduler (Инструменты ⇒ Планировщик) вызывается пла
нировщик Linkbot.
Пункт меню Tools ⇒ Validate HTML (Инструменты ⇒ Проверка правильно
сти HTMLкода) служит для запуска функции выявления ошибок в HTMLкоде.
Tools ⇒ Generate Map (Инструменты ⇒ Генерировать карту) применяется
для отображения в окне программы карты сайта.
Tools ⇒ Repair (Инструменты ⇒ Ремонт) позволяет исправить некорректные
ссылки.
При выборе Tools ⇒ Orphan Analysis (Инструменты ⇒ Анализ «потерянных
файлов») будет вызван Мастер анализа и откроется окно Server Information
Configuration (Конфигурация информации о сервере), показанное на рис. 2.52.
Указанная операция производится с целью поиска файлов, на которые нет ссы
лок (так называемых потерянных файлов). С помощью переключателя укажите
расположение документов: Use FTP based files (Использовать файлы с FTPсер
вера) или Use local site for files (Использовать локальные файлы). Если такой
анализ предполагается выполнять при каждом сканировании, включите флажок
Run as part of Site Scan (Запускать вместе со сканированием сайта) и щелкните
по кнопке Next (Далее).

Рис. 2.52. Окно Мастера анализа Server Information Configuration


Программы 151
В очередном окне Мастера анализа, изображенном на рис. 2.53, отметьте поле
Use base of starting URL (Использовать стартовый адрес как базу), если старто
вый адрес для сканирования и каталог для поиска потерянных файлов совпада
ют. В противном случае задайте нужный каталог в поле Specify Base (Укажите
базу). Щелкните по кнопке Next (Далее).

Рис. 2.53. Очередное окно Мастера анализа

В последнем окне Мастера, показанном на рис. 2.54, введите в поле Initial


Directory (Начальный каталог) полный путь к стартовому каталогу, с которого
начнется анализ. Если вы работаете с файлами на локальном компьютере, для
удобства можно воспользоваться кнопкой Browse (Обзор). При редактировании
файлов в программе создаются служебные папки, файлы в которых не имеет смыс
ла анализировать. В таком случае включите флажок Ignore FrontPage directories
(Пропускать папки программы FrontPage). Щелкните по кнопке Finish (Готово).

Рис. 2.54. Последнее окно Мастера анализа


152 Автоматизация

Впоследствии с помощью команды Tools ⇒ Orphan Analysis поиск потерян


ных файлов будет выполняться сразу, без применения Мастера анализа.
При выборе пункта меню Tools ⇒ Project Options (Инструменты ⇒ Параметры
проекта) откроется окно Options (Параметры), где можно произвести настройки для
текущего проекта или установить опции, используемые по умолчанию.
Команда Tools ⇒ Validator Options (Инструменты ⇒ Параметры программы
проверки кода) позволяет настроить конфигурацию и задать параметры про
граммы проверки правильности HTMLкода.
С помощью пункта меню Scan (Сканировать) запускается сканирование сайта.
Help (Помощь) служит для обращения к интерактивной справке, учебнику,
сайту фирмыпроизводителя программы, «совету дня» и подробной информации
о вашей версии Linkbot.
Панели инструментов
Программа Linkbot имеет многофункциональные панели инструментов для вы
полнения следующих задач:
¾ открытие и сохранение проектов;
¾ показ реквизитов выбранной ссылки;
¾ запуск программы проверки HTMLкода;
¾ запуск внешнего редактора;
¾ фильтрация файлов на правой панели окна для удобного просмотра.
Для работы с проектом используются кнопки панели инструментов. Они име
ют следующее назначение:

New Linkbot Project (Создать проект Linkbot) – создание нового проект;

Open Linkbot Project (Открыть проект Linkbot) – открытие файла про


екта (filename.bot);

Save Linkbot Project (Сохранить проект Linkbot) – сохранение суще


ствующего проекта;

Rotate Fields in List View (Изменить порядок следования полей) – изме


нение очередности следования колонок на вкладках правой панели окна
Children (Потомки) или Parents (Предки);

Launch Browser (Загрузить браузер) – запуск браузера для просмотра


страницы по адресу, выбранному в поле URL;

Launch Editor (Загрузить редактор) – загрузка внешнего редактора для


правки файла или страницы по выбранному адресу;
Программы 153

Launch HTML Validator (Загрузить программу проверки HTMLкода) –


проверка синтаксиса HTMLфайла;

Show Properties (Показать свойства) – отображение свойств ссылки по


выбранному URLадресу, включая: статус, тип, размер, загружаемый объем,
описание, заголовок документа, дату последнего изменения и авторство;

Back (Назад) – возврат к предыдущей странице. Кнопка доступна толь


ко на вкладке Browse (Просмотр);

Forward (Вперед) – переход к следующей странице. Кнопка доступна


только на вкладке Browse;

Stop (Стоп) – прекращение загрузки текущей страницы. Кнопка также


доступна только на вкладке Browse.
Остальные кнопки на панели инструментов – это кнопки фильтров.
Вкладки правой панели
На вкладке Children (Потомки), показанной на рис. 2.55, отображаются URLадре
са, которые ведут со страницы, выбранной в левой панели окна. Вкладка Parents
(Предки), показанная на рис. 2.56, содержит URLадреса, ведущие к странице или
файлу, которые выбраны в левой панели окна.

Рис. 2.55. Вкладка Children правой панели окна проекта


154 Автоматизация

Рис. 2.56. Вкладка Parents правой панели окна проекта

На обеих указанных вкладках назначение колонок идентично: в них отражена


статистика для каждого представленного адреса. Она не всегда бывает полной,
так как адреса отличаются по типу, а некоторые серверы не обеспечивают нуж
ных данных. Пустая колонка означает, что статистика недоступна. Ниже приве
дено описание каждой колонки.
¾ Link URL (URLадрес ссылки) – адрес проверяемой ссылки. Тип каждого
адреса отмечен соответствующей пиктограммой.
¾ Link Status (Состояние ссылки) – состояние ссылки, которое может быть
описано следующим образом:
¾ OK – ссылка работает;
¾ Warn (Предупреждение) – адрес изменен временно или на длительный
срок. При обращении к ссылке происходит перенаправление запросов.
Предупреждение может указывать также на синтаксическую ошибку
в написании адреса;
¾ Not checked (Не проверено) – проверить тип ссылки не удалось. Обычно
такое сообщение возникает, когда анализ данного типа ссылки не поддержи
вается программой или запрещен настройками параметров сканирования.
¾ Error (Ошибка) – ссылка недоступна, или допущена синтаксическая
ошибка в написании почтового адреса. Возможны следующие причины:
¾ Not found (Не найден) – указанный в адресе файл не найден на сер
вере, поскольку, вероятно, был удален или переименован;
¾ Connect failure (Ошибка соединения) – либо сервер больше не су
ществует, либо его адрес написан неверно;
¾ Timeout (Время ожидания истекло) – сервер не ответил на запрос за
положенное время, которое задается в параметрах соединения. Если
программа выдает одно из двух последних сообщений при анализе
Программы 155
ссылок, в работоспособности которых вы уверены, попробуйте умень
шить количество одновременно открываемых соединений: вполне
возможно, что на установленной скорости соединения сервер не успе
вает обработать все запросы;
¾ Unauthorized (Отсутствует авторизация) – для загрузки страницы тре
буются имя пользователя и пароль. Их можно задать в параметрах
HTTPсоединения для сканирования.
¾ Unknown (Не определено) – программа не может определить состоя
ние ссылки. Сообщение появляется, если: не поддерживается требуе
мый протокол или анализ был преждевременно прекращен, и програм
ма не смогла проверить ссылку.
¾ Hits (Нажатия) – количество посещений страницы, зарегистрированных
в logфайле посещений сервера.
¾ Link Description (Описание ссылки) – текст, размещенный на ссылке.
¾ Link Document Title (Заголовок документа ссылки) – содержимое тэга
<TITLE> страницы.
¾ Author (Автор) – имя автора, создавшего HTMLдокумент. Такая инфор
мация может отсутствовать, поскольку не все разработчики сайтов вклю
чают ее в свои страницы.
¾ Last Modified (Дата последнего изменения) – срок последнего изменения до
кумента. Эти данные также могут отсутствовать по указанной выше причине.
¾ Type (Тип) – тип ссылки: HTTP, FILE, Mailto, News, FTP и т. д.
¾ Size (Размер) – объем HTMLдокумента или изображения в байтах.
Вкладка HTML, показанная на рис. 2.57, предназначена для отображения ис
ходного HTMLкода страницы, выбранной в левой панели окна программы.
Здесь же можно редактировать код страницы, что, однако, не рекомендуется.

Рис. 2.57. Вкладка HTML правой панели окна проекта


156 Автоматизация

Вкладку Browse (Обзор), показанную на рис. 2.58, используют для просмотра


страницы по адресу, выбранному в левой панели окна программы, аналогично
тому, как это делается в любом браузере. Для обзора страниц требуется, чтобы на
компьютере был установлен обозреватель Microsoft Internet Explorer.

Рис. 2.58. Вкладка Browse правой панели окна проекта

Вкладка Properties (Реквизиты), показанная на рис. 2.59, позволяет вывести


общие статистические характеристики адреса, выбранного в левой панели окна
проекта, и включает в себя следующие сведения:
¾ Link Type (Тип ссылки);
¾ Link URL (Адрес ссылки);
¾ Link Status (Состояние ссылки);
¾ Link Description (Описание ссылки);
¾ Document Title (Заголовок документа);
¾ Document Type (Вид документа);
¾ Last Modified (Дата последнего изменения);
¾ Document Size (Размер документа);
¾ Download Size (Размер документа с учетом встроенных элементов: графи
ков и фреймов);
¾ Author (Автор);
¾ Parent URL (Адреса ссылокпредков). Если в левой панели окна проекта выб
ран режим Orphaned Files (Потерянные файлы), данное поле отсутствует.
Чтобы увидеть общую статистику сайта, выберите в раскрывающемся списке
левой панели окна проекта режим URL Tree (Дерево URLадресов) и пункт All
Links (Все ссылки), расположенный на вершине дерева адресов. Во вкладке
Программы 157

Рис. 2.59. Вкладка Properties правой панели окна проекта

Properties правой панели будет показано количество файлов каждого типа:


HTML, HTTP, HTTPS, IMAGE, MAILTO, FTP, APPLET, OTHER и TOTAL – по
всему сайту. Кроме того, в поле DURATION (Продолжительность) будет отобра
жено общее время сканирования.
Вкладка Site Map (Карта сайта), представленная на рис. 2.60, показывает
структуру сайта в виде трехмерной диаграммы.

Рис. 2.60. Вкладка Site Map правой панели окна проекта


158 Автоматизация

Вкладка Reports (Отчеты) – рис. 2.61 – предназначена для вывода самых раз
нообразных данных о сайте в виде статистических отчетов. В левой панели окна
проекта представлен список всех генерируемых отчетов, а в правой – содержание
каждого из них. Программа рассчитана на подготовку девятнадцати отчетов
с информацией об отдельных параметрах сайта.

Рис. 2.61. Вкладка Reports правой панели окна проекта

Строка состояния
В строке состояния, изображенной на рис. 2.62, отражается ход процесса скани
рования. Здесь же по его завершении выводятся результаты.

Рис. 2.62. Строка состояния программы Linkbot Developer Edition

Строка состояния находится внизу окна программы Linkbot Developer Edition


и содержит следующие информационные поля:
¾ Checking Site (Проверяемый сайт) – URL анализируемого сайта. После
проверки надпись меняется на следующую: Checking completed in …
minutes and … seconds (Проверка завершена за … минут и … секунд);
¾ Found (Найдено) – число ссылок, обнаруженных в результате сканирования;
Программы 159

¾ Checked (Проверено) – количество проверенных ссылок;


¾ Bad (Плохие) – число ссылок, отнесенных к разряду недоступных;
¾ Orphans (Потерянные файлы) – количество потерянных файлов, если вклю
чен режим Orphan Analysis;
¾ Speed (Скорость) – средняя скорость процесса сканирования, определяе
мая числом проверенных ссылок в минуту;
¾ Total Time (Общее время) – время, затраченное программой на сканирова
ние всего сайта.

Сканирование
В программе Linkbot реализован так называемый пакетный режим работы, то
есть исследуется сразу целая группа сайтов. Остановимся на этом подробнее.

Сканирование по списку адресов


Программа позволяет провести проверку по списку адресов. Этот список задает
ся в текстовом файле с разделителями, который имеет расширение .wu и служит
отправной точкой для сканирования. Каждый адрес, записанный в таком файле,
должен находиться на отдельной строке, то есть отделяться от другого адреса
символом конца строки. Например, если в какойто базе данных есть поле для
адресов в Internet, то вы можете написать соответствующий SQLзапрос, выгру
зить содержимое указанного поля в файл с расширением .wu и использовать его
имя как стартовый адрес для проекта.
Типичный файл в формате WU выглядит, как пока
зано на рис. 2.63.
Если программа Linkbot Developer Edition при скани
ровании Webсервера достигнет файла в формате WU,
она поступит точно так же, как если бы он находился на Рис. 2.63. Содержимое
локальной машине. Однако сервер должен быть сконфи файла в формате WU
гурирован надлежащим образом, чтобы распознать соот
ветствующий MIMEтип.
Для сканирования файла со списком адресов введите в поле URL путь к фай
лу и нажмите клавишу Enter. Программа преобразует пути в URLадреса, отска
нирует их и подготовит отчеты.

Сканирование по списку файлов


Можно указать список файлов с полными маршрутами к ним в текстовом файле
с разделителями. Такой документ будет сохранен с расширением .wf и указан как
стартовый для начала сканирования. Каждое имя файла должно располагаться
на отдельной строке, то есть имена разделяются символом перевода строки. На
пример, если вы хотите проверить каталог или несколько каталогов с HTMLдо
кументами, перечислите их в файле с расширением .wf и укажите его имя в каче
стве начального адреса для сканирования. Вид типичного файла в формате WF
представлен на рис. 2.64.
160 Автоматизация

Рис. 2.64. Содержимое файла в формате WF

Такой файл создается в любом текстовом редакторе или даже


в командной строке DOS.
Если программа при сканировании Webсервера встретит файл в формате WF,
она поступит так же, как если бы он находился на локальной машине. Однако
сервер должен быть сконфигурирован надлежащим образом, чтобы распознавать
соответствующий MIMEтип.
Для сканирования списка файлов введите в поле URL путь к файлу, содержа
щему список, и нажмите Enter. Программа преобразует пути в адреса URL, отска
нирует их, подготовит отчеты.
Приостановка и возобновление сканирования
В любое время сканирование сайта может быть прервано нажатием кнопки Stop
(Стоп) на панели инструментов или командой Scan ⇒ Stop (Сканирова
ние ⇒ Стоп). При этом результаты проверки будут неокончательными.
Чтобы возобновить процесс, воспользуйтесь пунктом меню Scan ⇒ Continue
(Сканирование ⇒ Продолжить). В строке состояния будут восстановлены акту
альные значения, и программа продолжит проверку сайта с того места, где было
остановлено сканирование. Результаты будут выведены в обычном виде, словно
остановки не было.
Повторная проверка
Повторное тестирование сайта целесообразно в следующих случаях:
¾ вы исправили ошибки и хотите проверить свою работу;
¾ вы считаете нужным заново проанализировать все внешние ссылки, чтобы
убедиться в их работоспособности;
¾ вы хотите перепроверить весь сайт, чтобы оценить его новое содержание.
Для повторной проверки сайта предназначены три опции меню Scan (Скани
рование):
¾ Re check Current List (Повторная проверка текущего списка);
¾ Re check Selected (Повторная проверка выделенного фрагмента);
¾ Entire (Целиком).
Обратите внимание, что повторно тестируются только ссылки на вкладках
Children (Потомки) или Parents (Предки).
При повторной проверке проекта, созданного в программе Linkbot Enterprise
Server, команда Scan ⇒ Entire (Сканирование ⇒ Целиком) недоступна.
Для повторной обработки группы ссылок выполните следующие действия:
1. Выберите в левой панели из раскрывающегося списка строку All Links
(Все ссылки).
2. В правой панели перейдите на вкладку Children (Потомки).
3. На панели инструментов щелкните по кнопкам подходящих фильтров.
Программы 161
4. Если требуется, выделите нужные файлы в правой панели с помощью кла
виш Shift или Ctrl.
5. Выберите пункт меню Scan ⇒ Re check Current List (Сканирование ⇒ По
вторная проверка текущего списка) либо Scan ⇒ Re check Selected (Ска
нирование ⇒ Повторная проверка выделенного фрагмента). Или же можно
щелкнуть правой кнопкой мыши и выбрать из контекстного меню строку
Re check Selected.

Страницы, защищенные паролем


В программе Linkbot предусмотрена защита информации. При этом все страни
цы или каталоги должны быть защищены одинаковыми именем пользователя
(user ID) и паролем.
Для объявления имени пользователя и пароля, которые будут применены по
умолчанию, выполните следующие действия.
1. Выберите пункт меню Tools ⇒ Project Options ⇒ New Project (Инструмен
ты ⇒ Параметры Проекта ⇒ Новый проект) или Tools ⇒ Project Options ⇒
Current Project (Инструменты ⇒ Параметры Проекта ⇒ Открытый про
ект). Откроется окно New Project Options (Параметры нового проекта), по
казанное на рис. 2.65, или Options for [имя проекта] (Параметры для [имя
проекта]) соответственно.
2. В левой части окна выберите пункт General ⇒ Connections ⇒ HTTP (Об
щие ⇒ Соединения ⇒ Протокол HTTP).
3. В правой части окна поставьте флажок Use the following Username and
Password for authenticated pages (Для защищенных страниц использо
вать следующие имя пользователя и пароль) и заполните поля Username
(Имя пользователя) и Password (Пароль). Щелкните по кнопке OK.

Рис. 2.65. Окно New Project Options


162 Автоматизация

Сканирование форм
Программа Linkbot Developer Edition умеет сканировать ссылки, исходящие из
форм, даже если предполагается ввод данных в форму. Например, для открытия
некоторой страницы требуется ввести имя пользователя и пароль. В этом случае
входные данные вводятся с помощью специального интерфейса поддержки форм.
Они могут быть сохранены для дальнейшей работы – это означает, что, когда
программа встречает такую форму, входные данные вводятся автоматически и
ссылки, ведущие с формы, проверяются.
Для вызова форм выберите в левой панели окна из раскрывающегося списка
строку Pages with Forms (Страницы с формами). Если во время сканирования
сайта будет выдан запрос Linkbot Developer Edition has found Forms on your
Web site. Would you like to fill out these forms and submit them now? (Программа
нашла на сайте формы. Заполнить и проверить их?), ответьте Yes (Да). Linkbot
автоматически установит в левой панели режим Pages with Forms и вызовет ин
терфейс поддержки форм.
Интерфейс поддержки форм
Интерфейс поддержки форм (рис. 2.66) предназначен для обзора форм и ввода
в них входных данных.

Рис. 2.66. Интерфейс поддержки форм,


реализуемый программой Linkbot Developer Edition

В левой панели отображается список форм, найденных на сайте. Щелкните по


любой строке списка, и в правом нижнем окне откроется страница с формой.
Программы 163
Слева от каждой строки списка присутствует пиктограмма, служащая инди
катором состояния формы. Пиктограммы свидетельствуют о следующем:
– данные в форму не вводились или были удалены;

– форма заполнена данными;

– новая форма еще не сканировалась, и данные в нее не вводились;

– форма изменялась с момента последнего ввода данных.


Панель обзора (в правом нижнем окне) предназначена для отображения
формы в виде, аналогичном выводимому в окне браузера. Заполнять форму
следует именно здесь, равно как и щелкнуть по кнопке, предназначенной для
отправки формы. После ввода ваша информация появится на панели данных,
в правом верхнем окне. Перед вводом убедитесь, что форма полностью загруже
на в окно.
Обратите внимание, что на панели обзора гиперссылки неактивны.
Отметим, что данные разного рода можно вводить многократно. Одинаковые
данные нельзя ввести повторно.
Колонки на панели данных имеют следующее назначение:
¾ Link URL (Адрес ссылки) – приведен адрес, по которому будут отправле
ны данные после их ввода в форму;
¾ Post Data (Отправленные данные) – отображены значения данных, вве
денных в форму. Если в ней не использован метод POST, поле останется
пустым, а строка значений будет добавлена к адресу в поле Link URL;
¾ Save (Сохранять) – показано, сохранены ли данные как в файле проекта,
так и для последующего сканирования. Можно щелкнуть по интересую
щей вас строке правой кнопкой мыши и, если по
зволяют параметры настройки поддержки форм,
вызвать контекстное меню (рис. 2.67). Здесь сле
дует отметить пункт Save Post Data (Сохранять
отправленные данные) или снять флажок возле
него. Пункт Delete Post Data (Удалять отправ Рис. 2.67. Контекстное
ленные данные) предназначен для удаления всей меню для настройки
строки с данными. данных формы
Чтобы после ввода данных сканировать имеющиеся
в формах ссылки, выполните команду Scan ⇒ Re check Current List (Сканирова
ние ⇒ Повторная проверка текущего списка).
Файл проекта можно сохранить, оставив в нем данные, введенные в формы.
Это допускается только в случае, если при настройке параметров для форм не
включен флажок Don’t save form input data to BOT file (Не сохранять данные
для форм вместе с проектом).
Если из соображений конфиденциальности вы не хотите сохранять данные
для форм в файле проекта, выполните следующие действия:
164 Автоматизация

1. Воспользуйтесь пунктом меню Tools ⇒ Project Options ⇒ New Project (Ин


струменты ⇒ Параметры Проекта ⇒ Новый проект) или Tools ⇒ Project
Options ⇒ Current Project (Инструменты ⇒ Параметры Проекта ⇒ Откры
тый проект). Откроется окно New Project Options (Параметры нового про
екта) или Options for [имя проекта] (Параметры для [имя проекта]) соот
ветственно.
2. В левой части окна выберите пункт Project ⇒ Scan ⇒ Forms (Проект ⇒ Ска
нирование ⇒ Формы), как показано на рис. 2.68.

Рис. 2.68. Окно Options for…

3. В правой части окна отметьте пункт Don’t save form input data to BOT file
(Не сохранять данные для форм вместе с файлом проекта). Щелкните по
кнопке OK.
При такой настройке все значения строк в колонке Save панели данных будут
переключены в состояние No, и перевести их в состояние Yes будет невозможно.
Здесь же, в окне настройки параметров проекта, можно отказаться от выдачи сооб
щения в тот момент, когда программа встречает форму. Достаточно отключить опцию
Prompt when new forms are found (Предупреждать при обнаружении новых форм).
Открытие и сохранение проектов
Результаты сканирования сохраняются в файле формата BOT (filename.bot). На
пример, при обработке узла http://sound.agava.ru по умолчанию создается файл
проекта с именем sound_agava_ru.bot. В файле хранится следующая информация:
¾ результаты сканирования;
¾ все параметры настроек;
¾ стартовый (базовый) URLадрес.
Программы 165
Такой файл можно использовать в дальнейшем для повторного сканирования
сайта, сравнения результатов и отслеживания изменений.
Чтобы открыть проект, щелкните по кнопке Open Linkbot Project (Открыть
проект Linkbot) на панели инструментов или выберите пункт меню File ⇒
Project ⇒ Open (Файл ⇒ Проект ⇒ Открыть). Если вы открываете проект, со
зданный в программе Linkbot Enterprise Server, появится соответствующее пре
дупреждение. В нем сообщается, что некоторые возможности программы
Linkbot Developer Edition заблокированы для подобных проектов. Щелкните
по кнопке OK.
Чтобы сохранить проект в файле формата BOT, нажмите на кнопку Save
Linkbot Project (Сохранить проект Linkbot) на панели инструментов или
выберите пункт меню File ⇒ Project ⇒ Save (Файл ⇒ Проект ⇒ Сохранить).
В открывшемся окне задайте путь к файлу и впишите его имя. Расширение .bot
будет добавлено автоматически.
Если проект создавался в программе Linkbot Enterprise Server, документ можно
сохранить только с помощью команды меню File ⇒ Project ⇒ Save As (Файл ⇒
Проект ⇒ Сохранить как). При этом следует самостоятельно выбрать нужный
формат botфайла – программы Linkbot Enterprise Server или Linkbot Developer
Edition. Обратите внимание, что в последнем случае сохранятся только первые
сто тысяч ссылок, а информация об остальных будет утеряна.
Окно возможных решений
Если во время работы программы отсканированы не все ссылки, то выдается
пояснительное сообщение с указанием причин. После сканирования выберите
пункт меню View ⇒ Suggestion Window (Вид ⇒ Окно возможных решений).
Откроется окно, показанное на рис. 2.69, с советами, как разрешить возникшие
проблемы.

Рис. 2.69. Окно Suggestion Window


166 Автоматизация

Результаты сканирования
Результаты сканирования можно увидеть в левой и правой панелях окна програм
мы. Левая панель снабжена раскрывающимся списком, который позволяет выб
рать тот или иной вид представления итоговых данных. Правая панель состоит из
нескольких вкладок, которые в сочетании с вариантами, представленными на ле
вой панели, дают возможность увидеть отчеты в разнообразном исполнении.
Для ускорения работы предусмотрены комбинации «горячих» клавиш, спи
сок которых представлен в табл. 3.

Таблица 3. «Горячие» клавиши


Комбинация клавиш Результат
Ctrl + A Служит для перевода курсора в поле URL
Ctrl + C Копировать
Ctrl + K Остановить проверку
Ctrl + Alt + L Включить регистрацию процесса работы программы
в logфайл
Ctrl + N Новый файл
Ctrl + O Открыть файл
Ctrl + P Печатать файл
Ctrl + S Сохранить файл
Ctrl + Alt + T Создать текстовый файл с разделителем (запятая) –
отчет ПредкиПотомки (ParentChild.csv)
Ctrl + V Вставить
Ctrl + X Вырезать
Ctrl + Z Отменить

Раскрывающийся список в левой панели позволяет включить следующие ре


жимы просмотра списков, диаграмм и графических схем:
¾ Directory Tree (Дерево каталогов) – дерево каталогов Webсайта;
¾ URL Tree (Дерево URLадресов) – структура сайта представлена в виде
дерева, что облегчает исследование интерактивности сайта и перемещение
по нему. Внешне такая структура напоминает Проводник Windows. По ва
шему усмотрению ссылки могут быть развернуты до требуемого уровня
вложенности и свернуты обратно;
¾ Broken Links (Недоступные ссылки) – список всех недоступных ссылок;
¾ Pages With Broken Links (Страницы с недоступными ссылками) – список
страниц, где присутствует хотя бы одна недоступная ссылка;
¾ New Pages (Новые страницы) – список страниц, измененных за опреде
ленный интервал времени;
¾ Old Pages (Старые страницы) – список страниц, не изменявшихся за опре
деленный интервал времени;
¾ Slow Pages (Медленно загружаемые страницы) – список страниц, которые
грузятся относительно медленно изза большого размера файла;
¾ Orphaned Files (Потерянные файлы) – список файлов, на которые нет ни
одной гиперссылки с Webсервера;
Программы 167
¾ Pages Missing Titles (Страницы с пропущенными заголовками) – список
страниц, у которых отсутствует тэг <TITLE>;
¾ Pages With Framesets (Страницы с фреймами) – список страниц с фрей
мами, а также загружаемых во фреймы;
¾ Pages Missing Alt Tags (Страницы с пропущенным тэгом ALT) – список
страниц, у которых в ссылках на изображения пропущен тэг ALT;
¾ Pages Missing Height/Width (Страницы с пропущенными тэгами HEIGHT
и WIDTH) – список страниц, у которых в ссылках на изображения отсут
ствуют указанные тэги;
¾ Pages With Log Errors (Страницы с зарегистрированными ошибками дос
тупа) – список страниц, которые зарегистрированы в logфайлах (файлах
посещений) как содержащие ошибки доступа;
¾ Pages with Forms (Страницы с формами) – список страниц с формами;
¾ Site Map (Карта сайта) – графическая диаграмма структуры сайта;
¾ Scan Rules (Правила сканирования) – правила, в соответствии с которы
ми производится сканирование;
¾ Reports (Отчеты) – отображение отчетов;
¾ All Links (Все ссылки) – список всех ссылок, обнаруженных на сайте.
Планировщик
Планировщик позволяет автоматизировать сопровождение вашего узла. С его
помощью можно выполнять как разовую, так и регулярную проверку страниц
сайта в заданные промежутки времени. Например, после сканирования и сохра
нения его результатов в файле формата BOT можно настроить программу таким
образом, чтобы через определенный период времени, предположим, в ночь с вос
кресенья на понедельник, начиналась повторная проверка. Тогда к утру поне
дельника у вас будут готовы новые результаты.
Для запуска планировщика выполните следующие действия:
1. Выберите пункт меню Tools ⇒ Scheduler (Инструменты ⇒ Планировщик).
Откроется окно Schedule Linkbot Runs (Планирование запусков програм
мы Linkbot). Перейдите на вкладку Run Schedule (Запуск планирования),
показанную на рис. 2.70.
2. В поле Scheduled Bot File (Планировочный BOTфайл) введите имя файла и
полный путь к нему. В секции Frequency (Частота) нажмите одну из кнопок:
¾ Off (Выключено) – ни одно из планируемых заданий не будет запущено;
¾ Run when Linkbot is started (Включать при запуске программы) – при
каждом запуске программы немедленно начинается сканирование стра
ниц сайта, указанных в соответствующем проекте. Данный параметр
может применяться, например, при использовании любого другого пла
нировщика заданий;
¾ Run Once (Запустить один раз) – программа Linkbot будет запущена
одинединственный раз во время, заданное в разделе Time to Start Run;
¾ Every … Hour(s) (Каждые … часов), Every … Day(s) (Каждые … дней)
или Every … Week(s) (Каждые … недель) – параметры, предназначен
168 Автоматизация

ные для настройки регулярного сканирования в заданные интервалы


времени.
3. В разделе Time to Start Run (Время начала работы) введите часы и минуты
в поле Time (Время) и день недели в поле Day (День).
4. Если требуется, включите опции Close Linkbot project window when run is
complete (Закрыть окно проекта программы Linkbot по окончании рабо
ты) и Exit Linkbot when scheduled task is finished (Выйти из программы
Linkbot при завершении планового задания). Первая позволяет сохранить
botфайл и закрыть проект, но не саму программу Linkbot, вторая – завер
шить ее работу.

Рис. 2.70. Окно Schedule Linkbot Runs, вкладка Run Schedule

Планировщик позволяет в заданное время подключиться к Internet по теле


фонной линии, используя одно из имеющихся в системе соединений, а по выпол
нении задания – отключиться и освободить линию. Перейдите на вкладку Dialup
Connection (Коммутируемое соединение), показанную на рис. 2.71, и произведите
там необходимые настройки. В поле Entry (Вход) выберите из списка имеющихся
соединений нужное и введите соответствующие ему Username (Имя пользовате
ля) и Password (Пароль). Щелкните по кнопке OK.
Экспорт информации во внешние файлы
Содержимое вкладок правой панели Children и Parents можно экспортировать
в HTMLфайл для просмотра в браузере. При этом выгружается только инфор
мация об адресах с учетом настроек фильтров. Для экспорта выполните следую
щие действия:
1. Перейдите на нужную вкладку (Children или Parents).
2. Если требуется, установите требуемые фильтры, чтобы были видны только
файлы, соответствующие условиям выбора.
Программы 169

Рис. 2.71. Окно Schedule Linkbot Runs, вкладка Dialup Connection

3. Воспользуйтесь командой меню File ⇒ Export ⇒ HTML Index (Файл ⇒


Экспорт ⇒ HTMLиндекс). Откроется окно Export HTML/Print Settings
(Экспорт HTML/Настройка печати), используемое при экспорте данных и
при печати (рис. 2.72). Здесь нужно отметить поля, которые требуется вы
вести в файл или на печать:
¾ Show Description (Показывать описа
ние);
¾ Show Status (Показывать состояние);
¾ Show Last Modified Date (Показывать
дату последнего изменения);
¾ Show Child Links (Показывать ссылки
на потомков);
¾ Show Parent Links (Показывать ссылки
на предков);
¾ Show Non HTML Links (Показывать
ссылки не в формате HTML).
4. Щелкните по кнопке Continue (Продол Рис. 2.72. Окно
жить). Откроется окно Export Report to Export HTML/Print Settings
HTML File (Экспортировать отчет в HTML
файл), в котором следует указать папку и имя файла, куда будет записан
отчет.
Для экспорта данных в текстовый файл с разделителями предназначена ко
манда File ⇒ Export ⇒ Delimited Text (Файл ⇒ Экспорт ⇒ Текст с разделителя
ми). Откроется диалоговое окно Export Report to Text File (Экспортировать от
чет в текстовый файл), где надлежит указать папку и имя файла для записи
отчета. Поля в созданном файле разделены запятыми. Такой файл можно импор
тировать в электронную таблицу или в базу данных.
170 Автоматизация

Проверка правильности кода


После сканирования стоит проверить синтаксис HTMLкода на страницах. Тес
тировать можно любой файл по отдельности или же выбрать группу файлов. Пе
ред проверкой следует убедиться в том, что список, отображенный в правой пане
ли, содержит документы HTML, у которых нет неопределенных ссылок:
1. Выберите в раскрывающемся списке левой панели пункт Directory Tree
или URL Tree. В верхней части дерева папок (или адресов) щелкните по
пункту All Files (Все файлы) или All Links (Все ссылки).
2. Нажмите кнопки Show Good Links (Показывать исправные ссылки)

и Show HTML Links (Показывать HTMLссылки) на инструмен


тальной панели фильтров. В правой панели выделите один или несколько
файлов (в последнем случае надо удерживать нажатой клавишу Shift или
Ctrl) и щелкните правой кнопкой мыши. В контекстном меню выберите
пункт Validate HTML (Проверить HTML–код). Откроется окно Batch
Validation (Пакетная проверка кода), показанное на рис. 2.73, с результата
ми проверки. То же самое произойдет при выборе пункта главного меню
Tools ⇒ Validate HTML (Инструменты ⇒ Проверить HTML–код).

Рис. 2.73. Окно Batch Validation

3. В окне Batch Validation щелкните дважды по номеру строки, и в правой


панели откроется текст источника, где вы сразу же можете внести исправ
ления в HTMLкод. Кнопки Next (Следующий) и Previous (Предыду
щий) предназначены для перехода к следующему и предыдущему файлам.

Настройка программы проверки


Для настройки параметров программы проверки кода предназначены пункты
меню Tools ⇒ Validator Options ⇒ HTML configuration (Инструменты ⇒ Пара
Программы 171
метры программы проверки кода ⇒ HTMLконфигурация) и Tools ⇒ Validator
Options ⇒ Program (Инструменты ⇒ Параметры программы проверки кода ⇒
Программа). В последнем случае откроется окно Validator Engine Options (Пара
метры системы программы проверки кода).
На вкладке General (Общие) в разделе File Options (Параметры файла)
находится поле Default HTML Configuration file (Файл HTMLконфигура
ции по умолчанию), где задается путь к файлу конфигурации, который загружа
ется автоматически при запуске программы проверки кода. В нем содержится
информация о допустимых тэгах, их атрибутах и свойствах. Файл конфигурации
имеет расширение .cfg и создается при помощи специального редактора, для
вызова которого предназначен пункт меню Tools ⇒ Validator Options ⇒ HTML
configuration.
При первом запуске программы используется файл конфигурации, настроен
ный на спецификации HTML 4.0 и HTML 3.2, а также на правила записи тэгов
Microsoft Internet Explorer и Netscape Navigator.
В разделе Miscellaneous Options (Другие параметры) отметьте поле Autosave
configuration (Автоматически сохранять конфигурацию), если хотите, чтобы лю
бые изменения в конфигурационный файл записывались без предупреждения.
На вкладке Validator 1 (Проверка 1), показанной на рис. 2.74, в разделе Text Edit
Options (Параметры текстового редактора) имеются две опции:
¾ Maximum errors (Максимальное число ошибок) – количество ошибок
в каждом из HTMLдокументов, после превышения которого проверка
прерывается;
¾ Maximum warnings (Максимальное число предупреждений) – количество
предупреждений в каждом из HTMLдокументов, после превышения кото
рого проверка прекращается.

Рис. 2.74. Окно Validator Engine Options, вкладка Validator 1


172 Автоматизация

В разделе Character Entity Options (Параметры символьного объекта) на


страиваются следующие опции:
¾ Validate entities (Проверять правильность объектов) – рекомендуется по
ставить данный флажок, если вы хотите, чтобы была проверена правиль
ность символьных объектов;
¾ Numeric entities include Unicode (Для числовых объектов допускается ко
дировка Unicode) – отметьте для проверки 16битных символьных объек
тов в кодировке Unicode;
¾ Allow hexadecimal numeric entities (Разрешить использование шестнадца
теричных числовых объектов) – отметьте для проверки шестнадцатерич
ных числовых символьных объектов, которые отображаются в виде: &#xH;,
где H – шестнадцатеричное число;
¾ Allow double quote in text (Разрешить использование двойных кавычек
в тексте) – поставьте этот флажок, чтобы программа не считала ошибкой
применение двойных кавычек в тексте HTMLдокументов. В противном
случае всякий фрагмент, где удваиваются кавычки, но не применена конст
рукция &quot;, программа принимает за ошибочный.
В разделе Message/Output Options (Параметры сообщения/вывода) исполь
зуются следующие опции:
¾ Show warnings (Показывать предупреждения) – рекомендуется поставить
данный флажок, чтобы появлялись все предупреждения;
¾ Show comment warnings (Показывать предупреждения для комментари
ев) – отметьте указанную опцию, чтобы предупреждения появлялись, ког
да комментарии в форме <!— —> содержат символы < и >;
¾ Show missing attribute warnings (Показывать предупреждения об отсут
ствующих атрибутах) – отметьте эту опцию, чтобы появлялись предуп
реждения об отсутствии атрибутов, если для них установлен параметр
Warn if missing (Предупреждать при отсутствии);
¾ Show messages (Показывать сообщения) – при установке флажка бу
дут появляться все сообщения, сопровождающие проверку HTMLдо
кумента;
¾ Show comments (Показывать комментарии) – если поставить флажок, то в
выходной файл, формируемый при завершении проверки, будут включены
комментарии;
¾ Show extended message info (Показывать информацию с развернутыми
сообщениями) – отметьте опцию, если хотите получать развернутые сооб
щения, в которых указаны допустимые и недопустимые тэги, их атрибуты
и свойства.
На вкладке Validator 2 (Проверка 2) в разделе Miscellaneous Options (Разные
параметры) производятся, в соответствии с названием, самые разнообразные на
стройки. Рассмотрим их.
¾ Check HTML tag nesting (Проверять вложенность HTMLтэгов). Если устано
вить данный флажок, программа укажет на потенциальные проблемы, связан
Программы 173
ные с применением конструкций вида: <H1>Æåëàåì <I>óäà÷è!</H1></I>,
где тэги <I> … </I> должны быть вложены в <H1> … </H1>, поэтому сле
довало бы написать более строго:
<H1>Æåëàåì <I>óäà÷è!</I></H1>.
¾ Allow spaces around “=“ (Разрешить пробелы рядом со знаком равенства).
Если опция отключена, наличие пробела справа или слева от знака равен
ства вынуждает программу выдавать предупреждающее сообщение – на
пример, в любом из следующих случаев:
ALIGN = CENTER
ALIGN= CENTER
¾ Tag range always valid (Допустимы любые значения атрибутов тэга). Та
ким образом отменяется проверка на допустимость значений атрибутов
тэга. Однако без крайней необходимости делать этого не следует.
¾ Check for high ASCII characters (Проверять на соответствие расширенной
кодовой ASCIIтаблице символов). Обнаружив символы из расширенной
части кодовой таблицы символов, программа будет выдавать предупреж
дение. HTMLдокументы, написанные на английском языке, обычно не со
держат таких символов, имеющих ASCIIкод больше 127. Обратите внима
ние, что данная установка применима ко всему HTMLдокументу даже при
наличии разделов, которые должны игнорироваться. Если в документах
присутствуют символы из расширенной кодовой таблицы, следует исполь
зовать символьные объекты.
¾ Allow multi line quotes (Разрешены кавычки на нескольких строчках). До
пускается размещение фраз, заключенных в кавычки, на нескольких стро
ках. Впрочем, лучше подобные фразы размещать на одной строке – тогда
проще найти ошибки, связанные с пропущенными открывающими или
закрывающими кавычками.
¾ Require quoted attribute values (Применяется установка значений атрибу
тов в кавычках). Программа проверяет обязательное наличие кавычек у всех
атрибутов (для проверки достоверности XHTML).
¾ Allow spaces such as in < b > (Разрешать пробелы в сочетаниях типа < b >).
Допускается использование пробела после открывающего тэг символа < и
перед закрывающим символом >. В этом случае предупреждения выво
диться не будут.
¾ Require optional closing tags (Требуется наличие необязательных заклю
чительных тэгов). Поставьте этот флажок, если необходимо, чтобы все
тэги, в которых наличие заключительных тэгов необязательно, их имели.
Например, заключительный тэг для <P> не обязателен. Если данная опция
включена, появятся сообщения об ошибке при всяком несоответствии зак
рывающего тэга </P> – открывающему тэгу <P>. Это бывает полезно для
наглядности. Используется для проверки достоверности XHTML.
¾ Ignore text in <% … %> (Игнорировать текст в <% … %>). Программа про
верки будет игнорировать текст между сочетаниями символов <% и %>
174 Автоматизация

(обычно это сценарии – так называемые скрипты, предназначенные для


выполнения на сервере).
¾ <!— … —> Strict comments (Строгие комментарии). Программа проверки
генерирует сообщения о комментариях в формате, отличном от <!— … — >.
В таком случае при анализе комментария вида <! Äîêóìåíò èçìåíåí
23/05/2000 > выдается сообщение об ошибке. Рекомендуется включать
данный параметр, а комментарии в документах делать в указанном формате.
¾ (first tag) can be anywhere (Первый тэг может быть любым). Если этот
параметр установлен, первый тэг документа не обязательно должен быть
тэгом <HTML>.
¾ Treat all quotes as equivalent (Кавычки любого рода считать эквивалент
ными). Включите эту опцию, если хотите, чтобы программа считала иден
тичными одинарные и двойные кавычки, используемые для установки зна
чений атрибутов. При этом применение одинарных кавычек не будет
считаться ошибкой, когда HTMLконфигурация настроена на применение
двойных, потому что оба эти символа эквивалентны. Если ваши документы
написаны для современных программ просмотра, в которых использование
одинарных кавычек не вызывает сложностей, следует установить данный
флажок.
¾ Collapse <% … %> in tags to “ASP” (Не рассматривать конструкцию
<% … %>, считая ее содержимое кодом ASP). При проверке пропускаются
блоки с конструкцией <% … %>. Данная настройка не имеет никакого эф
фекта, если не включен параметр Ignore text in <% … %>.
¾ XML compatibility (Совместимость с XML). Программа будет воспринимать
«быстрые» закрывающие тэги, например: <IMG SRC=“picture.gif” />.
Она проверит также, чтобы тэги, подобные упомянутому, не имели друго
го, отдельного закрывающего тэга. Требуется для проверки правильности
XHTML
¾ Ignore all quotation requirements (Игнорировать все требования цитирова
ния). Программа проверки игнорирует все требования цитирования для
значений атрибутов. При этом сообщения об ошибках такого рода не гене
рируются. Желательно отключить данную опцию.
¾ Require lowercase tags and attribs (Применяется нижний регистр для за
писи тэгов и атрибутов). Отметьте опцию, если необходимо проверять,
чтобы все тэги и атрибуты были записаны в нижнем регистре. Требуется
для проверки правильности XHTML.
¾ Require quick close (<br/>) (Применяется «быстрый» завершающий тэг –
<br/>). Воспользуйтесь этой опцией, если необходимо проверять, чтобы
пустые элементы имели завершение начального тэга притом, что использова
ние «быстрого» завершающего тэга (например, <br /> или <hr />) не пре
дусмотрено синтаксисом. Требуется для проверки правильности XHTML.
На вкладке Tag Name Program (Программа для тэга) окна Validator Engine
Options, показанной на рис. 2.75, в разделе Options (Параметры) по умолчанию
установлен флажок Enable programs (Разрешить программы). Если снять его,
Программы 175
проверка заметно ускорится, но вместе с тем может уменьшиться количество об
наруженных недочетов. Для наиболее полной проверки синтаксиса данная опция
должна быть всегда включена.

Рис. 2.75. Окно Validator Engine Options, вкладка Tag Name Program

В разделе Program Flags (Флажки программы) расположены шестьдесят


флажков, помеченные номерами от 1 до 60. Применение этих опций позволяет
включать и отключать функции программы для тэгов, которые используются
в программах тэга. Это, в свою очередь, позволяет написать программу тэга таким
образом, чтобы ее поведение было скоординировано с установкой или отключе
нием соответствующего флажка. Например, может быть предусмотрено опове
щение пользователей о тэгах, которые работают только в некоторых программах
просмотра. Если вы не хотите видеть эти сообщения, в программе тэга можно до
пустить их исключение в случае, если не установлен определенный флажок. По
умолчанию все флажки поставлены. Их взаимодействие с имеющейся HTML
конфигурацией будет рассмотрено в соответствующем разделе.
Вкладка Logging (Ведение журнала) окна Validator Engine Options предназ
начена для настройки параметров журнала регистрации. Вести журнал целесооб
разно, если вы не хотите рассматривать отчеты каждого файла по отдельности,
а предпочитаете исследовать весь сайт целиком и только потом будете выяснять,
какие документы могут вызвать проблемы. Используя файл регистрации (один),
вы быстро определите документы, которые требуют особого внимания. Запомни
те только, что если вы ведете журнал и не удаляете время от времени ненужные
материалы, он может непомерно разрастись. Поле Log reports to filename (Имя
файла журнала регистрации) в разделе File Options (Параметры файла) служит
для ввода полного имени файла, предназначенного для регистрации результатов
проверки правильности кода в случае, когда такая регистрация разрешена.
176 Автоматизация

В разделе Options (Параметры) собраны следующие опции:


¾ Enable logging (Разрешить ведение журнала) – результаты проверки HTML
документов записываются в файл – журнал регистрации;
¾ Log error messages (Регистрировать сообщения об ошибках) – в журнал за
носятся все сообщения об ошибках, замеченных программой при проверке;
¾ Log warning messages (Регистрировать предупреждения) – записываются
все предупреждения, генерируемые программой при проверке;
¾ Include HTML lines containing errors and/or warnings (Включить строки
HTMLкода, содержащие ошибки и/или предупреждения) – в журнал бу
дут включены строки HTMLдокумента, изза которых возникли ошибки
или предупреждающие сообщения. При этом должны быть поставлены
флажки Log error messages или Log warning messages, потому что соот
ветствующая строка не будет учитываться, если не зарегистрировано пре
дупреждение или сообщение об ошибках.

Настройка HTML конфигурации


В программе проверки правильности HTMLкода предусмотрена настройка
HTMLконфигурации на различные категории тэгов языка: HTML 4.0, расшире
ния Netscape, расширения Microsoft Internet Explorer, Cold Fusion и т. д.
Важная особенность включенной HTMLконфигурации заключается в том,
что категории HTML сформированы на основе своих предыдущих версий: катего
рия HTML 4.0 основана на HTML 3.2, а последняя, в свою очередь, – на HTML 2.0.
Так, для проверки кода на соответствие рекомендациям HTML 3.2, наряду с ука
занной категорией следует активизировать HTML 2.0. Для проверки на соответст
вие рекомендациям HTML 4.0 наряду с ней следует активизировать также HTML 2.0
и HTML 3.2.
Для проверки правильности кода для Microsoft Internet Explorer и его расшире
ний следует активизировать категории HTML 2.0, HTML 3.2 и, начиная с версии
Internet Explorer 4.0, – HTML 4.0. При этом для расширений Microsoft Internet
Explorer 4.0 нужно активизировать и расширения Microsoft Internet Explorer 3.0.
Подобный подход применим и к расширениям Netscape: требуется выбрать
категорию расширений, соответствие которой проверяется, а также категории
HTML 2.0, HTML 3.2, HTML 4.0 и др., поддерживаемые Netscape (в зависимости
от версии).
Для проверки WebTV требуются, по крайней мере, категории HTML, расши
рения Microsoft Internet Explorer, расширения Netscape и Tables (Таблицы).
По умолчанию все категории активны. Рекомендуется таковыми их и оставить.
Категории Dynamic HTML и Scripting & Applets настраиваются единообраз
но: если активна одна, то и другая должна быть активной; и наоборот.
В категории Obsolete содержатся тэги: LISTING, NOTE, PLAINTEXT и XMP;
в Miscellaneous – тэг NEXTID и атрибуты MSIMAGELIST, NATURALSIZEFLAG
и NOSAVE. В категории General содержится тэг CSEIGNORE., используемый для
указания программе тэгов, проверку которых проводить не требуется.
Программы 177

Флажки. HTMLконфигурация может быть настроена таким образом, что при


проверке правильности HTMLкода для любого тэга может быть выполнена своя
программа. При этом поведение программы может изменяться в зависимости от
установки определенных флажков. Обычно при включении какоголибо из них по
являются предупреждения и сообщения об ошибках. Большинство из них начина
ется с комбинации символов [x], где x – номер флажка. Такая отметка позволяет
легко определить, какой флажок следует снять, чтобы убрать сообщение, которое,
по вашему мнению, не требуется отображать при проверке. Однако учтите, что та
ким образом вы отключаете множество сообщений. Для того чтобы всесторонне
оценить результат отключения какоголибо флажка, воспользуйтесь информаци
ей, имеющейся в справочной системе программы (на английском языке).
Обратите внимание, что неперечисленные в справочной системе флажки в су
ществующей HTMLконфигурации фактически не используются. Эти опции заре
зервированы для применения в последующих HTMLконфигурациях. Эффекты
применения некоторых флажков могут слегка различаться в зависимости от вер
сии программы, которой вы пользуетесь для проверки правильности HTMLкода.
Приведем пример описания для флажков номер 1 и 2.
При установке флажка 1, встретив перечисленные ниже тэги и атрибуты, про
грамма выводит сообщения о том, что они используются исключительно в брау
зере Microsoft Internet Explorer:
¾ тэг ACRONYM;
¾ тэг BGSOUND;
¾ атрибут BGPROPERTIES в тэге BODY;
¾ атрибут LEFTMARGIN и/или TOPMARGIN в тэге BODY;
¾ тэг BUTTON;
¾ атрибут VALIGN в тэге CAPTION;
¾ тэги COL или COLGROUP;
¾ тэг COMMENT
¾ тэг DEL;
¾ тэг DFN;
¾ тэг FIELDSET;
¾ атрибут COLOR в тэге HR;
¾ тэг IFRAME;
¾ атрибуты CONTROLS, DYNSRC, LOOP, LOOPDELAY, START и/или VRML
в тэге IMG;
¾ тэг INS;
¾ тэг LABEL;
¾ тэг LEGEND;
¾ тэг MARQUEE, используемый также в WebTV;
¾ тэг OBJECT;
¾ тэг Q;
¾ атрибуты BORDERCOLOR, BORDERCOLORDARK, BORDERCOLORLIGHT, FRAME
и/или RULES в тэге TABLE;
178 Автоматизация

¾ атрибуты BORDERCOLOR, BORDERCOLORDARK и/или BORDERCOLORLIGHT


в тэгах TD, TH или TR;
¾ тэги TBODY, THEAD или TFOOT.
При установке флажка 2, встретив указанные ниже тэги и атрибуты, про
грамма выводит сообщения, что они используются исключительно в браузере
Netscape:
¾ атрибут ARCHIVE в тэге APPLET;
¾ атрибут COLOR в тэге BASEFONT;
¾ тэг BLINK;
¾ атрибуты MARGINHEIGHT или MARGINWIDTH в тэге BODY;
¾ атрибуты POINT-SIZE или WEIGHT в тэге FONT;
¾ тэг ILAYER;
¾ тэг KEYGEN;
¾ тэг LAYER;
¾ тэг MULTICOL;
¾ тэг SPACER, используемый также в WebTV;
¾ атрибут BACKGROUND в тэге TR;
Чтобы полностью исключить работу программ для тэгов, следует воспользо
ваться параметром Enable programs в окне Validator Engine Options (см. раздел,
посвященный настройке программы проверки). В этом случае никакие сообще
ния, которые генерируются такой программой, не выводятся. Скорость проверки
при этом, конечно, возрастает. Однако, отключая программы тэгов, вы лишаетесь
мощного инструмента программы проверки и значительно уменьшаете ее эффек
тивность.
Если вы хотите отключить только некоторые программы, можно воспользо
ваться вкладкой Programs (Программы) окна Validator HTML Configuration
Editor (Редактор HTMLконфигурации для программы проверки правильности
кода), которое откроется при выборе команды Tools ⇒ Validator Options ⇒
HTML configuration (Инструменты ⇒ Параметры программы проверки кода ⇒
HTMLконфигурация). Отключите опции Enable open program for tag (Разре
шить открывающую программу для тэга) или Enable close program for tag option
(Разрешить закрывающую программу для тэга).
Редактор тэгов. Программа проверки имеет мощнейшую базу для на
стройки на любой тэг. Такая настройка выполняется в специальном редакторе,
который вызывается с помощью меню: Tools ⇒ Validator Options ⇒ HTML
configuration (Инструменты ⇒ Параметры программы проверки кода ⇒ HTML
конфигурация). На экран будет выведено окно Validator HTML Configuration
Editor (Редактор HTMLконфигурации для программы проверки правильно
сти кода). Редактор позволяет добавить новые тэги и конфигурировать имею
щиеся. Рассмотрим вкладку Tag names (Наименования тэгов), показанную на
рис. 2.76. Начнем с раздела Tag Name Controls (Средства управления имена
ми тэгов).
Программы 179

Рис. 2.76. Окно Validator HTML Configuration Editor, вкладка Tag names

В окне Tag names (Наименования тэгов) содержится перечень тэгов: P, A,


TITLE, BODY, HTML, B, I и т. д. Сюда можно добавить новые названия или же уда
лить имеющиеся. Для добавления нового тэга введите его наименование в поле,
расположенное под списком, и щелкните по кнопке New Tag (Создать тэг). Что
бы выполнить обратную операцию, выберите требуемое название и нажмите
кнопку Delete Tag (Удалить тэг).
Окно Tag range (Диапазон тэгов) содержит список тэгов, указывающих, в ка
кой именно части HTMLдокумента может или не может появиться тот или иной
тэг. Иными словами, допустимо ли появление настраиваемого тэга между откры
вающим тэгом любого наименования, которое присутствует в окне Tag range, и
закрывающим тэгом того же наименования. Например, IMG может быть записан
в контейнерах <BODY> … </BODY> и <NOFRAMES> … </NOFRAMES>, а META –
только в контейнере <HEAD> … </HEAD>. Чтобы удалить наименование тэга из
списка, выберите его и нажмите кнопку или дважды щелкните по нему мы

шью. Для добавления тэга выделите его в окне Tag names и нажмите кнопку
или дважды щелкните мышью по нужному наименованию. Для настройки на до
пустимость/недопустимость предназначен переключатель Range View (Область
видимости) на два положения: Valid (Допустимо) и Invalid (Недопустимо).
Список в разделе Tag Name Being Configured (Наименование настраиваемого
тэга) содержит наименования тэгов, а список в секции Tag Name Category (Кате
гория тэга) – категории, к которым может быть отнесен настраиваемый тэг, на
пример: HTML 3.2, HTML 4.0, расширения Microsoft Internet Explorer, расшире
ния Netscape и т. д.
180 Автоматизация

Технология настройки такова. В разделеTag Name Being Configured выбира


ется тэг, который вы будете настраивать для последующей проверки. В списке из
раздела Tag Name Category следует отметить, какой категории будет соответ
ствовать данный тэг. В окне Tag range указывается, в каком контейнере тэгов до
пустимо его размещать. Не забудьте проверить положение переключателя Range
View. Настроив таким образом все нужные тэги, сохраните установки с помощью
кнопок Save Config (Сохранить конфигурацию) или Save Config As (Сохранить
конфигурацию как) и щелкните по кнопке Close (Закрыть).

WebQA 3.0

Программа WebQA (http://www.watchfire.com/products/desktop/webqa/default.


aspx) – это набор приложений для анализа содержания сайта, оценки поведения
его посетителей и управления метатэгами. Она выпускается фирмой Watchfire
Corporation (:http://www.watchfire.com/) и состоит из трех компонентов: WebQA
Content (WebQA Содержание), WebQA Interaction (WebQA Взаимодействие) и
WebQA Tag (WebQA Тэг). При инсталляции программы есть возможность выбора
устанавливаемых компонентов.
Минимальные системные требования, предъявляемые к компьютеру для ра
боты программы, следующие:
¾ процессор Pentium III 800 МГц;
¾ 256 Мб оперативной памяти;
¾ подключение к Internet;
¾ 100 Мб свободного пространства на жестком диске;
¾ операционная система Windows 98 / ME / NT4 (SP6a) / 2000 Professional
(SP4) / 2000 Server (SP4) / 2000 Advanced Server (SP4) / XP Professional (SP1);
¾ браузер Microsoft Internet Explorer 5.5 (SP2) или 6.0 (SP1).
Приложение WebQA Content сканирует сайт и ищет ошибки и причины, кото
рые ухудшают его восприятие, в частности:
¾ разорванные ссылки;
¾ длинные страницы;
¾ страницы, не имеющие на себя ссылок;
¾ ошибки правописания;
¾ несовместимость с различными браузерами;
¾ отсутствие ключевых слов и заголовочных тэгов;
¾ труднодоступные страницы.
По окончании сканирования создаются отчеты, которые служат для локали
зации ошибок.
Компонента WebQA Interaction записывает и воспроизводит сценарии пове
дения, которые моделируют действия посетителей сайта. Это позволяет опреде
Программы 181
лить, ведут ли они себя так, как хотел разработчик. В каждый сценарий есть воз
можность вставить тесты для каталогизации элементов, чтобы определить их
присутствие на странице; для выяснения, работают ли должным образом метки,
переключатели и списки; для гарантированного появления на странице необхо
димого текста.
Компонента WebQA Tag помогает в написании, вставке в документы и тести
ровании метатэгов. Она позволяет читать метатэги из файлов, вставлять их
в один или в несколько документов сразу и проверять их на соответствие опреде
ленным стандартам, принятым, например, в вашей организации. Существует воз
можность вставки ключевых слов как вручную, так и автоматически. Программа
анализирует содержание файла и предлагает набор ключевых слов. Можно со
здать список слов, которые не надо включать в набор. Из набора в произвольном
порядке могут быть исключены любые слова.
Во всех компонентах WebQA используются файлы проектов. Они применяются
для управления ходом задач, например, сканированием, выполнением сценария,
вставкой метатэгов. Хотя каждое из приложений WebQA обладает различными
комбинациями свойств проекта, все они могут использоваться для настройки отче
тов, обработки записей cookies и некоторых других операций. Для создания проек
та выберите пункт меню File ⇒ New Project (Файл ⇒ Новый проект). Для на
стройки его свойств – Tools ⇒ Project Properties (Сервис ⇒ Свойства проекта).
Существуют глобальные свойства, которые сохраняются для всех проектов –
это параметры рабочей области. Их изменение в одном из проектов приведет к их
модификации во всех других проектах. К таким свойствам следует отнести ис
пользование внешних HTMLредакторов и настройку сетевых соединений. Вне
шние редакторы можно интегрировать с компонентами WebQA Content и WebQA
Tag, а можно эти компоненты встроить в редактор. Поддерживается интеграция
со следующими HTMLредакторами:
¾ Macromedia HomeSite 5.0;
¾ Allaire HomeSite 4.0, 4.5;
¾ Macromedia Dreamweaver 3, 4;
¾ Microsoft FrontPage 98, 2000, 2002.
Чтобы назначить HTMLредактор, выполните следующие действия.
1. Выберите пункт меню Tools ⇒ Desktop Options (Сервис ⇒ Параметры ра
бочей области).
2. В открывшемся окне Desktop Options зайдите на вкладку Editors (Редак
торы).
3. В поле HTML editor (HTMLредактор) определите путь к файлу запуска
редактора.
4. Нажмите на кнопку OK для завершения настройки и закрытия окна или на
кнопку Apply (Применить) для сохранения изменений и продолжения на
стройки.
Чтобы подключить графический редактор, заполните поле Image editor (Гра
фический редактор) на той же вкладке Editors окна Desktop Options.
182 Автоматизация

Для отмены интеграции с редакторами достаточно очистить соответствующие


поля на вкладке Editors окна Desktop Options.
По окончании определенных процедур программы WebQA способны выда
вать уведомления, что также поддается настройке. Вот эти процедуры:
¾ завершение сканирования;
¾ завершение сканирования изза нахождения новых страниц с формами;
¾ завершение сканирования изза нахождения новых страниц с JavaScript;
¾ завершение сканирования изза нахождения новых страниц с Flash;
¾ завершение сканирования после его остановки пользователем.

Сканирование сайта с помощью компоненты WebQA Content


Программа сканирует сайт и ищет потенциальные проблемы и условия, при ко
торых может быть нарушена целостность и работа сайта. Она определяет уровень
ошибок и готовит набор отчетов, которые помогут проанализировать проблемы.
Кроме вебсайтов, Content позволяет сканировать содержимое удаленных серве
ров, доступных по протоколу FTP, и структуру локальной системы.
Минимальные системные требования, предъявляемые к компьютеру для ра
боты компоненты, следующие:
¾ процессор Pentium III 800 МГц;
¾ 128 Мб оперативной памяти (рекомендуется все же 256 Мб);
¾ подключение к Internet;
¾ 40 Мб свободного пространства на жестком диске;
¾ операционная система Windows NT4 (SP6a) / 2000 (SP4) / 2003 Server / XP
(SP1);
¾ браузер Microsoft Internet Explorer 5.5 (SP2) или 6.0 (SP1).
Программа обеспечивает пользователя следующими возможностями:
¾ базовое обслуживание;
¾ анализ структуры сайта;
¾ восстановление данных;
¾ отчеты.
Базовое обслуживание включает проверку:
¾ целостности внутренних и внешних ссылок;
¾ файлов, неиспользуемых или не имеющих на себя ссылок;
¾ новых, старых и медленно загружающихся страниц;
¾ страниц, в которых отсутствует элемент <TITLE> и необходимые атрибу
ты изображений;
¾ синтаксиса ссылок на адреса электронной почты.
Наличие фильтров способствует изоляции файлов, содержащих любую из
указанных проблем. При повторной проверке есть возможность тестирования
именно тех страниц, которые вызывают нарекания.
Анализируя структуру сайта, вы имеете возможность:
¾ отобразить все ссылки, исходящих с указанного адреса и указывающих на
него;
Программы 183
¾ отсортировать адреса по заголовкам, описаниям, авторам, размеру, дате
последней модификации и типу;
¾ изолировать при помощи фильтров определенные файлы по их типу или
статусу состояния. Таким образом можно отделить, например, ссылки на
FTPсерверы или разорванные ссылки.
Чтобы сделать восстановление страниц максимально удобным, вы можете
вызвать свой любимый HTMLредактор для правки проблемного файла непос
редственно из WebQA Content. При таком подходе восстановление наиболее эф
фективно, так как вам не потребуется разрывать технологический процесс от
крытием редактора и загрузкой соответствующего файла.
Интерфейс
Интерфейс программы WebQA Content построен на взаимодействии навигаци
онной панели, расположенной в левой части окна, и панели содержания, находя
щейся в его правой части (рис. 2.77).

Рис. 2.77. Окно программы WebQA Content

Навигационная панель служит для управления данными в панели содержания.


С целью облегчения анализа и редактирования есть возможность группировать –
другими словами, фильтровать – отдельные данные по следующим признакам:
¾ File Structure (Структура файлов) – отображается иерархия файлов, на
чиная от указанного стартового адреса или от определенного файла (для
анализа на локальном компьютере);
184 Автоматизация

¾ Link Structure (Структура ссылок) – отображается организация ссылок,


начиная со стартового адреса, так что можно определить файлы, на кото
рые указывают ссылки;
¾ Page Content (Содержание страниц) – содержит фильтры, которые позво
ляют определить те страницы, которые появятся на правой панели, осно
вываясь на типе содержания каждой страницы;
¾ Link Integrity (Целостность ссылок) – содержит фильтры, которые позво
ляют определить те страницы, которые появятся на правой панели, осно
вываясь на содержании каждой страницы и статусе ссылки;
¾ Accessibility (Доступность) – отображается организация файлов, ассоции
рованная со стартовым адресом или локальным файлом. Выводятся только
внутренние файлы MIMEтипа text/html, имеющие статус «Good» (Хоро
ший). Этот статус означает, что ссылка не разорвана;
¾ User Input Pages (Входные страницы пользователей) – содержит список
страниц, которые требуют интерактивного взаимодействия перед заходом
на них;
¾ Other Pages (Другие страницы) – содержит фильтр, который позволяет
определить другие типы страниц, например, не имеющих на себя ссылок;
¾ Reports (Отчеты) – отображаются ссылки на отчеты, доступные для теку
щего сканирования.
Перечисленные признаки группировки данных оформлены в виде вкладок, раз
мещенных в левой навигационной панели окна программы. Обычно при выборе
одной из этих вкладок в правой части отображаются: списки файлов – на вкладке
Context (Контекст), код выбранной страницы – на вкладке HTML и ее изображе
ние в том виде, как оно появится в окне браузера, – на вкладке Preview (Предвари
тельный просмотр). Лишь при щелчке по вкладке Accessibility справа появляются:
доступные со страницы данные – на вкладке Pages (Страницы), отчет о доступно
сти – на вкладке Report, вид избранной страницы в окне браузера – на вкладке
Preview (Предварительный просмотр) и ее код – на вкладке HTML.
Обратите внимание, что код на вкладке HTML предназначен только для про
смотра. Правка кода возможна, но изменения не будут сохранены в HTMLфайле.
Сканирование
Для сканирования в программе предусмотрены два способа. Первый, называе
мый Quick Scan (Быстрое сканирование), заключается в использовании пара
метров, заданных по умолчанию. Второй подразумевает настройку параметров
сканирования, чтобы они удовлетворяли требованиям более точного анализа.
Такой подход полезен при работе с достаточно крупными проектами, требующи
ми регулярной комплексной проверки.
Быстрое сканирование выполняется следующим образом.
В поле Quick Scan введите адрес сайта – точно так же, как это делается в лю
бом браузере. Нажмите на кнопку (Scan Now – Начать сканирование). Ска
нирование будет продолжаться, пока не будут проверены все ссылки, либо пока
Программы 185

вы не нажмете на кнопку (Stop Scan – Остановить сканирование) или же не


щелкнете по пункту меню Scan ⇒ Stop Scan.
Результаты быстрого сканирования можно сохранить, задав новое имя проек
та, который по умолчанию называется Untitled (Безымянный), и изменив при
желании параметры.
Но обычно производится регулярное сканирование сайта, которое начинается
с настройки свойств проекта. Для этого выполните команду File ⇒ New Project
(Файл ⇒ Новый проект), а затем – Tools ⇒ Project Properties (Инструменты ⇒
Свойства проекта). В открывшемся диалоговом окне Properties (рис. 2.78) отметьте
в левой панели пункт What to Scan (Что сканировать), заполните в правой панели по
ле New starting URL (Новый начальный адрес) и нажмите на кнопку Add (Добавить).

Рис. 2.78. Окно Properties

Если требуется, настройте в этом же окне и другие параметры в зависимости


от структуры и характеристик сайта.
Закройте окно свойств и выполните команду Scan ⇒ Scan Entire Site (Скани
рование ⇒ Сканировать весь сайт). Начнется сканирование, которое прекратит
ся при выполнении следующих условий:
¾ будут оттестированы все ссылки;
¾ вы щелкнете по кнопке Stop Scan или выберете пункт меню Scan ⇒
Stop Scan;
186 Автоматизация

¾ будет достигнуто число проверенных ссылок, которое определено настрой


ками как максимально возможное.
По окончании процесса на экране возникнет окно
(рис. 2.79) с надписью The scan is complete (Сканиро
вание завершено).
Для сканирования локальной файловой системы
в поле New starting URL окна Properties воспользуйтесь
протоколом file:///. Например: file:///C:\MyDirectory.
Рис. 2.79. Сообщение Если сканирование было принудительно остановлено,
об окончании
оно может быть возобновлено. При этом процесс продол
сканирования
жится с места остановки, а результаты будут представле
ны в обобщенном виде, словно прерывания не было. Такая возможность предос
тавляется командой Scan ⇒ Continue (Сканирование ⇒ Продолжить).
Время от времени требуется повторное тестирование сайта, например, при
внесении в него изменений или при желании убедиться в работоспособности
всех ссылок, в том числе и старых. Для такой проверки выберите пункт меню
Scan ⇒ Rescan URLs ⇒ All URLs (Сканирование ⇒ Повторное сканирова
ние ⇒ Все адреса), чтобы оттестировать весь сайт, или Scan ⇒ Rescan URLs ⇒
Selected URLs (Сканирование ⇒ Повторное сканирование ⇒ Выборочные адре
са), если нужно проверить лишь его часть. В последнем случае перед выполнени
ем операции выберите в панелях Parents и Children вкладки Context нужные
адреса (рис. 2.80).

Рис. 2.80. Выбор адресов в панелях Parents и Children


Рис. 2.81. Окно Export to

Программы 187
Оценка результатов сканирования
По завершении обработки можно оценить результаты одним из следующих способов:
¾ экспортировать их в текстовый файл с разделителями;
¾ вывести в HTMLфайл;
¾ генерировать отчеты непосредственно в программе.
Для экспорта выполняется следующая процедура.
1. Перейдите в правой панели окна программы на вкладку Context.
2. В зависимости от ваших намере
ний выберите для экспорта отчета
нужную команду:
¾ File ⇒ Export Links ⇒ All (Файл
⇒ Экспорт ссылок ⇒ Все) – по
всем ссылкам;
¾ File ⇒ Export Links ⇒ Current
(Файл ⇒ Экспорт ссылок ⇒ Те
кущая) – по одной выбранной
ссылке;
¾ File ⇒ Export Links ⇒ Current
Selection (Файл ⇒ Экспорт ссы
лок ⇒ Текущее выделение) – по
группе выделенных ссылок.
Откроется окно Export to (Экспор
тировать в), предназначенное для
определения местоположения со
храняемого файла (рис. 2.81). В поле
File Name (Имя файла) введите но
вое имя или выберите существую Рис. 2.81. Окно Export to
щий файл из списка.
3. Из списка в поле Export file as type (Экспортировать файл типа) выберите
значение Text File для вывода в текстовый файл с разделителями или
HTML File – для вывода в виде HTMLдокумента. В первом случае ин
формация предназначена для загрузки в электронные таблицы или базы
данных, и будет иметь вид, показанный на рис. 2.82. Во втором случае ре
зультаты вполне наглядны, как видно на рис. 2.83.
4. Щелкните по кнопке Export (Экспорт).
Отчеты, которые генерируются самой программой, готовы к рассмотрению
непосредственно после сканирования. Они создаются автоматически, их нельзя
изменить, невозможно построить новые. Щелкните в левой панели окна про
граммы по фильтру Reports (Отчеты). Вы увидите (рис. 2.84), что отчеты сгруп
пированы в пять основных категорий:
¾ Content Defects (Дефекты содержания);
¾ Search and Navigation (Поиск и перемещение);
188 Автоматизация

Рис. 2.82. Результаты сканирования экспортированы в текстовый файл

Рис. 2.83. Результаты сканирования экспортированы в HTMLфайл

¾ Page Efficiency (Эффективность страниц);


¾ Site Inventory (Инвентаризация сайта);
¾ Site Maintenance (Обслуживание сайта).
Программы 189

Рис. 2.84. Группировка отчетов в левой панели

К категории Content Defects относятся следующие отчеты:


¾ Broken Links (Разорванные ссылки) – помещена информация обо всех не
доступных ссылках, найденных во время сканирования;
¾ Pages with Broken Links (Страницы с разорванными ссылками) – указаны
страницы, на которых имеются недоступные ссылки;
¾ Broken Anchors (Разорванные метки) – перечислены все недоступные
метки. Как известно, метки заставляют браузер открыть документ не с на
чала, а с того места, где есть метка;
¾ Pages with Broken Anchors (Страницы с разорванными метками) – выве
дены страницы с недоступными метками;
¾ Links to Local Files (Ссылки на локальные файлы) – список ссылок, ука
зывающих на файлы локального сервера. Для посетителей из Сети они бу
дут недоступны.
В категории Search and Navigation размещены шесть отчетов:
¾ Missing Keywords (Отсутствие ключевых слов) – список страниц, не име
ющих тэга META NAME=“keywords”;
¾ Missing Titles (Отсутствие заголовков) – выводятся страницы с пропу
щенным тэгом TITLE;
¾ Missing Descriptions (Отсутствие описаний) – указаны страницы без тэга
META NAME=“description”;
¾ Missing Alt Text (Отсутствие текста Alt) – включены все страницы, в кото
рых для изображений не указан атрибут ALT;
¾ Duplicate Titles (Задвоение заголовков) – страницы, где тэг TITLE повто
рен дважды;
¾ Duplicate Keywords (Задвоение ключевых слов) – дважды повторен тэг
META NAME=“keywords”.
190 Автоматизация

К категории Page Efficiency отнесены следующие отчеты:


¾ Slow Pages (Медленно загружающиеся страницы);
¾ Warnings and Redirects (Предупреждения и переадресация);
¾ Missing Height or Width Attributes (Отсутствие атрибутов высоты или
ширины для изображений).
В категории Site Inventory присутствуют отчеты:
¾ Page Quality (Качество страниц);
¾ File Types (Типы файлов);
¾ File Inventory (Опись файлов);
¾ Image Catalog (Каталог изображений);
¾ Pages with Images (Страницы с изображениями);
¾ Style Sheet Dependencies (Зависимость от таблиц стилей);
¾ Pages with Style Sheet Dependencies (Страницы, зависящие от таблиц стилей);
¾ Server Side Image Maps (Карты серверных изображений);
¾ Pages with Server Side Image Maps (Страницы с картами серверных изоб
ражений);
¾ Multimedia Content (Мультимедиа содержание).
И наконец, категории. Site Maintenance составляют отчеты:
¾ Old Pages (Старые страницы);
¾ New Pages (Новые страницы);
¾ Small Pages (Страницы малого размера);
¾ Metadata Summary (Общая информация о содержании метаданных).
Как видно из перечисленного, встроенные отчеты позволяют провести деталь
ный анализ состояния сайта и не только выявить неполадки, но и оценить его по
тенциал.

Поиск свободных доменных имен


Domain Name Checker
Domain Name Checker – это удобная и простая в использовании программа, раз
работанная российской компанией NetPromoter (http://netpromoter.com/ru/
company/), для отсылки запросов о доменных именах на серверы Whois и полу
чения информации о возможности их приобретения, о владельцах, об истечении
регистрации и т. д.; словом, для поиска в Internet доступных доменных имен.
Не секрет, что с ростом популярности Internet все сложнее найти хорошее и
еще никем не зарегистрированное доменное имя. Такой поиск может занять мно
го времени, поскольку наличие доступных доменов с нужными ключевыми сло
вами придется проверять с помощью большого числа сайтоврегистраторов до
менных имен. Используя Domain Name Checker, вы сможете автоматически
обследовать до 30 потенциальных имен одновременно, не тратя драгоценное вре
мя на ввод любого из них на каждом сайтерегистраторе и на ожидание результа
тов поиска. Программа поддерживает самую современную базу данных регистра
торов, которые моментально зарегистрируют выбранное вами доменное имя.
Программы 191
В программе реализован планировщик заданий, который позволяет следить
за изменениями регистрационных записей на серверах WHOIS. Так, если срок
регистрации доменного имени, которое вы хотите купить, истекает, программа
отправит вам уведомление по электронной почте. Кроме того, вы никогда не по
теряете свое собственное доменное имя, даже если забудете своевременно внести
регистрационную плату или ктото попытается украсть ваш домен. Когда в реги
страции вашего домена происходят какието изменения, Domain Name Checker
автоматически сообщит об этом по электронной почте. Пользуясь программой,
вы имеете возможность управлять неограниченным количеством доменных имен
без какихлибо дополнительных забот.
Минимальные системные требования, предъявляемые к компьютеру для ра
боты с программой:
¾ процессор Intel Pentium с частотой 166 МГц и выше;
¾ 32 Мб оперативной памяти;
¾ 8 Мб свободного места на жестком диске;
¾ операционная система: Windows 95 OSR2, Windows NT 4, Windows 98/Me,
Windows 2000 Client/Server или Windows XP Home/Professional;
¾ браузер Internet Explorer 4.0 или более поздняя версия;
¾ Win Sock 2.0;
¾ скорость соединения с Internet 14 Кб/с;
Для комфортабельной работы рекомендуется:
¾ процессор Intel Pentium 450 МГц;
¾ 64 Мб оперативной памяти;
¾ соединение с Internet 56 Кб/с;
Базы данных программы периодически обновляются и доступны на сайте произ
водителя. Проводя обновления, вы сможете работать одновременно с несколькими
доменными именами и регистраторами, а также получать новые стили для отчетов.
Чтобы обновить базу данных, в главном меню программы выполните команду На
стройки ⇒ Проверить обновления.
Обновления базы данных проводят
ся с использованием HTTPпротоко
ла, сконфигурированного в опциях
программы.
При проведении обновлений
в окне Обновление вы получаете
информацию о новых базах данных,
доступных на сервере программы
(см. рис. 2.85). Версии сравнивают
ся, и, если базы данных на сайте
производителя содержат после
днюю версию обновлений, их мож

Рис. 2.85. Окно Обновление


192 Автоматизация

но загрузить. Рекомендуется проверять обновления регулярно, по крайней мере,


раз в месяц. Чтобы они вступили в силу, нужно после их загрузки перезапустить
программу.

Интерфейс программы
В главном окне программы (рис. 2.86) представлена вся информация проекта,
отображаемая в виде таблицы, содержащей записи о каждом из проверяемых до
менных имен. Чтобы свернуть детальную информацию (нижняя часть окна), на
жмите на кнопку Спрятать детали. Чтобы восстановить окно деталей, щелкните
по любой из трех кнопок на панели состояния: Текст, Поля или Показать детали.
Детальная информация содержит более подробные данные о каждой записи
в текстовом (выводится на экран с помощью кнопки Текст) или табличном
(кнопка Поля) форматах.

Рис. 2.86. Главное окно программы Domain Name Checker

Все функции проекта доступны в главном меню программы. Для облегчения


работы некоторые кнопки размещены на панели инструментов. Кроме того, ис
пользуется контекстное меню, вызываемое правой кнопкой мыши.
Проекты, содержащие необходимые настройки и данные ваших webсайтов,
сохраняются в файлах с расширением .ddt и размещаются в папке Projects ката
лога, в котором установлена программа. Их можно копировать и использовать на
других компьютерах при условии, что копии программы зарегистрированы: вы
не сможете открыть существующий проект с помощью незарегистрированной
копии программы, если он содержит более 5 записей.
Программы 193
Существует возможность планирования регулярных запусков проектов,
включая автоматическое генерирование отчетов и отправку их на нужные адреса
электронной почты. Количество создаваемых проектов не ограничено.
При запуске программа открывает последний проект, с которым вы работали.
Для удобного осмотра результатов работы программы используются отчеты.
Чтобы сгенерировать отчет обо всех доменных именах текущего проекта (рис. 2.87),
выполните команду Отчет ⇒ Отчет по текущему проекту или Отчет ⇒ Отчет по
выбранному доменному имени, если хотите получить отчет лишь по одному из них.

Рис. 2.87. Отчет по проекту

Чтобы распечатать подготовленный отчет, нужно открыть его в окне браузера


(для этого щелкните по кнопке Открыть в браузере) и, воспользовавшись на
стройками последнего, вывести его на принтер.
Каждая запись проекта имеет свой уникальный номер, соответствующий поряд
ку добавления в него доменных имен. Для создания нового проекта выберите пункт
меню Проект ⇒ Новый или щелкните в панели инструментов по кнопке Со
здать новый проект. Чтобы открыть существующий проект, выполните команду
Проект ⇒ Открыть или нажмите на кнопку Открыть существующий проект.
Для добавления в проект нового доменного имени предназначен пункт меню
Доменное имя ⇒ Добавить доменное имя или одноименная кнопка в панели
инструментов. С той же целью можно использовать клавишу Insert на клавиату
ре. Откроется диалоговое окно, в котором нужно ввести выбранное вами имя.
При его наборе вводите расширение после точки, то есть имя домена первого
уровня .ru, .com, .org или .net, но не вводите префикс www.
194 Автоматизация

Если вы хотите изменить какуюлибо запись проекта, воспользуйтесь функци


ей Доменное имя ⇒ Редактировать доменное имя или щелкните по одноименной
кнопке . Чтобы сохранить изменения, выберите пункт меню Проект ⇒ Сохра

нить или щелкните по кнопке Сохранить проект.


Для удаления записей проекта выделите их и выберите Доменное имя ⇒
Удалить доменные имена или нажмите на кнопку . Чтобы выделить одновре
менно несколько записей, щелкайте по ним, удерживая нажатой клавишу Ctrl на
клавиатуре.
Чтобы выполнить проверку доменов, выделите в главном окне программы
требуемые записи и выберите пункт меню Доменное имя ⇒ Проверить выбран
ные имена или нажмите на кнопку Проверить выбранные в панели инструмен
тов. Для ревизии всех доменных имен проекта выберите пункт Доменное имя ⇒
Проверить все доменные имена или нажмите на кнопку Проверить все в панели
инструментов. Чтобы остановить контроль доступности доменных имен, выбе
рите Доменное имя ⇒ Остановить проверку или щелкните в панели состояния
по кнопке Остановить.
Вы можете настроить программу таким образом,
чтобы она отправляла по электронной почте вам или
другим заинтересованным лицам уведомления о необ
ходимости перерегистрации, для чего нажмите кнопку
или выполните команду Проект ⇒ Напоминания
по электронной почте. При этом откроется окно Напо
минание по электронной почте (см. рис. 2.88), в кото
ром укажите требуемые электронные адреса и период.
Для настройки вида отображаемой в главном
окне проекта информации воспользуйтесь командой
Проект ⇒ Показать, кнопкой Показать поля
Рис. 2.88. Окно
Напоминание в панели инструментов или щелкните правой кноп
по электронной почте кой мыши по любому из заголовков таблицы. По
явится окно Показать поля (рис. 2.89) с перечнем
полей таблицы, которые становятся видимыми на экране, если их отметить соот
ветствующим флажком.
Содержание полей, по большей части, понятно из их названий. Поле Статус
указывает на состояние записи проекта (отображается в виде пиктограммы); со
стояний может быть четыре:
¾ доменное имя никогда не проверялось;
¾ доменное имя успешно проверено;
¾ доменное имя проверяется в настоящее время;
¾ последняя проверка доменного имени неуспешна.
Программы 195
Рис. 2.89. Окно Показать поля

Поле Регистрационный статус служит для вывода


информации о возможности регистрации доменного
имени:
¾ Доменное имя не проверено – попытки прове
рить доступность доменного имени не проводи
лись и его регистрационный статус неизвестен;
¾ Доменное имя зарегистрировано – оно прове
рено, и получена информация о его регистрации;
¾ Доменное имя не зарегистрировано – домен
ное имя проверено и известно, что оно не заре
гистрировано.
Если доменное имя доступно, в поле Статус регис
трации появится кнопка Buy (Купить). Эта кнопка вызывает список регистрато
ров, которые помогут приобрести нужное доменное имя. Цена за регистрацию
у разных регистраторов может отличаться.
Доменное имя можно регистрировать в любое время, независимо от того, хо
тите ли вы его использовать сразу или позже.
Приведем назначение некоторых других полей:
¾ Последняя проверка – дата последней попытки исследования доступнос
ти доменного имени;
¾ Последняя отсылка – дата доставки последнего уведомления;
¾ Эффект – эффективность доменного имени;
¾ Дата регистрации – имеется в виду дата регистрации доменного имени;
¾ Дата обновления – дата последнего продления регистрации;
¾ Дата истечения регистрации – дата истечения регистрации доменного
имени;
¾ Последнее обновление базы данных – дата последнего обновления базы
данных информационного сервера.
Для лучшего восприятия результатов работы программы можно осущест
вить настройку цвета записей проекта в зависимости от срока истечения регист
рации:
¾ более тридцати дней;
¾ от трех до тридцати дней;
¾ менее трех дней;
¾ не зарегистрировано и может быть приобретено;
¾ не проверено.
Чтобы выполнить указанные настройки, выберите пункт меню Настройки ⇒
Опции программы и в открывшемся окне Опции программы перейдите на вклад
ку Цвет (рис. 2.90).
196 Автоматизация

Рис. 2.90. Окно Опции программы, вкладка Цвет

На вкладке Отчеты окна Опции программы можно выбрать стили для отчетов
в формате HTML, которые обеспечивают лучшее визуальное восприятие таблич
ной информации. При установке программы доступен только один стиль, допол
нительные стили поставляются в пакетах обновлений. Если у вас есть опыт рабо
ты с CSS, вы можете создавать собственные стили, сохраняя их в папке CSS того
каталога, в котором установлена программа.
Кроме рассмотренных технических параметров, программа позволяет устано
вить и другие. На вкладке Общие отображаются общие опции программы:
¾ Проверять доменные имена при добавлении. Если вы хотите, чтобы при
вводе каждого нового доменного имени программа автоматически искала
на серверах WHOIS соответствующие регистрационные записи, то вклю
чите этот флажок;
¾ Запускать планировщик при загрузке – при каждой загрузке операционной
системы будет запущен Планировщик, работающий в фоновом режиме;
¾ Запускать планировщик после закрытия программы – Планировщик бу
дет запущен сразу после выхода из программы Domain Name Checker;
¾ Язык – выберите язык интерфейса программы;
¾ Показывать новости – при каждом запуске программы будет открываться
окно с новостями;
¾ Показывать советы – перед открытием главного окна программы будут
выводиться на экран полезные советы.
Опции на вкладке HTTP прокси нужно настраивать только в том случае, если
вы используете для HTTPсоединения проксисервер:
¾ Использовать HTTPпрокси;
¾ Хост – имя проксисервера;
¾ Порт – порт проксисервера; по умолчанию установлено значение 3128;
¾ Загрузить настройки из Internet Explorer. Если вы применяете указанный
обозреватель, нажмите на эту кнопку, чтобы воспользоваться в программе
его настройками;
Программы 197
¾ Требуется аутентификация – включите этот флажок, если для входа на
проксисервер требуется аутентификация;
¾ Логин – введите ваше имя пользователя для проксисервера;
¾ Пароль – введите ваш пароль, если требуется проксисервером.
Из настроек Internet Explorer вы сможете загрузить только имя хоста и значе
ние порта; имя пользователя и пароль следует ввести вручную.
Параметры вкладки SOCKS прокси настраиваются, если вы используете SOCKS
прокси:
¾ Использовать SOCKS для HTTP соединения – включите этот флажок,
если вы используете для HTTPсоединений SOCKSпрокси;
¾ Использовать SOCKS для WHOIS соединения – включите этот флажок,
если вы используете для WHOISсоединений SOCKSпрокси;
¾ Тип SOCKS – выберите тип SOCKSпрокси, который вы используете
(SOCKS 4, SOCKS 4A или SOCKS 5);
¾ Хост – имя проксисервера SOCKS или его IPадрес;
¾ Порт – порт проксисервера; по умолчанию – 1080;
¾ Загрузить настройки из Internet Explorer. Нажмите эту кнопку, чтобы заг
рузить настройки Internet Explorer;
¾ Требуется аутентификация – включите этот флажок, если для входа на
проксисервер SOCKS нужна аутентификация;
¾ Логин – введите ваше имя пользователя, если требуется проксисервером
SOCKS;
¾ Пароль – введите ваш пароль для проксисервера SOCKS.
Как и для проксисервера HTTP, из настроек Internet Explorer будут загруже
ны лишь имя хоста и порт, а имя пользователя и пароль следует ввести вручную.
Для того чтобы программа имела возможность отправлять уведомления по
электронной почте, на вкладке SMTP окна Опции программы нужно заполнить
следующую информацию об SMTPсервере:
¾ Адрес отправителя – электронный адрес отправителя уведомлений (поле
необязательно для заполнения);
¾ Имя отправителя – также необязательное поле;
¾ SMTP сервер – имя SMTPсервера или его IPадрес;
¾ Порт – порт SMTPсервера (по умолчанию – 25);
¾ Требуется аутентификация – включите этот флажок, если ваш SMTPсер
вер требует аутентификации пользователя;
¾ Логин – ваше имя для работы с SMTPсервером;
¾ Пароль – ваш пароль для SMTPсервера.
Каждый проект имеет свои собственные настройки напоминаний по электрон
ной почте, в то время как настройки SMTP общие для всех проектов, Если вы хотите
применить разные настройки напоминания по электронной почте для разных адре
сов (ваших клиентов, персонала и т. д.), то создайте отдельные файлы проектов.
На вкладке Домены для удобства работы с программой у вас есть возмож
ность установки ваших личных приоритетов выбора домена первого уровня, ко
198 Автоматизация

торый будет автоматически добавлен к любому доменному имени, набираемому


вами в соответствующем поле. И, наконец, на вкладке Популярность окна Опции
программы вы можете выбрать из списка те поисковые машины, по которым про
грамма определит популярность вашего доменного имени по наличию в ее базе
страниц, содержащих указанное слово.
Планировщик
Планировщик – это программный модуль, который выполняет назначенные
вами задания и отправляет напоминания по электронной почте. После запуска
операционной системы планировщик работает в фоновом режиме, постоянно
следя за изменениями регистрационного статуса доменов и отсылая по электрон
ной почте уведомления о доступных доменных именах или о тех, регистрация
которых истекает в ближайшее время.
Особенностью серверной системы WHOIS является то, что она не разрешает
использовать программы для получения информации с серверов. Планировщик
же позволяет получать ее без необходимости ручного набора каждого имени и
ожидания результатов поиска. Он использует технологию, действующую в точ
ности таким же образом, как работает пользователь браузера, автоматически со
храняя cookies, заполняя скрытые формы и поля и т. д.
Чтобы осмотреть список текущих заданий для Планировщика, выполните ко
манду Настройки ⇒ Планировщик или щелкните в панели инструментов по
кнопке . Откроется окно Список заданий планировщика (см. рис. 2.91).

Рис. 2.91. Окно Список заданий планировщика

В каждой строке таблицы присутствует следующая информация о заданиях:


¾ Проект – полный путь к файлу проекта на компьютере;
¾ Дата – дата начала работы с проектом;
¾ Период – периодичность проверок;
¾ Время – время начала проверки данного проекта планировщиком;
¾ Последняя проверка – дата последней проверки. Если проект никогда не
проверялся, в этом поле будет сообщение «Никогда не проверялось».
Программы 199
Вы можете добавлять задания, редактировать или удалять их. Планировщик
начинает работать в фоновом режиме после выхода из программы. Для отправки
уведомлений по электронной почте компьютер должен быть подключен к Internet.
Автоматическая генерация доменных имен
Для автоматического подбора возможных комбинаций доменных имен, содержа
щих желаемые ключевые слова, используйте Генератор доменных имен, который
запускается по команде Доменное имя ⇒ Генератор доменных имен. Его окно
представлено на рис. 2.92.

Рис. 2.92. Окно Генератор доменных имен

Заполните нужные поля (Префикс, Ключевое слово, Суффикс), отметьте


домены верхнего уровня, укажите количество ключевых слов, из которых будет
составлено имя (поле Комбинировать максимум) и щелкните по кнопке Генери
ровать. Программа автоматически заполнит таблицу проекта именами (в данном
случае: design.com, pro.com, designpro.com и prodesign.com) и предложит сразу же
проверить их.

Проверка ссылок
Выше мы рассмотрели некоторые сервисы в Internet, предназначенные для про
верки корректности гиперссылок. То же самое можно сделать и при помощи спе
циализированных программ. Таких программ немало; во многие HTMLредакто
ры внедрена подобная функция.

Retrieve 1.0

Программа Retrieve предназначена в основном для поддержки личных страниц,


а также небольших Webузлов. Она отличается малым объемом – для установки
необходимо чуть более 300 Кб свободного пространства на жестком диске.
200 Автоматизация

Retrieve – это отечественная разработка (ООО «БВ») с русскоанглийским ин


терфейсом. Найти ее можно в каталоге ListSoft (http://www.listsoft.ru/), разделе
Программы ⇒ Интернет ⇒ WWW ⇒ Проверка ссылок (http://www.listsoft.ru/nt/
linkchk.htm; адрес программы: http://www.listsoft.ru/?id=1994).
Retrieve обследует заданный сервер (удаленный или локальный), ищет клю
чевые слова, проверяет доступность гиперссылок, в том числе внешних, и коррек
тность HTMLстраниц с точки зрения поисковой машины. Собранную информа
цию можно использовать не только для исправления ошибочных гиперссылок,
но и для локального поиска по ключевым словам, а также создания поисковой
страницы на сервере.
Программа написана на языке Java и поэтому может работать во многих опе
рационных системах. Разработчики утверждают, что она тестировалась в ОС MS
Windows 95/98/NT 4, UNIX, Lynux.
К компьютеру предъявляются следующие минимальные требования:
¾ процессор 486;
¾ оперативная память – 8 Мб;
¾ установленный браузер MicroSoft Internet Explorer, версия не ниже 4.0.
Устанавливать Retrieve в Windows – одно удовольствие, вероятно, изза ис
пользования в ней русского языка и оригинальных картинок. После запуска про
граммы установки откроется окно Здравствуйте!, показанное на рис. 2.93. Щелк
ните по кнопке Далее.

Рис. 2.93. Окно Здравствуйте! программы установки

Откроется окно Важные заметки, представленное на рис. 2.94. Вам предложат


закрыть все приложения, запущенные на компьютере, для чего следует прервать
установку, нажав на кнопку Отмена, и завершить работу всех прочих программ.
После этого можно продолжить инсталляцию. Если запущенных приложений
нет, нажмите на кнопку Далее.
На экран будет выведено окно Лицензионное соглашение, показанное на рис. 2.95.
В нем поставьте флажок Согласен и снова щелкните по кнопке Далее.
Программы 201

Рис. 2.94. Окно Важные заметки программы установки

Рис. 2.95. Окно Лицензионное соглашение программы установки

Появится окно Выбор директории для программы (рис. 2.96). Здесь можно
выбрать папку, куда устанавливается Retrieve (по умолчанию – C:\Retrieve).
Для продолжения инсталляции щелкните по кнопке Далее.

Рис. 2.96. Окно Выбор директории для программы


202 Автоматизация

В окне Выбор папки… (рис. 2.97) задается название пункта меню (программ
ной группы), откуда впоследствии будет запускаться Retrieve. Можно изменить
предложенное название или оставить его прежним. Для продолжения снова щел
кните по кнопке Далее.

Рис. 2.97. Окно Выбор папки…

Откроется окно Программа готова к установке (рис. 2.98). После нажатия


кнопки Готово начнется инсталляция программы Retrieve. Ее ярлыки помеща
ются на Рабочий стол и в заданную на предыдущем шаге программную группу
системного меню Пуск.

Рис. 2.98. Окно Программа готова к установке

В завершение на экран выводится последнее окно программы инсталляции –


С успешной установкой! (рис. 2.99). Щелкните по кнопке Готово.
После запуска Retrieve сначала появляется консольное окно DOSсеанса, где
приведена вспомогательная техническая информация о работе программы
Программы 203
(в других операционных системах, отличных от Windows, ее запуск производит
ся из консольного окна). Через несколько секунд открывается рабочее окно про
граммы Retrieve, представленное на рис. 2.100:

Рис. 2.99. Окно С успешной установкой!

Рис. 2.100. Рабочее окно программы Retrieve

Перед началом работы следует произвести некоторые настройки. Например,


если требуется проверить внешние ссылки, то есть ссылки на внешние серверы,
выберите пункт меню Options ⇒ Check external link (Параметры ⇒ Проверять
внешние ссылки).
В поле корневой URL введите стартовый адрес страницы (на локальном или
удаленном компьютере), с которого программа начнет проверку гиперссылок.
Если проверка начинается с файла, расположенного на вашем ПК или на компь
204 Автоматизация

ютере в локальной сети, то для ввода полного пути к файлу воспользуйтесь кноп
кой Обзор. В открывшемся диалоговом окне Open root HTML document (От
крыть корневой HTMLдокумент), показанном на рис. 2.101, выберите нужный
файл. После этого нажмите кнопку Открыть.
В поле поиск в глубину введите число
страниц, которые требуется проверить.
Переключатель на семь положений –
Auto, English, Windows, KOI 8, DOS(866),
ISO 5, Mac – предназначен для указания
кодировки, в которой выполнен документ.
Это необходимо для корректного поиска
по ключевым словам, так как страницы,
написанные на русском языке, кодируют
ся множеством способов. Если обследуют
Рис. 2.101. Окно Open root HTML ся страницы, написанные на английском
document языке, или нужна только проверка гипер
ссылок, можно установить переключа
тель в положение English – при этом программа будет работать немного быстрее.
Заметим, что английские слова будут декодироваться правильно при любом вы
боре кодировки.
Работа программы начинается со щелчка по кнопке Пуск. Рабочее окно выг
лядит так, как показано на рис. 2.102.

Рис. 2.102. Вид рабочего окна программы Retrieve после щелчка по кнопке Пуск

В нижней части окна в строке состояния Текущая страница отражена дина


мика просмотра страниц. Более детальная информация о работе программы со
средоточена в консольном окне, изображенном на рис. 2.103, переключиться
в которое можно при помощи кнопки ® (стрелка вправо). Правда, автору книгис
Программы 205
делать это не удалось, но поскольку обычное переключение между окнами
Windows затруднений не вызывает, то замеченный недостаток, по сути, неважен
и никак не сказывается на работе Retrieve.

Рис. 2.103. Консольное окно программы Retrieve

Программа тестирует все внутренние ссылки (если указано, то и внешние) на


отмеченной в поле корневой URL странице, исследуя все основные адресные
тэги: HREF, SRC, BACKGROUND, ACTION и USEMAP. Обрабатываются, в частности,
HTMLдокументы, фреймы, изображения, формы и т. д. Retrieve проверяет пра
вильность написания ссылок и наличие документов, которые в них указаны.
Если в гиперссылке указан документ типа text/html, программа рассматривает
его, проверяя ссылки и метаданные, имеющиеся в его тексте. Retrieve работает до
тех пор, пока все ссылки из связанных HTMLстраниц (включая те, что указыва
ют на внешние Webсерверы) не будут проверены или не исчерпается заданный
лимит страниц. Найденные ошибки записываются в файл Errors.html, размещае
мый в том же каталоге, что и проверяемая страница.
На обследуемых страницах собирается информация о ключевых словах из
специально предназначенных для этого тэгов: META NAME=“keywords”, META
HTTP-EQUIV=“keywords”, META NAME=“description” и TITLE.
В любой момент можно приостановить работу программы щелчком по кнопке
Стоп. Позже вы сможете продолжить обработку страниц с помощью кнопки Restore
(Возобновить).
В завершение обработки информа
ции появляется окно Result of searching
(Результат поиска), показанное на
рис. 2.104.

Рис. 2.104. Окно Result of searching


206 Автоматизация

В верхней части окна в строке Visited links: … Errors links … Found keywords: …
(Обнаружено ссылок: … Ошибочных ссылок … Найдено ключевых слов: …) со
общаются количественные результаты поиска.
Отчеты программы
Чтобы подготовить отчеты об ошибочных гиперссылках и ошибках в оформле
нии метаданных, включите в окне Result of searching флажки Generate error’s
report и Generate design’s report соответственно и щелкните по кнопке OK. Пос
ле того как формирование отчетов будет завершено, в нижней части окна появит
ся надпись: View result in file RESULT.HTML (Результат смотрите в файле
RESULT.HTML), как показано на рис. 2.105.

Рис. 2.105. Вид окна Result of searching после подготовки отчетов

Если вы не подготовили отчеты, но уже закрыли окно Result of searching


с помощью кнопки Close (Закрыть), запустите Retrieve снова, щелкните по кноп
ке Restore, дождитесь появления окна Result of searching и выполните описан
ные выше действия.
Файл Result.html, как и Errors.html, располагается в каталоге, где находится
стартовая страница для проверки. Кроме этих двух файлов программа Retrieve
в том же каталоге создает еще девять: goodSearch.html, hardIndex.html, hardSearch.
html, notFriend.html, notParsed.html, Search.html, slowIndex.html, dBase.kkw и
forResume.kkw. Наверное, такое решение не самое лучшее, тем более что два пос
ледних файла – это служебная информация Retrieve, а не файлы отчетов, но это,
скорее, отдельный вопрос к разработчикам программы.
Найденные ошибки в гиперссылках и оформлении метатэгов сгруппированы
в файле Result.html по доступности их поиска, как показано в следующем приме
ре (здесь обследован локальный компьютер, намеренно отключенный от Internet
для генерации ошибок по внешним ссылкам):
———————————————-
The result of searching (Ðåçóëüòàòû ïîèñêà)
———————————————-
Visited links (Ïðîâåðåíî ññûëîê): 34 Errors links (Îøèáî÷íûõ ññû-
ëîê): 7 Found keywords: (Íàéäåíî êëþ÷åâûõ ñëîâ): 4
Tue Oct 10 23:02:04 GMT+03:00 2000
Программы 207
Hard to search (Òðóäíûå äëÿ ïîèñêà)
The pages that are hard to search (no title) (Ñòðàíèöû, êîòîðûå
òðóäíî íàéòè)
Hard index (Òðóäíûå äëÿ èíäåêñèðîâàíèÿ)
The pages that are hard to index correctly (title – yes,
keywords – no) (Ñòðàíèöû, ó êîòîðûõ òðóäíî ïðàâèëüíî âûáðàòü êëþ÷å-
âûå ñëîâà)
Slow index (Ìåäëåííûå äëÿ èíäåêñèðîâàíèÿ)
The pages that are good but slow to index (title – yes, keywords –
yes, content – yes, http-equiv – no) (Ñòðàíèöû, êîòîðûå â öåëîì
ïðàâèëüíî îôîðìëåíû, íî çàìåäëÿþò ðàáîòó ïîèñêîâûõ ìàøèí)
Not friend pages (Íåäðóæåñòâåííûå äëÿ ïîèñêà)
The pages that are not friendly for those who search (title – yes,
keywords – yes, content – no) (Ñòðàíèöû, êîòîðûå íåäðóæåñòâåííû
ê òîìó, êòî èõ èùåò)
Good search pages (Õîðîøèå äëÿ ïîèñêà)
The pages that are good to search (Ñòðàíèöû, óäîáíûå äëÿ ðàáîòû
ïîèñêîâûõ ìàøèí)
Not parsed pages (Íåîáñëåäîâàííûå)
The pages that were not parsed (because they are not html, or links
are broken, or other reasons). (Ñòðàíèöû, êîòîðûå íå àíàëèçèðîâà-
ëèñü ëèáî ïîòîìó, ÷òî îíè íå html, ëèáî èç-çà îøèáêè â ññûëêå, ëèáî
ïî äðóãèì ïðè÷èíàì)
———————————————-
Errors links (Îøèáî÷íûå ññûëêè)
Ссылки на показанной странице открывают доступ к детальной и сгруппиро
ванной по результатам анализа информации; возможен переход на страницу
с описанием обнаруженных ошибок в гиперссылках (Errors links), фрагмент ко
торой выглядит следующим образом:
Errors
——————
Ëèíê âçÿò èç (ëîêàëüíî): 6.html
Ëèíê âçÿò èç (ñåðâåð): file:/E:\Internet\~sound/sound.htm
Ëèíê (ëîêàëüíî): null
Ëèíê (ñåðâåð): file:/E:\Internet\~sound/index.htm
Îøèáêà: Failed to connect: IOException:
java.io.FileNotFoundException: \E:\Internet\~sound\index.htm , URL:
file:/E:\Internet\~sound/index.htm
——————
Ëèíê âçÿò èç (ëîêàëüíî): 2.html
Ëèíê âçÿò èç (ñåðâåð): file:/E:\Internet\~sound/index.html
Ëèíê (ëîêàëüíî): 3.html
208 Автоматизация

Ëèíê (ñåðâåð): file:/E:\Internet\~sound/midi.htm


Íåò çàãîëîâêà
Íåò êëþ÷åâûõ ñëîâ
Íåò àííîòàöèè
Íåò HTTP-EQUIV
Îøèáêà: No title
——————

Поиск по ключевым словам


Для локального поиска по ключевым словам, собранным как с удаленного, так и
с локального серверов, воспользуйтесь окном Result of searching. Если информа
ция уже была собрана ранее, достаточно снова запустить программу Retrieve,
щелкнуть по кнопке Restore и дождаться появления указанного окна. Введите
в поле Input keywords (Введите ключевые слова) слова для поиска, разделяя
их пробелами; щелкните по кнопке OK и дождитесь появления в строке состо
яния надписи: View result in file RESULT.HTML (Результат смотрите в фай
ле RESULT.HTML). Откройте данный файл в браузере. Щелкните по ссылке
The result of searching (Результат поиска), расположенной вверху отчета об
ошибках. В окно браузера загрузится страница, примерный вид которой пред
ставлен ниже (в данном случае поиск велся по строке «gaap ias»):
Inotec: accounting software (GAAP, IAS)- Contents
The integrated accounting software systems allow to keep parallel
accounting under both Russian and any international (like GAAP and
IAS) standards as two independent charts of accounts, MSFO, msfo,
GAAP, gaap, IAS, ias, accounting software, parallel accounting,
law, LAW, justice, soft, moscow, Moscow, MOSCOW, inotec, inotek
file:/E:\Internet\Inotec\www.inotec.ru/indcnt_e.htm

Inotec: Ïîñëåäíèå íîâîñòè


The integrated accounting software systems allow to keep parallel
accounting under both Russian and any international (like GAAP and
IAS) standards as two independent charts of accounts, Ðàçðàáîòêà è
ñîïðîâîæäåíèå ïðîãðàìì äëÿ àóäèòà è áóõãàëòåðñêîãî ó÷åòà ïî ðîññèé-
ñêîìó çàêîíîäàòåëüñòâó è ìåæäóíàðîäíûì (GAAP è IAS) ñòàíäàðòàì
ôèíàíñîâîé îò÷åòíîñòè, gaap, ias, accounting software, parallel
accounting, accountancy, free, soft, moscow, ãààï, èàñ, ìñôî,
àóäèò, áóõó÷åò, îò÷åòíîñòü, ïðàâî, íàëîã, áóõãàëòåð, áóõãàëòåðñêèé
ó÷åò, ïðîãðàììû, ïðàâîâûå, ñèñòåìû, ôèíàíñû, îò÷åòíîñòü, íîâîñòè,
ñåòè, çàêîí, ðàáîòà, ðîññèéñêîå çàêîíîäàòåëüñòâî, ìåæäóíàðîäíûå
ñòàíäàðòû, àðõèâ, ïîäïèñêà, ðàññûëêà, êóðñ usd, ïîãîäà, ìîñêâà,
öåíû, áåíçèí, êàëåíäàðü, èíîòåê, inotec, inotek
file:/E:\Internet\Inotec\www.inotec.ru/inotec.htm
Программы 209

CyberSpyder Link Test 2.2.0

Программа CyberSpyder Link Test предназначена для проверки доступности ги


перссылок в HTMLдокументах. В этих целях задается один или несколько стар
товых адресов, которые должны указывать на все остальные страницы сайта или
на другие страницы, содержащие подобные ссылки. Результаты определяются
целым рядом параметров.
Разработчик CyberSpyder Link Test – компания Aman Software (http://www.
cyberspyder.com/, страница поддержки – http://www.cyberspyder.com/cslnkts1.html).
Найти дистрибутив можно также в каталоге ListSoft (http://www.listsoft.ru/)
в разделе Программы ⇒ Интернет ⇒ WWW ⇒ Проверка ссылок (http://www.
listsoft. ru/nt/linkchk.htm).
Для работы программы система должна удовлетворять следующим мини
мальным требованиям:
¾ IBMсовместимый компьютер;
¾ операционная система MS Windows 3.1x/95/98/Me/NT/2000/XP (для
версий 3.1x поддерживается 16разрядная модификация программы);
¾ подключение к Internet.
При проверке создается база данных, наличие которой предоставляет опреде
ленные преимущества:
¾ тест может быть прерван и продолжен позднее. При этом неважно, какова
причина прекращения проверки: сбой системы, аварийное завершение ра
боты программы или обрыв соединения с сервером;
¾ однажды выполненный тест может быть повторен, но уже с учетом преды
дущих результатов. То есть неизмененный со времени последней проверки
документ не подвергается повторному синтаксическому анализу, посколь
ку сохраненные данные могут использоваться многократно;
¾ при повторной проверке результаты теста помогут определить новые или
измененные элементы документов;
¾ отчеты могут быть подготовлены в любое время, в различных формах и
в произвольной последовательности. Ряд отчетов служит для анализа
структуры сайта и помогает при его организации.
После запуска программы открывается окно CyberSpyder Link Test Version 2.2.0
(рис. 2.106). На ваш выбор предлагается несколько возможностей:
¾ начать новый тест;
¾ открыть завершенный тест для повторной проверки;
¾ открыть незаконченный тест и продолжить его.
210 Автоматизация

Рис. 2.106. Рабочее окно программы CyberSpyder Link Test

Отметив один из этих вариантов, необходимо настроить разнообразные пара


метры работы, в том числе задать стартовый адрес (или адреса). Во время провер
ки программа тестирует каждый из них, отыскивает страницы, на которые указы
вают ссылки документа, расположенного по этому адресу, и страницы, на
которые имеются ссылки в очередном рассматриваемом документе.
Если документ расположен на проверяемом сайте, он анализируется програм
мой полностью. Если ссылка ведет на внешний сервер или не имеет отношения
к HTMLдокументу, проверяется только фактическое наличие документа, без его
анализа. Цикл повторяется, пока не будут проверены все ссылки.
Интерфейс программы
Ко всем функциям программы доступ осуществляется через пункты меню рабоче
го окна; а к используемым чаще всего – еще и с помощью кнопок на панели, распо
ложенной непосредственно под этим меню. Три панели в нижней части окна, кото
рые образуют строку состояния программы, имеют следующее назначение:
¾ левая панель используется для отображения процесса обработки информа
ции, когда программа выполняет операции, во время которых пользовате
лю приходится ждать (курсор принимает вид песочных часов);
¾ в средней панели отображается процесс выполнения теста;
¾ в правой панели высвечивается наименование выполняемого теста.
Пункты меню и кнопки панели сгруппированы в секции, при этом в зависимо
сти от состояния программы они могут быть доступны или недоступны. Кроме
того, меняются и надписи на кнопках.
Пункт меню File (Файл) используется для открытия и закрытия тестовых баз
данных. Здесь же вызываются для настройки базы данных тех сайтов, проверка кото
рых отложена. Указанному пункту меню соответствует секция кнопок Database File
(Файл базы данных).
Команда File ⇒ New Test Database (Файл ⇒ Создать базу данных теста)
и кнопка New (Создать) предназначены для создания новой базы данных, куда
Программы 211
будут записываться все результаты тестирования. При этом открывается обычное
диалоговое окно для выбора имени файла. Произведя требуемые установки, вы
переходите к окну CyberSpyder Link Test, изображенному на рис. 2.107, где тре
буется ввести имя теста. Это имя используется в качестве заголовка и появляется
в правой панели строки состояния рабочего окна и во всех отчетах программы.
Откроется окно CyberSpyder Link Test –
Setup of [test name] (Настройка [имя теста]),
предназначенное для настройки параметров
теста. Когда она полностью завершится, на эк
ран будет выведено окноиндикатор процесса
проверки. Информация здесь постоянно изме
няется, отражая динамику и текущее состоя
ние тестирования. Рис. 2.107. Окно CyberSpyder
Пункты меню главного окна программы Link Test для ввода имени теста
File ⇒ Open Test Database (Файл ⇒ Открыть
базу данных теста) и кнопка Open (Открыть) служат для открытия существую
щей базы данных. Работа ведется в обычном диалоговом окне для выбора имени
файла. Произведя нужные настройки, вы переходите в окно CyberSpyder Link
Test – Setup of [test name], куда загружается информация из базы данных и где
она может быть в любое время изменена.
Команда главного окна File ⇒ Delayed Start Setup (Файл ⇒ Настройка запуска
теста с задержкой) предназначена для открытия существующей базы данных и за
пуска теста в определенное время. На экране появляется окно Delayed Start Setup
(рис. 2.108). В поле Start time (Время старта) введите время начала тестирования
в формате ЧЧ:ММ, где ЧЧ – часы, а ММ – минуты, и щелкните по кнопке OK. Выб
рав имя файла в открывшемся окне, вы переведете программу в режим ожидания,
после чего окно будет закрыто, а в указанное время начнется тестирование.

Рис. 2.108. Окно Delayed Start Setup


212 Автоматизация

Пункт меню File ⇒ Close Database (Файл ⇒ Закрыть базу данных) и кнопка
Close (Закрыть) предназначены для закрытия базы данных. По команде File ⇒
Exit (Файл ⇒ Выход) завершается работа программы.
Запуск режима проверки производится с помощью меню Control ⇒ Start
(Управление ⇒ Пуск) и кнопки Start (Пуск). В зависимости от состояния, в ко
тором находится программа, указанный пункт меню и кнопка меняют названия:
¾ Start – при открытии нового теста;
¾ Stop (Стоп) – с началом проверки и во все время ее выполнения. Команда
используется для остановки тестирования. При этом остановка произой
дет не раньше, чем программа завершит проверку текущего адреса. Такой
подход гарантирует сохранение информации в базе данных. Остановлен
ный тест можно закрыть и продолжить тестирование позже;
¾ Continue (Продолжить) – при остановке или при открытии прерванного
теста.
Пункт главного меню Control ⇒ New Test of Site (Управление ⇒ Новый тест
сайта) и кнопка New Test (Новый тест) становятся доступными при открытии
ранее запускавшегося теста, вне зависимости от того, был он завершен или нет.
При использовании данных команд удаляются результаты предыдущей провер
ки и тестирование начинается заново.
Пункт главного меню Control ⇒ Recheck the Site (Управление ⇒ Повторная
проверка сайта) и кнопка Recheck (Повторная проверка) также становятся доступ
ными после открытия ранее запускавшегося теста независимо от того, был ли он за
вершен. При этом используются результаты предыдущей проверки, сохраненные
в базе данных, что позволяет сэкономить время, затрачиваемое на тестирование.
Много времени экономится на тестировании внутренних ссылок своего узла.
Программе не требуется дополнительный запрос, чтобы определить тип объекта,
поскольку все HTMLдокументы определены. Поэтому к таким документам мо
жет быть немедленно применена операция GET (Получить). Она выполняется
только в том случае, если искомая страница изменилась со времени последнего
тестирования.
В последней версии программы до
бавлена еще одна команда: Control ⇒
Abort (Управление ⇒ Прервать). Она
предназначена для немедленного пре
кращения процесса тестирования.
Пункт главного меню Reports ⇒
Select (Отчеты ⇒ Выбрать) и кнопка
Select (Выбрать) предназначены для
осмотра различных отчетов. Откроется
окно Report Type Selector (Выбор типа
отчета), показанное на рис. 2.109.

Рис. 2.109. Окно Report Type Selector


Программы 213
У переключателя в этом окне две позиции:
¾ Result Reports (Итоговые отчеты) – отчеты с учетом опций, настройка ко
торых выполняется на вкладке Reports (Отчеты) окна CyberSpyder Link
Test – Setup of [test name], доступного при создании новых или открытии
существующих тестовых баз данных;
¾ Analysis Reports (Аналитические отчеты) – различные отчеты для анализа
структуры и содержания проверяемого узла.
Выбрав тип отчета, нажмите кнопку Select (Выбрать). Откроется окно Result
Report Selector (Выбор итоговых отчетов) или Analysis Report Selector (Выбор
аналитических отчетов). Первое из них похоже на упомянутое окно CyberSpyder
Link Test – Setup of [test name], но позволяет указать, какие именно элементы бу
дут включены в отчеты, а также настроить их вывод непосредственно на экран.
Второе позволяет выбрать различные отчеты, которые помогают при анализе узла.
С помощью пункта главного меню Reports ⇒ View in Browser (Отчеты ⇒
Отобразить в браузере) запускается браузер, установленный в системе по умол
чанию, и в него загружается файл index.htm из текущей папки для отчетов.
По команде Reports ⇒ Report Manager (Отчеты ⇒ Диспетчер отчетов) от
крывается окно CyberSpyder Link Test Report Manager (рис. 2.110). В нем ото
бражается список всех HTMLотчетов, содержащихся в специальной папке, и
здесь же можно удалить те из них, которые больше не нужны. Для правильного
построения индексного HTMLфайла следует удалять отчеты именно в окне
CyberSpyder Link Test Report Manager. Для этого после выделения требуемого
отчета необходимо нажать кнопку Delete (Удалить).

Рис. 2.110. Окно CyberSpyder Link Test Report Manager

Пункт главного меню Miscellaneous ⇒ News (Разное ⇒ Новости) и кнопка


News предназначены для доступа к сайту производителя программы. По выпол
214 Автоматизация

нении команды откроется окно CyberSpyder Link Test – Update Check (Провер
ка на наличие обновлений) – рис. 2.111.

Рис. 2.111. Окно CyberSpyder Link Test – Update Check

Если у вас есть возможность соединения с Internet, щелкните по кнопке


Check (Проверить), чтобы получить последние новости о программе и сайте.
Команда Miscellaneous ⇒ Winsock (Разное ⇒ Сокеты Windows) и кнопка
Winsock предназначены для вывода информации об установленной в компьютере
версии Winsock. Winsock (Windows’ Sockets) – это программа, обеспечивающая
передачу данных по сети; обычно она записана в файле winsock.dll, который на
ходится в папке C:\Windows\System. Однако некоторые сетевые программы ис
пользуют другие способы передачи информации.
Пункты главного меню Windows (Окна) предназначены для стандартного
управления расположением окон в рабочей области программы.
Настройка
При открытии существующей базы данных или создании новой открывается
окно CyberSpyder Link Test – Setup of [test name], состоящее из шести вкладок:
¾ Start URLs (Стартовые адреса) – для ввода начальных адресов тестирова
ния (рис. 2.112);
¾ Skip URLs (Пропустить адреса) – для указания адресов, которые следует
пропустить при тестировании;
¾ ID/PW URLs (Адреса с идентификацией) – для указания адресов с защи
той посредством идентификаторов и паролей;
¾ Test Options (Параметры теста) – для настройки некоторых опций, касаю
щихся особенностей проведения теста: например, для ввода времени ожида
ния соединения и отклика, числа повторных запросов, информации о прокси
сервере, если он используется (рис. 2.113);
Программы 215

Рис. 2.112. Вкладка Start URLs окна CyberSpyder Link Test – Setup of [Имя теста]

Рис. 2.113. Вкладка Test Options окна CyberSpyder Link Test – Setup of [Имя теста]

¾ Netiquette (Сетевой этикет) – для ввода информации, предназначенной


для серверных роботов (рис. 2.114);
¾ Reports (Отчеты) – для настройки основных отчетов, начиная от выбора
каталога для их сохранения и заканчивая применением разнообразных
фильтров (рис. 2.115).
Для задания адресов на вкладках Start URLs, Skip URLs и ID/PW URLs служит
кнопка New (Новый), для исправления – кнопка Edit (Правка) и для удаления –
Delete (Удалить). При вводе нового адреса и при правке имеющегося на вкладках
Start URLs или ID/PW URLs откроется дополнительное окно CyberSpyder Link
Test – URL Edit or Entry (Правка или ввод адреса). В этом окне можно указать не
только адрес, но и идентификатор пользователя (ID), а также пароль (Password)
(рис. 2.116). В поле Enter URL (Введите адрес) необходимо перед написанием ад
реса задать протокол (например, http:// или ftp://).
216 Автоматизация

Рис. 2.114. Вкладка Netiquette окна CyberSpyder Link Test – Setup of [Имя теста]

Рис. 2.115. Вкладка Reports окна CyberSpyder Link Test – Setup of [Имя теста]

Рис. 2.116. Окно CyberSpyder Link Test – URL Edit or Entry

Первоначальная настройка производится при выполнении нового теста,


а в дальнейшем для выполненных и открытых тестов параметры загружаются из
базы данных и могут быть в любое время изменены.
В нижней части окна CyberSpyder Link Test – Setup of [test name] располо
жены три кнопки. Они имеют следующее назначение:
Программы 217

¾ Cancel (Отменить) – закрыть базу данных и окно без какихлибо действий


и записи изменений;
¾ Tab Defaults (По умолчанию для вкладки) – восстановить на открытой
вкладке значения параметров, подразумеваемые по умолчанию;
¾ OK – проверить введенные значения на полноту и соответствие и, если все
в порядке, сохранить информацию в базе данных. При возникновении ка
кихлибо осложнений программа выводит на экран сообщение об ошибке,
как показано на рис. 2.117 и 2.118. Нажав кнопку OK в окне с сообщением,
вы попадете на вкладку, где обнаружена погрешность: в первом случае это
Start URLs (не указан протокол), во втором – Netiquette (не указан адрес
электронной почты).

Рис. 2.117. Сообщение об Рис. 2.118. Еще одно сообщение


ошибке в настройках теста об ошибке в настройках теста

Если же все настройки выполнены корректно, окно CyberSpyder Link Test –


Setup of [test name] закроется, и откроется окноиндикатор тестирования.
Тестирование
Ход проверки показан в окне, представленном на рис. 2.119.

Рис. 2.119. Окноиндикатор тестирования программы CyberSpyder Link Test


218 Автоматизация

Информация в окне постоянно изменяется, отражая динамику тестирования


и его текущее состояние. Окноиндикатор содержит три раздела:
¾ Current URL (Нынешний адрес) – указан адрес, который в данное время
проверяется;
¾ Processing Status (Статус выполнения) – показана операция, которая вы
полняется в данный момент, отражено состояние теста и время, прошедшее
с его начала.
¾ URL Counters (Счетчики адресов) – приведены итоговые показания счет
чиков для различных элементов теста.
Раздел Current URL включает в себя пять полей:
¾ Service (Служба) – имеется в виду протокол для адреса. В настоящее вре
мя программа поддерживает только протокол HTTP;
¾ Host (Главный компьютер) – имя главного компьютера (узла), которое,
как правило, обозначают аббревиатурой URL. Поле может быть и не запол
нено, если вместо имени узла представлен адрес IP;
¾ Host IP (IPадрес узла) – IPадрес главного компьютера (узла). Если не
удастся его узнать, поле останется пустым;
¾ Port (Порт) – порт, через который идет проверка;
¾ URL (URLадрес) – отображается адрес, тестируемый в настоящее время.
Раздел Processing Status (Статус выполнения) содержит четыре поля. В поле
Current Operation (Текущая операция) программа указывает действие, которое
выполняется в настоящий момент времени:
¾ Waiting to Start (Ожидание начала) – ожидание начала тестирования;
¾ Continue (Продолжить) – продолжение прерванного теста;
¾ Preparing to run test (Подготовка к запуску теста) – первоначальный от
бор информации, необходимой для запуска теста;
¾ Preparing to run test – ensuring tables are clear (Подготовка к запуску тес
та – очистка служебных таблиц) – часть первоначальной установки, ис
пользуемая для настройки нового теста;
¾ Preparing to run test – recording startup info (Подготовка к запуску теста –
запись первоначальной информации) – извлечение необходимой базовой
информации и накопление ее в памяти;
¾ Setting up for a Retest – please wait (Настройка повторного запуска – по
дождите немного) – подготовка к повторному тестированию сайта. Вклю
чает удаление или переустановку значений некоторых таблиц;
¾ Loading info for Incomplete Test restart (Загрузка информации для по
вторного запуска незавершенного теста) – восстановление информации,
полученной до того, как тест был прерван;
¾ Stopped (Остановлен) – тест остановлен;
¾ Get next URL to test (Получение очередного адреса для тестирования) –
поиск нетестировавшегося адреса в таблице структуры сайта;
¾ See if tested (Проверка, не тестировался ли) – проверка наличия результа
тов тестирования конкретного адреса;
Программы 219
¾ Parsing URL (Синтаксический анализ адреса) – синтаксический анализ
компонентов URLадреса: узла, порта, пути, файла;
¾ Get/Create Unique URL record (Получить/Создать запись для уникаль
ного адреса) – извлечение уникальной записи для данного уникального
URLадреса или, при отсутствии таковой, – ее создание;
¾ Checking on name anchor (Проверка на наличие поименованной ссылки) –
проверяется наличие в коде HTMLстраницы атрибута NAME (наименова
ния) в тэге A (конструкция вида <A HREF=“…” NAME=“…” > … </A>);
¾ See if we have the host IP (Проверка на наличие IPадреса узла) – поиск
в таблицах IPадреса узла;
¾ Do DNS lookup for Host address (Поиск адреса узла по DNS) – определе
ние IPадреса узла по его DNS;
¾ Create Host/IP reference record (Создание справочной записи об узле/
Ссылка на IPадрес) – сохранение в таблице найденного IPадреса узла,
с тем чтобы впоследствии не потребовалось снова определять его по сети;
¾ Check host for «robots.txt» (Проверка наличия файла robots.txt на узле) –
выясняется, имеет ли узел файл robots.txt (проверка выполняется один раз
для каждого узла);
¾ Short pause to reduce server load (Краткая пауза для уменьшения нагрузки
на сервер) – при ограничении по скорости, программа будет работать с не
большими паузами, чтобы не превысить его;
¾ Testing the URL (Тестирование адреса) – отбор информации, необходи
мой для тестирования URLадреса.
Поле Timer (Таймер) используется для отсчета времени при попытке подклю
чения к сайту или при ожидании ответа.
В поле Retries (Попытки) отражается число попыток выполнения операций,
которые могут быть повторены. Вначале устанавливается нулевое значение, ко
торое увеличивается на единицу при каждой новой попытке.
При сканировании и нахождении программой HTMLдокумента заголовок поля
No Document in Process (Не обрабатывается никакой документ) изменяется на
Process Document: … Bytes Received (Обработка документа: получено … байт),
а показания счетчика в данном поле увеличиваются по мере загрузки документа.
Когда загрузка завершена, заголовок поля изменяется на Process Document: …
Bytes Left (Обработка документа: осталось … байт), а значение счетчика умень
шаются по мере просмотра документа и анализа имеющихся в нем ссылок.
Поле Elapsed Time (Прошедшее время) служит для отсчета времени, прошед
шего с начала тестирования. Если открыт завершенный тест, то здесь показыва
ется общее время, затраченное на тестирование; если незаконченный – время,
прошедшее от начала тестирования до его прекращения. Время отображается
в формате hh:mm, где hh – часы, а mm – минуты.
Поле Status (Состояние) предназначено для фиксации текущего состояния
теста и может принимать следующие значения:
¾ New Test (Новый тест) – создана новая тестовая база данных или открыта
уже имеющаяся, но тест еще не запускался;
220 Автоматизация

¾ Incomplete Test (Незавершенный тест) – открыта база данных частично


выполненного теста;
¾ Starting (Запуск) – программа выполняет операции по подготовке к тести
рованию;
¾ Running (Выполнение) – идет тестирование;
¾ Waiting to Stop (Ожидание до остановки) – такое сообщение возникает
при нажатии на кнопку Stop (Стоп), в то время, когда реально тестирова
ние еще не прервано. Задержка обусловлена необходимостью завершить
текущую операцию, чтобы сохранить состояние теста;
¾ Stopped (Остановлено) – полная остановка тестирования. Теперь, если
требуется, тест можно закрыть, и продолжить его выполнение позднее. Эта
ситуация безопасна, так как промежуточные результаты сохраняются;
¾ Finished (Закончено) – завершение теста;
¾ Completed (Завершено) – такое сообщение появляется при повторном от
крытии завершенного теста.
Раздел URL Counters состоит из счетчиков, показывающих:
¾ Left (Осталось) – количество адресов, которые должны быть еще провере
ны. При анализе ссылок из нового HTMLдокумента показания данного
счетчика уменьшаются по мере проверки ссылок;
¾ Checked (Проверено) – число проверенных адресов;
¾ Unique (Уникальные) – число уникальных URLадресов. В дополнение к ад
ресам документов проверяемых сайтов (указанных на вкладке Start URLs
в окне CyberSpyder Link Test – Setup of [test name]) данный счетчик фик
сирует ссылки на документы, находящиеся на других сайтах, – внешние
ссылки. В связи с этим по завершении проверки показания данного счетчи
ка могут быть выше, чем показания Checked;
¾ Skipped (Пропущено) – отражает число пропущенных адресов, то есть тех,
которые не тестировались. Сюда входят не только адреса, введенные при
настройке тестовой базы в окне CyberSpyder Link Test – Setup of [test name]
на вкладке Skip URLs (Пропустить URLадреса), показанной на рис. 2.120,
но и те, которые получены с помощью файла исключений для роботов
robots.txt;
¾ Good (Исправные) – показывает число удачно протестированных адресов
(по ссылкам найдены документы);
¾ Broken (Некорректные) – показывает число неудачно протестированных
адресов (по ссылкам не найдены документы);
¾ Can’t (Непроверенные) – показывает число адресов, которые программа
не может проверить, так как для них использован не HTTPпротокол;
¾ Warnings (Предупреждения) – показывает число предупреждающих сооб
щений, например, изза ошибок в тэгах HTMLдокумента.
Значения счетчиков Skipped, Good, Broken и Can’t в сумме дают значение
счетчика Checked, то есть детализируют его.
Программы 221

Рис. 2.120. Вкладка Skip URLs окна CyberSpyder Link Test – Setup of [test name]

Итоговые отчеты
В главном меню программы выберите пункт Reports ⇒ Select (Отчеты ⇒ Выбрать)
или щелкните по кнопке Select (Выбрать). В открывшемся окне Report Type
Selector (Выбор типа отчета) установите переключатель в положение Result
Reports (Итоговые отчеты) и нажмите кнопку Select. Откроется окно CyberSpyder
Link Test Result Report Selector (Выбор итогового отчета), предназначенное для
подготовки отчетов к полностью или частично завершенным тестам (рис. 2.121).

Рис. 2.121. Окно CyberSpyder Link Test Result Report Selector

Здесь собраны все опции, которые имеются на вкладке Reports в окне


CyberSpyder Link Test – Setup of [test name] (оно используется при открытии
222 Автоматизация

существующего или создании нового теста), а также предусмотрены дополни


тельные возможности: просмотр результатов на экране без запуска браузера и
специальная настройка данных, включаемых в отчет.
В разделе Choose Format (Выбор формата) расположен трехпозиционный
переключатель, с помощью которого выбирается способ вывода отчета:
¾ HTML – в виде HTMLдокумента для его просмотра в браузере;
¾ Printed (Печатный) – распечатка на принтере;
¾ On Screen (На экране) – вывод на экран в самой программе.
В разделе Select the HTML Report Directory (Выберите каталог для сохране
ния HTMLотчета) можно указать директорию, куда программа будет записы
вать отчеты, подготовленные в формате HTML. По умолчанию выбрана директо
рия Reports, находящаяся в каталоге, где установлена программа CyberSpyder
Link Test. Чтобы хранить здесь же результаты не одного, а нескольких тестов, сле
дует воспользоваться опцией Allow multiple report sets in directory (Разрешить
размещение нескольких отчетов в одном каталоге). Если этого не сделать, про
грамма при записи нового отчета может удалить прежний, выдав, впрочем, пре
дупреждающее сообщение.
Кнопка Select (Выбрать) предназначена для выбора каталога в обычном окне
доступа к файловой системе компьютера. Очень важно, чтобы все создаваемые
отчеты находились в одном каталоге: программа автоматически формирует ссыл
ки с главной индексной страницы к различным отчетам. При создании новых или
удалении имеющихся программа заново создает главную индексную страницу.
Раздел Sort by (Сортировка) используется для сортировки отчетов следую
щим образом:
¾ Page URL, showing referenced links (По адресам страниц, показывая вы
зываемые ссылки) – отчет отсортирован по HTMLстраницам с показом
содержащихся на них ссылок;
¾ Referenced links, showing page URLs (По вызываемым ссылкам, показы
вая адреса страниц) – отчет отсортирован по ссылкам с показом адреса
каждой страницы, содержащей ссылку;
¾ By result code (По коду результата) – отчет отсортирован по коду резуль
тата, далее по ссылкам. Показан адрес каждой страницы, содержащей
ссылку.
Раздел Sort by недоступен, если переключатель в разделе Choose Format ус
тановлен в положение On Screen.
Переключатель в разделе Report Grouping (Группировка отчета) использует
ся для дополнительной структуризации отчета и может быть установлен в одно
из двух положений:
¾ Broken, Can’t Check, etc. separated (Некорректные, непроверенные и т. д.
отдельно) – ошибки, то есть неисправные, недоступные, пропущенные
ссылки, предупреждения, фиксируются обособленно: в случае подготовки
отчета в формате HTML – на HTMLстранице, в случае подготовки печат
ного отчета – на листе бумаги;
Программы 223
¾ Show all types together (Показывать все вместе) – все отчетные сведения
сводятся воедино и сортируются с учетом соответствующих настроек. Это
единственно возможная позиция, если переключатель в разделе Choose
Format установлен в положение On Screen.
Для отбора информации, которая будет включена в отчеты, используются
фильтры. Переключатель в разделе Selection (Выделение) предназначен для вы
бора стандартного или специального наборов фильтров:
¾ Standard Filters (Стандартные фильтры);
¾ Custom Selection (Специальный выбор).
Для настройки стандартных фильтров выберите Standard Filters, и тогда дос
тупны следующие параметры.
Программа создает запись в отчете по каждому адресу, который она не может
проверить. В некоторых случаях можно запретить создание таких записей, если
в разделе Can’t Check Filter (Фильтр для непроверенных ссылок) отметить опре
деленные виды протоколов.
Для каждого адреса, который программа пропускает, создается запись, неза
висимо от того, был ли такой адрес получен в соответствии с анализом файла
robots.txt или был введен при настройке теста. Чтобы избежать включения в от
чет подобных записей, следует в разделе Skipped Filter (Фильтр пропущенных
ссылок) установить флажок No messages for skipped URLs (Без сообщений для
пропущенных адресов).
Кроме того, выполняется некоторый синтаксический анализ HTMLкода. Впро
чем, сообщения об ошибках в нем также можно исключить из отчета, если воспользо
ваться выключателем в разделе Warning Filter (Фильтр предупреждений).
Для настройки специальных фильтров в разделе Selection следует выбрать
Custom Selection., а в одноименном разделе нажать кнопку Make Selection (Сде
лать выбор). Откроется окно Custom Selection, показанное на рис. 2.122. Оно

Рис. 2.122. Окно Custom Selection


224 Автоматизация

представляет собой таблицу, куда сведены все коды, полученные в результате


проверки ссылок для выполняемого теста. Таблица состоит из трех колонок:
Code (Код), Type (Тип) и Description (Описание). Тип кода – это обобщенное
состояние проверяемой ссылки, например: Good (Исправная), Broken (Неисп
равная) и т. д. Выберите те коды, которые примут участие в формировании отче
тов. Допускается множественный выбор, осуществляемый стандартным спосо
бом – с помощью мыши и клавиши Shift или Ctrl. Теперь нажмите кнопку OK.
Справочная система программы снабжена подробным перечнем используе
мых кодов с описанием на английском языке.
Осуществив все необходимые настройки в окне CyberSpyder Link Test Result
Report Selector, нажмите кнопку Do Reports (Построить отчеты). Формирова
ние отчетов сопровождается индикацией хода их построения в строке состояния
(левый нижний угол главного окна программы). Закончив построение отчетов,
программа закроет окно CyberSpyder Link Test Result Report Selector. Если для
отчетов был выбран формат On Screen, откроется еще одно: Report for [testname]
(Отчет для [имя теста]) – рис. 2.123. Здесь присутствует таблица с несколькими
колонками:
¾ Page URL (Адрес страницы);
¾ Page Title (Заголовок страницы);
¾ Ref Type (Тип ссылки) – вида <A HREF …, или <IMG SRC …, и т. д.;
¾ Ref in Page (Ссылка на странице) – ссылка в том виде, как она выглядит на
странице, то есть ее HTMLкод;
¾ Expanded Reference (Развернутая ссылка) – ссылка, конвертированная
в полный URLадрес;
¾ Result Code (Код результата) – код результата, полученный при анализе
ссылки;
¾ Message (Сообщение) – описание кода результата.

Рис. 2.123. Окно Report for [testname]


Программы 225
Если щелкнуть по одному из заголовков таблицы, то в зависимости от выб
ранного заголовка, отчет будет пересортирован на экране следующим образом:
¾ Page URL – сортировка по колонкам Page URL и Expanded Reference;
¾ Page Title – сортировка по колонкам Page Title, Page URL и Expanded
Reference;
¾ Ref Type – по колонкам Reference Type, Page Title, Page URL и Expanded
Reference;
¾ Ref in Page – по колонкам Reference in Page и Page URL;
¾ Expanded Reference – по колонкам Expanded Reference и Page URL;
¾ Result Code – по колонкам Result Code, Page URL и Expanded Reference;
¾ Message – по колонкам Message, Page URL и Expanded Reference.
Ширину колонок можно изменить, если указателем мыши переместить разде
литель между ними (в заголовочной части) влево или вправо.
Работая с таким отчетом, можно продолжить выполнение прерванного теста,
что очень удобно для предварительного ознакомления с результатами тестирова
ния. Для этого, не закрывая окно Report for …, нажмите кнопку Continue или
выберите пункт Control ⇒ Continue в главном меню программы.
Аналитические отчеты
В меню программы выберите пункт Reports ⇒ Select (Отчеты ⇒ Выбрать) или
щелкните по кнопке Select (Выбрать). В открывшемся окне Report Type Selector
(Выбор типа отчета) установите переключатель в положение Analysis Reports
(Аналитические отчеты) и нажмите кнопку Select, после чего на экран будет вы
ведено окно CyberSpyder Link Test Analysis Report Selector (Выбор аналитичес
кого отчета) – рис. 2.124. Оно служит для подготовки отчетов о тестах, завершен
ным полностью или частично. Аналитические отчеты используются для анализа
структуры и содержания проверяемого узла.

Рис. 2.124. Окно CyberSpyder Link Test Analysis Report Selector


226 Автоматизация

Тип отчета, который будет сформирован программой, следует выбрать в раз


деле Choose Report (Выбор отчета) с помощью переключателя, фиксируемого
в одном из следующих положений:
¾ Site File Structure (Файловая структура сайта) – отчет будет представлять
файловую структуру сайта. Различные его уровни для наглядности помече
ны соответствующими пиктограммами (директории, или папки; HTML
страницы; изображения; пропущенные ссылки; неисправные ссылки; нерас
познанные объекты). Данный вид подходит, например, для определения
неиспользуемых файлов путем сравнения отчета с реальной файловой
структурой сервера;
¾ Site Map (Карта сайта) – формируемый отчет аналогичен предыдущему,
за исключением того, что сюда включена информация только о HTML
файлах. Таким образом, дается наглядное представление о расположении
HTMLстраниц на сайте;
¾ Page Size Analysis (Анализ размера страниц) – здесь указывается размер
каждой страницы в байтах, который рассчитывается как суммарный объем
текста, графики, HTMLкода и скриптов, составляющих страницу. Такой
отчет используется для разработки быстро загружающихся страниц –
именно они входят в состав эффективных сайтов. Стандартный расчет та
ков: размеры основных входных страниц, а также страниц следующего
уровня не должны превышать 20 Кб, максимум – 30 Кб. Страницы, распо
ложенные глубже, могут быть большего размера, так как логично предпо
ложить, что пользователь добрался до них не из праздного любопытства,
а значит, готов дождаться полной загрузки.
Если вам не подходят указанные варианты, раздел Cross Reference Reports
(Отчеты по перекрестным ссылкам) предоставляет возможность выбрать дру
гие – отчеты, которые позволят увидеть, какие именно ссылки имеются на каж
дой из страниц. Учитываются как внешние, так и внутренние ссылки. Такие отче
ты особенно полезны при модернизации сайта, когда изменяется расположение
страниц и требуется, соответственно, изменить имеющиеся гиперссылки. Можно
построить отчеты двух видов:
¾ By page showing links (По страницам, показывая ссылки) – выводится
список всех страниц с указанием всех ссылок на каждой из них;
¾ By links showing pages (По ссылкам, показывая страницы) – выводится
список всех ссылок с указанием для каждой ссылки всех страниц, где она
размещена.
Отчеты по перекрестным ссылкам можно подстроить с помощью следующих
параметров:
¾ HTML links only (Только HTMLссылки) – в отчет будут включены толь
ко ссылки, указывающие на HTMLстраницы;
¾ Suppress Result Messages (Подавлять результирующие сообщения) –
неисправные ссылки обычно помечаются как недоступные (broken), и
в отчет включается соответствующее сообщение. При выборе данного
Программы 227
параметра оно не входит в отчет, а ссылки помечаются как неопознанные
(unknown type);
¾ HREF links only (Только HREFссылки) – в отчете присутствуют только
те ссылки, которые организованы при помощи тэга HREF.
Другие варианты, выбор которых весьма полезен при обновлении сайта, мож
но найти в разделе What’s New, What’s Old Reports (Отчеты о новом и старом).
Подобные проверки позволяют обнаружить ошибочные ссылки и гарантируют
корректность сайта. Кроме того, можно получить сведения о новых страницах и
о тех, которые давно не изменялись. Впрочем, последнее допустимо только при
повторной проверке сайта.
Отчеты такого рода зависят от информации, отправляемой Webсервером, в част
ности от указанной сервером даты последнего обновления файла. При повторной
проверке сайта программа CyberSpyder Link Test сравнивает дату с той, что была
сохранена при предыдущей проверке. Отметим, что некоторые серверы не предо
ставляют данной информации. Кроме того, страницы, автоматически генерируе
мые по запросу с помощью CGIскриптов, технологий ASP (Active Server Page)
или SSI (Server Side Includes), всегда будут отправляться сервером как новые.
Отчеты, о которых идет речь, компонуются различными способами:
¾ By page showing items (По страницам, показывая элементы) – выводится
список страниц с указанием всех элементов (объектов) на каждой из них;
¾ By items showing pages (По элементам, показывая страницы) – выводится
список всех элементов (объектов), и для каждого указываются все страни
цы, на которых он размещен.
Формирование отчетов зависит от опции select New, Old, or Unknown (Выбе
рите: новые, устаревшие или неопределенные):
¾ New or Changed items (Новые или измененные элементы): в отчет включа
ются элементы, по которым сервер возвратил код 200 – то есть объект най
ден – и дату последнего обновления. Таким образом, подразумевается либо
новая ссылка, либо ссылка, измененная со времени предыдущего тестиро
вания;
¾ Old or Unchanged items (Устаревшие или неизмененные элементы): вклю
чаются элементы, по которым сервер возвратил код 304 – то есть объект
найден, но не изменялся;
¾ Unknown Status items (Элементы с неопределенным состоянием): в отчет
входят элементы, по которым сервер возвратил код 200 – то есть объект
найден – но не возвратил дату последнего обновления.
Рассматриваемые отчеты можно подстроить с помощью следующих параметров:
¾ HTML items only (Только HTMLэлементы) – в отчет будут включены
только ссылки, указывающие на HTMLстраницы;
¾ HREF items only (Только HREFэлементы) – в отчете присутствуют толь
ко те ссылки, которые организованы при помощи тэга HREF;
¾ “Home” site only (Только свой сайт) – в отчет включены только внутрен
ние ссылки, указывающие на свой (локальный) сайт;
228 Автоматизация

¾ “Non home” site only (Только не свой сайт) – в отчет будут включены
только внешние ссылки, то есть указывающие не на свой сайт, что полезно
для проверки этих ссылок.
Отчеты можно вывести в формате HTML или распечатать на принтере, для
чего в разделе Choose Format (Выбор формата) следует установить переключа
тель в положение HTML или Printed (Печатный).
В разделе Select the HTML Report Directory (Выберите каталог для сохранения
HTMLотчета) указывается директория, куда программа будет записывать отчеты,
подготовленные в формате HTML. По умолчанию выбрана папка Reports, находя
щаяся в каталоге, где установлена программа CyberSpyder Link Test. Чтобы хранить
здесь же результаты не одного, а нескольких тестов, следует воспользоваться выклю
чателем Allow multiple report sets in directory (Разрешить размещение нескольких
отчетов в одном каталоге). Если не сделать этого, программа при записи нового отче
та удалит прежний, выдав, однако, предупреждающее сообщение.
Примеры отчетов
Если в каталоге, предназначенном для сохранения отчетов, их содержится не
сколько, то программа строит индекс, который всегда записывается в файл с име
нем index.htm (см. рис. 2.125). Для перехода к нужному отчету используются
обычные гиперссылки.

Рис. 2.125. Индекс отчетов программы CyberSpyder Link Test

Если выбран итоговый отчет, первой страницей в нем будет Summary (Ито
ги) – см. рис. 2.126. Здесь приведены итоги теста и ссылки на другие страницы
отчета, в том числе на индексную.
Программы 229

Рис. 2.126. Страница Summary итогового отчета

Содержание подробных отчетов теста зависит от установок, произведенных


перед их построением, в частности от того, применяется ли группировка (пере
ключатель в разделе Report Grouping для итоговых отчетов). Наличие ссылок
указывает на то, что группировка использована. На рис. 2.127 показан фрагмент
подобного отчета, а именно, страница Broken (Некорректные).

Рис. 2.127. Страница Broken итогового отчета

Фрагмент отчета о файловой структуре сайта показан на рис. 2.128. Как уже
отмечалось, он содержит только ссылки на HTMLдокументы.
230 Автоматизация

Рис. 2.128. Фрагмент отчета о файловой структуре сайта

HTML Link Validator 4.21


Эта несложная программа компании Lithops Software (http://lithopssoft.com/) по
зволяет проверить все ссылки сайта на ресурсы, доступные по протоколу HTTP.
Найти дистрибутив можно по адресу http://lithopssoft.com/hlv/index.html,
а также в каталоге SoftPortal в разделе Download ⇒ ⇒ Разное (http://
softportal.com/freesoftware/537/htmllinkvalidator). Программа представляет со
бой полностью автоматизированную многопоточную поисковую систему, кото
рая дает подробный отчет обо всех найденных ссылках во всех отсканированных
файлах и страницах. Ее отличают быстрота работы, легкость использования и
возможность тестирования неограниченного числа ссылок и файлов. Обработ
ку можно вести как на удаленном сервере, так и на локальной машине. Кроме
HTMLфайлов, программа позволяет проверить закладки обозревателей
Microsoft Internet Explorer, Netscape Navigator и Opera, а также связи в базе дан
ных MS Access Database (файлы с расширением .mdb).
По завершении проверки HTML Link Validator создает список всех оттести
рованных файлов и ссылок, отмечая файлы с ошибками. Для правки достаточ
но щелкнуть по строке списка – и в соседней панели появится исходный
HTMLкод страницы, в котором курсор будет позиционирован на некоррект
ной ссылке.
Для тестирования ссылок на локальном компьютере выбирается нужная пап
ка и запускается сканирование. Программа найдет все HTMLфайлы в заданной
папке и во всех папках нижнего уровня, создаст их список, отметит файлы
с ошибками, отобразит ссылки в удобном формате, позволяя редактировать их.
Самое главное, в отличие от аналогичных программ, HTML Link Validator прове
ряет имена файлов с учетом регистра букв. Это важно, так как большинство сер
Программы 231
веров в Internet построены на платформе операционной системы UNIX, а она
чувствительна к регистру букв в названиях файлов. Так, если файл называется
image.GIF, то ссылка на image.gif будет работать на компьютере под ОС Windows
и не будет – под ОС UNIX.
Проверка всего сайта
Главное окно программы имеет вид, изображенный на рис. 2.129. Для тестирова
ния сайта в правой панели окна поставьте флажок Validate HTML files on web
server (Проверять HTMLфайлы вебсервера).

Рис. 2.129. Главное окно программы HTML Link Validator

Если требуется обработать сайт целиком, отметьте опцию Validator will scan
whole website (Будет сканироваться весь сайт). Введите в поле Starting address
(Стартовый адрес) начальный адрес сканирования сайта и щелкните по кнопке
VALIDATE! (Проверить!). При тестировании можно пропустить ссылки, указы
вающие на другие сайты. Для этого отметьте опцию Exclude any link that does
not start with the folder address above (Исключать всякую ссылку, которая начи
нается не с адреса, указанного выше).
Проверка части сайта
Чтобы обследовать только часть сайта, поставьте флажок I’ll supply a list of files that
should be validated (Подам список файлов для проверки). После этого правая панель
изменит вид (рис. 2.130). Здесь в поле Enter a list of files that should be validated
(Введите список файлов для проверки) укажите список адресов, с которых начнется
тестирование. При этом переключателем выбирается одна из двух возможностей:
¾ Download each file and check all links it contains (Загружать каждый файл
и проверять все ссылки, которые он содержит) – обычная проверка всех
232 Автоматизация

ссылок по алгоритму, используемому всеми поисковыми системами с пе


реходом по ссылкам от страницы к странице;
¾ Do not download files, just check if they are available (Не загружать файлы,
лишь проверять их доступность) – в этом случае не происходит перехода
по ссылке на соответствующую страницу и ее анализа, а проверяется толь
ко доступность ссылки.

Рис. 2.130. Главное окно программы с видоизмененной правой панелью

Для запуска обработки щелкните по кнопке VALIDATE!. Программа начнет


работу, индицируя на экране ход обработки, как показано на рис. 2.131.

Рис. 2.131. Главное окно программы при локальной проверке файлов


Программы 233
Можно подготовить список адресов для проверки в отдельном текстовом фай
ле (каждый адрес на отдельной строке), загрузить его с помощью кнопки Load
file list (Загрузить список файлов) и таким же образом, как описано выше,
запустить обработку.
Локальная проверка файлов
Для проверки файлов на компьютере отметьте опцию Validate HTML files on local
computer (Проверять HTMLфайлы на локальном компьютере). Главное окно
программы примет вид, изображенный на рис. 2.132.

Рис. 2.132. Главное окно программы при локальной проверке файлов

В левой панели выберите необходимую папку. В правой панели отметьте оп


цию This folder (Эта папка), если не хотите тестировать файлы, находящиеся
в папках нижнего уровня, или This folder and all subfolders (Эта папка и все
папки нижнего уровня) для обработки всех файлов, в том числе и находящихся
в подчиненных папках. Двойным щелчком по выбранной папке запускается
сканирование. Программа находит HTMLфайлы и проверяет корректность
имеющихся в них ссылок. Если требуется следовать за ссылками, поставьте
флажок Follow links and validate linked files (Следовать по ссылкам и прове
рять связанные файлы).
Результаты тестирования
По завершении проверки программа HTML Link Validator отображает на экране
в отдельных панелях (рис. 2.133):
¾ список всех найденных HTMLфайлов (файлы с ошибками маркируются
красным кружком);
¾ список всех ссылок, найденных в выбранном файле.
234 Автоматизация

Рис. 2.133. Окно программы после проверки сайта

Для каждой ссылки в графе Status (Состояние) существует свое сообщение.


Эти сообщения различаются для ссылок на удаленном сервере и на локальном
компьютере, кроме двух:
¾ OK – нет ошибок;
¾ untested (Не тестировалось).
Вот некоторые сообщения после проверки файлов на компьютере:
¾ File missing (Файл отсутствует);
¾ File found, but internal link is absent (Файл найден, но отсутствует внутрен
няя ссылка). Например, по ссылке «index.htm#xxx» найден файл index.htm,
но в нем нет метки «xxx»;
¾ Case error (Ошибка в регистре). Например, найдена ссылка src=“image.gif”,
в то время как подлинное имя файла «image.GIF».
Конструкция сообщений после проверки HTMLстраниц на удаленном
сервере такова:
Error (Ошибка): [детальное описание ошибки].
Например: Error: resource not found (Ошибка: ресурс не найден).
Если щелкнуть в списке по ссылке, в верхней части окна откроется панель
с исходным кодом страницы, при этом курсор позиционируется именно на нуж
ной ссылке (рис. 2.134). Здесь можно внести необходимые исправления и сохра
нить файл.
Список ссылок фильтруется с помощью кнопки Apply/Remove filter (Приме
нить/Удалить фильтр) . Для настройки предназначена кнопка Set filter (Уста

новка фильтра) , после щелчка по которой откроется окно Filters (Фильтры) –


рис. 2.135. Оно позволяет выполнить установки по следующим параметрам:
Программы 235

Рис. 2.134. Окно программы с исходным кодом страницы

¾ status (Состояние);
¾ tag (Тэг);
¾ url (URLадрес).
Кроме того, есть возможность указать такие блоки
адресов: Hide links starting from (Скрыть ссылки, на
чинающиеся с…) и Hide links not starting from
(Скрыть ссылки, начинающиеся не с…).
Отчеты
Как правило, программы проверки ссылок строят
собственные отчеты. HTML Link Validator не являет
ся исключением – предлагаются следующие отчеты:
¾ Full Report (Полный отчет) – список всех про
веренных файлов и всех ссылок в каждом фай
ле. Как и в предыдущем отчете, отмечается
состояние каждой ссылки и основание, по ко
торому она отнесена к некорректной;
¾ Bad Links Report (Отчет о недоступных ссыл
ках) – отображаются только недоступные файлы
и некорректные ссылки, для каждой из которых
указывается причина недосягаемости файла; Рис. 2.135. Окно Filters
¾ Redirected Links Report (Отчет о ссылках с пе
реадресацией) – список перенаправленных ссылок, например, при помощи
тэга <meta http-equiv=“Refresh”…;
¾ List of External Links Report (Отчет: список внешних ссылок) – полный
список всех ссылок на файлы, которые не находятся в домене сайта;
236 Автоматизация

¾ Custom Report (Заказной отчет) – отчет, который строится на основании


настроенных фильтров.
Для получения отчетов щелкните по кнопке Report (Отчет) . Откроется
окно Reports (рис. 2.136).

Рис. 2.136. Окно Reports

В разделе Report Format (Формат отчета) выберите вид отчета: Plain Text
(Текстовый), HTML (HTML) или Export to MS Access (Экспорт в MS Access).
В разделе Report Type (Тип отчета) – его тип из списка, приведенного выше. Для
построения заказного отчета нажмите кнопку Settings (Настройки) и установите
фильтры.

Проверка HTMLкода
CSE HTML Validator

Программа CSE HTML Validator разработана компанией AI Internet Solutions и


распространяется в двух вариантах: CSE HTML Validator Professional 6.52 и CSE
HTML Validator Lite 6.52 (последний – бесплатно). Адрес в Internet: http://
www.htmlvalidator.com/.
Программа предназначена для выявления и устранения синтаксических оши
бок в HTMLдокументах с целью идентичного отображения HTMLстраниц
в различных браузерах. Работает она под управлением операционных систем
Microsoft Windows 98/Me/2000/XP. Минимальные системные требования:
Программы 237
¾ процессор класса Pentium с частотой 100 МГц;
¾ оперативная память – 32 Мб;
¾ монитор с разрешением экрана 800×600 и палитрой из 256 цветов.
Лучших результатов можно достичь на компьютерах, оснащенных процессо
рами Pentium II или Celeron, с объемом оперативной памяти 128 Мб и разреше
нием 1024×768, а для работы в ОС Windows XP желательно иметь процессор
Pentium III и объем оперативной памяти 256 Мб.
Для исправления ошибок, которые найдет программа в ваших HTMLфайлах,
можно использовать встроенный редактор. Несмотря на свою простоту, он обла
дает довольно мощными средствами редактирования документов.
В версии программы CSE HTML Validator Professional реализована возмож
ность пакетной обработки нескольких документов, когда результаты проверки
формируются в одном отчете.
Краткий обзор возможностей интегрированного редактора
Закладки позволяют легко переходить от одного фрагмента текста к другому. Для
установки закладки используется комбинация клавиш Shift+Ctrl+#, а для пере
хода по ней – Ctrl+#, где # – любая цифра от 0 до 9. Найти в тексте поставленные
закладки можно без труда: соответствующие строки помечаются значком (по
левому краю окна редактора, там же, где выведены номера строк) – см. рис. 2.137.

Рис. 2.137. Закладки на строках 173, 177 и 181

Вставка цветовой гаммы в формате #RRGGBB осуществляется с помощью


визуального инструмента выбора цвета.
238 Автоматизация

Выделение текста по колонкам производится следующим образом. Нажмите


клавишу Alt и, удерживая ее, выделяйте текст мышью. Вместо стандартного вы
деления по строкам будут маркированы колонки текста.
Предусмотрено редактирование множества файлов – одновременно можно
открыть и редактировать любое количество файлов.
Полноэкранный режим используется для того, чтобы увеличить размеры окна
редактора до максимума. Переключение в полноэкранный режим и обратно про
изводится клавишей F10 или соответствующей ей кнопкой , расположенной
на вертикальной панели (в версии CSE HTML Validator Professional).
Перейти к строке можно быстро – указав ее номер. Достаточно применить со
четание клавиш Ctrl+G или команду Edit ⇒ Go to Line (Редактирование ⇒ Перей
ти к строке).
Интегрированный браузер позволяет просматривать и страницы, которые вы
редактируете, и страницы в Internet.
«Горячие» клавиши предусмотрены не только для функций программы, но и
для ввода тэгов языка HTML.
Нумерация строк ведется для всех строк документа, но по вашему желанию
может быть легко отключена командой View ⇒ Editor ⇒ Line Numbers (Вид ⇒
Редактор ⇒ Номера строк).
Разделители строк позволяют сделать текст документа более удобным для
редактирования за счет разделения строк горизонтальными линиями, как пока
зано на рис. 2.138. Эта возможность включается при помощи пункта меню
View ⇒ Editor ⇒ Line Separators (Вид ⇒ Редактор ⇒ Разделители строк).

Рис. 2.138. Фрагмент окна редактора с включенными разделителями строк

Проверка ссылок. При анализе кода документа программа создает список ссы
лок, которые в дальнейшем можно просмотреть и проверить. Поддерживается
проверка ссылок, как на локальном компьютере, так и в сети Internet. Для того
Программы 239
чтобы рассмотреть и проанализировать ссылки, откройте окно результатов с по
мощью меню: View ⇒ Windows ⇒ Results (Вид ⇒ Окна ⇒ Результаты) и перей
дите на вкладку Links (Ссылки).
Проверка кода
Чтобы проверить правильность HTMLкода в документе, находящемся на жест
ком диске вашего компьютера или компьютера в локальной сети, следует от
крыть документ в интегрированном редакторе программы HTML Validator по
команде File ⇒ Open (Файл ⇒ Открыть) или нажав кнопку Open на панели
управления. При использовании профессиональной версии программы файл от
крывается также двойным щелчком по нему на вкладке Shell (Оболочка) в окне
ресурсов. Страницу в Internet открывайте с помощью команды File ⇒ Open from
the Web (Файл ⇒ Открыть из Сети) или кнопки Open from the Web . Загру
женный в редактор документ проверьте одним из следующих способов:
¾ выберите в главном меню пункт Tools ⇒ Validate (Инструменты ⇒ Про
верить);
¾ нажмите клавишу F6;
¾ переключившись в окно редактора или окно результатов проверки, вызо
вите контекстное меню и выберите в нем пункт Validate (Проверить);
¾ щелкните по кнопке Validate Document (Проверить документ) ,
расположенной на горизонтальной панели управления, или по одноимен
ной кнопке на вертикальной (вертикальная панель доступна только
в профессиональной версии);
¾ если документ не проверялся ранее, воспользуйтесь комбинацией клавиш
Alt+Up или Alt+Down.
Найденные программой ошибки отражаются в окне результатов. Если вы
пользуетесь профессиональной версией, выберите для просмотра в окне ре
зультатов вкладку Messages (Сообщения). В упрощенной версии CSE HTML
Validator Lite такой возможности нет. Щелкните по сообщению в окне резуль
татов, чтобы просмотреть его полностью в текстовом блоке. При этом позиция
в строке с замеченной ошибкой будет выделена в редакторе автоматически. Об
ратите внимание, что не все отчеты будут указывать на определенную позицию
проверяемого документа. Некоторые из сообщений, например, комментарии,
не имеют такой связи. Начиная с версий CSE HTML Validator Pro 4.05 и CSE
HTML Validator Lite 2.01 и выше, предусмотрена возможность быстрого перехо
да к очередному сообщению при помощи комбинации клавиш Alt+Down, а к пре
дыдущему – Alt+Up.
После просмотра сообщений и правки HTMLдокумента можно повторно
проверить его, чтобы убедиться, что внесенные изменения возымели должный
эффект.
240 Автоматизация

Числа в квадратных скобках, которые появляются перед некоторыми из сооб


щений (например, [10]), означают номера флажков, которые вы можете включить
или выключить. По умолчанию все флажки включены. Если вы не хотите видеть
некоторые сообщения при последующих проверках документа, то, установив кур
сор на данном сообщении, правой кнопкой мыши вызовите контекстное меню и
снимите флажок. В любое время вы можете снова включить нужную опцию, вос
пользовавшись соответствующими пунктами в меню Options ⇒ Validator Engine
Options (Параметры ⇒ Параметры системы проверки кода). Это средство явля
ется мощным инструментом настройки программы CSE HTML Validator Pro, но
отсутствует в версии Lite.
Без специальной программы Batch Wizard (Мастер пакетной обработки) от
чет о проверке нельзя распечатать на принтере, в отличие от исходного докумен
та, для которого предназначена команда File ⇒ Print (Файл ⇒ Печать).
Проверка ссылок
Проверка достоверности ссылок (URL) выполняется только в профессиональ
ной версии программы CSE HTML Validator Pro. Для этого служит вкладка Links
(Ссылки) в окне результатов. Обратите внимание, что данная возможность появ
ляется только после проверки правильности кода самого документа. Чтобы на
чать тестирование, выполните команду Tools ⇒ Validate ⇒ Link check only (Ин
струменты ⇒ Проверить ⇒ Проверять только ссылки). Каждая недоступная для
программы ссылка будет помечена слева красным прямоугольником. Если про
верку ссылки в программе HTML Validator осуществить нельзя, она будет поме
чена слева синим прямоугольником. Отметьте, что проверяются только ссылки
на локальный файл и на ресурсы, доступные по протоколу HTTP.
Файл конфигурации
Программа поставляется с файлом конфигурации для поддержки различных кате
горий тэгов: HTML 4.01, HTML 4.0, расширения Netscape, расширения Microsoft
Internet Explorer, Cold Fusion/CFML, SMIL, RealText, WML, XHTML и др.
Важная особенность включенной HTMLконфигурации состоит в том, что ка
тегории HTML сформированы на основе своих предыдущих версий (об этом под
робно говорилось выше – см. раздел «Настройка HTMLконфигурации» в описа
нии программы Linkbot Developer Edition).
Обратите внимание, что по сравнению с версией CSE HTML Validator
Professional, в версии программы CSE HTML Validator Lite ограничена поддерж
ка многих категорий тэгов. Не поддерживаются CFML, RealText, SMIL, WebTV
и XHTML, а также и проверочные программы для тэгов. Поэтому информация
о флажках существенна только для профессиональной версии.
Флажки
HTMLконфигурацию допустимо настроить таким образом, что при проверке
правильности HTMLкода для любого тэга выполняется своя программа. При
этом в зависимости от состояния определенных флажков (установлен – снят)
Программы 241
поведение программы может меняться. Обычно при включении той или иной
опции появляются предупреждения и сообщения об ошибках. Большинство из
них начинается с комбинации символов [x], где x – номер флажка. Такая отмет
ка позволяет легко определить, какой флажок следует снять, чтобы убрать сооб
щение, которое, по вашему мнению, не требуется отображать при проверке. Од
нако при отключении опции вы лишаетесь возможности просматривать многие
сообщения. Чтобы оценить последствия отключения какоголибо флажка, вос
пользуйтесь справочной системой программы (на английском языке).
Обратите внимание, что неперечисленные в справочной системе флажки фак
тически не используются в существующей HTMLконфигурации: эти опции за
резервированы для применения в последующих конфигурациях. Эффекты при
менения некоторых флажков также незначительно различаются в зависимости
от версии программы, которой вы пользуетесь для проверки правильности
HTMLкода.
Приведем пример описания для флажков номер 1 и 2.
При установке флажка 1 программа, встретив нижеперечисленные тэги и ат
рибуты, выводит сообщения о том, что они используются исключительно в брау
зере Microsoft Internet Explorer:
¾ тэг ACRONYM;
¾ атрибут AUTOCOMPLETE, использующийся только в Microsoft Internet Explorer
версии 4.0 и выше;
¾ атрибуты FACE или COLOR в тэге BASEFONT;
¾ тэг BGSOUND;
¾ атрибут BGPROPERTIES в тэге BODY;
¾ атрибут LEFTMARGIN и/или TOPMARGIN в тэге BODY;
¾ тэг BUTTON;
¾ атрибут VALIGN в тэге CAPTION;
¾ тэги COL или COLGROUP;
¾ тэг DEL;
¾ тэг DFN;
¾ тэг FIELDSET;
¾ атрибут FRAMESPACING в тэге FRAMESET;
¾ атрибут COLOR в тэге HR;
¾ тэг IFRAME;
¾ атрибуты CONTROLS, DYNSRC, LOOP, LOOPDELAY, START и/или VRML в тэге
IMG –могут быть исключены из будущих версий Microsoft Internet Explorer;
¾ тэг INS;
¾ тэг LABEL;
¾ тэг LEGEND;
¾ тэг MARQUEE, используемый также в WebTV;
¾ тэг OBJECT;
¾ тэг Q;
¾ атрибуты BORDERCOLOR, BORDERCOLORDARK, BORDERCOLORLIGHT, FRAME
и/или RULES в тэге TABLE;
242 Автоматизация

¾ атрибуты BORDERCOLOR, BORDERCOLORDARK и/или BORDERCOLORLIGHT


в тэгах TD, TH или TR;
¾ тэги TBODY, THEAD или TFOOT.
При установке флажка 2 программа, встречая нижеследующие тэги и атрибуты,
выводит сообщения, что они используются исключительно в браузере Netscape:
¾ атрибут ARCHIVE в тэге APPLET;
¾ тэг BLINK;
¾ атрибуты MARGINHEIGHT или MARGINWIDTH в тэге BODY;
¾ атрибуты POINT-SIZE или WEIGHT в тэге FONT;
¾ тэг ILAYER;
¾ атрибут BORDER в тэге INPUT;
¾ тэг KEYGEN;
¾ тэг LAYER;
¾ тэг MULTICOL;
¾ тэг SPACER, используемый также в WebTV;
¾ атрибуты HSPACE или VSPACE в тэге TABLE;
¾ встретив атрибут BACKGROUND в тэге TR.
Чтобы полностью исключить работу программ для тэгов, следует воспользо
ваться параметром Enable programs в окне Validator Engine Options, как описано
в разделе, посвященном настройке программы проверки. Скорость тестирования
при этом возрастет, но, отключая программы тэгов, вы значительно уменьшите
эффективность программы проверки.
Если вы хотите отключить не все программы, а лишь некоторые из них, перейди
те на вкладку Programs (Программы) окна CSE HTML Validator Pro Configuration
Editor (Редактор конфигурации для программы проверки правильности HTML
кода), которое откроется при выборе пункта меню Options ⇒ Configuration Editor
(Параметры ⇒ Редактор конфигурации). Отключите параметр Enable open program
for tag (Разрешить открывающую программу для тэга) или Enable end program
for tag (Разрешить закрывающую программу для тэга).
Редактор тэгов
Настройка на любой тэг выполняется в специальном редакторе, вызываемом че
рез меню: Options ⇒ Configuration Editor. В открывшемся окне CSE HTML
Validator Pro Configuration Editor можно добавлять новые тэги и конфигуриро
вать существующие. Рассмотрим вкладку Tag Names (Наименования тэгов) –
см. рис. 2.139. Начнем с раздела Tag Name Controls (Настройка тэгов).
В окне Tag names приведен перечень тэгов: P, A, TITLE, BODY, HTML, B, I и т. д.
Сюда можно добавить новые названия, удалить имеющиеся. Для добавления тэга
введите его наименование в поле, расположенное под списком, и нажмите кнопку
New Tag (Создать тэг); чтобы удалить наименование тэга из списка, выберите его
и щелкните по кнопке Delete Tag (Удалить тэг).
Окно Tag range (Диапазон тэгов) содержит список тэгов, которые указыват,
в какой именно части HTMLдокумента может или не может появиться соответ
Программы 243

Рис. 2.139. Окно CSE HTML Validator Pro Configuration Editor, вкладка Tag Names

ствующий тэг. Другими словами, допустимо ли появление настраиваемого тэга


между открывающим тэгом любого наименования, имеющегося в окне Tag range,
и закрывающим того же наименования. Например, IMG может быть записан в кон
тейнерах <BODY> … </BODY> и <NOFRAMES> … </NOFRAMES>, а META – только
в контейнере <HEAD> … </HEAD>. Чтобы удалить наименование тэга из списка,
выберите его и нажмите кнопку или дважды щелкните по нему мышью. Для

добавления выделите нужное название в окне Tag names и нажмите кнопку


или выполните двойной щелчок мышью. Для настройки на допустимость/недо
пустимость предназначен переключатель Range View (Область видимости); воз
можны два варианта: Valid (Допустимо) и Invalid (Недопустимо).
Список в разделе Tag Name Being Configured (Наименование настраиваемого
тэга) содержит наименования тэгов, а перечень в разделе Tag Name Category
(Категория тэга) – категории, к которым может быть отнесен настраиваемый тэг,
например: HTML 3.2, HTML 4.0, Microsoft IE Extensions (Расширения Microsoft
Internet Explorer), Netscape Extensions (Расширения Netscape) и т. д.
Технология настройки такова. В разделе Tag Name Being Configured выбира
ется тэг, который необходимо подготовить для проверки. В списке из раздела Tag
Name Category отмечается категория, которой будет соответствовать данный
тэг; в окне Tag range указывается, в каком контейнере тэгов допустимо его разме
щать. Не забудьте проверить положение переключателя Range View. Настроив
таким образом все нужные тэги, сохраните данные нажатием кнопки Save Config
(Сохранить конфигурацию) или Save Config As (Сохранить конфигурацию как)
и щелкните по кнопке Close (Закрыть).
244 Автоматизация

A Real Validator

Авторская программа A Real Validator (http://www.htmlvalidator.com/), разрабо


танная Лайэмом Квинном (Liam Quinn), предназначена для выявления синтак
сических ошибок в HTMLстраницах и очень проста в использовании.
Для обработки какоголибо файла создайте новый проект командой File ⇒
New Project (Файл ⇒ Новый проект) и включите в него требуемый документ:
File ⇒ Add Files (Файл ⇒ Добавить файлы). Ту же операцию можно выполнить
перетаскиванием нужного файла из Проводника Windows в окно программы,
изображенное на рис. 2.140.

Рис. 2.140. Окно программы A Real Validator

Выбрав файл, можно приступать к проверке, для чего предназначены пункт


меню Actions ⇒ Validate (Действия ⇒ Проверить) или кнопка Validate (Прове
рить) в инструментальной панели. Отчет о тестировании выводится в ниж
ней панели главного окна программы под заголовком Results for (Результаты
для). В разделе отчета Errors (Ошибки) содержится полный список обнаружен
ных погрешностей с указанием местоположения ошибки в документе и ее толко
ванием.
Программы 245

Программы для работы с метатэгами


Постоянно увеличивается число разработчиков, предлагающих программное обес
печение, которое автоматически генерирует или проверяет метатэги.

Программа построения метатэгов MetaTag ToolKit


Программа MetaTag ToolKit (http://www.dittotech.com/Products/MetaTag/), разра
ботанная компанией Ditto Technologies (http://www.dittotech.com/), является про
стым пошаговым мастером построения метатэгов и призвана обеспечить лучшее
индексирование HTMLстраниц поисковыми системами. В отличие от других
программ, которые строят лишь несколько простых метатэгов, MetaTag ToolKit
идет чуть дальше, формируя дополнительные тэги, которые, возможно, и позволят
увеличить посещаемость ваших страниц.
Программа работает в среде операционных
систем MS Windows 95/98/2000/XP, имеет
очень небольшой объем (315 Кб) и распростра
няется бесплатно. При ее запуске открываются
два окна: главное, с программным интерфейсом
(см. рис. 2.141), и дополнительное, предназна
ченное для показа рекламных баннеров. Если
вы не подключены к Internet, баннеры, есте
ственно, не видны, однако в любом случае до Рис. 2.141. Главное окно
полнительное окно закрыть нельзя. Впрочем, программы MetaTag ToolKit
это малая плата за предоставляемый програм
мой несложный сервис. Нажмите в главном окне кнопку Step 1 (Пункт 1).
В открывшемся окне Step 1 (см. рис. 2.142) введите описание страницы – со
держимое метатэга META NAME=“description”. В правом верхнем углу окна вы
найдете счетчик числа введенных символов, что очень удобно, так как описание
требуется ограничить 150–200 символами. Щелкните по кнопке Step 2 (Пункт 2).
Откроется окно Step 2, показанное на рис. 2.143. Оно предназначено для ввода
ключевых слов и фраз, то есть содержимого метатэга META NAME=“keywords”.
Их следует отделять друг от друга запятой и затем пробелом. В правом верхнем
углу окна вы заметите также счетчик количества введенных символов. Нажмите
кнопку Step 3 (Пункт 3).

Рис. 2.142. Окно Step 1 Рис. 2.143. Окно Step 2


программы MetaTag ToolKit программы MetaTag ToolKit
246 Автоматизация

Откроется окно Step 3, показанное на рис. 2.144. Его назначение – выбор спо
соба индексации документа при помощи специального метатэга для роботов по
исковых машин META NAME=“robots”. Выбор осуществляется переключате
лем на четыре положения со следующими значениями:
¾ Index + Follow all links – будет создан метатэг: <meta name=“robot”
content=“index,follow”>;
¾ Index – don’t follow links – будет создан метатэг: <meta name=“robot”
content=“index,nofollow”>;
¾ Don’t index + follow all links –создается метатэг: <meta name=“robot”
content=“noindex,follow”>;
¾ Don’t index – don’t follow links – будет создан метатэг: <meta name=“robot”
content=“noindex,follow”>.
Для последнего случая программа написана неверно, поэтому, очевидно, вам
придется вручную исправить запись: вместо content=“noindex,follow”
следует набрать content=“noindex,nofollow”. Кроме того, здесь же вкра
лась еще одна ошибка: name=“robot” надо исправить на name=“robots”.
Нажмите кнопку Step 4 (Пункт 4).
Откроется окно Step 4 (см. рис. 2.145). В нем задается свойство Refresh с ука
занием времени задержки, после которой браузер автоматически обновляет до
кумент:
<META HTTP-EQUIV=“Refresh” CONTENT=“n”>
где n – время задержки в секундах.

Рис. 2.144. Окно Step 3 Рис. 2.145. Окно Step 4


программы MetaTag ToolKit программы MetaTag ToolKit

Для применения указанного метатэга отметьте опцию Include this feature


(Включить данное свойство). В поле Seconds (Секунды) введите время задержки.
После щелчка по кнопке Step 5 (Пункт 5) от
кроется одноименное окно, показанное на рис.
2.146. Здесь следует задать метатэг с парамет
ром NAME=“copyright”, если отмечена опция
Include this feature. Нажмите кнопку Step 6
Рис. 2.146. Окно Step 5 (Пункт 6).
программы MetaTag ToolKit В появившемся окне Step 6, представлен
ном на рис. 2.147, задается метатэг с парамет
ром NAME=“author”, если отмечена опция Include this feature. Щелкните по
кнопке Step 7 (Пункт 7).
Программы 247
Рис. 2.147. Окно Step 6
программы MetaTag ToolKit

Откроется окно Step 7 с заголовком Cache


Page (Кэширование страницы), показанное на рис. 2.148. Здесь вы можете задать
свойство Pragma, которое применяется для управления кэшированием. Так, для
отказа от кэширования необходимо отметить
опцию Include this feature, а в соседнем поле
выбрать из списка No (Нет), в результате чего
будет сформирована следующая запись:
<META HTTP- EQUIV =“Pragma”
Рис. 2.148. Окно Step 7 про
CONTENT=“no-cache”>
граммы MetaTag ToolKit
Нажмите кнопку Finish (Готово).
Откроется окно Info Sheet (Информационный лист), показанное на рис. 2.149.
В полях окна записаны все метатэги, которые сгенерированы программой, причем
в подготовленный код вы можете внести исправления. Кнопка Save HTML (Сохра
нить HTMLдокумент) служит для сохране
ния сформированных данных на жестком
диске компьютера, кнопка Exit (Выход) –
для завершения работы с программой.
Если щелкнуть по кнопке Generate
HTML (Сформировать HTMLдокумент),
откроется окно HTML, показанное на
рис. 2.150. Как видите, все метатэги
оформлены в том виде, в каком они дол
жны появиться в вашем документе. Мо Рис. 2.149. Окно Info Sheet программы
жете скопировать весь текст в буфер об MetaTag ToolKit

Рис. 2.150. Окно HTML программы MetaTag ToolKit


248 Автоматизация

мена, нажав кнопку Copy (Копировать), и в любом редакторе вставить его в нуж
ный файл.

Программа для создания


и модификации метатэгов MetaMan
Программа MetaMan, разработанная компанией Hyperpresence Inc. (http://www.
hyperpres.com/), представляет собой утилиту для создания и модификации мета
тэгов, которая позволяет работать с несколькими файлами одновременно.
Так, если вы хотите, например, изменить цвет фона на всех ваших страницах,
достаточно поменять его описание только в одной главной странице, а все осталь
ное поможет осуществить программа. То же самое можно сделать и с любыми
метатэгами: составить новое описание или набор ключевых слов и поместить их
в любые файлы.
Главное окно программы показано на рис. 2.151. Оно разделено на три ос
новные части. Слева находится файловое окно для выбора нужных файлов из
схематической файловой структуры на дисках компьютера, справа вверху –
окно файловых тэгов для отображения метатэгов выбранного файла и манипу
ляции ими, а справа внизу – окно буферных тэгов для работы с метатэгами, со
держащимися в специальном буфере обмена. Метатэги добавляются в после
днее окно выборочно и могут представлять собой комбинации метатэгов из
различных файлов.

Рис. 2.151. Главное окно программы MetaMan


Программы 249
Назначение трех кнопок, расположенных над файловым окном, следующее:

Folders (Папки) – служит для выбора папок на жестких дисках компьютера;

Options (Параметры) – используется для настройки общих параметров


программы;
Lock Files (Блокировка файлов) – предназначена для блокировки и, со
ответственно, разблокировки файлов. При копировании описаний мета
тэгов из окна файловых тэгов или из окна буферных тэгов в заблокиро
ванный файл программа потребует указать имя файла для выполнения
операции. Если кнопка не нажата, то есть файлы не заблокированы, будет
переписан без запроса оригинальный файл.
При нажатии кнопки Folders откроется обычное окно
проводник Select Path (Выбрать путь) – см. рис. 2.152.
Здесь следует выбрать нужную папку и щелкнуть по
кнопке (Ok).
При щелчке по кнопке Options откроется одноимен
ное окно (рис. 2.153). С помощью расположенных в нем
флажков выполняются следующие настройки:
¾ Lock Tags (Блокировка тэгов) – блокируются
файловые тэги по умолчанию;
¾ Lock Clipboard (Блокировка буфера) – блокиру
ются буферные тэги по умолчанию; Рис. 2.152. Окно
¾ Lock Files (Блокировка файлов) – блокируются Select Path
файлы по умолчанию;
¾ Debug Mode (Режим отладки) – включается режим отладки по умолчанию;
¾ Multi Clear (Множественная очистка) – производится настройка тэгов,
которые в таблицах отражены несколь
кими строчками, то есть имеют несколь
ко параметров, предусматривающая их
полную замену. Обычно данная опция
применима только к тэгу BODY.
Переключатель Browser Icon (Пиктограм
ма браузера) предназначен для выбора одной
из двух пиктограмм браузера: или Internet
Explorer, или Netscape. Даже если на вашем Рис. 2.153. Окно Options
компьютере установлены оба браузера, для
просмотра будет использован тот, на который по умолчанию настроена система.
Назначение трех кнопок, расположенных под файловым окном, таково:
View in Browser (Просмотр в браузере) – используется для отображения
выбранного файла в браузере;
250 Автоматизация

View File HTML (Просмотр HTMLкода файла) – используется для про


смотра HTMLкода выбранного файла;
Debug On/Debug Off (Отладка включена/выключена) – при включении
отладки HTMLкод, который предполагается вставить в файл, отобража
ется на экране для подтверждения операции.

Две одинаковые кнопки To Tag List (В список тэгов) и To Clipboard


(В буфер обмена), расположенные справа от файлового окна, предназначены для
передачи метатэгов выбранного файла в окна, соответственно, файловых и бу
ферных тэгов.
Две пиктограммы To File (В файл), расположенные в той же части, отве
дены для передачи метатэгов из окна файловых или буферных тэгов (соответ
ственно верхняя и нижняя кнопки) в заданный файл.
Давайте выберем в файловом окне какойлибо документ. Предположим, нача
ло его выглядит следующим образом:
<HTML>

<HEAD>
<TITLE>Ññûëêè</TITLE>
<META HTTP-EQUIV=“Content-Type”
CONTENT=“text/html; charset=windows-1251”>
<META NAME=“GENERATOR” CONTENT=“Notepad”>
</HEAD>

<BODY BGCOLOR=“#FFFFFF” TEXT=“#663300” LINK=“#660000”


VLINK=“#999900” ALINK=“#006600”>

Нажмите кнопку To Tag List или дважды щелкните по имена файла


в файловом окне. Окно файловых тэгов будет заполнено, как показано на
рис. 2.154.

Рис. 2.154. Заполненное окно файловых тэгов


Программы 251
Кнопки, расположенные над окном файловых тэгов, имеют следующее назначение:
Move Tag Up (Переместить тэг выше) – выбранные тэги перемещаются
выше на одну строку;
Move Tag Down (Переместить тэг ниже) – выбранные тэги перемещают
ся на строку ниже;
Delete All Tags (Удалить все тэги) – удаляется все содержимое окна фай
ловых тэгов;
Delete Tag (Удалить тэг) – удаляются только определенные тэги;

Select All (Выбрать все) – выделяется все содержимое окна файловых тэгов;

Edit Tag (Редактировать тэг) – при нажатии данной кнопки открывается


окно Tag Assistant (Помощник для тэгов), показанное на рис. 2.155. Здесь
вы сможете исправить выбранный тэг. То же самое произойдет, если дваж
ды щелкнуть по нужному названию в окне файловых тэгов. Для добавле
ния нового названия следует выбрать строку с надписью (empty) (пусто);

Рис. 2.155. Окно Tag Assistant

View HTML (Просмотр HTMLкода) – при нажатии этой кнопки на эк


ран выводится окно HTML Viewer (Обзор HTMLкода), представленное
252 Автоматизация

на рис. 2.156. Здесь все тэги, имеющиеся в окне файловых тэгов, оформле
ны в виде HTMLкода. Обратите внимание, что это не фрагмент кода из
файла, а именно код, формируемый на основании информации, отобра
женной в окне файловых тэгов. Окно HTML Viewer – нередактируемое:
оно служит исключительно для просмотра кода;

Рис. 2.156. Окно HTML Viewer

Lock Tags (Блокировать тэги) – когда кнопка нажата (тэги заблокирова


ны), при передаче метатэгов из файла или буфера обмена добавляются
только те из них, которых нет в окне файловых тэгов.
Окно Tag Assistant состоит из трех частей. В верхней части, названной
HTML, показан фрагмент кода, который будет сгенерирован для соответ
ствующего тэга. Обратите внимание, что это именно новый код, а не тот, кото
рый был взят из файла. И здесь его можно править, как в обыкновенном ре
дакторе.
В средней части – Tag Assistance – помещена справочная информация, каса
ющаяся текущего тэга. Если существует дополнительная справка (например,
список параметров и т. д.), появится кнопка More (Еще).
В третьей части окна Tag Assistant находится таблица со всеми элементами
тэга, а под ней – кнопки управления:

Done (Сделано) – для сохранения всех внесенных изменений;

Check (Проверить) – для проверки текущего тэга и обновления его эле


ментов;
Undo (Восстановить) – для возвращения к исходным значениям тэга;

Cancel (Отменить) – для отказа от всех изменений.


Программы 253
Кнопки, расположенные под окном файловых тэгов, служат:
To Clipboard (В буфер обмена) – для передачи выбранных метатэгов из
окна файловых тэгов в окно буферных тэгов;

To Tags List (В список тэгов) – для передачи выбранных метатэгов из


окна буферных тэгов в окно файловых тэгов;
Exit (Выход) – для завершения работы с программой.
Кнопки, расположенные под окном буферных тэгов, аналогичны кнопкам над
окном файловых тэгов и имеют то же назначение, но применительно к окну бу
ферных тэгов.
Общая технология работы с одним HTMLфайлом такова.
1. Выберите в файловом окне нужный документ. Дважды щелкните по его на
званию или нажмите кнопку . Метатэги из файла появятся в окне фай
ловых тэгов.
2. Чтобы исправить тэг, выделите в этом окне нужное имя и дважды щелкни
те по нему или нажмите кнопку . Откроется редактор тэгов – окно Tag
Assistant.
3. Произведите необходимые изменения.
4. Исправьте аналогичным образом все тэги, какие требуется. Посмотреть по
лученный код можно при помощи кнопки .
5. Завершив корректировку, выберите в файловом окне тот документ, в кото
ром требуется разместить подготовленные метатэги, и щелкните по кнопке
, расположенной рядом с окном файловых тэгов.

Если заблаговременно нажата кнопка Debug On/Debug Off, перед запи


сью в файл откроется окно предварительного просмотра кода Debug (Отладка),
то есть HTMLкода из файла с добавленными к нему метатэгами (см. рис. 2.157).
Работа с несколькими файлами ведется чуть иначе:
1. Выберите в файловом окне нужный документ. Дважды щелкните по его на
званию или нажмите кнопку . Метатэги из файла появятся в окне фай
ловых тэгов.
2. Выделите в этом окне нужные тэги: щелкните по ним мышью, удерживая
нажатой клавишу Ctrl.
3. Скопируйте выбранные тэги в буферное окно при помощи кнопки .
4. Повторите действия, предусмотренные в пп. 1–3, необходимое количе
ство раз.
254 Автоматизация

Рис. 2.157. Окно Debug

5. Любой тэг можно отредактировать. Для этого в окне буферных тэгов выбе
рите нужный и дважды щелкните по нему или нажмите кнопку . От
кроется редактор тэгов – окно Tag Assistant.
6. Исправьте все необходимые тэги. Для просмотра получаемого кода стоит
воспользоваться пиктограммой .
7. После того как все тэги скорректированы, выберите в файловом окне тот
документ, в котором требуется разместить подготовленные метатэги, и
щелкните по кнопке , расположенной рядом с окном буферных тэгов.

Если заблаговременно была нажата кнопка Debug On/Debug Off, перед


записью в файл откроется окно Debug для предварительного просмотра кода, то
есть HTMLкода из файла с добавляемыми метатэгами.
Окно Debug состоит из трех частей. В верхней – Tags To Be Copied/Added
(Тэги, которые будут копироваться/добавляться) – отражены тэги, которые будут
скопированы или добавлены в HTMLфайл. Колонка Ptr (Указатель) служит для
указания тэгов, имеющихся в выбранном файле. Если значение соответствующей
ячейки в данной колонке равно нулю, это означает, что тэг отсутствует в файле.
Следующая часть –Existing Destination File Tags (Тэги, имеющиеся в исход
ном файле) – служит для просмотра тэгов из выбранного HTMLфайла.
Программы 255
Третья часть Messages (Сообщения) предназначена для описания всех дейст
вий, которые выполнит программа при записи данных в файл.
В нижней части окна Debug расположены кнопки управления:

Ok – для подтверждения и записи всех сделанных изменений в HTMLфайл;

Cancel (Отменить) – для отказа от записи;

View HTML (Просмотр HTMLкода) – используется для просмотра но


вого HTMLкода, сформированного для файла.
Программа распознает следующие метатэги (показаны с примерами):
REFRESH
<META HTTP-EQUIV=“Refresh”
CONTENT=“5;URL=http://www.mydomain.ru/newhome.htm”>
EXPIRES
<META HTTP-EQUIV=“Expires” CONTENT=“Tue, 2 Feb 2001 01:23:45 GMT”>
KEYWORDS
<META NAME=“Keywords” CONTENT=“software, freeware”>
REPLY-TO
<META NAME=“Reply-To” CONTENTS=“me@someaddress.ru”>
GENERATOR
<META NAME=“Generator” CONTENT=“CuteHTML”>
AUTHOR
<META NAME=“Author” CONTENT=“John Doe”>
DESCRIPTION
<META NAME=“Description” CONTENT=“This site contains all of the
great works of Shakespeare. There are also links to other
Shakespeare sites.”>
ROBOTS
<META NAME=“Robots” CONTENT=“INDEX,FOLLOW”>
CONTENT-SCRIPT-TYPE
<META HTTP-EQUIV=“Content-Script-Type” CONTENT=“text/javascript”>
CONTENT-STYLE-TYPE
<META HTTP-EQUIV=“Content-Style-Type” CONTENT=“text/css”>
256 Автоматизация

CONTENT-TYPE
<META HTTP-EQUIV=“Content-Type”
CONTENT=“text/html; charset=US-ASCII”>
LANG
PAGE-ENTER
<META NAME=“Page-Enter”
CONTENT=“RevealTrans (Duration=x, Transition=y)”>
PAGE-EXIT
<META NAME=“Page-Exit”
CONTENT=“RevealTrans (Duration=x, Transition=y)”>
SITE-ENTER
<META NAME=“Site-Enter”
CONTENT=“RevealTrans (Duration=x, Transition=y)”>
SITE-EXIT
<META NAME=“Site-Exit”
CONTENT=“RevealTrans (Duration=x, Transition=y)”>
CONTENT-DISPOSITION
<META HTTP-EQUIV=“Content-Disposition”
CONTENT=“inline; filename=spreasheet.xls”>
PRAGMA
<META HTTP-EQUIV=“Pragma” CONTENT=“No-Cache”>
CONTENT-LANGUAGE
<META HTTP-EQUIV=“Content-Language” CONTENT=“xx-yy”>
WINDOW-TARGET
<META HTTP-EQUIV=“Window-target” CONTENT=“_top”>
EXT-CACHE
SET-COOKIE
CACHE-CONTROL
FORMATTER
COPYRIGHT
<META NAME=“Copyright” CONTENT=“(c) 2001 HAL”>
RATING
Программы 257
BODY
<BODY ALINK… VLINK… LINK… TEXT… ONLOAD… BGCOLOR… BACKGROUND…
LEFTMARGIN… TOPMARGIN…>

Компонент WebQA Tag программы WebQA


Как отмечалось в разделе «Программа тестирования Webсайтов WebQA 3.0», ком
понент WebQA Tag, имеющийся в составе программы WebQA, предназначен для со
здания, вставки и редактирования метаданных, в том числе, одновременно в не
скольких файлах. Приложение позволяет обслуживать документы форматов
HTML, Microsoft Office, .pdf, а также тэги изображений в рамках HTMLдокументов.
При работе с уже существующими файлами программа заметно снижает затра
ты времени, необходимые для поддержания метатэгов, автоматически генерируя
ключевые слова, основываясь на содержании документов. Удобный интерфейс,
оформленный в привычном виде электронной таблицы, позволяет рассматривать
имеющиеся метаданные и изменять их командами вставки, поиска и замены сразу
во многих файлах.
При создании новых документов можно пользоваться Мастером шаблонов
для формирования настроенных наборов метаданных, которые послужат своеоб
разным корпоративным стандартом, и затем применять эти шаблоны для всех
вновь образуемых документов. Такой подход позволяет подключать к созданию
сайта большие коллективы людей.
Для вставки и редактирования метатэгов в программе используются два инст
румента: Мастер тэгов и Представление сетки. Мастер тэгов предназначен для
работы с отдельными файлами. Он предлагает заполнить поля, требуемые соот
ветствующей группой метатэгов, которые определены опциями метатэга. При
этом доступна синтаксическая проверка правильности написания метаданных,
что гарантирует соответствие файлов, модифицируемых Мастером, существую
щим стандартам. Представление сетки используется для работы с множеством
файлов. Реализованный в виде электронной таблицы, этот интерфейс позволяет
рассматривать все метатэги, имеющиеся в файлах, основываясь на выбранной
группе метатэгов, и разрешает использовать типовые инструменты, вроде встав
ки, поиска и замены, для применения требуемых исправлений к множеству фай
лов одновременно.
Тэги можно править вручную или автоматически с помощью сгенерирован
ных Экстрактором – составной частью программы WebQA Tag – метатэгов. Экст
рактор сканирует каждый файл и создает набор ключевых слов, основанный на
его содержании. Такой метод гарантирует, что ключевые слова будут совмести
мы с телом документа, что важно для ранжирования страниц в поисковых систе
мах. Свойствами проекта задается та или иная степень автоматизации указанных
работ.
По мере сканирования файлов проекта WebQA Tag анализирует наличие ат
рибута ALT в тэгах изображений IMG. Как известно, данным атрибутом задается
альтернативный текст или описания, которые появляются в окне обозревателя
вместо изображения, если оно по какимлибо причинам не выводится на экран.
258 Автоматизация

Правильные атрибуты ALT – важная часть обеспечения содержания страниц.


Некоторые поисковые машины даже используют их для отображения содержа
ния. WebQA Tag может автоматически извлечь атрибуты ALT, основываясь всего
лишь на именах файлов изображений. Говоря о тэге IMG, заметим попутно, что
задание атрибутов WIDTH (Ширина) и HEIGHT (Высота) может значительно со
кратить время загрузки страниц.
Для создания групп метатэгов используется файл опций метатэгов. По умол
чанию тэги в активной группе будут отображены в виде сетки. Так как Сетка –
это рабочая среда для манипулирования метатэгами, определение метатэгов
в файле опций позволяет эффективно контролировать метаданные, вставляемые
или редактируемые в документах.
Как только группа метатэгов в файле опций определена, она может быть ис
пользована для создания шаблонов в Мастере шаблонов. Она же применяется
для проверки файлов на соответствие корпоративным стандартам. Документы
с вставленными метаданными просматривают в выбранной группе метатэгов ком
пании. Отсутствие какихлибо тэгов будет очевидно, поскольку соответствующие
ячейки в сетке окажутся незаполненными.
Мастер шаблонов используется, чтобы обусловить набор метатэгов для при
менения авторами документов. Этот инструмент может употребляться для рас
пространения корпоративных стандартов на метатэги, поскольку таким образом
есть возможность определить перечень тэгов, включаемых в файлы, созданные
в пределах одной организации.
Вы можете выбирать желаемые тэги из активной группы метатэгов, а также
добавлять новые и изменять существующие. Как только определен шаблон, он
становится доступен всем пользователям при создании документов.
Шаблоны используются Мастером шаблонов для вставки правильных мета
данных в создаваемые документы, чтобы обеспечить уверенную доступность
страниц из поисковых систем.
Запуск процедуры сканирования метатэгов реализуется следующим образом:
1. Выполните команду File ⇒ New Project (Файл ⇒ Новый проект).
2. Выберите пункт меню Tools ⇒ Project Properties (Инструменты ⇒ Свой
ства проекта). Откроется окно Properties (Свойства).
3. На его вкладке General Properties (Основные свойства) – см. рис. 2.158 – за
полните поля Project Name (Название проекта) и Description (Описание).
4. В навигационной панели щелкните по надписи What to Scan (Что скани
ровать).
5. На одноименной вкладке выберите способ доступа к файлам: либо Local
area network (Локальное сетевое окружение), если исследование прово
дится на одном компьютере или в локальной сети (рис. 2.159), либо FTP
site (FTPсайт), если будут загружаться файлы с удаленного сервера (тог
да вкладка примет вид, представленный на рис. 2.160). В первом случае
щелкните по кнопке Browse (Обзор) и выберите каталог начала сканиро
вания. Во втором – заполните поля:
¾ Host (Сервер) – имеется в виду его логическое имя;
¾ Port (Порт);
Программы 259
¾ User name (Имя пользователя);
¾ Password (Пароль);
¾ Starting directory (Стартовый каталог).

Рис. 2.158. Окно Properties, вкладка General Properties

Рис. 2.159. Окно Properties, вкладка What to Scan, доступ Local area network
260 Автоматизация

Рис. 2.160. Окно Properties, вкладка What to Scan, доступ FTP site

Здесь же можно отметить флажок Save password (Сохранить пароль), что


бы не вводить пароль каждый раз заново.
6. Щелкните по кнопке OK или Apply (Применить), чтобы сохранить на
стройки проекта.
7. Выполните команду Scan ⇒ Start (Сканирование ⇒ Начать) или щелкни
те по кнопке Scan (Сканировать).
Обработка выполняется над файлами, расположенными в стартовом каталоге,
и продолжается во всех вложенных каталогах. После завершения сканирования
можно будет вставлять, исправлять или удалять метатэги.
Рекомендуется ограничить количество документов в активном проекте
1000, иначе заметно увеличится время, необходимое для модификации инфор
мации.
Обратите внимание, что при работе с удаленным сервером (когда выбран спо
соб доступа к файлам – FTP site) отключены определенные функции програм
мы, а именно:
¾ не сканируются документы Microsoft Office;
¾ нельзя просматривать HTMLстраницы в браузере;
¾ невозможно загрузить файлы в каталог;
¾ имя каталога следует всегда начинать со слеша, например: /myWebsite;
¾ команда View ⇒ Show Image Preview Area (Вид ⇒ Показывать область
предпросмотра изображений) недоступна.
Программы 261
Свойства проекта
Свойствами проекта задается способ сканирования и действия, выполняемые в его
процессе:
¾ автоматическое заполнение ключевых слов;
¾ сканируемые типы файлов;
¾ вид записи тэгов внутри элемента <HEAD> ... </HEAD>.
В процессе обработки программа может автоматически извлечь ключевые сло
ва, а также атрибуты ALT изображений. Высота и ширина картинок также опреде
ляются в течение просмотра, но эти атрибуты нельзя заполнить автоматически –
для их вставки следует воспользоваться командой Autofill (Автозаполнение).
Надлежащий выбор ключевых слов критичен для ранжирования документов
поисковыми машинами: он позволяет точно индексировать webстраницы.
WebQA Tag просматривает документы, с помощью встроенного Экстрактора ана
лизирует их содержание и предлагает ключевые слова. Вы можете принять их все
или сократить список по своему усмотрению.
Атрибут ALT тэга вставки изображений применяется для их описания словами.
Это особенно полезно для браузеров, которые не выводят графику или у которых
эта возможность отключена. Кроме того, они помогают пользователям с дефектами
зрения, использующих устройства чтения. По этой причине, атрибуты Высокого
звука гарантируют, что Вы поддерживаете{обслуживаете} согласие промышленно
сти для достижимости.
Программу можно и следует использовать для редактирования атрибутов
ALT, WIDTH и HEIGHT всех тэгов IMG в HTMLдокументах, а также атрибута SRC,
чтобы изменить имя исходного файла изображения.
Если анализ тэга IMG заблокирован, сканирование выполняется быстрее, так
как в этом случае просматривается лишь контейнер <HEAD> ... </HEAD>.
Отметим попутно, что атрибуты WIDTH и HEIGHT никоим образом не увеличи
вают объем загружаемого модуля; они служат только для задания размеров облас
ти, которая будет зарезервирована для изображений при загрузке страницы.
Типы документов
Вкладка Document Types (Типы документов) окна Properties – см. рис. 2.161 –
позволяет выбирать расширения файлов (другими словами, типы документов),
которые разрешено открывать. WebQA Tag автоматически выбирает правильное
средство просмотра для таких документов.
Механизм синтаксического анализа программы не исследует файлы с расши
рениями .rtf или .txt, но анализирует файлы .jsp и .asp, а также некоторые другие
сетевые форматы.
Заданные по умолчанию расширения:
¾ в разделе HTML documents (HTMLдокументы): .htm, .html, .shtm и .shtml;
¾ в разделе Microsoft Office documents (Документы Microsoft Office):.doc (для
документов Microsoft Word), .xls (для документов Microsoft Excel) и .ppt (для
документов Microsoft PowerPoint);
¾ в разделе Adobe Acrobat (PDF) documents (Документы Adobe Acrobat): .pdf.
262 Автоматизация

Рис. 2.161. Окно Properties, вкладка Document Types

Анализ документов в любом из перечисленных разделов можно отключить,


для чего предназначены следующие флажки (перечислены в том же порядке сле
дования разделов):
¾ Scan all these types of HTML documents (Сканировать все эти типы
HTMLдокументов);
¾ Scan all these types of Microsoft Office documents (Сканировать все эти
типы документов Microsoft Office);
¾ Scan all Adobe Acrobat documents (Сканировать все документы Adobe
Acrobat).
Кроме того, в разделе HTML documents возможно отключение обработки тэгов
изображений, для чего предназначена опция Also scan for image tags (<IMG=…>)
(Сканировать также тэги изображений), а в разделе Adobe Acrobat (PDF)
documents – извлечение ключевых слов: Enable Adobe Acrobat keywords extraction
(Разрешить извлечение ключевых слов Adobe Acrobat). Обратите внимание, что ус
тановка последней опции может значительно замедлить сканирование.
С помощью кнопок Add (Добавить) и Delete (Удалить) вы можете расширить
или, наоборот, сузить диапазон исследуемых типов файлов.
Список ключевых слов
Вкладка Keywords List (Список ключевых слов) окна Properties (рис. 2.162) по
зволяет управлять вставкой ключевых слов в документы, для чего предназначе
Программы 263
ны два списка, формируемые в разделах: Imported keywords list (Импортирован
ный список ключевых слов) и Keywords noise list (Список шума). Первый слу
жит для добавления ключевых слов в генерируемый программой перечень, а вто
рой, наоборот, для запрета использования определенных слов и фраз в качестве
ключевых. Список шума применяется ко всем документам в текущем проекте.

Рис. 2.162. Окно Properties, вкладка Keywords List

Слова в списки можно добавлять вручную (кнопка Add) или импортировать


извне (кнопка Import). Для удаления слов из списков служит кнопка Delete.
Кнопка Export (Экспорт) применяется для сохранения сформированных спис
ков в файлах.
В списках можно использовать разделитель элементов. Заданный по умолча
нию – запятая.
Список шума составляется без учета регистра, все слова в нем строчные.
Исключения
Вкладка Exclusions (Исключения) окна Properties (рис. 2.163) служит для
указания, если требуется, папок, которые будут исключены из просмотра. Та
кая настройка полезна, если каталоги очень большие, или известно, что в них
не содержатся файлы, требующие обследования. Так, вы можете исключить
каталоги ASP или каталоги FrontPage, которые начинаются с символа подчер
кивания.
264 Автоматизация

Рис. 2.163. Окно Properties, вкладка Exclusions

Для выбора каталогов предназначена кнопка Browse, для добавления их


в список – кнопка Add , для замены выбранной строки в списке – кнопка Replace
(Заменить) и для удаления – Delete.
Элементы заголовка
Как известно, метаданные размещаются в контейнере <HEAD> ... </HEAD>
каждого HTMLфайла. Поскольку они содержат всю описательную информа
цию о документе, поисковые системы делают особый акцент на обработке этих
сведений. Открыв очередной файл, WebQA Tag считывает содержимое его заго
ловочной части в память. Всякий раз, когда программа встречает метатэг, она
проверяет его имя, сверяет с имеющимися списками и, если он был изменен,
записывает новое значение. Если метатэг был удален из списков, он не будет
внесен в файл.
Сначала WebQA Tag удаляет все тэги TITLE и META, а также имеющиеся пус
тые строки. Тэги форматируются в точности по выполненным настройкам, а за
тем вставляются непосредственно за открывающим тэгом <HEAD> документа.
Такой подход обеспечивает наглядность метаданных при открытии файла в тек
стовом редакторе. Для организации указанных операций предназначена вкладка
HTML Head Write (Запись HTMLтэга HEAD) – см. рис. 2.164.
Здесь можно определить варианты форматирования тэгов при записи. Систе
матизация записываемых элементов упрощает дальнейшее обслуживание HTML
страниц. Раздел Tag Case (Регистр тэгов) позволяет установить внутренний стан
Программы 265
дарт написания тэгов и атрибутов, хотя браузеры не чувствительны к регистру
букв тэгов. Допустимы три варианта:
¾ The existing case (Существующий регистр) – останется прежнее написание;
¾ All lower case – строчными буквами, например: <meta name=“Author” … >;
¾ All upper case (e.g.,) – прописными: <META NAME=“Author” … >.

Рис. 2.164. Окно Properties, вкладка HTML Head Write

В разделе Character references (Таблицы символов) можно выбрать форму


представления символов в HTMLдокументе:
¾ I want to preserve the characters (Сохранить символы);
¾ In character references (Из таблиц символов) – для использования в коде
HTML специальных наборов символов, которые начинаются со знака «&»
(амперсанд) и заканчиваются знаком «;» (точка с запятой), а служат для
отображения в браузере определенных знаков и символов. Например, ком
бинация символов &gt; используется для обозначения знака «>» (боль
ше чем);
¾ In numeric decimal value (В числовом десятичном коде) – например: &#233;;
¾ In numeric hexadecimal value (В числовом шестнадцатеричном коде) – на
пример: &#×E0;.
Отметим, что функционально числовые коды соответствуют комбинациям из
таблиц символов, отличие – лишь в форме представления.
266 Автоматизация

Раздел Head write organization (Порядок записи заголовка) служит для до
полнительной настройки расположения метатэгов и позволяет воспользоваться
следующими возможностями:
¾ Sort metatags alphabetically (Сортировать метатэги в алфавитном порядке);
¾ Write the «Content Type» metatag first (Записывать метатэг “Content-
Type” первым);
¾ Use closing slash on metatags (Использовать в метатэгах закрывающий
слэш) – например: “ / > ”;
¾ Allow this number of characters per line before the text wrap to the next line
(Допустимое число символов в строке, после достижения которого перехо
дить на следующую строку) – если задано 0, то строка не разбивается.

Создание и изменение метатэгов


После завершения сканирования каталога на локальном компьютере или FTP
сайта все найденные метатэги отображаются в виде сетки (рис. 2.165), где вы мо
жете определить, какие файлы требуют модификации.

Рис. 2.165. Сетка метатэгов

Для добавления метатэга в какойлибо HTMLдокумент выполните следую


щие операции:
1. Перейдите в Сетке на вкладку, соответствующую выбранному типу файла
(в данном случае – Web Pages).
Программы 267
2. Выберите ячейку, которую собираетесь