Вы находитесь на странице: 1из 42

Правила работы над хитапом

«Spam» для многочисленных


пользователей
Обновлено 1/27/23

Новые обновления: Иностранный язык

Введение и Обзор

В хитапе «Спам» Вы будете изучать и оценивать, является ли веб-страница «Spam» (спамом),


«Acceptable» (допустимой) или «Not Applicable» (несоответствующей критериям).

Для этого Вам будет необходимо изучить веб-страницу, обращая внимание на различные виды
поисковой оптимизации (SEO), которые на ней присутствуют. Некоторые SEO-технологии допустимы и
даже необходимы для создания успешного сайта, в то время как другие SEO-технологии используются в
спам-целях для увеличения посещаемости сайта и являются незаконными.

В рамках данного задания, если на странице используются какие-либо спам-методы SEO, страница
оценивается как «Spam» и в дальнейшем не будет применяться в качестве результата в поисковой
системе Bing. Если на странице не используются никакие SEO-технологии или используются только
допустимые SEO-технологии, страница должна быть отмечена как «Acceptable», и значит, она будет
продвигаться в результатах поиска Bing. Допустимые страницы - это страницы, которые безопасны и
полезны для наших пользователей!

Страницы также могут быть помечены как «Not Applicable» по нескольким причинам, включая, в
частности, ошибку HTTP, материалы для взрослых, расположенные на сайте, или по причине отсутствия
любого содержания на странице.

В оставшейся части данного руководства Вы научитесь всему, что Вам необходимо знать для вынесения
точного и обоснованного суждения. Сюда войдут определения всех категорий SEO, а также категории
страниц, несоответствующие критериям, с многочисленными наглядными примерами, которые
проиллюстрируют различные типы страниц, с которыми вы столкнетесь при выполнении этого задания.
Подготовка

Перед началом работы над хитапом «Спам», пожалуйста, выполните следующие шаги для настройки
вашего веб-браузера и компьютера, чтобы убедиться, что все приложения и программы работают
правильно.

Интернет-браузеры
В этом проекте настоятельно рекомендуется использовать Microsoft Edge, однако в определённых
обстоятельствах можно использовать и другие веб-браузеры.

Поддерживаемые в настоящее время браузеры:

- Microsoft Edge
- Google Chrome
- Mozilla Firefox

Расширения браузера
Чтобы веб-страницы воспринимались нами точно так же, как обычными пользователями, необходимо отключить или удалить все
соответствующие расширения браузера.

Любое расширение, блокирующее рекламу, мгновенную переадресацию или всплывающие окна, должно быть отключено или удалено, чтобы
гарантировать, что при оценке все будут видеть одну и ту же веб-страницу со всеми характеристиками.

Вы можете обратиться к вашему руководителю, чтобы убедиться, что ваш компьютер или иное устройство правильно настроены.

Встроенные блокировщики рекламы


Некоторые браузеры, например Google Chrome, содержат встроенные блокировщики рекламы. В целях
правильной оценки этого задания, пожалуйста, примите меры по отключению встроенных
блокировщиков рекламы в выбранном вами браузере.

Google Chrome

Выйдите из социальных сетей


Перед началом работы, пожалуйста, выйдите из всех учетных записей социальных сетей в выбранном
вами браузере. Это обеспечит согласованность судейства для всех, кто работает над хитапом.
Пользовательский интерфейс и функциональность хитапа

После выбора хитапа «Crowd Spam Labeling – Russian» в UHRS, вы увидите пользовательский
интерфейс хитапа:

Работа в хитапе проста; хитап содержит всего несколько элементов интерфейса. Он разработан для простоты
использования и должен подходить практически под любой размер экрана.

Первым элементом, на который следует обратить внимание, является заголовок UHRS. В нем
содержится название хитапа, время, данное для работы над заданием, ваше имя пользователя и элементы
управления для закрытия хитапа или сообщения о технической проблеме:
Далее находится строка URL и связанные с ней кнопки. Это URL-адрес страницы, которую вы будете
оценивать:

Используйте кнопку «Open» в правой части панели URL, чтобы открыть страницу в новой вкладке, или
используйте вкладку «Landing Page» в нижней части пользовательского интерфейса хитапа.

После того как выбран рейтинг, используйте кнопку «Submit» в крайнем правом углу, чтобы отправить
хит на рассмотрение и перейти к следующему.

Далее следует раздел «SEO Usage», где мы указываем, какие SEO-технологии были использованы на
странице:

Каждая кнопка относится к определенной категории SEO. Большинство из них можно оставить либо в
зеленом, либо в красном состоянии. Если использование SEO допустимо, переключите кнопку на
зеленый цвет. Если используется спам SEO, переключите кнопку на красный цвет. Некоторые
категории можно переключить только в красное состояние (Spam), поскольку является невозможным
использование категории приемлемым образом (например, машинно-генерируемый контент).
Следующее изображение - пример того, как выглядит раздел с многочисленными категориями,
установленными в случайные красные и зеленые состояния (изображение представлено в целях
иллюстрации):
Далее находится основная область оценки. Здесь мы оцениваем, является ли страница «Acceptable»,
«Spam» или «Not Applicable»:

Выберите один из вариантов, чтобы пометить страницу как «Acceptable», «Spam» или «Not Applicable».

Наконец, кнопка «Escalate» используется для того, чтобы сообщить о задании аудиторам. Эту функцию
следует использовать в крайних случаях. Если страница содержит изображения или медиаматериалы,
сексуализирующие детей или содержащие порнографию с участием детей, пожалуйста, сообщите об
этом и укажите вебсайт с помощью инструкций, приведённых в конце данного руководства.
Как Принимается Решение

После того как вы освоитесь с элементами пользовательского интерфейса, приступайте к оценке веб-
страницы на предмет спама. Оценка проводится в несколько этапов:

1) Откройте URL-адрес в новой вкладке или изучите страницу из вкладки «Landing Page». Следите за
изменениями URL-адреса по мере загрузки страницы, так вы можете быть перенаправлены
(подробнее об этом в разделе о мгновенной переадресации).

Используйте кнопку «Открыть», чтобы сделать это легко и быстро:

2) Изучите всю веб-страницу на предмет наличия любых SEO-приемов. Просмотрите страницу


сверху вниз, нажимайте на ссылки и т. д. Различные методы SEO, которые можно увидеть на
страницах, будут обсуждаться в разделе «Категории и техники SEO». Отмечайте различные
тактики SEO или записывайте их в блокноте и т. д.

Помните, что методы SEO могут быть использованы как в качестве спама, так и приемлемым
образом. Если какие-либо методы SEO используются как спам, вся страница должна быть
помечена как спам.
ПРИМЕЧАНИЕ: на всех страницах с медиафайлами (такими как фильмы и музыка) обязательно
попробуйте воспроизвести медиафайл, прежде чем принимать решение. Обычно сайты потокового
вещания скрывают спамерское поведение до тех пор, пока вы не нажмете кнопку
«Play». Если страница с фильмом или музыкой воспроизводит мультимедиа без вредоносного
использования SEO (ссылки, перенаправляющие на иные вебсайты, наполнение ключевыми
словами, слишком агрессивная реклама и т. д.), страница приемлема.

Это правило также относится к страницам, на которых размещены онлайн-игры. Если в игру можно
играть без вредоносного использования SEO (вводящие в заблуждение ссылки, наполнение
ключевыми словами, слишком агрессивная реклама и т. д.), страница приемлема.

3) После изучения страницы вернитесь в хитап и отметьте, какие из SEO техник были использованы на
странице. Например, если вы посетили известный новостной сайт, такой как CNN, и на нем
было несколько допустимых объявлений с некоторой аффилированностью, ваше суждение может
выглядеть примерно так:

CNN - известный источник новостей, поэтому он не будет использовать рекламу или


аффилированность спамерским способом. Кнопки рекламы и аффилированности можно сделать
зелеными, чтобы показать, что на странице есть приемлемая реклама и аффилированность, а для
основного рейтинга можно установить значение «Acceptable», чтобы показать, что страница
приемлема.

4) После того как оценка завершена, нажмите на синюю кнопку «Submit» справа от URL, чтобы отправить
хит. Загрузится следующий хит, и вы увидите новое задание.
Категории и техники SEO

Обзор категорий и техник SEO


SEO бывает разных типов. Некоторые из них могут быть использованы как приемлемым, так и спам-
способом, а некоторые всегда являются спамом. В следующем разделе описаны различные категории
техник, а также иные техники в рамках этих категорий. Для наглядности будут приведены примеры.

Кроме того, некоторые методы SEO помечены «Spam Only». Эти методы используются только как спам и
никогда приемлемым способом. Если вы заметили на странице SEO-технику, отмеченную как «Spam
Only», то страница должна быть помечена как спам, а для соответствующей SEO-категории
установлено красное значение в области «SEO Usage».

В следующей таблице приведены различные категории SEO, по которым мы проводим поиск, и


отдельные методы, входящие в каждую категорию:

Категория SEO Отдельные техники SEO

Броские/мешающие просмотру объявления


Объявления/Ads
Агрессивные объявления (Spam Only)

Скопированный контент
Дешевый контент/CheapContent
Чрезмерное количество
грамматических/орфографических ошибок (Spam Only)

Плохой/дешевый дизайн

Мгновенная переадресация
Манипулирование ссылками/Link Manip.
Недостоверные ссылки (Spam Only)

Чрезмерное количество внешних ссылок (Spam Only)

Фаннелинг (Spam Only)

Допустимая аффилированность
Аффилированность/Affiliation
Слабая аффилированность (Spam Only)

Наполнение ключевымисловами/KW Числа (Spam Only)

Stuffing Определенные ключевые слова (Spam Only)


Наполнение URL (Spam Only)

Пользовательский контент/UGC Форум/Социальные медиа

Комментарии не по теме (Spam Only)


Фишинг (Spam Only)
Вредоносные
намерения/Malicious Вредоносные программы (Spam Only)

Мошенничество (Spam Only)

Несогласованное использование
бренда/Brand Ложная ассоциация (Spam Only )
Abuse

Машинно-генерируемый Автоматически генерируемый контент (Spam Only)


контент/MGC

Документы PDF/Word Документы PDF/Word

Как вы можете видеть, значительное количество методов являются «только спамом» а некоторые
категории содержат исключительно «только спам». Например, категория SEO «Вредоносные
намерения» никогда не может быть допустимой, она может быть только спамом. Что правда: ни
один приемлемый, нормальный сайт не будет использовать вредоносные методы в отношении
пользователей, которые посещают этот сайт.

Обзор категории «Not Applicable»


Страницы, несоответствующие критериям, могут также иметь несколько различных категорий. Если
страница попадает под любую из этих категорий, она должна быть помечена как «Not Applicable»:

Not Applicable

Пустые страница

Ошибки

Иностранный язык

Содержание для взрослых

Автоматические загрузки

Каждая из этих категорий будет подробно рассмотрена на последующих страницах.


Описания категорий и техник SEO
В этом разделе будут более подробно описаны различные типы SEO-методик, с которыми мы
столкнемся при поиске спам-страниц. Когда на веб-странице будет обнаружена техника SEO, отметьте
соответствующую категорию в пользовательском интерфейсе хитапа: зеленый цвет для допустимого
использования или красный для спама.

Помните, что не все категории могут быть использованы на допустимых страницах, так как некоторые
методы являются «только спамом».

Ads (объявления)
Реклама на сайтах может принимать различные формы, но мы сосредоточимся на двух типах: броская
или мешающая просмотру реклама и реклама, которая настолько навязчива, что становится
агрессивной.

Flashy/Interrupting Ads (Броская/мешающая просмотру реклама):

Эти объявления либо анимированы (броские), либо прерывают основное содержание. Объявления
над или в середине контента считаются мешающими просмотру, тогда как объявления сбоку от
контента - нет. Обратите внимание, что броская/мешающая просмотру реклама редко или никогда не
является
причиной того, что страница помечается как спам, хотя она может способствовать повышению
рейтинга спама, если используется вместе с другими методами или категориями.

Следующая страница содержит рекламу перед основным контентом, мешающую просмотру, но это
всё ещё является приемлемым использованием броской/мешающей просмотру рекламы:
Aggressive Ads (Агрессивные объявления) (Spam Only):

Агрессивная реклама — это реклама, которая является не только броской/мешающей просмотру, но


настолько назойливой и мешающей, что страница будет считаться спамом. Страницы, на которых
рекламы больше, чем контента, страницы с множеством назойливых всплывающих объявлений,
страницы с множеством автовоспроизводящихся видеореклам, страницы, на которых реклама
закрывает или иным образом прерывает содержание страницы, - все эти страницы могут быть
признаны спамом, так как содержат агрессивную рекламу.

На следующей странице достаточно мешающих просмотру объявлений, чтобы применить ярлык


«Aggressive Ads» стали применимы:
Commented [VL1]: На данном изображении вы
можете видеть обведённые красным объявления,
которые мешают просмотру статьи. Такие объявления
считаются агрессивными.

Мигающая/отвлекающая реклама:

Этот вид рекламы либо как-либо анимирован (мигает), либо прерывает контент.
Реклама сверху или в середине контента может считаться
отвлекающей, однако реклама по бокам контента таковой не
считается.

Имейте в виду, что такая мигающая/отвлекающая реклама сама


по себе редко, если не вообще никогда, является причиной
пометить страницу как спам, однако она может повлиять на
финальную оценку как дополнение к другим спамным техникам
и категориям.

Агрессивная реклама (только спам):

Агрессивной рекламой считается такая реклама, которая


следует за мигающей/отвлекающей и настолько назойлива, что
должна быть расценена как спам.

Страницы, на которых рекламы больше, чем контента, страницы со множественными


всплывающими окнами, автоматически проигрываемой
видеорекламой, а также страницы, где реклама перекрывает
контент или мешает его просмотру, могут расцениваться как
спам из-за агрессивной рекламы.

Некоторые примеры того, как реклама может быть агрессивной:

* Реклама занимает 70% страницы;

* Множественные всплывающие окна, которые не получается закрыть.

* Множественная мигающая или видеореклама внутри контента.

* Реклама, мешающая просмотру или поиску контента.

* Реклама открывается в отдельном окне при щелчке по кнопкам на сайте.

Реклама может быть приемлемой. Например:

*Большие рекламные блоки сбоку контента, или те, которые можно закрыть.

* Реклама, прерывающая контент, однако он остается читаемым.

* Реклама показывается перед просмотром видео/ началом игры.

* Новостные сайты с рекламой, окружающей контент.

* Отвлекающая реклама, которая появляется при открытии сайта, но ее легко закрыть.


* Беззвучная видео-реклама.
Cheap Content (Дешевый контент)
Дешевый контент — это контент низкого качества, скопированный с других веб-сайтов, плохо
оформленный или имеющий низкую ценность для пользователя.

Copied Content (Скопированный контент):

Скопированный контент — это контент, который, если это возможно подтвердить, был взят с другого
веб-сайта. Обычно это текстовый контент, поскольку текст легко найти и проверить, не был ли он
скопирован. Изображения также могут быть скопированы и найдены с помощью поиска изображений.

Иногда скопированный контент может быть использован приемлемым образом на сайтах: в тех
случаях, когда он добавляет значительное количество дополнительной ценности. Например, сайт,
который
копирует часть текста из книги, но затем указывает свой собственный обзор на книгу, может быть
приемлемым. Такое использование добавляет ценность оригинальному скопированному контенту.

Примечание: Мы не ожидаем от судей знания деталей лицензирования видео, поэтому не


учитываем скопированный контент на сайтах потокового вещания. Проверка того, есть ли у
страницы права на показ определенного видеоконтента, не входит в рамки данного задания.

Следующий сайт содержит контент, скопированный непосредственно из «Google Play», без


содержания каких-либо дополнительных преимуществ на самом сайте:
Commented [VL2]: SpongeBob: Krusty Cook-Off | Новые
Apk игры и приложения | Modyhair.com
Чрезмерное количество грамматических/ орфографических ошибок (только спам):

На страницах иногда встречаются орфографические или грамматические ошибки, в том числе и на


известных и новых сайтах и т. д. Ошибки случаются. Однако если страница содержит чрезмерное
количество ошибок, то, скорее всего, она была скопирована и плохо воспроизведена, автоматически
переведена с другого языка или обладает настолько низким качеством, что мы хотим ограничить
возможность ее посещения пользователями нашей поисковой системы.

Следующий текст с сайта технической поддержки содержит значительное количество грамматических


и орфографических ошибок:

Poor Layout/Cheaply Designed (Плохой/дешевый дизайн):

Страницы, дизайн и оформление которых не требуют больших усилий, всегда должны вызывать
подозрение при оценке. Создатели спама часто создают спам-страницы с помощью шаблонов или
других дешевых и быстрых методов, в результате чего получаются плохие макеты или дизайн, не
имеющий смысла.

Следующая страница — это дешевая и плохо оформленная шаблонная Commented [VL4]: сертификация по уходу за зрением

страница, без заголовка или

навигации, с отсутствующей информацией о профиле и явно не требующим


больших усилий дизайном контент:
Link Manipulation (Манипулирование ссылками)

Манипулирование ссылками — это использование ссылок и URL-адресов для создания впечатления,


что страница получает больше трафика, а также для большей важности или большей значимости, чем
на
самом деле. Ссылки являются основным источником SEO во всем интернете.

Instant Redirections (Мгновенная переадресация):

Мгновенная переадресация происходит, когда мы щелкаем по одной ссылке, но адрес конечной


страницы отличается от адреса ссылки, по которой мы щелкнули. Например, если мы нажимаем на
ссылку с адресом «highqualitysite1.com», но в результате оказываемся на странице с адресом
«spammysite2.com», то первый URL перенаправляет на второй URL без нашего участия. Это мгновенная
переадресация.

Примечание: не всегда мгновенная переадресация являются спамом. Например, если у вас есть
учетная запись электронной почты Hotmail и вы пытаетесь перейти на "https://hotmail.com", вместо
этого вы будете перенаправлены на "https://outlook.live.com/owa/". В данном случае, одна
известная ссылка, связанная с компанией «Microsoft», перенаправляет пользователя на другую
подобную
ссылку.

В этом примере URL-адрес (верхнее изображение) перенаправляет пользователя на спам-сайт


(нижнее
изображение с другим URL-адресом). Это спам-использование мгновенной переадресации:
Commented
[VDA5]:
https://comun
ic-
arts.eu/reakti
onsmotor

Commented [VL6]: В этом примере


важно обратить внимание на то, насколько
разные адреса страницы. Адрес второй
страницы не имеет никакого отношения к
ПЕРЕАДРЕСОВЫ URL первой.
ВАЕТСЯ НА
Misleading Links (Недостоверные ссылки):

Недостоверная ссылка — это любая ссылка на веб-странице, которая при нажатии ведет нас туда, куда
мы не намеревались переходить. Например, если на странице загрузки программного обеспечения
есть ссылка «Загрузить», но она ведет на страницу рекламы казино, это недостоверная ссылка.

В следующем примере показана страница PDF с фальшивой ссылкой captcha в середине. Мы ожидаем, что
произойдёт переход на полезную страницу, но вместо этого ссылка переводит нас на спам. Это недостоверная
ссылка: Commented [VDA7]: Данное
изображение не является настоящим и чаще
всего будет встречаться, написанное на
английском языке.
Commented [VDA8]: Arundhati
tamil full movietamilrockers
(studiodebiaggi.eu)

В следующем примере показана страница технической поддержки с одной ссылкой. Вместо перехода
на официальный сайт техподдержки эта ссылка ведет на другой, поддельный сайт техподдержки:
Overwhelming Outlinks (Подавляющее число внешних ссылок):

Спам-страницы иногда заполняют всю страницу ссылками на различные другие сайты. Это спам-
поведение, не имеющее особой ценности для пользователя.

Следующая страница полностью заполнена ссылками на другие сайты. Все эти ссылки ведут на сайты,
не совпадающие с тем, на котором мы находимся. Это подавляющее число ссылок:
Commented [VL9]: Несмотря на то, что ссылк
названия страниц написаны на английском язы
ссылки составляют всё содержание страницы,
является спамом.

Фаннелинг:

Фаннелинг присутствует тогда, когда на веб-странице размещается несколько ссылок на один веб-сайт,
не совпадающий с исходной веб-страницей. Например, если на «examplesiteone.com» находится 20
ссылок на «examplesiteten.com», то «examplesiteon.com» переводит пользователей на
«examplesiteten.com» через большое количество ссылок.

В следующем примере на странице, которую мы рассматриваем («http://inurl-view-index-shtml-


com.blogspot.com/"), находится несколько ссылок, которые ведут на совершенно разные сайты.
Однако все они ведут на один и тот же сайт - "onlinewebcameras.com». Это фаннелинг от одной
страницы к
другой:
Commented [VDA10]: inurl:
"view/index.shtml",inurl:
"ViewerFrame?Mode=",Live WebCams:
AXIS 206 сетевая камера, AXIS 207 сетевая
камера, Axis 2100 сетевые
камеры, AXIS 211 сетевая камера, AXIS 215
PTZ сетевые камеры, AXIS 221 сетевая
камера (inurl-view-index-shtml-
com.blogspot.com)

Affiliation (Аффилированность

Аффилированность — это ситуация, в которой на сайте размещаются ссылки на товар или услугу
другого сайта электронной коммерции. Например, если на сайте «supertelevisions.com» размещены
ссылки на телевизоры, продаваемые на eBay или Amazon, это и есть аффилированность. Хост такого
сайта часто
получает определенную оплату от компаний, если кто-то покупает товар по одной из этих ссылок. Эта
функциональность может быть использована как в допустимых, так и в спам-целях, о чем
рассказывается ниже.

Good Affiliation (Допустимая аффилированность):


Сайт, который непосредственно связан или имеет контракт/соглашение с компанией электронной
коммерции, может размещать аффилированные ссылки допустимым образом, часто путем
предоставления дополнительных преимуществ. Например, если сайт обзора туристического
снаряжения предоставляет подробный обзор продукта, а затем содержит ссылку, по которой
посетители могут купить этот товар на Amazon, это допустимая аффилированность. Сайт обзора
предоставляет дополнительную и уникальную ценность, которую посетители не смогли бы найти,
просто посетив сайт Amazon и выполнив поиск по запросу «туристическое снаряжение».

В следующем примере, взятого с сайта «Men's Health», страница содержит уникальное и полезное
содержание статьи, за которым следует допустимая аффилированность с Amazon:

Commented [VDA11]: 15 лучших кремов для


глаз для мужчин 2020 - Как избавиться от
темных кругов (menshealth.com)

Thin Affiliation (Слабая аффилированность):

Противоположность допустимой, слабая аффилированность —когда сайт использует


аффилированность с сайтом электронной коммерции без предоставления дополнительной ценности.
Такие сайты часто пытаются просто заработать на партнерских ссылках, прилагая минимум усилий.

В данном примере на странице представлены результаты по запросу «Холодильник с экраном для


компьютера», но товары явно не связаны между собой. Эта страница имеет низкую или нулевую
ценность и просто пытается заработать на слабой аффилированности:
Commented [VDA12]: Лучший холодильник с
для компьютера - домашние гаджеты
(homesellquick.com)

Keyword Stuffing (Наполнение ключевыми словами):


Наполнение ключевыми словами — это практика использования ключевых слов на сайте в попытке
повысить его рейтинг в результатах поиска. Идея заключается в том, что большее количество ключевых
слов равняется лучшим результатам. Несмотря на то, что для современных поисковых систем это не
всегда является правдой, многие спам-сайты по-прежнему используют наполнение ключевыми
словами в качестве одного из методов SEO.

Для данного хитапа недопустимо использование наполнения ключевыми словами, поэтому убедитесь,
что вы понимаете разницу между допустимым использованием ключевых слов и наполнением
ключевыми словами. Наполнение — это процесс чрезмерного использования ключевых слов до такой
степени, что это становится назойливым и зловредным для пользователя веб-страницы.
Использование одного или двух ключевых слов — это использование, а использование одного и того
же ключевого слова 25 раз — это наполнение.
Numerical (Использование чисел):

Числовой вброс обычно связан с номерами телефонов, адресами или другим числовым

содержимым. В этом примере страница заполняется числовыми ключевыми словами:

Commented [VDA13]: 661-556**** Может быть


плохо.Узнайте сейчас! (porcimex.org)

Specific Keywords (Определённые ключевые слова):

Использование определённых ключевых слов можно наблюдать тогда, когда на странице упоминается
определенная фраза или слово (или вариации фразы/слова) много раз. Помните о различии между
приемлемым использованием и спам-вбросом.

Этот пример иллюстрирует содержание страницы с наполнением ключевыми словами, связанными с


Roblox:
Commented [VDA14]: Коды виртуальных игрушек
Roblox (counterbloxrobloxcode.blogspot.com)
URL Stuffing (Наполнение URL):

Наполнение URL происходит, когда URL-адрес конкретной страницы использует слишком много
ключевых слов в самом URL-адресе. Помните о различии между приемлемым использованием и
спамом.

Этот пример иллюстрирует спам-страницу и ее URL, наполненный ключевыми словами:

«https://www.nicksbuilding.com/Clearance_door_pics/clearance_door_index.php/closeout-doors/b-line-
unfin/cl-a422~430/discounted_doors/feature_doors/entry-doors-clearance/discounted-
doors/contact/discounted_doors/discounted-doors/discounted_doors_cl500-
up/finished_entry_doors_pfc250/b-line-unfin/discounted-doors/Discounted-Doors/CL-
10_Mahogany_Black_Full-Lite_Glass_Entry_Door.php»
Commented [VDA15]: Прозрачные наружные
подфарниками (nicksbuilding.com)
User Generated Content (Пользовательский контент):
Пользовательский контент (или «UGC») — это любой тип контента, созданный пользователями на
онлайн-платформе или форуме социальных сетей. Большинство пользовательского контента
допустимо и законно размещается на популярных сайтах социальных сетей, таких как «Facebook» или
«Twitter».

Однако некоторые создатели используют платформы пользовательского контента для размещения


или направления пользователей на спам-страницы. Мы попытаемся найти пользовательский контент и
отметить, является ли его использование допустимым или спамом.

Forum/Social Media (Форум/Социальные медиа):

Любой контент в социальных сетях или на форуме должен считаться пользовательским контентом и
отмечаться в категории пользовательского контента в хитапе.

Ниже приведен пример спам-использования пользовательского контента, где автор поста ссылается на
игровой спам. Не стоит забывать, что здесь также используются и другие спам SEO-приемы: плохая
грамматика и недостоверные ссылки. UGC редко бывает единственной категорией SEO, которую
можно увидеть на страницах со спам-UGC:
Commented [VDA16]: asphalt 8 airborne hack
Cheats Game Hack Android and iOS | Asphalt 8 air
Racing games, Airborne (pinterest.com)
Off Topic Comments (Комментарии Не По Теме):

Иногда спамеры используют разделы комментариев на небезопасных или немодерируемых


страницах для ссылок на спам-страницы или пытаются использовать SEO-технологии, чтобы повлиять
на
поисковые показатели страницы с комментариями. Обратите внимание, что мы еще раз взвешиваем
ценность страницы и влияние комментариев не по теме. Один или два комментария, слегка
отклоняющиеся от темы, но не вредоносные, не являются веской причиной для использования этой
категории. Страница, на которой имеется от шести до десяти комментариев не по теме, с
комментариями, которые явно являются вредоносными, — это подходящая для отметки как спам
страница, поскольку она использует пользовательский контент в качестве спама.

Следующая страница содержит несколько комментариев не по теме, ни один из которых не относится


к онлайн веб-камерам, которые являются темой обсуждения:
Malicious Intent (Вредоносные намерения):
Некоторые спам-сайты просто являются вредоносными. Их цель - обмануть посетителей, украсть их
информацию или загрузить вредоносное ПО на их устройства. Такие страницы очень опасны для
пользователей поисковых систем, поэтому для нас приоритетной задачей является их выявление и
удаление.

Как и в предыдущих категориях, невозможно использовать этот метод в категории «Acceptable».


Невозможно использовать мошенничество и т. д. законным и приемлемым образом.

Phishing (Фишинг):

Фишинг возникает, когда веб-сайт пытается украсть личную или персонально идентифицируемую
информацию посетителей, обычно способом ввода данной информации. Если посетитель добровольно
предоставляет эту информацию, мошенник может использовать ее, чтобы попытаться получить доступ к
учетной записи посетителя.

Например, поддельный сайт онлайн-банкинга может иметь форму входа, в которую посетители
вводят свою настоящую банковскую информацию. Затем мошенник может использовать эту
информацию, чтобы попытаться войти в банковские счета посетителя на официальном банковском
сайте.

Следующий пример показывает попытку собрать имена пользователей для игры Roblox. Затем эти
имена могут быть использованы мошенниками другими способами:

Commented [VDA17]: Free Robux (mourder.website)

Malware (Вредоносные программы):

Загрузка вредоносных программ встречается реже, чем простое мошенничество, но она не менее
опасна, если не более опасна, чем фишинг или мошенничество. Если сайт загружает файл, но ваш
браузер блокирует загрузку или антивирус вашей операционной системы блокирует загрузку, скорее
всего, это вредоносное ПО. Сайты, на которых размещается вредоносное ПО, всегда следует помечать
как спам.
В следующем примере показан сайт загрузки игр, который пытается загрузить файл, помеченный
браузером как вредоносный. Эта страница может быть помечена как спам для вредоносных
программ:

Commented [VL18]: MSN Games Bubble Town | MSN


Free Games

«scrubbleswebloader.swf был
заблокирован, поскольку данный
тип файла может являться
вредоносным для Вашего
Scam (Мошенничество):
устройства»

Мошенничество — это широкий термин для обозначения любого веб-сайта, который пытается
выманить у посетителей деньги, информацию или поставить под угрозу их благополучие.

Например, сайт, представляющий возможность «быстро разбогатеть», скорее всего, является


мошенничеством, как и ряд «онлайн-кредитов», навязывающих заявителям вопиющие процентные
ставки. Такие сайты вредны и опасны для посетителей.

Страница в следующем примере обещает «мгновенное одобрение кредита», содержит простой


дизайн, на который не потребовалось много времени, не содержит ссылок на социальные сети или
информации о бизнесе. Это очень подозрительно и, скорее всего, является кредитным
мошенничеством:

Brand Abuse (Нелегальное использование бренда):


Один из лучших способов заставить людей доверять спам-сайту — сделать его похожим на страницу
надежного бренда. Веб-страницы, которые придают своей странице вид, заслуживающий доверия,
путем кражи идентичности и дизайна у известного бренда, компании или услуги, используют бренд
нелегально и являются спамом.
False Association (Ложная ассоциация):

Как уже говорилось выше, ложная ассоциация — это когда веб-страница (или весь сайт) пытается
выглядеть как официальная страница известного бренда, компании или сервиса. Например, многие
спам-сайты техподдержки пытаются создать впечатление, что они заслуживают доверия, используя
дизайн, логотипы и цвета официальной технической компании, на который они пытаются быть
похожи.

Следующая страница является примером спам-страницы, ложно ассоциирующейся с известным


аэропортом в США. На странице используется официальный URL-адрес и название, но на ней
размещено большое количество мешающей просмотру рекламы, и она имеет мало преимуществ перед
простым посещением официального сайта аэропорта:

Machine Generated Content (Машинно-генерируемый контент):


Распространенным способом создания спам-страницы является добавление машинно-
генерированного контента. Обычно это текст, который не написан человеком, а сгенерирован
компьютерными
алгоритмами. MGC часто может выглядеть как высококачественный контент, но после прочтения
становится ясно, что это либо текст, не имеющий смысла, либо скопированный и вставленный контент
из многочисленных других источников.
Auto Generated (Автогенерируемый контент):

Автогенерируемый контент не имеет ценности для пользователя и часто представляет собой текст, не
имеющий смысла, или скопированный из других источников и вставленный контент.

В следующем примере показана страница, полностью состоящая из автоматически генерируемого


содержимого:
Commented [VDA19]: Пикуки (ezfinancesolutions.com)

Документы PDF и Word


Хотя использование документов PDF или Word не относится к категориям SEO, которая важны для нас
в этом задании, важно понимать, как к ним относиться, если мы сталкиваемся с ними во время
работы.

Если URL/страница, которую вы оцениваете, является PDF-документом или автоматически загружает


его, откройте и изучите PDF-документ, как и любой другой сайт. Проверьте его на предмет
использования спам SEO точно так же, как если бы вы оценивали веб-страницу.

Если URL/страница на рассмотрении автоматически загружает документ Word, откройте документ в


защищенном режиме в Microsoft Word, чтобы определить, не используется ли в документе спам SEO.

Все остальные автоматически загружаемые типы файлов не следует открывать, как описано ниже в
правилах категории "Not Applicable".

Описания категорий «Not Applicable»


Существует несколько примеров, в которых страница может быть «Not Applicable», или
несоответствующей критериям. В этом разделе приведено
краткое описание каждого из них с примерами изображений.
Junk (Пустые страницы):
Нежелательные страницы — это страницы, на которых нет полезного содержимого. Эти страницы могут
быть совершенно пустые, страницами, которые не содержат результатов поиска или страницами,
сообщающих об отсутствии определённого товара, на которых к тому же нет иного содержимого.

Пустая страница
Отсутствуют результаты поиска

Шаблон сайта для хостинга доменов


Error (Ошибки):
Обычно на веб-сайтах возникает ошибка, которая мешает пользователям посетить страницу. Ошибки
кода HTTP, такие как ошибка HTTP 404, хорошо известны большинству пользователей Интернета.

Любая ошибка, которая не позволяет пользователю увидеть содержание страницы, является причиной
для пометки страницы как «Not Applicable».
Ошибка 404

Ошибка IP
Ошибка безопасности

Foreign Language (Иностранный язык):


Не оценивайте страницы, которые НЕ на вашем рабочем языке, ДАЖЕ если страница выглядит как
очевидный спам.

Такие страницы должны быть помечены только как ‘NOT APPLICABLE’. Например, если вы занимаетесь
оценкой для английского языка, то не оценивайте никакие страницы на любом другом, отличном от
английского, языке, даже если вы понимаете его.

Как распознать, что страница относится к категории Foreign language –

1) Более 50% основного контента страницы представлены на другом языке (не относится к видео и
изображениям)

Примечания:

-Не включайте опцию автопереводчика в браузере, чтобы пытаться оценить контент


-Игнорируйте язык рекламы

Английский также расценивается как иностранный язык


Ниже представлено несколько примеров страниц, которые должны быть оценены как Foreign Language :

Example 1: Страница с записью на сайте, посвящённому недвижимости. Основное наполнение страницы


на иностранном языке, что делает указанную страницу не соответствующей критериям.
Example 2: Главная страница сайта, посвящённому теме бизнеса, основной контент страницы на иностранном
языке, что делает её не соответствующей критериям.

Example 3: Страница с текстом, посвящённому онлайн-казино. Сама страница выглядит спамной:


присутствует наполнение ключевыми словами, манипулирование ссылками, скудный дизайн и
реклама, но основной контент страницы на иностранном языке, что делает её не соответствующей
критериям.
Adult Content (Содержание для взрослых):
Содержание страницы носит взрослый/сексуально откровенный характер. Почти во всех случаях это
изображения наготы и порнографические изображения. Если на странице нет медиа (фото/видео)
наготы или откровенного контента, или если содержание является лишь пикантным (модель в нижнем
белье для сайта одежды или сайт знакомств для взрослых, например), она не может быть
использована с кодом 005. Пожалуйста, оценивайте эти страницы в обычном порядке.

Примечание: откровенное содержание может включать сексуальные ситуации/действия, такие


как связывания и т. д. Если это достаточно откровенно, вы можете использовать код 005.

Примечание: другие материалы, такие как сайты с возрастными ограничениями, сайты, на


которых продаётся алкоголь, сайты с огнестрельным оружием и сайты азартных игр, не
относятся к этому коду и должны оцениваться как обычные.
Automatic Downloads (Автоматические загрузки):
Одной из известных SEO-техника является автоматическая загрузка НЕ PDF ИЛИ WORD ДОКУМЕНТА
без инициации загрузки посетителем. Это считается небезопасным для посетителя, поскольку он не
запрашивал и не начинал загрузку.

Если браузер начинает автоматическую загрузку без предварительного отображения веб-


страницы,отметьте страницу как «Not Applicable».

Если браузер открывает веб-страницу, а через некоторое время начинает загрузку, оцените страницу
как обычную, присвоив ей ярлык «Spam» или «Acceptable».

Примечание: судьи должны настроить параметры загрузки в браузере так, чтобы браузер всегда
предлагал варианты загрузки перед загрузкой файла. Во время работы над заданием «Спам» никогда
не позволяйте браузеру загружать файлы без предварительного запроса.

Сообщение о ДП и сексуализации несовершеннолетних


ДП и сексуализация несовершеннолетних - деликатный вопрос, имеющий юридические последствия
для Microsoft.

Если вы видите изображения, которые, по вашему мнению, могут считаться ДП, выполните следующие
действия:

1. Сообщите о задании, используя кнопку «Escalate» в хитапе.


2. Сообщите URL-адрес по адресу https://www.microsoft.com/en-us/concern/bing. В поле «Query»
введите «N/A» или «Not Applicable».

Создание сайтов, которые сексуализируют детей, - еще один острый вопрос. Изображения,
предназначенные для сексуализации/эксплуатации детей, даже если они не содержат наготы
или порнографии, также являются нежелательными, и в этом случае следует придерживаться
вышеуказанных правил и рекомендаций. Сообщите о задании и URL-адресе, чтобы на эти
страницы обратили внимание соответствующие команды Bing.

Использование социальных сетей


Социальные сети могут выступать полезным инструментом в определении легитимности сайта,
компании или сервиса. Если оцениваемая Вами страница кажется подозрительной или похожей на спам,
проверьте, имеет ли она активные профили в соц. сетях. Если да, и профиль выглядит настоящим, то,
скорее всего, данный новостной ресурс легитимен. Например, у «New York Times» есть страница на
Facebook, у которой 17,462,387 лайков:

Вряд ли компания, у которой столько лайков, создает спамные страницы. С другой стороны, если
компания, новостной портал, сервис и т.п. проявляет слабую активность в соц. сетях, то, скорее всего, ее
стоит более тщательно проверить на спам.
На заметку: Пожалуйста, просматривайте страницы социальных сетей НЕ зарегистрированными!
Просматривая как зарегистрированный пользователь, оценивающий может спровоцировать страницу
показывать контент, который другие аудиторы не видят или не могут видеть. Все аудиторы должны выйти из
своих профилей в социальных сетях, чтобы давать адекватную оценку контенту.

Вам также может понравиться