Вы находитесь на странице: 1из 15

МИНИСТЕРСТВО НАУКИ И ОБРАЗОВАНИЯ УКРАНЫ

ХАРЬКОВСКИЙ НАЦИОНАЛЬНЫЙ УНИВЕРСИТЕТ РАДИОЭЛЕКТРОНИКИ

Кафедра ИИ

Реферат
Дисциплина: «Менеджмент знаний»
Тема: «Разработка элементов программного обеспечения для
визуализации сетей»

Выполнил:
ст. гр. СШIм-17-1
Шевченко И.Г.

Приняла:
проф. каф. ИИ
Петров К.Е.

Харьков 2017
1 КЛАССИФИКАЦИЯ СЕТЕЙ

Объединение компонентов в сеть может производится различными


способами и средствами. По составу своих компонент, способам их
соединения, сфере использования и другим признакам сети можно разбить на
классы таким образом, чтобы принадлежность описываемой сети к тому или
иному классу достаточно полно могла характеризовать свойства и
качественные параметры сети.
Компьютерная сеть – это сложный комплекс взаимосвязанных и
согласованно функционирующих программных и аппаратных компонентов.
Однако такого рода классификация сетей является довольно условной.
Наибольшее распространение на сегодня получило, разделение
компьютерных сетей по признаку территориального размещения.
По этому признаку сети делятся на три основных класса:
- LAN – локальные сети (Local Area Networks);
- MAN – городские сети (Metropolitan Area Networks);
- WAN – глобальные сети (Wide Area Networks);
Локальная сеть (ЛС) – это коммуникационная система,
поддерживающая в пределах здания или некоторой другой ограниченной
территории один или несколько высокоскоростных каналов передачи
цифровой информации, предоставляемых подключенным устройствам для
кратковременного монопольного использования. Территории, охватываемые
ЛС, могут существенно различаться.
Длина линий связи для некоторых сетей может быть не более 1000 м,
други е же ЛС в состоянии обслужить целый город. Обслуживаемыми
территориями могут быть как заводы, суда, самолеты, так и учреждения,
университеты, колледжи. В качестве передающей среды, как правило,
используются коаксиальные кабели, хотя все большее распространение
получают сети на витой паре и оптоволокне, а в последнее время также
стремительно развивается технология беспроводных локальных сетей, в
которых используется один из трех видов излучений: широкополосные
радиосигналы, маломощное излучение сверхвысоких частот (СВЧ излучение)
и инфракрасные лучи.
Небольшие расстояния между узлами сети, используемая передающая
среда и связанная с этим малая вероятность появления ошибок в
передаваемых данных позволяют поддерживать высокие скорости обмена –
от 1 Мбит/с до 100 Мбит/с (в настоящее время уже есть промышленные
образцы ЛС со скоростями порядка 1 Гбит/с).
Городские сети, как правило, охватывают группу зданий и реализуются
на оптоволоконных или широкополосных кабелях. По своим
характеристикам они являются промежуточными между локальными и
глобальными сетями. В последнее время в связи с прокладкой
высокоскоростных и надежных оптоволоконных кабелей на городских и
междугородних участках, а новые перспективные сетевые протоколы,
например, ATM (Asynchronous Transfer Mode – режим асинхронной
передачи), которые в перспективе могут использоваться как в локальных, так
и в глобальных сетях.
Глобальные сети, в отличие от локальных, как правило, охватывают
значительно большие территории и даже большинство регионов земного
шара (примером может служить сеть Internet). В настоящее время в качестве
передающей среды в глобальных сетях используются аналоговые или
цифровые проводные каналы, а также спутниковые каналы связи (обычно
для связи между континентами). Ограничения по скорости передачи (до 28,8
Кбит/с на аналоговых каналах и до 64 Кбит/с – на пользовательских участках
цифровых каналов) и относительно низкая надежность аналоговых каналов,
требующая использования на нижних уровнях протоколов средств
обнаружения и исправления ошибок существенно снижают скорость обмена
данными в глобальных сетях по сравнению с локальными. Существуют и
другие классификационные признаки компьютерных сетей.
По сфере функционирования сети делятся на:
- банковские сети,
- сети научных учреждений,
- университетские сети,
- социальные сети;
По форме функционирования можно выделить:
- коммерческие сети;
- бесплатные сети,
- корпоративные сети
- сети общего пользования;
По характеру реализуемых функций сети разделяются на:
- вычислительные, предназначенные для решения задач управления на
основе вычислительной обработки исходной информации;
- информационные, предназначенные для получения справочных
данных по запросу пользователей; смешанные, в которых реализуются
вычислительные и информационные функции.
По способу управления вычислительные сети делятся на:
- сети с децентрализованным управлением;
- централизованным управлением;
- смешанным управлением.
В условиях смешанных сетей под централизованным управлением
ведется решение задач, обладающих высшим приоритетом и, как правило,
связанных с обработкой больших объемов информации.
По совместимости программного обеспечения бывают сети:
- однородные;
- гомогенные (состоящие из программно-совместимых компьютеров)
- неоднородные или гетерогенные (если компьютеры, входящие в
сеть, программно несовместимы).

2 ПРИМЕРЫ СЛОЖНЫХ СЕТЕЙ


Интернет представляет собой мировой океан знаний. Объем знаний
настолько велик, что основной задачей для человека становится извле- чение
информации из уже существующих данных. Сбор новых данных с развитием
электронно-вычислительных систем упрощается, тем самым усложняя задачу
поиска нужной информации. Автоматическое извлече- ние необходимых в
конкретной ситуации знаний становится сложной, а порой и почти
неразрешимой для поисковых систем общего назначения задачей.
В настоящее время для улучшения качества поиска прибегают к со-
зданию узконаправленных поисковых систем. Однако, не всегда инфор-
мация находится на поверхности. Зачастую для извлечения знаний поми- мо
выбора нужной информации среди найденой требуется проанализиро- вать
данные, в ходе чего можно выделить новые, скрытые ранее знания.
Направление, занимающееся разработкой подобных методов, называется
Data Mining (извлечение данных, интеллектуальный анализ данных).
Одним из направлений развития Data Mining является так называ- емый
Community Mining, использующийся в свою очередь для анализа сообществ
 групп людей, объединенных общими интересами. Также за- частую
Community Mining решает задачу выделения сообществ. Анализ социальных
связей и выявление сообществ также может выявить новую неочевидную
информацию о направлении деятельности сообществ.
В математическом смысле социальная сеть — не что иное как граф с
вершинами и ребрами, которые, соответственно, представляют акторов
(субъектов общения) и связи между ними.
На каком основании – а, точнее, на основании какой информации –
строится такой граф? Все очень просто. Вашему вниманию — ставший уже
классическим пример с построением графа коммуникаций между пилотами
самолетов в роковой день 11 сентября 2001 года на основании фактов
переговоров по линиям радиосвязи (рис 1.1)
Рисунок 1.1 – Граф комммуникаций между пилотами
Каждая вершина графа обозначала отдельного пилота, каждое ребро,
соединяющее две вершины, – факт переговоров между пилотами. Очевидно,
что вывод о том, какие пилоты являлись террористами, делался на основании
наблюдения, что в некоторых местах графа плотность связей (количество
переговоров) возрастало.
Примеры существующих социальных сетей, рассмотрены далее.
1.2.1 Социальная сеть LinkedIn
Социальная сеть LinkedIn, предназначена для поиска и установле- ния
деловых контактов. На июль 2012 года содержит более 175 миллионов
зарегистрированных пользователей.
Сервис InMaps, разработанный сотрудниками LinkedIn, является
интерактивным представлением профессиональной вселенной пользова-
теля. Сервис строит граф профессиональной среды и обеспечивает поль-
зователю интерактивный доступ к нему. Этот граф позволяет пользова- телю
просмотреть на какие группы делятся его профессиональные связи, как
связаны его деловые контакты между собой, а также найти людей,
являющихся концентраторами своей профессиональной среды.
В InMaps используются следующие технологи: Hadoop/Pig, Ruby,
Voldemort, Java и Processing для построения графа и обработки изобра-
жений. Алгоритмы на графах и их отображение реализованы на основе Gephi
платформы с открытым исходным кодом для визуализации сетей. InMaps
является интересной разработкой социальной сети LinkedIn, выбравшей в
качестве способа отображения данных визуализацию соци- ального графа.
Однако проект InMaps направлен на профессиональную среду и не
предоставляет возможность поиска научных сообществ, что является
основной целью проекта, работа над которым описывается в данном
документе.
3 Community Mining Tool using Bibliography Data
Японские исследователи Ryutaro Ichise и Hideaki Takeda разработали
инструмент для выделения сообществ на основе библиографических дан-
ных. Для исследований ими была использована электронная библиотека
CiNii (Citation Information by the National Institute of Informatics). В результате
их исследований опубликована статья Community Mining Tool using
Bibliography Data.
В своей работе они рассматривают следующие три вида отношений
для поиска сообществ:
- соавторство;
- цитирование;
- автор цитаты.
Разработанный японскими исследователями инструмент выделения
сообществ использует следующие технологии: MySQL для управления
базами данных, Perl для реализации части системы, выделяющей сообщества,
а для визуализации SVG (Scalable Vector Graphics) Viewer.
Авторы статьи стали своего рода первопроходцами в задаче поиска
научных сообществ на основе социальных графов библиографических дан-
ных. Однако, реализованный ими поиск научных сообществ ориентирован
исключительно на японский язык.
4 Facebook Graph Search
В марте 2013 года Facebook представила свой семантический поис-
ковой движок названный Graph Search. Он разработан таким образом, чтобы
давать ответы пользователям на натуральном языке, а не списком ссылок.
Graph Search сочетает в себе большое количество данных, со- бранных от
миллиарда пользователей, и внешние данные из поискового движка,
обеспечивающиеся определенными запросами пользователя.
Facebook поддерживает поиск для следующих типов объектов:
- публичные записи;
- люди;
- страницы;
- события;
- приложения;
- группы;
- места;
- отметки пользователя или друзей;
- объекты с прилагающейся информацией о расположении.
Результатом поиска в Graph Search является список приведенных выше
объектов, например список фотографий. Graph Search работает на основе
поискового алгоритма похожего на традиционные поисковые системы такие,
как Google. Для осуществления поиска Facebook интегрировал в проект
поисковую сисетму от Bing.
Поисковой движок от Facebook для данной работы интересен тем, что
использует социльные связи для поиска информации, и может отвечать на
множество различных вопросов пользователей. Однако, данная раз- работка
не решает проблему поиска научных сообществ, хотя и могла бы быть
модифицирована для данной задачи. Но проект Graph Search является
закрытым и не может быть использован с этой целью.

5 ЖЕЛЕЗНОДОРОЖНЫЕ СЕТИ

Железнодоро́жная сеть  — совокупность всех


эксплуатируемых железных дорог — транспортная система для перевозки
грузов и пассажиров. Понятие железная дорога является более узким,
ограничиваясь описанием транспортных средств. В то же время,
под железнодорожной сетью подразумевают не только группы транспортных
средств данной транспортной системы, но и всю совокупность тяговых
подстанций и прочей инфраструктуры, необходимой для нормальной
эксплуатации железных дорог.
Магистральная железнодорожная сеть представляет собой
железнодорожную инфраструктуру, включающую магистральные и
станционные пути, объекты электроснабжения сигнализации и связи,
необходимые для обеспечения их эксплуатации.
Условно магистральную железнодорожную сеть можно разделить на
три секторальных инфраструктуры:
- магистральная инфраструктура, основное назначение которой –
пропуск поездопотоков, включающая в себя главные (магистральные) пути и
искусственные сооружения, устройства электроснабжения и технические
устройства сигнализации и связи на перегоне;
- станционная инфраструктура, предназначенная для проведения
технических операций формирования – расформирования, стоянки
подвижного состава, и в которую входят станционные пути, устройства
электроснабжения, технические устройства сигнализации и связи на
станциях;
- подъездные пути, предназначенные для подачи (уборки) подвижного
состава к местам погрузки (выгрузки) или ремонта (они могут принадлежать
и другим собственникам).
6 АНАЛИЗ СПОСОБОВ ВИЗУАЛИЗАЦИИ ДАННЫХ

Существует множество методов визуализации данных. Большинство из


них подходят для определенных типов данных, но каждый представ- ляет
информацию по-своему.
Считается, что 90% информации человек получает посредством зрения
и только 10% через остальные органы чувств. Естественно, что пробле- ма
визуализации графовой информации приобрела первостепенную важ- ность.
Задача визуализации состоит в создании изображения, позволяюще- го
анализировать структуру графа и выявлять его характеристики.
Самым простым способом визуализации выходных данных является
представление в виде таблиц. В этом случае каждому автору будет
соответствовать таблица с его библиографическими данными, спис ком
авторов, с которыми он состоит в соавторстве, списком авторов, с которыми
он состоит в отношении цитирования и списком статей написанных автором.
Данный вариант позволяет описать выходные данные наиболее
подробным образом, однако является очень не наглядным и имеет большой
объём, что затрудняет пользователю возможность полного обзора всех
выходных данных.
Кроме того не имеет возможности быстрого перехода от одной таблице
к другой. Другим вариантом является визуализация данных в виде графа.
Авторов можно рассматривать, как вершины графа, а ребра будут обозначать
отношения цитирования и соавторства между авторами. Дополнительные
данные, например статьи написанные определенным автором, можно
отображать отдельным от графа элементом.

7 СПОСОБЫ ВИЗУАЛИЗАЦИИ ДАННЫХ


Визуализация данных является одним из способов работы с большими
данными и решением проблемы сложности их восприятия. То, что, на
первый взгляд, может показаться цифрами, никак не связанными друг с
другом, при правильной визуализации складывается в единую историю.
Визуализация – это точка соединения искусства и науки, а то, как и с
помощью каких инструментов визуализировать имеющиеся у вас данные, во
многом зависит от того, что вы хотите показать.
8 ВИЗУАЛИЗАЦИЯ ДИНАМИЧЕСКИХ СЕТЕЙ
Такие графы изменяются с течением времени: могут появиться
(исчезнуть) некоторые вершины или ребра, могут быть изменены атрибуты
вершин или ребер. Подобные сценарии часто встречаются в жизни.
Например, если граф моделирует некото- рую социальную сеть, то
естественные изменения в графе – это появление новых знакомств или
участников в сети. Основная сложность задачи рисования динамиче- ского
графа состоит в том, чтобы наиболее ясно и точно подчеркнуть
происходящие изменения.
Для рисования динамических сетей мы используем метод послойной
визуализации (также в литературе используется термин 2.5D-визуализация),
который состоит из следующих шагов:
- рассматриваемый период времени разбивается на непересекающиеся
подпе- риоды. Далее строится последовательность графов, моделирующая
исходные данные за каждый подпериод. Выбор количества и длины
подпериодов зависит от предметной области. Например, в случае с
социальными сетями можно анализировать изменения за неделю. В случае с
графом ссылок в сети Интернет логично выбирать более крупные
подпериоды;
- для каждого построенного графа строится укладка на плоскости;
- результирующая визуализация получается объединением всех
укладок с со- единением вершин, соответствующим одинаковым объектам в
соседних графах.
Граф, состоящий из трех слоев. (a) Укладки без учета ментальной карты. (b)
Сохранение ментальной карты. (c) Послойная визуализация.

При построении послойной визуализации важно учитывать два


конкурирующих критерия. С одной стороны, каждый слой должен быть
нарисован с учетом об- щепринятых критериев эстетичности графа: малое
количество пересечений ребер, симметрия, постоянная длина ребер [3]. С
другой – последовательность укладок должна сохранять ментальную карту
(mental map) [4]. Это означает, что графы должны быть нарисованы в
унифицированном, похожем стиле. Такой подход заметно облегчает анализ
данных и обеспечивает динамическую стабильность, под- черкивает
изменения между графами. В данной статье мы считаем, что ментальная
карта сохраняется, если вершины графа приближенно сохраняют свои
координаты в последовательных укладках.
Существует несколько способов построения укладок графов на
плоскости. Самые популярные – методы, основанные на физических
аналогиях – силовой (forcedirected) и пружинный (spring). Для построения
укладки строится специальная модель, в которой вершины и ребра графа
соответствуют «реальным» физическим взаимодействующим объектам. Для
этой системы вводится функция энергии та- ким образом, что конфигурации
с меньшим уровнем энергии соответствуют луч- шим укладкам. При этом
задача поиска лучшей укладки графа сводится к поис- ку минимума энергии
системы. Однако такие методы имеют ряд ограничений, и в классической
формулировке не применимы к рисованию динамических графов.
9 ОБЗОР СУЩЕСТВУЮЩИХ МЕТОДОВ
Алгоритмы визуализации графов разрабатываются с начала 60-х годов.
Наиболее активно область рисования графов начала развиваться с
появлением методов, основанных на физических аналогиях. Классическими
работами считаются пружинный алгоритм Eades и алгоритм Kamada и Kawai.
Силовая модель предложена Fruchterman и Reingold. Позже были
предложены многочисленные модификации и оптимизации этих алгоритмов.
Задача динамической визуализации графов активно изучается
последнее десятилетие, когда стала доступна обработка больших объемов
информации. Большинство существующих алгоритмов предназначено для
рисования ограниченного класса графов или не применимо для графов
большого размера.
В процессе анализа источников информации были выделены такие
способы визализации:
- способ визуализации динамических;
- ментальной карты;
- метод многомерного шкалирования;
- послойную визуализацию для анализа данных
Метод многомерного шкалировани, используется для визуализации
графов с 1980 г. Широкое распространение он получил после работы Gansner
и др., и сейчас является одним из самых популярных методов рисования
графов. В классической формулировке многомерное шкалирование не
применимо для рисования последовательности графов
Способ визуализации динамических графов в трехмерном
пространстве, при котором каждый граф последовательности располагается
на отдельной плоскости.
Визуализация графов часто используется для анализа сложных сетей.
Например, изучается граф ссылок в сети Интернет, методы рисования графов
применены для исследования архива электронной почты. Среди работ,
использующих послойную визуализацию для анализа данных, стоит
отметить также [5] и [6]. В каждой из этих работ метод визуализации графов
«переизобретается». Насколько нам известно, не существует единого
подхода для рисования произвольных динамических графов.
ПЕРЕЧЕНЬ ССЫЛОК

1. 1 ДСТУ 3008-95. Документація. Звіти у сфері науки і техніки.


Структура і правила оформлення. – Чинний з 23.02.95. – Київ: Держстандарт
України, 1995. – 38 с.
2. Печенкин В.В. Методы анализа социальных сетей на примере
визуализации социальной структуры предпочтения профессий //
Социология:4М. 2001. № 13. С. 60-75.
3. Purchase H. Which aesthetic has the greatest effect on human
understanding? // Proc. 5th Int. Symp. on Graph Drawing. 1998. P. 248–261.
4. Misue K., Eades P., Lai W., Sugiyama K. Layout adjustment and the
mental map // Journal of Visual Languages and Computing. 1995. 6(2). P. 183–
210.
5. Erten C., Harding P. J., Kobourov S. G., Wampler K., Yee G. Exploring
the computing literature using temporal graph visualization // Proc. of SPIE. 2004.
Vol. 5295. P. 45–56.
6. Hanstein H., Groh G. Interactive visualization of dynamic social
networks // GI Jahrestagung (2). 2008. P. 929–936.