Вы находитесь на странице: 1из 37

Дисциплина

Контроль и диагностика средств


вычислительной техники
Все виды занятий проводит
старший преподаватель кафедры ИСиТ ИИТ
Климов Сергей Михайлович

моб. + 375-29-3408611 (А1, Тelegram, Viber, WhatsApp)

эл. почта: а) s.klimov@bsuir.by;


б) сообщения через СЭО Moodle;
в) через старосту группы.
ТЕМА 1. ЗАДАЧИ КОНТРОЛЯ И
ДИАГНОСТИРОВАНИЯ

Лекция 1. Контроль и
диагностирование на всех этапах
жизненного цикла цифровой системы
План лекции:

1. Введение.
2. Основные понятия и определения дисциплины.
3. Отказоустойчивые IT-системы. Основные
направления построения отказоустойчивых
систем и систем высокой готовности.
ВВЕДЕНИЕ
Вопросы контроля и диагностики средств
вычислительной техники становятся все более
актуальными по мере развития интегральной
схемотехники и расширения областей и сфер
применения информационных технологий.
Технология производства позволяет создавать
интегральные схемы размером порядка миллиарда
логических вентилей на кристалле.
Технология проектирования требует постоянного
развития, так как в маршруте проектирования
функционально-сложной интегральной схемы более
60 процентов времени приходится на построение
тестов, верификацию проектов на всех этапах
проектирования и организацию системы контроля.
Особенность контроля современных средств
вычислительной техники в том, что большая часть
задач по организации контроля концентрируется на
этапах проектирования и, в первую очередь,
проектирования СБИС (сверхбольшая интегральная
схема), СБИС типа СнК («система на кристале»).
Вопрос 1.

Основные понятия и определения


дисциплины.
1. Техническая диагностика - область научно-
технических знаний, включающих теорию, методы и
средства определения технического состояния
объектов вычислительной техники (объектов
диагностирования), поиска и обнаружения
дефектов.
Любой технический объект проходит следующие
основные стадии своего существования:
1) проектирование;
2) изготовление;
3) эксплуатация;
4) ремонт;
5) списание.
Основные задачи технической диагностики:

1) предотвращение производственного брака при


изготовлении объектов;
2) повышение надежности и достоверности
правильного функционирования при их
эксплуатации;
3) обеспечение быстрого и качественного ремонта.

Диагностирование - это процесс исследования


объекта, который позволяет сделать заключение
относительно его технического состояния.
Предотвращение производственного брака
достигается правильной организацией
диагностирования на операциях входного контроля
комплектующих изделий и материалов.
Повышение надежности проявляется как
улучшение показателей коэффициента готовности,
коэффициента технического использования, времени
восстановления работоспособности состояния,
наработки на отказ.
Т.О., для обеспечения качества любой
технической системы (объекта) возникает
необходимость на всех стадиях жизненного цикла
определять ее техническое состояние.
Процесс проектирования объекта сопровождается
нормативно-технической документации, в которой
определён перечень требований к параметрам и
характеристикам данного объекта.
Если объект удовлетворяет всем требованиям, то
он признается исправным, в противном случае –
неисправным.
Например, в нормативных требованиях, указаны
допуски температурных режимов, целостность
корпуса объекта и т.п.
Тогда выход за допуск или трещина на корпусе
позволяют определить техническое состояние, как
неисправное.
Исправное состояние это состояние
объекта, при котором он соответствует всем
заданным требованиям.
Неисправное состояние – состояние
объекта, при котором он не соответствует хотя
бы одному из исходных требований на
проектирование.
С точки зрения обработки информации
вычислительной системы различают другие виды
технического состояния:
работоспособное или неработоспособное;
правильно функционирующее или неправильно
функционирующее.
Техническое состояние правильного
функционирования определяется тогда, когда объект
правильно, без ошибок выполняет свою функцию
(предписанный алгоритм) в текущий момент
времени.
Работоспособное состояние – состояние
объекта, при котором значения всех
параметров, характеризующих способность
выполнять требуемые функции,
соответствуют заданным требованиям.
Неработоспособное состояние – состояние
объекта, при котором значение хотя бы
одного параметра, характеризующего
способность выполнять требуемые функции,
не соответствует заданным требованиям.
Техническое состояние
объекта
диагностирования

Не Не Не

Правильного Работоспособное
Исправное функционирования

Рис. 1. Виды технического состояния


На всех этапах проектирования в
проектах могут по разным причинам
появляться различные ошибки
проектирования:
логического типа,
временной несогласованности,
обусловленные высокой функциональной
сложностью современных цифровых систем,
отсутствием полной автоматизации
процессов синтеза и анализа проектов,
ошибки, связанные с человеческим
фактором.
Важнейшей задачей является наличие достоверной и
полной информации относительно типов возможных
ошибок и соответствующих утверждений для их
выявления.
При верификации проектов, во время производства
изделий, при эксплуатации электронных
систем пользуются понятием неисправности.
Под неисправностью (логической неисправностью)
понимают модель, характеризующую проявление дефекта
как изменения функции хотя бы одного элемента
устройства (не путать с понятием неисправного
технического состояния объекта).
Дефект может возникать при изготовлении объекта в
результате неточности технологии, воздействия ряда
конструктивно-технологических факторов.
В период эксплуатации дефект может стать
результатом дестабилизирующего воздействия внешней
среды.
Отказ – это переход объекта диагностирования из
работоспособного состояния в неработоспособное.
Отказы могут быть полные либо частичные,
постепенные либо внезапные (катастрофические),
восстанавливаемые или невосстанавливаемые.
Сбой – это самоустраняющийся отказ, временная
утрата работоспособности объектом.
Как сбой, так и отказ могут приводить к ошибкам в
произвольных вычислениях, реализуемых
алгоритмах и т.п.
Причинно-следственные связи подобных цепей
событий отражены схемой на рисунке 2.
Рис. 2. Причинно-следственные связи неисправности
В зависимости от вида технического состояния,
получаемого в ходе диагностирования, различают:
функциональное диагностирование,
тестовое диагностирование.
При функциональном диагностировании объект
непосредственно используется по прямому
назначению, на вход подаются «рабочие
воздействия». Диагнозом является заключение о
техническом состоянии: объект правильно
(неправильно) функционирует в данный момент
времени.
Схема функционального диагностирования
представлена на рисунке 3.
Рабочие
воздействия Реакция
Объект
диагностирования

Устройство
контроля
Диагноз

Рис. 3. Схема функционального диагностирования


Синонимами понятия «функциональное
диагностирование» является «оперативный
(аппаратный) контроль» («online testing»).
Обычно функциональное диагностирование
применяется в системах управления, где риск
принятия неверного решения в реальном времени
должен сводиться к минимуму (управление
пилотированием, наведение ракет, управление
ядерным реактором и пр.).
В результате тестового диагностирования на вход
объекта подаются специальные воздействия
(тестовые наборы) и по реакции на них ставится
диагноз: работоспособен или неработоспособен
объект.
При этом объект не используется по
функциональному назначению.
Синонимом тестового диагностирования является
«тестирование» («offline testing»).
Общая схема тестового диагностирования
приведена на рисунке 4.
Генератор Объект диаг- Анализатор
ностирования тестов
тестов

Тест Реакция Диагноз

Эталон

Рис. 4. Схема тестового диагностирования


Из рисунков 3 и 4 видно, что наряду с объектом
диагностирования присутствуют дополнительные
аппаратные и программные средства
диагностирования, цель которых автоматизировать
процесс получения диагноза.
Конструктивно средства диагностирования могут
быть как внешними по отношению к объекту
диагностирования, так и встроенными в него, т.е.
представлять единый вычислительный модуль.
Общая схема процедуры диагностирования
изображена на рисунке 5.
Рис. 5 - Общая схема процедуры диагностирования
Вопрос 2.

Отказоустойчивые IT-системы. Основные


направления построения отказоустойчивых
систем и систем высокой готовности
Отказоустойчивой вычислительной системой
называют среду, которая предоставляет постоянное,
непрерывное обслуживание — доступ к данным и
приложениям — даже в случае возникновения сбоев
в аппаратных или программных сетевых
компонентах.

Средства обеспечения отказоустойчивости


встраиваются в программное обеспечение, входят в
состав аппаратных средств либо являются
комбинированными.
Введение отказоустойчивости в систему или
отдельно взятый компонент всегда нуждается в
появлении некоторой избыточности.
Избыточность - это наличие в структуре
устройства возможностей сверх тех, которые могли
бы обеспечить выполнение всех требуемых
функций.
Избыточность вводится для обеспечения
требуемой степени надёжности работы и для
исключения влияния на достоверность
передаваемой информации помех и сбоев (в
телекоммуникационных устройствах).
Существует два основных направления при
построении отказоустойчивых систем.
Первый способ - использование только
отказоустойчивых компонентов. При реализации этого
направления каждый компонент системы может
продолжать свое функционирование, даже если один
или несколько подкомпонентов системы выходят из
строя.
Второй способ - разработка методов, гарантирующих
построение отказоустойчивой системы из компонентов,
не являющихся отказоустойчивыми.
В таких системах отказоустойчивость реализуется за
счет введения избыточности и разработки
специального программного обеспечения, введения
элементных взаимосвязей и применения разных
алгоритмов функционирования.
При разработке отказоустойчивых систем
используется четыре вида избыточности:

1) аппаратная избыточность (Hardware


Redundancy),
2) программная избыточность (Software
Redundancy),
3) информационная избыточность
(Information Redundancy),
4) временная избыточность (Time Redundancy).
Аппаратная избыточность более известна как
резервирование.
Существуют методы постоянного
резервирования, синтез избыточных устройств,
нечувствительных к определенному классу
неисправностей, методы системного
резервирования, резервирования замещением.
Исключая даже кратковременный простой,
аппаратная избыточность, постоянное
резервирование имеет относительное
преимущество по сравнению со второй группой
методов.
Программная избыточность используется
для контроля и обеспечения достоверности
наиболее важных решений по управлению и
обработке информации.
Она заключается в сопоставлении
результатов обработки одинаковых исходных
данных разными программами и
исключении искажения результатов,
обусловленных различными аномалиями.
Информационная избыточность наиболее
часто применяется в телекоммуникационных
системах, в которых информация передается
многократно.
Информационная избыточность
заключается в дублировании накопленных
исходных и промежуточных данных.
Временная избыточность заключается
в использовании некоторой части
производительности компьютера для
контроля за исполнением программ и
восстановления (рестарта) вычислительного
процесса.
Спрос на широкую функциональность ИТ -
систем в настоящее время уходит на второй
план, уступая место требованиям
максимальной надежности.
Разработка отказоустойчивой системы и
ее отказоустойчивая эксплуатация основываются на
знании и понимании природы тех видов отказов,
вероятность которых, при данных условиях эксплуатации
устройства, имеют максимально большую вероятность
возникновения.
По времени воздействия на объект отказы
подразделяются на:
- постоянные отказы, появление которых способно
исказить закон функционирования системы и вывести
систему из работоспособного состояния,
- перемежающиеся отказы, когда невозможно опре-
делить закономерность,
- проходные отказы, однократные кратковремен-
ные отказы без возможности их повторения при рестарте
системы.

Вам также может понравиться