Вы находитесь на странице: 1из 35

1.

Определение понятия «информационные и телекоммуникационные технологии»


Причины появления информационных технологий.

Информационные технологии – совокупность методов, процессов и программно-


технических средств, объединенных с целью сбора, обработки, хранения, распростр. и
исп-ия информации. Их следует отличать от компьютерных технологий – это
совокупность законов, методов и средств получения, хранения, передачи и распростр.
информации с помощью компьютера. С появлением глобальных сетей ИТ стали назыв.
телекоммуникационными. Телекоммуникация – процесс передачи разного рода инфы
по линиям связи, как правило, на большие расстояния (проводная и беспроводная связь).
Например, телефон, телевизор, радио, интернет и т.п.

Наука, к. занимается ИТ называется итологией.

Организационная стр-ра ИТ включает 3 осн. группы организации: 1) международные


организации, входящие в структуру ООН (международн. огранизация по
стандартизации); административные организации (Совет управления деятельностью
Интернет), промышленные организации (Европейская ассоциация производителей
вычислительной техники)

ИТ развив. давно. Выделяют 5 осн. этапов их развития:

I. До 2-ой пол. XIX в. – ручные ИТ. Инструменты: перо, чернильница, бумага,


книга. Цель: представление инфы в нужной форме.
II. С к.XIX в. – механические ИТ. Инструменты: пишущая машинка, телефон,
фонограф, почта. Цель: представление инфы в нужн. форме более удобными ср-вами.
III. 40-60 гг. XX в. – электрические ИТ. Инстр.: большие ЭВМ, соответсв. им
ПО, электрич. пишуш. машинки, копировальн. аппараты, магнитофон. Цель: с формы
предст-ия инфы акцент перемещ. на формир-ие её содерж-ия.
IV. 70-ые гг. XX в. – электронные ИТ. Инстр: большие ЭВМ, создаваем. на их
базе автоматизир. системы упр-ия, оснащенные спец. программами. Цель: формир-ие
содержательной стороны инфы.
V. Сер. 80-х гг. XX в. – компьютерные ИТ. Инстр.: ПК, стандартные
программы разного назначения, создание и поддержка систем принятия решений.
Цель: та же.

3 группы причин появления ИТ: 1) технич. достижения: созд-ие компов с больш.


памятью и больш. скоростью выполнения операций; разраб-ка звуковых плат для обраб-
ки звуковой инфы; разраб-ка видеоплат (для обраб-ки видео-инфы; разраб-ка спец.
мультимедийных компов, способных обрабатывать любой тип инфы; разраб-ка сетевых
плат (для объед-ия компов в локальн. сеть); разраб-ка устройств электронн. связи
(модемов); созд-ие электронной оргтехники (принтеры, сканеры, ксероксы) 2) Прогр.
причины: новые ОС (Wind.10), новые языки программирования (java, php), появление
прикладных систем обраб-ки инфы (прикладн. пр-мы) 3 информационные причины:
созд-ние баз и банков данных, электронн. хранилищ инфы (облако), появл-ие электронн.
сл-рей и энциклоп., системы упр-ия базами данных, развитие сети интернет (интернет 2).
2. Цель создания и основные черты информационных технологий. Структура ИТ.
Информационные технологии – совокупность методов, процессов и программно-
технических средств, объединенных с целью сбора, обработки, хранения, распростр. и
исп-ия информации. Их следует отличать от компьютерных технологий – это
совокупность законов, методов и средств получения, хранения, передачи и распростр.
информации с помощью компьютера. С появлением глобальных сетей ИТ стали назыв.
телекоммуникационными. Телекоммуникация – процесс передачи разного рода инфы
по линиям связи, как правило, на большие расстояния (проводная и беспроводная связь).
Например, телефон, телевизор, радио, интернет и т.п. Наука, к. занимается ИТ
называется итологией.
Осн. цель создания ИТ – максимальная информатизация и компьютеризация совр.
общества. Информатизация - доступ к инфе в люб. точке мира и создание мироваого
инф. пространства. Компьютеризация – увеличение парков компьютеров и кол-во
компов на душу населения. (США, Япония, Великобритания, Франция – в топе).
Осн.черты комп. ИТ: 1) безбумажность (однако, дублирование инфы бум вариантом),
диалоговый режим обмена инфой, доступность ИТ, альтернативность (Linux/windows),
формализованность (ИТ находятся в структурированном абстрактном виде – базы
данных), открытость (возможность изменения и переведения на др. устройства/технику),
безопасность .
Стр-ра ИТ: 1) теоретические основы ИТ (понятия информации и информатики);
2)методы решения задач; 3) средства решения задач (техническое и прогр. обеспечения)
Инфа – определенным образом связанные сведения, отражаемые в нашем сознании и
изменяющие наше представление о реальном мире. Инфа (сведения в активном виде) VS
Данные (св. в пассивном виде). Св-ва инфы: ценность, достоверность, полнота,
актуальность, логичность.
Виды инфы: в зав.от органов чувств : визуальная, аудиальная, аудио-визульная,
тактильная; по направленности: массовая, специальная (научная (физическая,
лингвистическая), техническая, эстетическая);
Лингв.инфа. – множество опр.образом связанных сведений о языке и правилах его
функционирования.
Информатика – наука о знаниях и технологиях использования инфы с помощью компа.
Виды информатики: экономическая, медицинская, лингвистическая.
Лингвистическая информатика – наука, к.изучает законы, методы и ср-ва организации
и переработки с помощью компа лингв. инфы.
Методы: 1)эксперимент-е (опрос,интервью,тестир) 2)теоретич (от абстр к конкр;
формализация-получение знаний с пом формул) 3)эксперим-теоретич
(индукция,дедукция, моделирование)
Ср-ва: 1)аппаратное обеспечение ит-ий (hardware) 2)программное обеспечение ит-ий
(software).
3. Перспективные информационные технологии в лингвистике.
Информационные технологии – совокупность методов, процессов и программно-
технических средств, объединенных с целью сбора, обработки, хранения, распростр. и
исп-ия информации. Их следует отличать от компьютерных технологий – это
совокупность законов, методов и средств получения, хранения, передачи и распростр.
информации с помощью компьютера. С появлением глобальных сетей ИТ стали назыв.
телекоммуникационными. Телекоммуникация – процесс передачи разного рода инфы
по линиям связи, как правило, на большие расстояния (проводная и беспроводная связь).
Например, телефон, телевизор, радио, интернет и т.п.

Наука, к. занимается ИТ называется итологией.

Существует множество примеров исп-ия ИТ в лингвистике и обучении (языкам).

- распознавание и синтез речи

- понимание текста

- автоматическое порождение нового текста

- автоматическое чтение текста

- машинные перевод

- автоматическое индексирование (определение исходного текста той или иной


тематике), аннотирование и реферирование текста (опред. осн содерж-ия текста)

- лингвистические ресурсы (корпусы текстов, словари, фонетические ресурсы. например,


с помощью корпусов текстов по определенной тематике можно находить слова,
словосоч., выражения, устанавливать их употребительность и частотность. )

- создание автоматических словарей

- автоматическое определение авторства неизвестного текста (автоматическое опр-ие


автора некоторого текста).

-определение тональности текста

Примеры ИТ в обучении: дистанционное обучение, распознавание и синтез речи в


обучении фонетике, параллельные корпусы текстов для обуч. переводу, базы и банки
данных для созданий обучающих прог (фонетика – Профессор Хиггинс, грамматика –
Big Ben, English World, English Platinum, лексика - English World, обучение чтению - -
welcome to English world), лингворесурсы (словари) для обуч. переводу, системы
понимания и порождения текста для обучению переводу, составления рефератов и
аннотаций, использование сайтов для различных д/з, электр. учебников, облачные
технологии для хранения учебных материалов на сервере для общ.доступа.)
4. Основные конструктивные блоки персонального компьютера.

Компьютер — это многофункциональное электронное устройство, предназначенное для


накопления, обработки и передачи информации. ПК-универсальный
однопользовательский микрокомпьютер.

Первый ПК был создан в 1976 г. Возняком и Джобсом. Apple-1.

ПК может быть представлен в виде формулы: ПК = Аппар. ср-ва + Программн. ср-ва


Аппаратн. ср-ва – приборы и устройства, входящ. в состав ПК, образующие его
конфигурацию. Программн. ср-ва – совок-ть пр-м, обеспечивающ. упр-ие аппаратн. ср-
вами и выполнение задач по обраб-ке инф-ии. ПК включает конструктивные блоки
(системный блок, монитор, клавиатура, мышь – базовая конфигурация ПК) и
функциональные узлы (устр-ва, выполняющ. опред. ф-ию по обраб-ке инф-ии) – устр-
ва ввода, процессор, внутр. память, устр-ва вывода

(Констр.блоки)Системный блок состоит из:

1) материнской платы
 центральный процессор (осн.устр-во,вып.все вычисления)
 оперативная память (быстродейств.память,хранящая инф-ю при включ-м
питании)
 видеокарта (управление экраном)
 звуковая карта (управление звуком)
3) жесткого диска (винчестер); м.б.несколько устройств для длительн.хран.больших
массивов инф-ии
4) приводов: накопители на CD и DvD дисках
5) блока питания (содержит системы автономного и сетевого электропитания)
6) кулера.
Монитор: по цветопередачи: монохромные/цветные, по строению: ЭЛТ (электронно-
лучевая трубка), ЖК, плазменные, лазерный(на основе лазерной панели), гибкий
дисплей, 3Д,5Д)

Клавиатура: Осн.блоки клавиш: алф-цифровые;кл.управления курсором;


функцион.кл; служ.кл;дополнит.

Различают эргономичные/неэргономичные, проводные/беспроводные (с


радиоинтерфейсом, инфракрасная, виртуальная лазерная) с обратным наклоном клавы,
объемная для слабовидящих, силиконовая.

Мышь. проводная (оптико-механическая, оптическая)/беспроводная ,


эргономические/неэргономические.
5. Основные функциональные узлы ПК.
Комп — многофункц. электронное устр-во, предназнач. для накопл., обраб. и
передачи инфы. ПК-универсальный однопольз. микрокомп.. 1-й ПК был создан в
1976 г. Возняком и Джобсом. Apple-1.
ПК может быть представлен в виде формулы: ПК = Аппар. ср-ва + Программн.
ср-ва Аппаратн. ср-ва – приборы и устройства, входящ. в состав ПК,
образующие его конфигурацию. Программн. ср-ва – совок-ть пр-м,
обеспечивающ. упр-ие аппаратн. ср-вами и выполнение задач по обраб-ке инф-ии.
ПК включает конструктивные блоки (системный блок, монитор, клавиатура,
мышь – базовая конфигурация ПК) и функциональные узлы (устр-ва,
выполняющ. опред. ф-ию по обраб-ке инф-ии) – устр-ва ввода, процессор, внутр.
память, устр-ва вывода
Условно процесс обраб-ки инф-ии на комп-ре можно представить в виде схемы:
устр-ва ввода → устр-во хранения инф-ии → устр-ва вывода
↓↑
процессор (устройство обраб. инф-ии)
Устройства ввода: Клавиатура (Осн.блоки клавиш: алф-
цифровые;кл.управления курсором; функцион.кл; служ.кл;дополнит), мышь
(проводная (оптико-механическая, оптическая)/беспроводная ,
эргономические/неэргономические.), сканер, модем, фото/видео камера,
дополнительные устройства , в основном биометрические технологии (-
речевой интерфейс (необх-мы звуков. карта и микрофон), - глазной интерфейс, -
мыслительный интерфейс (посредством импульсов мозга), - расшифровка мимики
и жестов; графич.планшеты;джойстик;игровые планшеты; руль-манипулятор;
сенсорный экран.) Устройства вывода: Монитор: по цветопередачи:
монохромные/цветные, по строению: ЭЛТ (электронно-лучевая трубка), ЖК,
плазменные, лазерный(на основе лазерной панели), гибкий дисплей, 3Д,5Д),
модем (устр-во, выполняющ. преобраз-ие компьют. данных в звуковой сигнал с
целью передачи по линиям связи, а также обратное преобраз-ие. Осн. харак-ка –
скорость передачи данных), факс-модем – служит для приема и передачи
документов, необх-м сканер, и принтер), принтер (матричный,
струйный/лазерный), плоттер, 3Д принтер), Альтернат.устр-ва вывода:
акустич.системы (колонки). Память: внешн и внутр. Внутр. память
(ОЗУ/RAM (random access memory) – оперативная память – хранятся
промежуточные результаты, Объем: планка памяти – 2 ГБ, всего 5 планок
(максимум – 10 ГБ) и ПЗУ/ROM (read only memory) – постоянная память или
ППЗУ - перепрограммируемая ПЗУ – которую можно настроить) – содержит
системные программы, необходимые для запуска компа.) Внешняя память – 1)
жесткий магнитный диск (винчестер) – устр-во для длительного хранения
больших массивов инф-ии. (может быть несколько, Объем – 1-2 т.б.) 2) дискеты
(1,44 Мб), Zip-дискета – 250 Мб. 3) Перфокарты, перфоленты, 4) флеш-память
(512 мб – 64 гб), 5) карта памяти ( 2гб – 16 гб) 6) (СD – 750 Мб, DVD – 17 Гб,
ультрафиолетовый диск – Blu-Ray – от 23,3 Гб до 400-500 гб). Основная внутр.
память сост. из: ПЗУ/ROM (read only memory) (постоянн. запоминающее устр-
во) или ППЗУ (перепрограммируемая ПЗУ – которую можно настроить) – память
только для чтения, базовая система ввода-вывода, в ней нах-ся полн. набор пр-м
нижнего ур-ня для упр-ия устр-вами ввода-вывода. При включении комп-ра нач-
ет выполняться пр-ма начальн. запуска, хранится она в ПЗУ и включает: - пр-му
самотестирования комп-ра (простейш. диагностика осн. узлов комп-ра, инф-ия о
рез-тах – на монитор), - пр-му нач. загрузки ОС, - пр-му задания текущ.
параметров комп-ра (Setup).Устр-ва обраб.инф-ии: Микропроцессор
(центральн. процессор) – нах-ся в центре материнской платы, устр-во, кот.
выполняет все действия по обраб-ке инф-ии и управляет всеми компонентами
комп-ра. Составляющ-ие процессора: 1) арифметич. и логич. устр-во (осущ.
процесс обраб-ки инф-ии, 2)сопроцессор –для ускорения скорости обр. данных.
3)кэш-память – быв. неск. уровней: хранит частоиспользуем.данные, часто
используем.коды), 4)устр-во упр.(управляет работой всех осн. устр-в комп-ра).
Фун-и процессора: обработка данных по заданной программе; управл-е работой
устройств компа. Осн. параметры процессора: 1) тактовая частота – частота
изменения сигнала за такт, в МГц, На сегд.день пар-тры проц. 5-7 ГГц. 2)
разрядность – кол-во бит, кот. процессор может принимать на обраб-ку за 1 такт.
(16, 32, 64, 128) 3) размер кэш-памяти (от 16 Кб, по 8 Кб на каждый ур-нь) , 4)
быстродействие (кол-во операций в сек, > 10-100 млрд для многопроцессорной
техники), 5) кол-во ядер и кол-во процессоров (2,4,8,16 ядра).
Сравнительная характеристика человека и компа.
Ввод информации.
Пк 54 Мбит/сек
Чел. 25 букв/сек
Память
Пк – 4гб-16 гб
Чел. – 3 Тб – 1000 тб
Скорость обработки инфы
Пк – 200млд опер. /сек.
Чел. 20-30 операций/сек
Вывод инфы
Пк 16-32 стр/мин
Чел – 120-360 слов/мин
6. Понятие о виртуальной реальности.

Виртуальная реальность – это программа или набор прог. для создания с помощью
компа искусственный среды, в кот. человек может быть управляем этой средой и сам
управлять ее объектами. Термин «искусств.реальность» был предложен в 1972 г.
Майроном Крюгером. В 1985г. Джароном Линьером был предложен термин «ВР».
Предвестниками ВР явились: - механические тренажеры для спортсменов, пилотов, -
экспериментальн. театр «Сенсорама» (США) Мортона Хейлига (Morton Heilig), в
котором при демонстрации фильма о поездке имитировались тряска, шум, порывы ветра,
дым, запахи. Виды ВР: Телевидение (сериалы…, но нет обратн.воздествия), Комп.игры,
Киберпростр-во, Интернет (вирт.магазины, кибермузыка, есть зависимость), сами
системы ВР (робот хирург).

Аппаратн. Ср-ва ВР: Очки, шлем, перчатки, джойстик-руль, мышь, костюм.

Сферы применения систем ВР:

1) комп.тренажеры для спортсменов, военных, авидиспетчеров, водителей


транспорта
2) архитектура, созд-ие экологич.домов, строит-во домов, воспроизведение
городов прошлого, проекционные экраны вместо стен)
3) медицина (объемное изображение органов, томографы, роботы-хирурги)
4) воссоздание животных прошлого (палеонтология)
5) кино (созд-ие искусств.декораций), съемки фильмов с актерами прошлого
6) мода
7) военные операции
8) криминалистика (отработка мотивов, внешность через 5 лет,после
пласт.операций; сверка фото с камер наблюдения)
Технологии ВР:
1) технология видеоналожения (телевидение, иллюзия присутствия публики)
2) Система «Окно в мир» (воссоздание городов прошлого)
3) тех.дистанционного присутствия (медицина: операция с помощью скальпеля
зондов, нейрохирургия…)
4) тех. Полного погружения (с костюмом, напр. путешествия на Марс)
7. Основные классификации персонального компьютера.
Комп — многофункц. электронное устр-во, предназнач. для накопл., обраб. и передачи
инфы. ПК-универсальный однопольз. микрокомп..
Существует достаточно много систем классификации компьютеров. Они различаются по
назначению, мощности, размерам, элементной базе и т.д. Поэтому их классифицируют
по различным признакам. Любая классификация является в некоторой мере условной из-
за бурного развития компьютерной науки и техники. Приведем некоторые из них.
I. По размеру и весу: напольные
(многопроцессорн.техника)/настольные /портативные (ноутбуки) – или лэп-топы. Вес
от 1 до 5 кг, жидкокристаллич. монитор, встроенн. звуков. плата, колонки, микрофон,
модем. Могут работать от сети или от аккумулятора/карманные (КПК, PDA) –
произошел от калькулятора. Это современные элегантные устройства весом до 300 г с
цветн. чувствит. экраном и спец. пером для управления. Некот. КПК оснащены
усеченными клавиатурами, нет винчестера, все пр-мы запис-ся в ПЗУ, но может быть
встроена флэш-память. Возм-ти: - чтение электр. книг, - электронн. офис, - мульмедиа-
центр, - игры, - выход в Интернет, - встроенная фотокамера. Сущ-ют также
коммуникаторы (карманн. комп. + GSM, больш. экран) и смартфоны (моб. тел.,
имеющ. ОС). Настольные комп-ры, ноутбуки и КПК совместимы.
II. По поколениям
 1 пок на электронных лампах 1949-1959 Минск-1
 2 пок на транзисторах 1959-1969 Урал-11
 3 пок на интегральных схемах 1969-1979 ЕС-1033; СМ-1
 4 пок большие интегр схемы 1979-1989 Макинтош, Агат
 5 пок многопроцессорная техника 1989-наст вр. Корвет, Квантовый компьютер,
ДНК-комп.
III. По назнач-ю и роли при обработке инф-и:
 универсальные
 суперкомп-ры – мощные многопроцессорные компы, имеющие невероятную
скорость обраб-ки инф-ии и очень высокую производит-ть. Исп-ся для решения задач, в
кот. очень много сложн. матем. вычислений (для решения проблем квантовой физики,
прогноза погоды, исследования климата, молекулярного моделирования и т.п.). Комп.в
Чижовка-Арене. СКИФ – бел.разработка 200 млрд операц в сек.
 серверы – для хран,извлеч и передачи инф (облачные технологии)
IV. По уровню специализации
 универсальные - на базе универсальных ПК можно создать любую
конфигурацию для работы с графикой, текстом, музыкой, видео и т.п..
 специализированные - созданы для решения конкретных задач, в частности,
бортовые компьютеры в самолетах и автомобилях. Специализированные комп-ры для
работы с графикой (кино- видеофильмы, реклама) называются графическими станциями.
Спец. компы, объединяющие компьютеры в единую сеть, называются файловыми
серверами. Компы, обеспеч. передачу инфы через Интернет, называются сетевыми
серверами.
V. По назначению:
 Массовый, Деловой (для опред работы), Портативный, Развлекательный
VI. По платформам (набор аппаратн. и программн.ср-в):
1) Платформы IBM – на базе процессора Intel (70% комп-ров), исп-ся повсеместно
(учебн. Учрежд. ПК, вычисления, игры…) 2) Платформа Apple (Macintosh) – процессор
изнач-но Motorola, сегодня тоже Intel. Исп-ся в осн.: для научно-исслед.работ, для
обраб.звука, видео, графики 3) Суперкомп-ры (для обраб. кино, видео эффектов,
широкомаштабн. вычислений)
8. Определение понятия «Компьютерная сеть». Типы сетей.
Комп. сеть (КС) – объединение нескольких компьютеров т.о., что они могут
взаимодействовать друг с другом с целью совместного использования информации.
Компоненты сети: 1) аппаратные компоненты : - компьютеры, - периферийные
устройства (принтер, сканер), - средства электронной связи (модем, сетевая карта и
т.д), - коммуникационное оборудование (концентратор – для приема/передачи данных по
сети между компами без учетного адреса компа и коммутатор – данные передаются на
конкретный компьютер), - маршрутизатор (для соединения сетей).

2) программные компоненты: -сетевая ОС (UMX), - сетевой протокол, - сетевые


приложения (средства управления сетями, средства сетевой защиты и т.д.)

Классификация сетей. - По территориальной принадлежности: 1) локальные; 2)


региональные; 3) глобальные;

Локальные сети – соединение компов, расположенных на небольших расстояниях друг


от др. (50-100м.) в переделах одного или ближ.зданий. (1976 – Роберт Меткалф создал
первую локальную компьютерную сеть Ethernet. Осн. функции: совместное
использование файловых данных и прикладн. прог., передача сообщений, совместное
использ. переферийных устройств.

Каналы связи в лок. сети: проводные (телефонные, коаксиальные, оптоволоконные, на


витой паре, линии электропитания) и беспроводные (радиоканалы, инфракрасное
излучение, лазерное излучение)

Топология сети – физическое расположение компов в сети (шина, кольцо, звезда),


различают одноранговые сети (все компы равны) и сети на основе сервера.

Региональная сеть – объединение компов и локальных сетей для решения общих


проблем регионального масштаба. Осн. функции: поддержка ежедневн.функций
организаций, предоставление сотрудниках доступа к архивам, возможность
коллективной работы, доступ к сети интернет. Каналы связи: Для работы в
региональной сети необходимо модем (внешний, внутренний). Каналы (средства) связи:
если сеть в пределах города, то используют обычные каналы связи (телефонные, оптико-
волоконные). Если сеть выходит за пределы города, то используется: 1.оптоволоконные
средства (выделенные, специальные). 2. телевизионные (кабельное ТВ). 3. спутниковая
связь (1998-1й проект «Иридиум»).
Глобальная сеть – объединение компов и локальных сетей расположенных на
удаленном расстоянии для общего использования информационных ресурсов.

Функции: 1)созд.глоб.системы передачи данных; 2)созд.среды для творч.самовыраж.


3)ведение совместных проектов 4)совершенств. профессиональн.подготовки. Каналы
связи: телеф.линии;оптоволок;радиосвязь;спутниковая.
- По ведомственной принадлежности: корпоративные, ведомственные, глобальные,
государственные, домашние
- По скорости передачи информации: низкоскоростные (до 10Мбит/сек,
среднескоростные до 100 Мббит/сек и высокоскоростные)

9. Представление информации в базе данных.


Инфа – определенным образом связанные сведения, отражаемые в нашем сознании и
изменяющие наше представление о реальном мире. Инфа (сведения в активном виде) VS
Данные (св. в пассивном виде). Св-ва инфы: ценность, достоверность, полнота,
актуальность, логичность.
База данных — это совокупность определенным образом упорядоченных сведений о
некоторых объектах. Под объектами при этом понимаются сведения, факты, события,
процессы реальной жизни.
Термин БД появ. в 60-х г. ХХ в., его относили к письм. данным в ящиках. БД – набор
связанных между собой опред. образом организованных сведений о некот. объекте, и
обеспечивающий получ-ие нужной инф-ии, позволяющ. сделать опред. выводы и
принимать опред. решения. При построении БД все сведения, факты, события условно
назыв-ся объектами. Он может быть материальн. (студент) и нематериальн. (названия,
номера).
В реальн. мире кажд. объект облад. опред. св-вами. В сознании человека св-вам
объекта приписываются аттрибуты (вес, скорость, размер...). Аттрибуты имеют значения
(вес 500 г., скорость 50 км/ч...). В БД аттрибуты представлены данными, а значения
аттрибутов – значениями данных. БЗ – БД + правила исп-ия фактов, данных.
Данное – некот. показатель, кот. характеризует заданный объект и принимает для конкр.
экземпляра объекта опред. значение. #: объект – студент, экземпляр – Иванов. Запись –
группа данных, образующих в таблице одну горизонт. строку. Запись необх-мо
иденцифицировать, чтобы извлечь к-л инф-ию. Поэтому одно из данных, значение кот.
не повторяется, т.е. явл-ся уникальным, выбирается в кач-ве идентификатора объекта
(первичный ключ записи), #: № зачетной книжки студента. Набор значений одного
столбца назыв. полем (#: все номера зачеток).
Типы данных в БД: 1) текстовые данные – для хранения текста огранич. размера
(ФИО); 2) числовые данные – для хранения чисел (№ зачетки); 3) дата, время – для
хранения календарной даты и текущ. времени; 4) денежные данные – для хранения
денежных сумм, 5) счетчики – для хранения автоматически наращиваемых чисел; 6)
логич. данные – содерж. одно из значений: да или нет; 7) МЕМО – для хранения больш.
объемов текста, 8) OLE – содерж. указатели на располож. в БД мультимейной инф-ии; 9)
гиперссылки – содерж. URL-адреса веб-объектов. Множество записей одного формата
в теории БД – файл, а множество файлов образуют БД.
Иерархия БД: Данные – Поле _ Запись – Файл – БД – Автоматич. Банк данных (все
это работает под управлением СУБД)
Поле при табличн. Предст-ии БД – это столбик, группа данных, образующ.строку –
запись или кортеж. Одно из полей записи может быть основным и называться
идентификатором. Модели представления данных: Иерархическая модель –
взаимосвязь данных в виде иерархич. дерева, состоящего из узлов. Верхний узел –
корень. Каждый порожденный узел имеет только 1 исходный узел. Сетевая модель – в
отличие от иерархич. модели может быть не 1, а несколько корней, у 1-го порожденного
узла может быть неск-ко исходных.Каждый узел связан с каждым другим узлом.
Реляционная модель – представление данных в виде таблицы, в кот. выражены опред.
отношения между данными по горизонтали и по вертикали. Их пересеч-ие – ячейка.
Объектно-ориентированная модель – программируются с пом. объектно-ориентир.
языков. Объекты не разделяются на отдельн. экземпляры, а рассм-ся как целый объект.
Объектно-реляционная модель – объед. возм-ти объектно-ориентир. БД и
реляционных БД (объекты представлены как единое целое в ячейках таблицы).
10. Модели представления данных.
Инфа – определенным образом связанные сведения, отражаемые в нашем сознании и
изменяющие наше представление о реальном мире. Инфа (сведения в активном виде) VS
Данные (св. в пассивном виде). Св-ва инфы: ценность, достоверность, полнота,
актуальность, логичность. База данных — это совокупность определенным образом
упорядоченных сведений о некоторых объектах. Под объектами при этом понимаются
сведения, факты, события, процессы реальной жизни. Термин БД появ. в 60-х г. ХХ в., его
относили к письм. данным в ящиках. БД – набор связанных между собой опред. образом
организованных сведений о некот. объекте, и обеспечивающий получ-ие нужной инф-ии,
позволяющ. сделать опред. выводы и принимать опред. решения. При построении БД все
сведения, факты, события условно назыв-ся объектами. Он может быть материальн.
(студент) и нематериальн. (названия, номера).
Модели представления данных (сп-б представления инф-ии, входящ. в БД):
I. Иерархическая модель – взаимосвязь данных в виде иерархич. дерева,
состоящего из узлов. Все данные располагаются на нескольких ур-нях. Верхний узел –
корень. от него идут порожденные узлы на более низких ур-нях. Св-во дерева: каждый
порожденный узел имеет только 1 исходный узел, а каждый исходн. узел может иметь
любое кол-во порожденных узлов. Листья – узлы, распол. в самом конце ветвей. Иерархия
БД: Данные – Поле _ Запись – Файл – БД – Автоматич. Банк данных (все это работает
под управлением СУБД)
II. Сетевая модель – в отличие от иерархич. модели может быть не 1, а несколько
корней, у 1-го порожденного узла может быть неск-ко исходных.Каждый узел связан с
каждым другим узлом.
III. Реляционная модель – представление данных в виде таблицы, в кот. выражены
опред. отношения между данными по горизонтали и по вертикали. Их пересеч-ие – ячейка.
IV. Объектно-ориентированная модель – программируются с пом. объектно-
ориентир. языков. Объекты не разделяются на отдельн. экземпляры, а рассм-ся как целый
объект.
V. Объектно-реляционная модель – объед. возм-ти объектно-ориентир. БД и
реляционных БД (объекты представлены как единое целое в ячейках таблицы).
В БД любого типа можно производить след. действия: 1) запомнить новую запись
(горизонт. строку), 2) обновить (изменить значение некоторого данного, не всей строки), 3)
удалить (всю запись или отдельные данные), 4) поиск инф-ии в БД.
Автоматизир. банк данных – опред. образрм организованн. совок-ть БД, предназнач. для
решения различн. информац. задач в интересах польз-ля (в промышл-ти, сфере образ-ия,
науки, к-ры..). Для созд-ия БД и банков данных исп-ся ПО – СУБД (системы упр-ия БД).
СУБД – совок-то программн. ср-в, позволяющ. осущ-ть ведение БД или банка данных.
Различают НАСТОЛЬНЫЕ (исп-ся в автономное режиме на комп-ре польз-ля: 1) MS
Schedule* и MS Outlook, Такие программы позволяют хранить, изменять и управлять
сведениями о контактах, встречах, событиях, собраниях, задачах. Они имитируют работу с
обычной записной книжкой, представляющей собой адресный справочник контактных лиц,
и настольным календарем, вдотором отмечается расписание встреч и событий, список дел.
и серверные (функционируют в рамках сети, централизованно хранят инф-ию) СУБД. 2)
программы созд. и обраб. электр. таблиц (табличные процессоры), например: MS Excel,
Lotus 1-2-3 фирмы «Lotus», Corel QuattroPro фирмы «Corel». Они не только создают
базы данных в виде сложных таблиц и осуществляют в них поиск информации, но и могут
проводить в таблицах различные вычисления. 3) должны уметь программировать на
специальных алгоритмических языках, встроенных в СУБД (например, VBA — Visual Basic
for Applications, Paradox Application Language и т.д.). К числу таких СУБД относятся
Paradox, dBASE, FoxBase, FoxPro, Clipper, MS Access и т.д. СЕРВЕРНЫЕ: К числу
наиболее известных серверных СУБД относятся программы Oracle, Informix, Ingres,
Sybase, DB2, MS SQL Server.

11. Лингвистические информационные ресурсы. Основные составляющие


лингвистических информационных ресурсов.
ЛИР – множество опред. образом оформленных и организованных речевых и языковых данных,
представленных в электронном виде и используемых в различн. сферах деят-ти человека.
(образовании, промышленности, экономике, культуре, искусстве, издательстве и т.п.).
Термин «ЛИР» ввел Антонио Замполли (1991).Это основа для создания прогр-м для обработки
языка и речи. Лир включает: 1) письменные текстовые массивы (корпусы текстов), 2)
письменный лексикон (электронн. сл-ри), 3) фонетические ресурсы (массивы устных
высказываний)
В 1-ой пол. 90-х г. ХХ в. в прикладной лингвистике возникло напр-ие корпусной лингвистики,
объектом изучения которой стал корпус текстов. Суть – достоверные данные о фонетич.,
морфол., синтаксич. и семантич. стр-ре языка и речи можно получить только из
достаточно большого массива письменных текстов. 1) КТ – совок-ть текстов, являющаяся
достаточной для обеспечения надежных научных выводов о некотором языке, диалекте или др.
подмножестве языка (кот. связано с опред. предм. областью). КТ исп-ся: - в лексикографии и
лексикологии (для составл-ия сл-рей, опред. значений многозн. слов, изучения лексич.
сочетаемости слов), - в грамматике (для опред. частоты употр-ия слов, морфем, словосоч., для
выявления наиболее типичн. структурн. типов предложений), - в лингвистике текста (для
выявл-ия связей между предложениями, абзацами, для опред. осн. жанровых и стилистич.
харак-к текста), - в учебных целях (для выбора примеров при создании учебников, выбот
цитат), - при автоматич. переводе (поиск переводн. эквив. слов и словосоч. в параллельн. КТ).
Виды КТ: (единого подхода к классиф-ии КТ нет – проблема) 1) исследовательские КТ –
создаются с целью изучения различн. аспектов функционир-ия языка (КТ большого объема), 2)
иллюстративные КТ – с целью извлечения из них лингвистич. примеров , подтверждения
языковых фактов, 3) статические КТ – содержат тексты, написанн. в теч. небольш. временного
промежутка, 4) динамические КТ – тексты большого временного промежутка для изучения
изменений в языке, 5) корпусы параллельных текстов – состоят из текстов-оригиналов и
текстов-переводов, выполненных человеком.
Сп-бы представления текстов в КТ: 1) в виде текстового архива, 2) в виде банка данных
(размеченные тексты), 3) в виде БД информационно-поисковой системы (в формате,
удобном для поиска и статистич. обраб-ки).
Важн. особ-ть КТ – это целенаправленно подобранные тексты. Важна цель создания и целевая
аудитория. При создании КТ необх-мо решить 4 задачи: 1) выбрать осн. ед-цу КТ (слово – чаще
всего, основы слов, словосоч., предлож.), 2) определить объем КТ (зависит от цели созд-ия: для
изуч-ия графем и звуков – КТ небольш., для морфол., синтаксиса и тем более лексич. системы
яз. – КТ большие (от неск-ких тысяч до десятков и сотен миллионов словоупотр); 3) опред-ие
текстовых источников и их кол-во (какого стиля будут тексты, к кокому времени относ., лит. яз
или диалекты и т.п.); 4) определить исходн. область (худ., научн., офиц.-деловые...). Для комп.
обраб-ки тексты необх-мо разметить (тэггировать) – приписать коды самому тексту,
предложениям, словосоч., словам, морфемам. Для этого нужно предварит-но разраб. систему
кодов (коды частей речи, их лексич. и грамматич. признаков, код семантич. класса).
Параллельные КТ также могут быть чистыми или размеченными, размечать нужны и тексты-
оригиналы, и их переводы. Необх-мо также установить соотв-ия между предлож-ми текста-
оригинала и предлож. текста перевода – это автоматическое выравнивание предложений. 6
возможных соотв-ий: 1) 1 предл. – 1 предл., 2) 2 предл. – 1 предл., 3) 1 предл. – 2 предл. ,4) 2
предл. – 2 предл. с др. границами, 5) предл. исх. текста не переводится, 6) предлож. в тексте
перевода не имеет эквив-та в тексте оригинала. С пом. параллельн. КТ можно: 1)
автоматически создавать переводн. сл-ри, сл-ри для систем МП, 2) автоматически устанавл.
знач. многозначн. слов, 3) переводить различн. типы словосоч. (терминологич., фразеол.,
устойчив.), 4) формир-ть БД для систем с переводческ. памятью.
2. СЛОВАРЬ – справочная книга, кот. содерж. слова (морфемы, словосоч., рисунки..),
расположенные в опред. порядке для удобного их поиска. Сл-рь объясняет знач-ие
описываемых ед-ц, приводит инф-ию о них, дает перевод на др. языки или сообщ. сведения о
предметах, обозначаемых ими. 3 соц. ф-ии сл-ря: 1) информативная (приобщение к инф-ии,
накопленн. человечеством), 2) коммуникативная (приобретение новых слов, словосоч. и
понятий для активного их исп-ия в процессе общения), 3) нормативная (закрепление языковой
нормы). 1.) Частотные сл-ри. 2 типа частотн. сл-рей: 1) частотно-алфавитные (упорядочены
по частоте, одинаковые частоты - по алфавиту) , 2) алфавитно-частотные (упорядочены по
алфавиту с указанием частоты слов). Созд-ся для: - опред-ия лексич. минимума, - определения
особ-тей авторского стиля, - для созд-ия др. типов сл-рей (например, для машинного перевода).
I. Словоуказатели. Все слова упорядочены по алфавиту. Рядом с кажд. ЛЕ указана её
общая частота употр-ия в КТ; кол-во текстов, в кот эта ЛЕ встретилась; кол-во страниц в кажд.
тексте, где встретилась эта ед-ца; перечень конкр. страниц, где она встретилась с указанием
частоты употр-ия на кажд. странице, иногда указыв-ся номера строк, где она встретилась. Такие
сл-ри находят широкое применение для проведения лингвистич. и литературоведч. исслед-
ий (помогают легко находить нужн. слова, работать с редкими словами, видеть их контекст).
II. Конкордансы. Специфич. сл-ри, в кот. помимо всех колическтвенных харак-к, кот.
приводятся в словоуказателях, включены контексты, характерные для употр-ия каждой ЛЕ.
(словоуказатель + микроконтекст). Длина контекста: от неск. слов до неск. предлож. Исп-ся
для изучения многозначных слов, для созд-ия новых сл-рей, поиска примеров
употребления слов, как иллюстративный материал.
III. Энциклопедии. Изначально полностью автоматически созданы быть не могут.
Возможно создание в полуавтоматическом режиме. Это словари, содержащие характеристики
не слова как такового, а обозначенного им предмета, факта или явления, поэтому комп-р не
может сам создать словарь. Материал подбирается людьми и переводится в электронн. вид, где
обрабатывается. Исп-ся для пополнения знаний, для созд-ия сложн. комп. систем обработки
текста и речи.
IV. Тезаурусы. Это сл-рь, содержащ. ЛЕ с явным указанием семантич. отношений между
ними (синонимич., антонимич., общее/частное, род/вид, часть/целое и т.п.). Тезуарусы: 1)
общеязыковые, 2) специальные (общетехнические, информационно-поисковые). Любой
тезаурус включ.: а) слова-дескрипторы (описывающ. осн. понятия), б) слова-недескриптора
(описывающ. неосн. понятия). Тезаурус упорядочивает ЛЕ по след. признакам: - по понятиям
(#: бережливость – дескриптор, беречь, экономить – недескриптор), - по алфавиту
(расположены с указанием дескрипторов и недескрипторов, у последних помеч-ся, с какими
дескрипторами они связаны.
V. АПС (автоматич. переводн. сл-рь). Это находящ. в памяти комп-ра сл-рь, кот.
помогает человеку переводить тексты с 1-го яз. на другой. 1-ые АПС: Lexis (ФРГ), DICATOM.
Они изначально были многоязычные. Св-ва АПС: 1) многоязычие (лингвистич. фактор – лишь
перевод слов, разрабатывать такой сл-рь сравнительно проще, чем системы, многоязычие не
влияет на кач-во или скорость работы АПС; экстралингв. – быстрее покупаются и окупаются,
приносят прибыль); 2) Обратимость – возм-ть произвольно менять входной и выходной языки
местами. Обратимость может быть полной (кажд. ЛЕ в сл-ре может быть и входн. и выходной –
только в двуязычных сл-рях) и частичной (в больш-ве сл-рей, т.к. объемы лексич. массивов в
разн. яз. разные); 3) гибкость – комплекс приемов, кот. упрощают обращение к сл-рю, расшир.
возм-ти польз-ля, снижают требования к его ур-ню знаний. Гибкий сл-рю поддержив. ввод ЛЕ
как в исходн. (словарной) форме, так и в текстовой (в том виде, в кот. она встреч. в тексте).
Должна быть проведена лемматизация – приведение к исходной форме.
4 зоны статьи АПС: - зона морфол. сведений (код части речи, морфол признаки), - зона лекс.
сведений (код стилист. принадл., исп-ие как части фразеол-ма), - зона семантич. сведений (код
семант. подкласа, адрес перев. эквив., тип формообр-ия), - зона синтакс. сведений (код упр-ия
ЛЕ, код синтакс. ф-ии).
3. ФОНЕТИЧЕСКИЕ РЕСУРСЫ: Записи выступлений в Белом доме – положены в основу.
Немецкий Ульмский фонетический КТ (КТУР – УКТ устн.речи). Может записыв-ся отдельно
монологич.речь, отдельно диалоги, могут учитываться паралингв.аспекты (паузы, смех).

12. Определение и основные функции электронной почты.


Электронная почта — сервис Интернета, позволяющий обмениваться через
компьютерную сеть электронными сообщениями.
1971 год. Рэй Томлисон (Ray Tomlison), программист из компьютерной фирмы
Bolt Beranek and Newman, разрабатывает систему электронной почты и
предлагает использовать значок @ ("собака")
Функции электронной почты:
1) Доставка корреспонденции.
2) Распространение периодических изданий (почтовые списки или списки рассылки).
3) Поддержка сетевых новостей (Usenet).
4) Организация делопроизводства.
Адрес электронной почты записывается по определенной форме и состоит из двух
частей: имя_пользователя@имя_сервера
Имя_пользователя, чаще всего, имеет произвольный характер и задается самим
пользователем; имя_сервера жестко связано с выбором пользователем сервера, на
котором он разместил свой почтовый ящик. Пример,swetlow@mail.ru
Все электронные адреса условно можно разделить на:
провайдерские (почтовый ящик на сервере провайдера — организации-поставщика
сетевых услуг),
корпоративные (ящик на сервере по месту работы),
коммерческие (ящик на сервере платной почтовой службы)
и бесплатные (ящик на сервере бесплатной почтовой службы, например, mail.ru,
yandex.ru).
Типы почты: почта на базе протокола РОР, почта на основе программы просмотра
(веб-браузера), перенаправленная почта (farwarding), голосовая почта, гибридная
почта.
Для работы с электронной почтой используется почтовый пакет.
Почтовый пакет — это специальная прикладная система, которая управляет
отсылкой и приемом почтовых сообщений, состоящая из:
1) почтового клиента (программы для непосредственной работы
пользователя с почтой); (The bat, outlook express)
2) транспортной программы; программы почтового сервера и т.д.
Простейший почтовый клиент — программа Outlook Express. Она входит в
стандартный пакет Windows (начиная с Windows 98) и потому есть в наличии на
каждом компьютере, работающем в этой операционной системе.
Так же широкой популярностью у пользователей пользуются The Bat и бесплатный
почтовый клиент Mozilla Thunderbird
Протоколы электронной почты
SMTP (Simple Mail Transfer Protocol ) – протокол для отправки сообщений на сервер
и для пересылки их между серверами. Он не требует идентификации личности.
РОРЗ (Post Office Protocol) — протокол для получения поступившей почты. Он
требует идентификации личности, то есть должно быть предъявлено регистрационное
имя (Login) и пароль (Password), который подтверждает правомочность использования
имени.
Цифровое удостоверение - файл, частью которого является неизменяемый ключ
(графический файл с подписью).

13. Основные понятия, исп. при работе в сети Интернет. Возможности Сети.
Интернет – самая большая глобальная сеть (сообщество, состоящ. из разноплановых
негомогенных сетей, объединяющ. миллионы комп-ров). Она объединила в единое
целое многие глобальные сети мира. Осн. назначение: обеспечить любому
желающему постоянн. доступ к любой инф-ии в сети.
Краткая история Net: началом сети Internet стала сеть ARPANET, созданная в США
в 1969 г., кот. объед. 4 больш. ЭВМ, но сеть быстро расширялась. 1 января 1983 г.
(Д.Р. сети Интернет) сеть ARPANET создала протоколы TCP/IP – правила передачи
информации., кот. применяется до сих пор для объед-ия сетей. Самой популярной
службой передачи данных, возн. на базе сети Интернет стала всемирная паутина –
www. Позже были разработаны протокол HTTP и язык HTML. 1991 г. – всемирная
паутина стала доступной в Интернет и через пару лет стала основным поставщиком
инф-ии в сети.
Основные понятия сети Интернет. Совр. сеть Интернет – Объединение крупных
узлов. Узел – 1 или несколько мощных компьютеров-серверов. Провайдер –
отдельная организация, управл. компьютерами.
Протокол – набор правил, позволяющ. осуществить соединение и обмен данными
между двумя и более подключенными к сети комп-рами. Базовые протоколы отвеч. за
физич. пересылку инф-ии, прикладные протоколы отвеч. за функционир-ие
специализир. служб высокого ур-ня.
Исп-ся неск-ко разновидностей адресов: 1) IP-адрес – осн. сетевой адрес каждого
комп-ра, подлюченн. к сети Интернет. – 32 разрядное двоичное число, к. точно
определяет местонахождение конкр. узла в Сети. (84.42.63.1) - можно подключать до
4 млр. пользователей. Для расширегия пользователей был создан Интернет-2 - IP-
адреса не 32-разрядные, а 128 разрядные, 2) доменный адрес (буквенный,
символьный – предназначен для опред. местополож. комп-ра в сети (.by). Доменн.
адреса хранятся на DNS-серверах, кот. переводят буквенные адреса в цифровые.
Первоначально сущ. 6 доменов верхнего уровня (com, edu, gov, mil, net, org). Все
домены верхн. уровня условно делятся на общепользовательские и национальные
(для США кода не существует) домены.
Инф-ия на веб-серварах представлена в виде веб-страниц, просмотреть кот. позволяет
веб-браузер. Больш-во веб-страниц созданы на языке HTML (язык гипертекстовой
разметки). Гипертекст – электронный документ, в кот. кроме текста содержатся спец.
команды форматирования, а также встроенные объекты. Веб-сайт – совок-ть веб-
страниц, связанных вместе единой темой, общим стилем оформления и взаимными
гипертекстовыми ссылками. Веб-канал - это технология, позволяющая в стандартной
форме обмениваться через интернет информацией об обновлениях на сайтах. Раньше
для того, чтобы узнать, появилось ли на любимом сайте что-то новое, нужно было
зайти на него или оформить электронную рассылку. Теперь для этого достаточно
подключить веб-поток к программе или сервису, которые их понимают, и все новости
будут отображаться на персональной странице, без захода на сайт. Веб – портал –
Веб сайт для очень широкой или очень узкой аудитории. (мегапорталы(СМИ),
тематические порталы (портал туристического агенства).
Доступ к сети Интернет обеспеч. провайдер-организация, имеющ. лицензию на право
торговли услугами Интернет. Провайдеры имеют магистральные комп. сети, кот.
постоянно подключены к Интернет. Иерархия провайдеров: региональн. –
национальн. – международн.
Для обращения и навигации в сети существуют клиентские пргораммы – Веб
раузеры. Осн. возможности: - загрузка страниц по введенному URL-адресу (адрес
каждого объекта; http(протокол)://sws(доменное имя компа, на котором хранится
документ).bsu.by); - перемещение по гипертекстовым ссылкам, - ускорение
перемещения; - сохранение веб-страницы целиком.
Возможности глобальной сети: - создание глобальной системы компьютерных
телекоммуникаций и передачи данных – создание мирового информационного
пространства; - создание среды для творческого самовыражения человека; -
использование Интернет в профессиональной деятельности (ведение совместных
проектов, поиск работы, информацияф о себе, реклама и т.д.; - образование)
Осн. ресурсы и услуги сети Интернет: 1) всемирная паутина (включ. тематич.
каталоги, поисковые системы, интернет-энциклопедии, виртуальн. библиотеки и
магазины, форумы, чаты, блоги...), 2) FTP-архивы – для скачивания различн. файлов
(текстов, пр-м, музыки, изображ, видео), 3) Telnet – удаленный доступ, протокол,
позволяющ. превратить ваш компьютер в удаленный терминал др. компа. Позволяет
передавать инфу другому компу на обработку, а результаты отображать на Вашем
компе. (для этого необх-мы права доступа). Как ср-во общения Интернет
предлагает: 1) электронная почта – исп-ие комп. сети для отправления и получения
сообщений, 2) телеконференции – ср-во общения для целых групп людей, 3) чат-пр-
мы, 4) интернет-телефония (Skype), 5) видеоконференция.
Перспективы развития Интернет: - Рост аудитории Всемирной сети (1,5 млрд
пользователей) 100 стран-лидеров по проникновению Интернет. (исландия, Норвегия,
США, Беларусь занимает 64 место)
-увеличение доменных зон (146 млн. доменов) (Домен.ру, ком, ком, нет, орг – 12 тыс.
русскоязычных доменов)
- рост интернет сайтов распространение высоскоростного доступа к Интернет.
- распространение беспроводных технологий доступа к Интернет
- рост интернет-трафика
- рост популярности фотохостинг ресурсов
- расширение аудитории онлайнового видео.
- рост популярности IP-телефонии.
14. Основные информационные услуги и ресурсы Интернет.
Интернет – самая большая глобальная сеть (сообщество, состоящ. из разноплановых
негомогенных сетей, объединяющ. миллионы комп-ров). Она объединила в единое целое
многие глобальные сети мира. Осн. назначение: обеспечить любому желающему
постоянн. доступ к любой инф-ии в сети.
Доступ к сети Интернет обеспеч. провайдер-организация, имеющ. лицензию на право
торговли услугами Интернет. Провайдеры имеют магистральные комп. сети, кот.
постоянно подключены к Интернет. Иерархия провайдеров: региональн. – национальн. –
международн.
Для обращения и навигации в сети существуют клиентские пргораммы – Веб браузеры.
Осн. возможности: - загрузка страниц по введенному URL-адресу (адрес каждого
объекта; http(протокол)://sws(доменное имя компа, на котором хранится
документ).bsu.by); - перемещение по гипертекстовым ссылкам, - ускорение
перемещения; - сохранение веб-страницы целиком.
Осн. ресурсы и услуги сети Интернет: 1) всемирная паутина (включ. тематич.
каталоги, поисковые системы, интернет-энциклопедии, виртуальн. библиотеки и
магазины, форумы, чаты, блоги...),
2) FTP-архивы – для подключения к серверам FTP, просмотр содержания каталогов,
загружать файлы с сервера. К FTP относят каталоги библиотек, публикации учебных
заведений, архивы и базы даннх крупных организаций) ; для скачивания различн. файлов
(текстов, пр-м, музыки, изображ, видео),
3) Telnet – удаленный доступ, протокол, позволяющ. превратить ваш компьютер в
удаленный терминал др. компа. Позволяет передавать инфу другому компу на обработку,
а результаты отображать на Вашем компе. (для этого необх-мы права доступа).
Как ср-во общения Интернет предлагает: 1) электронная почта – исп-ие комп. сети
для отправления и получения сообщений; 1971 год. Рэй Томлисон (Ray Tomlison),
программист из компьютерной фирмы Bolt Beranek and Newman, разрабатывает систему
электронной почты и предлагает использовать значок @ ("собака")
Функции электронной почты: 1) Доставка корреспонденции. 2) Распространение
периодических изданий (почтовые списки или списки рассылки). 3) Поддержка сетевых
новостей (Usenet). 4) Организация делопроизводства.
Адрес электронной почты записывается по определенной форме и состоит из двух
частей: имя_пользователя@имя_сервера
Для работы с электронной почтой используется почтовый пакет.
Почтовый пакет — это специальная прикладная система, которая управляет отсылкой и
приемом почтовых сообщений, состоящая из: почтового клиента (программы для
непосредственной работы пользователя с почтой - The bat, outlook express, Mozilla
Thunderbird); транспортной программы; программы почтового сервера и т.д.
Протоколы электронной почты SMTP (Simple Mail Transfer Protocol ) – протокол для
отправки сообщений. РОРЗ (Post Office Protocol) — протокол для получения
поступившей почты.
2) телеконференции – ср-во общения для целых групп людей,
3) чат-пр-мы,
4) интернет-телефония (Skype, IP-телефония),
5) видеоконференция.,
6) Электронная платежная система,
7) Социальные сети

15. Поиск информации и навигации в Интернете.


Интернет – самая большая глобальная сеть (сообщество, состоящ. из разноплановых
негомогенных сетей, объединяющ. миллионы комп-ров). Она объединила в единое целое
многие глобальные сети мира. Осн. назначение: обеспечить любому желающему
постоянн. доступ к любой инф-ии в сети.
Для обращения и навигации в сети существуют клиентские программы – Веб браузеры.
Основные возможности веб-браузера: 1) осуществлять поиск инфо (загрузка страницы)
по введенному URL-адресу (адрес каждого объекта; http(протокол)://sws(доменное имя
компа, на котором хранится документ).bsu.by);, 2) все введенные адреса помещать в
папку журнал, 3) возможность подписываться на частопосещаемые веб-страницы и веб-
каналы, 4) просмотр найденной инфо в свёрнутом окне, 5) любой документ может
сохраняться на винчестере, дискете, вывести на печать, 6) перемещение по
гипертекстовым ссылкам, 7) остановка (ускорение) загрузки страницы в виде закладки,
8) сохранение страницы целиком, рисунков, можно сделать фоном рабочего стола.
Навигаторы = браузеры.
Поиск информации – одна и самых востребованных на практике задач, к. приходится
решать любому пользователю Интернета.
3 вида поиска в Интернет:
1.вручную (по адресам, ключевым словам).
2. использование справочных адресов (справочников адресов, желтые страницы),
передвижение по гиперссылкам (фрагмент HTML-документа, указывающий на другой
файл, который может быть расположен в Интернете, содержащая полный путь (URL) к
этому файлу.)
3. использование автоматических поисковых систем (ИПС) – веб-сайты,
предоставляющие возможность поиска инфы в Сети. Задачи ПС: - определение точных
адресов, источников инфы; - индексирование источников информации; описание и
построение спец. БД для эффективного поиска.
Структура ИПС:
1) программа сама, 2) интерфейс пользователя; 3) программа для перевода запросов
пользователей на поисковой язык; 4) база данных или индекс для поиска адреса ресурса;
5) запросы пользователя; 6) спецпрога «робот-индексировщик» для поиска новых
документов и помещения их их в базу данных; 7) перечень веб-сайтов, доступ к которым
обеспечивает инфо-поисковая система.
По принципу действия ИПС делят на:
а) Поисковые каталоги : поисковый сервер yahoo – являются аналогом тематического
указателя в библиотеках и представляет собой перечень наиболее важных документов по
заданной теме.
б) Поисковые индексы (ПС общего назначения) – ПС общего назначения ,
позволяющие находить документы по ключевым словам: Google, Rambler.
в) Специализированные системы – для поиска в других «слоях» Интернета.
www.lycos.ru, позволяют находить информацию, находящуюся в других
информационных ресурсах интернета http://ftpsearch.lycos.com.
В последнее время появились метапоисковые системы - обращение с запросом к
набору поисковых систем и объединение полученных результатов.
16. Структура ПО ПК.
Комп — многофункц. электронное устр-во, предназнач. для накопл., обраб. и передачи инфы. ПК-
универсальный однопольз. микрокомп.. 1-й ПК был создан в 1976 г. Возняком и Джобсом. Apple-1.
ПК м. б. представлен в виде формулы: ПК = Аппар. ср-ва + Программн. ср-ва. ПО – космплекс
всех пр-м, используемых соврем. комп-ром (по-другому – soft). ПО является логическим
продолжением технических средств. ПО включает: - Системные проги (25%); -Приклад. проги
(50%);- Приклад. инструментальные проги (25%). Систем. проги (- операционные системы, -
проги-оболочки и операционные оболочки, - драйверы, - утилиты) - необх-мы для обеспеч.
нормальн. работы компа, его обслуж-ия и настройки. 1) Операционная система - управляющ. пр-
ма, загружаемая в ОП компа после его включения. Обеспечив. взаимод-ие оборудования компа с пр-
мами, взаимод-ие польз-ля с программн. и аппаратн. ср-вами (способ этого взаимод-ия – интерфейс).
Классиф-ия ОС: по интерфейсу: текстовые (однозадачные) ( MS-DOS); 2) графические (с
графич. интерфейсом, ниличие окон, меню, работа с мышью) – многопользоват., многозадачн. (неск-
ко приложений одноврем.), (Windows 95, 98, Millenium, 2000, ХР, Vista, Linux) Mac OS; 3)
мультимедийн. – рассчитаны на многопроцессорн. компы и графич. станции. Многозадачн. (около
100 прилож-ий одноврем (Be OS). 4)c социальн. интерфейсом, с диалогом (упр-ие голосом, общ-ие с
комп-ром). по режиму работы: 1) автономные (ОС отдельн. компа не в сети) - Windows 95, 98; 2)
сетевые ОС (кот. содерж. ф-ии работы с сетью. Соврем. ОС практически все имеют встроенн.
сетевые ф-ии.
2) Программы-оболочки обеспечивают более удобный и наглядный способ общения с
компьютером, чем с помощью командной строки DOS, например, Norton Commander). 3)
Операционные оболочки – интерфейсные системы, которые используются для создания
графических интерфейсов, мультипрограммирования и.т.д, проги для наглядности, в кот. может
использоваться многозадачность. (Windows 3)
4) Драйверы – подключают и управляют устройствами. (обычно загружаются в оперативную память
при запуске компьютера) 5) Утилиты – проги, расширяющие возможности ОС. (проги-упаковщики,
проги динамического сжатия дисков, антивирусы, средства дигностики) *компьютерный вирус –
прога, которая м. создавать свои копии и внедрять их в файлы, изменять состояние дисков, наносить
др. вредоносные действия. Прикладные проги – проги, к. решают специфические задачи для
выполнения конкр. вида работы (обучение, перевод и т.д.) Деловые ПО – 60%, домашние – 40%.
Деловые – а) экономические (бухгалтерские, кадровые, финансовые, складские) б) офисные (проги
автоматизации делопроизводства, проги создания деловой графики, комп. графика, презентации) !!
На смену офисному ПО пришли электронные офисы (надежность и безопасность работы,
доступность совместной работы) Основные направления разв. офисного ПО: создание нов. верс.
оф.ПО, совершенствование и интеграция технологии распознавания речи в рамках естеств.-реч.
интерфейса., внедрение интеллект. обраб. текста – модули порождения текстов, составление
документов) в) лингвистические программы (по обработке текстовой инфы) : машинный перевод,
автоматическое чтение текста, автоматическое реферирование текста и т.д) Домашние.: -
самообразование (словари, учебные курсы и т.д), -ведение бизнеса, работа на дому), -развлечения
(музыка, игры). Прикладные инстументальные средства. (языки программирования –
искусствен. язык, использ.для предсталения алгоритма решения задачи в виде, понятном компу., ; 1)
языки Асэмблер – представл. записанн. в алгоритме действия в виде машинн. кодов, 2) языки
системн. ур-ня – действие алгоритма запис-ся в виде отдельн. слов или их частей по опред. правилам,
направлены на решение задач определенного курса (Basic, Pascal), 3) языки Объектно-
ориентированные – совокупность действий, для создания сайтов. Visual Basic, Java) 4) Скриптовые
языки (команда – сценарий действий. Java Script). системы программирования – включают я.прогр.
и ср-ва компоновки и отладки прог.)
17. Компьютерная лингвистика как наука о принципах и способах моделирования
естественного языка на компьютере. Основные направления компьютерной
лингвистики. Компьютерная лингв-ка – раздел прикладного языкознания, моделирующий
речемыслит.деят-ть чел-ка, разрабатывающий теории моделирования языка, речи и
текстообразования и представляющая рез-ты в виде алгоритмов, компьютерных систем и
программ. КЛ появилась благодаря сближению прикладной лингвистики с физико-
математическими науками для решения практических задач. С 80-ых гг. появляется
вычислительная лингв. (= инженерная лингвистика = компьютерная лингвистика). КЛ
возникла благодаря: - развитию аппаратных средств комп-ра, - появлению новых научных
направлений, - влиянию лингвостатистики (квантитативной лингвистики), кот. исслед-ет
законы употребления тех или иных единиц (частоту употребления). КЛ – очень быстро
развивающееся и перспективное напр-ие.
Осн.напр-ия КЛ:
1) Распознавание и синтез речи
2) Машинный перевод текстов любых жанров
3) Системы порождения текстов
4) Системы понимания текста
5) Разработка лингвистических аспектов ИИ: - системы автоматического чтения
текста
- информационно-поисковые системы, - системы автоматической компрессии текста
(аннотир-ия и реферир-ия), - системы автоматич. Индексирования текста (определения
тематики),
6) Разработка и расширение ЛИР (лингв.информац.ресурсов): корпусов текстов,
автоматический словарей, фонетических ресурсов.
Основной метод КЛ – метод моделир-ия.
При моделир-ии исслед-ию подвергается не сам реальный объект или ситуация, а его
заместитель – модель.
Модель – формализ.описание объекта, нескольких объектов или процесса, выраженное
конечным набором предложений языка, математич.формулами, схемами, графиками,
таблицами и т.д.
Формализ.описание – если оно понятно не только чел-ку, но и машине (комп-ру).
Св-ва модели:
1) Это упрощенный аналог изучаем.объекта, модель не должна быть сложнее
оригинала.
2) Модель должна быть логически корректной (не содержать ошибок или
противоречий).
3) Модель отражает наиболее существенные признаки и черты реальн.объекта.
4) Модель желательно должна носить универсальный характер (быть применимой к
другим подобным объектам).
5) Метод моделирования должен быть более экономным по сравнению с
др.возможными методами.
Разновидности моделей:
I. Структурные модели – служат для изучения и описания внутреннего строения
объекта (например, строение речевого аппарата)
II. Функциональные модели– для изуч. поведения и функций объекта, протекания
какого-либо процесса (например, модель процесса перевода текста человеком)
III. Динамические модели – изуч.изменение объекта в его временном развитии.
КЛ часто прибегает к гипотетическим моделям как разновидности функциональной модели
(строится гипотеза того, как происх. тот или иной процесс у чел-ка.

18. Методы автоматического аннотирования и реферирования текста.


Спец-ты в разн. областях с наступлением научно-технич. прогресса не успевают следить за
огромными потоками постоянно обновляющейся инф-ии. Для этого созд-ся вторичные тексты
– аннотац. и рефер (для оперативного ознакомления с первоисточниками в сжатом виде).
Аннотац и рефер., созданные чел-ком явл-ся интеллектуальными. Аннотация (с точки
зрения человека) – краткое изложение содержания документа, дающее общ. представление о
его теме. Машинная аннотация – набор ключевых слов после вводных слов (клише - в
книге речь идет…). Реферат (с точки зрения человека) – связанный текст, к. кратко
выражает центральн. тему, цель, методы, технологии, рез-ты и выводы первоисточника. Для
сокращения времени созд-ия А и Р с 50-х гг. ХХ в. этот процесс пытаются автоматизировать
(проблема автоматич. компрессии исходного текста). В процессе человеч. аннотир-ия и
реферир-ия необх-мо осущ-ть след. этапы: 1)- подговит. этап – внимательное чтение исх.
текста, осмысление, опред. предм. области, темы. 2)- аналитич. этап – анализ отдельн.
абзацев, выделение смыслов. ед-ц (В кач-ве смыслов. ед-ц могут выступать ключев. слова –
частотные полнозначное слово или термин или словосоч., ключев. предложения – содржат 2
и более ключ слова), составление плана (для реферата) 3) Этап непосредственного построения
текста А или Р. Методы автоматич. А и Р:
I. Статистич. метод: 1 этап: созд-ие частотно-алфавитн. сл-ря каждого абзаца
текста. 2 этап: созд-ие распределит. частотно-алфавитн. сл-ря всего текста (для кажд. ЛЕ
указ-ся общ. абсол. частота употр-ия в тексте, кол-во абзацев, в кот. она встретилась, номера
абзацев и конкр. частота для кажд. абзаца). 3 этап: распред.-частотный сл-рь преобраз-ся в
сл-рь потенциальн. ключев. слов текста. Сл-рь проходит обраб-ку: 1) удаляется вся
общеупотр. и служебн. лексика, 2) суммир-ся частоты разн. форм одного и того же слова, 3)
суммир-ся частоты синонимичн. слов, 4) удал-ся ЛЕ, кот. имеют больш. частоту только в
одном абзаце. 4 этап: сл-рь потенц. ключев. слов разбив-ся на 2 списка: ГОС и ВОС (главн. и
второстеп. опорн. слова) – вычисляется коэф. кажности кажд. слова и средн. коэф. важности.
Если коэф. важности слова больше среднего коэф. важности – это ГОС, если меньше – ВОС. 2
В формуле для Кваж.=F*m/N*n буквы означают следующее: F— частота словоупотреблений
в тексте; m — число абзацев текста, в которых встретилось слово; N — общее число
словоупотреблений в тексте; n — общее число абзацев в тексте.
Созд-ие аннотации: она нач-ся с фразы-клише, кот. нах-ся в памяти комп-ра, затем список
ГОС. Созд-ие реферата: Сюда включ-ся предлож., в кот. 3 и более ГОС и ВОС (это значит,
что предложение информативно важное). Недостаток статистич. метода: он игнорирует
смыслов. связи, отсутствует анализ семантики текста.
1) Позиционные методы: ключев. ед-цами считаются те ед-цы, кот. занимают
опред. позицию в тексте. методы заглавия: предварит-но спец-ты созд-ют БД заголовков и
подзаголовков кажд. предметн. области. Для реферир-ия комп-р читает предлож. и
сравнивает их со сл-рем заголовков той же предметн. области. Если в предлож. встреч. 2 ЛЕ
из заголовков или 3 и более ЛЕ из подзаголовков, такие предлож. включ-ся в текст реферата.
2) методы локалицации: счит-ся, что наиб. информативн. предложениями явл-ся
те, в кот. говорится о теме, целях, методах, технологиях, выводах. Спец-ты исслед. больш.
кол-во текстов по предм. областям, нумеруют предложения и смотрят, в каких по счету
предлож. говорится о вышеперечисленных моментах. В итоге созд-ся БД числовых
параметров. При реферир-ии исх. текст накладыв-ся на таблицу с числов. данными и
экстрагируются предложения, помеченные в табл. как наиб. информативные.
II. Логико-семантические методы: Исследуют структуру и семантику текста.
Создается словарь в кот. каждому слову приписывается семантический код (Отрицательный
– субъективное значение/положительный). Алгоритм отбора: предложения, в к. 2 и более
слова с отрицательным весом (кодом) не включ в реферат., предложение без глагола не
включаются, предложения, в к. есть слова из заголовка, но нет слов с отриц. кодом
включаются. Метод Скороходько : Цель: выделить из текста предлож. с наибольш.
функцион. весом. Функцион. вес предлож. измер-ся числом межфразовых связей этого
предлож. Опред. числа межфразов. связей: 1) на основании совпадения рядом стоящ. сущ.; 2)
на основе повторения производн. слов, слов связанн. отнош. общее-частное или словарн.
синонимов; 3) местоименн. замены и контекстуальн. синонимы; 4) совпадение корней
знаменат. слов. Послед-ть действий комп-ра: 1 этап. составл-ие сл-ря повторов по тексту –
список знаменат. слов и номера предлож., в кот. они встретились (из него удал-ся вся
общеупотр. и служебн. лексика). 2 этап. комп-р подсчитывает, сколько раз в сл-ре встретился
номер кажд. предлож. (это и есть функцион. вес предлож.). 3 этап. номера предлож. располаг.
в порядке убыв-ия функцион. веса. 4 этап. в текст реферата включ. предлож. функцион. вес
кот. больше или равен средн. знач-ию функцион. веса. Все перечисл. методы имеют
недостатки, поэтому исп-ся комбинир. методы – правильное сочетание 2-ух или всех трех
методов. Если исп-ся все 3 метода, то сначала примен-ся статистич. метод (выдел-ие ключев.
слов и предлож), затем позиционные методы (они могут скорректировать ключев. предлож.,
вычисленные на онс. статистич. метода) и в конце исп-ся логико-семантич. метод.
19. Краткая история развития машинного перевода. Основные стратегии МП.
Перевод – вид человеческой деятельности в результате к. некоторый текст на одном
языке ставится в соответствие тексту на др. языке, при этом обеспечивается их смысловая
эквивалентность. Машинный перевод (МП) – выполняемое компьютером действие по
преобразованию текста на одном естественном языке в текст на другом языке при
сохранении эквивалентности в содержании. Общий лингвистический подход взят из
криптографии (шифровка/дешифровка). Первые идеи МП высказаны Уораном Уивером
в 1946г.. Выделяют 4 периода в МП. 1949-сер.60х - Начало работ по переводу - 1949 г.
Создание научных центров в США. - В Вашингтонском университете был создан первый
центр, занимающийся теоретическими и пракическими проблемами англоязычного
машинного перевода. - В 1954 г. в Джорджтаунском университете в США была
продемонстрирована первая система, которая перевела небольшой текст по физике с
русского на английский. - В СССР первый эксперимент прошел в 1955 г. Текст по
математике с французского на русский. Первые системы были в основном бинарные,
алгоритм перевода был жестко привязан к конкретному линг.материалу. сер.60х – к.70х.
создание целого ряда систем машинного перевода. Отечественные системы: АРАП,
ЯРАП, ФРАМ, НЕРПА. Западные системы – SYSTRАN. Правила перевода не были
жестко привязаны к языковому материалу., поддерживался многоязыковой перевод.
к.70х-н.90х. – улучшается качество перевода. Все системы поддерживают
многоуровневый анализ текста. н.90х – наст.вр. – разработка основных стратегий МП.
3 теоретические стратегии: 1) прямой бинарный машинный перевод. Элементарные
трансформации на основе переводных словарей; (нет семантической обработки)
2) трансформационный перевод (перевод с трансфером) – исходный текст должен
пройти трансформацию.
3) системы МП с языком-посредником (фреймы, семантические сети), в качестве
которого использовался какой-либо формальный способ представления знаний. Должна
быть БЗ, опираясь на которую К должен понять смысл исходного текста и перевести его
на другие языки. В целом выделяют 3 вида перевода в зависимости от степени
автоматизации: 1) Перевод текста человеком с помощью комп-ра: текст переводит
человек (переводчик) и обращается к электронным словарям для получения эквивалента.
2) Автоматизированный(а) – перевод, выполняемый человеком с помощью компа.
(ЛИНГВА), (б) перевод выполняемый компом с помощью человека - на определённых
этапах подключается человек осуществляет предредактирование, интерредактирование
или постредактирование). На сегодняшний день около 20% текстов нуждаются в
постредакторской правке. Часто исправляются стилистические особенности, неологизмы,
многозначные слова. 3) Машинный перевод (автоматический перевод) : от начала до
конца выполняется комп-ром без вмешательства человека, (но также для этого типа
характерно как предредактирование (обозначение абзацев) и постредактирование) –
Google translate, Prompt (модульная система, в состав входят Dictionary Editor – средство
создания и коррекции словарей, Smartool – инструмент, реализующий функцию перевода
в приложении Microsoft Office.), Trados – в основе системы лежит принцип сбора и
хранения переведенных текстов на двух языках; эти фрагменты хранятся в специальном
накопителе переводов; при занесении перевода в систему работает система выравнивания.
20. Структура системы машинного перевода.
Машинный перевод (МП) – выполняемое компьютером действие по преобразованию текста
на одном естественном языке в текст на другом языке при сохранении эквивалентности в
содержании.
В 1954 г. в Джорджтаунском университете в США была продемонстрирована первая
система, которая перевела небольшой текст по физике с русского на английский. - В СССР
первый эксперимент прошел в 1955 г. Текст по математике с французского на русский.
Автоматический словарь системв МП м.б. представлен в виде - словаря словоформ; -
словаря основ(квазиоснов – неизменяемых частей слова). В автоматический словарь
включаются все формы ЛЕ, которые подаются «Гнёздами». Выбор ЛЕ зависит от 1)типа
языка (для флективных – квазиоснова, для аналитических – словоформа) 2) объема словаря и
вычислительных ресурсов ПК. 3)типа системы МП. Если СМП создается для
«информативного» перевода (грубый, пословный) – м. использовать квазиоснову. Словарная
статья – слово+инфа к нему (морфолог., лексич.зн., чинт, семантич. зн) +переводн.
эквивалент . Установление синтакс. соответствий возможно 2 способоами: 1)
синтаксическая структура один к одному переносится на перевод – A+N – a+n; 2) синт.
структура получается путем трансформации N+N=a+n (n2+n1: n2+n1).
С к.70-х годос СМП стали поддерживать многоуровневый анализ.
Алгоритм системы МП. Начало – ввод предложения, мрфологический анализ,
синтаксический анализ, синтаксический синтез, морфологический синтез, печать
перевода, если ввсе предложения введены то «завершить».
1. Подсистема морфологического анализа
Основная задача подсистемы: приписать каждому слову набор лексико-грамматических
признаков. Комп-р обращается к автоматическому переводному словарю (АПС), ищет
переводной эквивалент слова исходного языка, приписывает словам нужные коды.
2. Подсистема синтаксического анализа
Задача подсистемы: определить синтаксическую структуру исходного предложения на
уровне членов предложения. В языках аналитического типа показателями синтаксических
отношений могут выступать порядок слов, служебные слова, формы вспомогательных
глаголов и т.д. В языках синтетического типа показателями синтаксических отношений будут
формы слов, поэтому очень важны результаты работы подсистемы морфологического
анализа. Результатом работы подсистемы синтаксического анализа должна стать формула с
условными обозначениями членов предложения.
3. Подсистема синтаксического синтеза
2 основные задачи:
 Комп-р должен определить синтаксическую структуру предложения на
переводящем языке (с опорой на систему синтаксических соответсвий и на результаты
работы второй подсистемы). Если соответствия в базе данных не найдены, чаще всего
исходная структура сохраняется.
 Выбор переводных эквивалентов с помощью АПС
4. Подсистема морфологического синтеза
Данная подсистема очень важна при переводе на язык синтетического типа, используются
результаты работы всех предыдущих подсистем, т.е. подсистем морфологического и
синтаксического анализа. Для аналитических языков это система контроля соответствий
форм.
21. Определение понятия «система искусственного интеллекта». Основные типы
систем искусственного интеллекта.
Термин введен в 1956 г. Дж. Маккарти на Дартмусской конференции.
ИИ имеет два определения:
- Теория создания аппаратных и программных средств, способных осуществлять
интеллектуальную деятельность.
- Аппаратные и программные средства, способные осуществлять интеллектуальную
деятельность, а также выполняемая ими деятельность.
СИИ – комплексная система, способная получать такие результаты, которые при решении
данного класса задач приводит интеллектуальная деятельность человека.
Сегодня важнейшая особенность ИИ, как науки, СИИ не
обязательно должно имитировать интеллектуальные действия человека, направление
моделирования поведения человека, физическую деятельность.
Идеальная СИИ характеризуется след особенностями: -наличие внутренней модели
внешнего мира; -способ пополнения имеющихся знаний; - система должна обладать
способностью к дедуктивным выводам; -обладать умением действовать в ситуациях,
связанных с использованием нечетко представленных знаний( понимание естесств
языков); - должна обладать способностью вести диалог на ЕЯ; - должна адаптироваться к
условиям окруж среды.
Как и большая часть наук, ИИ разбивается на множество поддисциплин, нашедших
себе различные применения. Прикладные области: -Ведение игр; -Доказательство
теорем (основаны на строгости и общности логики); - Экспертные системы; -Понимание
языков (базируется на обширном фоновом знании о предмете беседы, способности
применять общее контекстуальное знание для понятия недомолвок и
ошибок) ; -Моделирование работы ч-кого интеллекта; -Планирование и робототехника
(пространственное ориентирование роботов – планирование их действий);-Языки
программирования; -Машинное обучение; -Альтернативное представление: нейронные
сети; Проблемы: -возможность создания беспредельного разума, уменьшение роли
человечества, самосовершениствование машин, появление непонятных устройств.
-«технологическая сингулярность» - точка, когда мы перестанем понимать, что
происходит вокруг нас. 2029, 2050 – разные прогнозы. -нужное направление – повышение
эффективности работы нашего интеллекта. -ИИ усилит различия между странами
(обладает им страна или нет) -искусство (муз. Импровизация, стихи);
Лингвистические задачи:
1. Поиск способов эффективного представления знаний в памяти компа
2. Автоматическое определение содержания текста
3. Распознавание рукописных текстов
4. Создание совершенных систем машинного перевода
5. Автоматическое порождение текстов
6. Распознавание и синтез устной речи без ограничений
7. Создание систем дистанционного обучения и образования
8. Проблема речевого управления сложными устройствами (роботами)

22. Экспертные системы: определение и основные понятия.


ЭС—компьютерная система, которая моделирует рассуждения человека-эксперта в
некоторой предметной области и использует для этого БЗ. В настоящее время
существует огромное количество ЭС, что может быть объяснено 3 причинами:
1) компактность современной вычислительной техники, огромные
вычислительные ресурсы которой позволяют использовать компьютер для решения
задач во многих областях (Напр.: при поиске полезных ископаемых, прогнозах погоды,
процессе порождения текста);
2) общение идет на естественном языке, могут использовать не только программеры;
3) в ходе решения задач ЭС достигает таких результатов, которые получают люди-
эксперты.
С т.зр. назначения: а) ЭС для обучения специалистов; б) ЭС для решения задач; в) ЭС
для автоматизированных рутинных работ, с учетом предметной области; г)
предсказывающие ЭС; д) диагностирующие; е) конструирующие; ж) планирующие
(порядок сборки детали) и т.д.
Сферы использования предметных областей, в которых применяются ЭС: медицина;
физика; химия; математика; электроника; информатика; Космическая техника;
инженерное дело; военное дело; метеорология; геология; сельское хозяйство;
промышленность;юриспруденция; управление процессами; компьютерные системы.
США – система «Prospector” прогнозир. и оценив. геолог. ресурсы, система “Mycin”ставит
диагнозы и назначает лечение при сложн. заболеваниях, система «Car Guide” выбирает
наиболее краткий маршрут, система “Plant” определяет заболевания с/х растений. СССР –
система «Плотина» - для диагностики гидросооружений, система «Сонэт» - для
обнаружения неисправностей электронн. техники.

Стр-ра ЭС: соотв. стр-ре систем ИИ. 5 этапов созд-ия ЭС:


I. Этап идентификации задачи – вербально формулир-ся решаемая задача, отмеч.
предм. область, цели созд-ия, указ-ся ключев. понятия и отнош. между ними. Этот этап
выполн-ся экспертом и инженером знаний.
II. Этап концептуализации – выявление всех знаний, кот. необх-мы для
функционир. системы (в виде перечней, таблиц, схем). Этот этап тоже реализ-ся в ходе
диалога эксперта и инженера знаний, кот. думает, в каком формализ. виде представить все
знания.
III. Этап формализации – формализ. предст-ие данных (чаще всего, в виде логич.
правил вывода).
IV. Этап реализации – преобраз. формализ. знаний в работающ. комп. систему
(написание пр-мы). Создается работающ. прототип будущ. системы.
V. Этап тестирования – тестирование, проверка и оценивание инженером знаний
и экспертом. Сначала на небольш., затем на больш. массиве примеров. 4 важн. аспекта:
1) принимает ли комп. система решения, кот. признаются экспертом верными, 2) явл-ся ли
правила логич. вывода безошибочными и полными, 3) адекватны ли объясн-ия комп-ра о
том, почему система пришла к такому выводу, 4) есть ли многочисл. примеров такие, кот.
комп. не может обработать и почему.

23. Общие понятия и порядок построения автоматизированной обучающей


системы.
АОС – комплексная обучающая программа, относящ. в основном к одной языковой
области, напр. на решение одной или неск уч задач.
АУК – комплекс программ, направленных на достиж как правило неск учеб целей
Этапы создания АОС: 1) теоретич. обоснование выбранного метода обучения
два подхода - Бихевиористский – “чем чаще употр-ся к-л явл-ие, тем лучше оно
запомин-ся». методы: 1) программирование учебной деят-ти обучаемого – в зависимости
от уровня знаний задается определенная последовательность заданий, жесткий сценарий
диалога. 2) тестирование – выявление характеристик обучаемого и вывод рез-тов. 3)
информир-ие – исп-ие комп-ра как информац. ресурса. - Когнитивно-
интеллектуальный – осн. задача – активировать у обучаемого познавательные ф-ии. 2
метода: 1) моделир-ие учебной среды 2) свободное обучение – комп-р дает самому
обучаемому возм-ть выбрать сп-б обучения (тематику, принцип общения..). Комп-р
направляют и корректирует действия обучаемого.
2) Проектирование содержания курса - детальный анализ уч программы по
конкр. дисциплине, выделение разделов (морфология), выделение в разд тем (глагол),
каждая тема предст в виде подтем (мод гл), каждая пробл рассматрив как сов-ть задач
(глагол должествования) 3) метод проработка уч мат: а) какой тип обуч проги создается
(обуч / контрол или комбинированная)б) параметры для оценки рез-тов (общее число
заданий / число верно вып / время / число подсказок) в) какие задания будут
использоваться (Задания открытого и закр типа) г)Мотивационный блок
3) Создание обуч сценария – последовательность того, что идет на экране,
последовательность кадров. Кадр - порция инфы единовременно представленная на
дисплее. (основ (информац - правила / операцион - упражнения / кадры обр связи –
высказывания, свидетельств о неверном ответе и подсказка / контрольные - статистика) и
вспомог (информирующ – тема/цель / иллюстр - образец / директив – особенности работы
с прогой / результирующие/разрядки – для снятия напряжения))
4) Создание и тестир обуч проги - инструментальные ср-ва (алгор языки, авторские
(ЯОК – ящыки обучающих кадров), языки для работы с БД (си++))
Выявл трудностей предусм след вопросы:
- выявл труд предпол заданий; уточнение оценок; выявл психо-физиол
особенностей работы с прогр;
Дистанц обуч – обуч на расстоянии, предполаг телекоммуник принцип и интерактив
взамод обучаемого и препода
Классиф: 1) интерактивно-телевизион; 2) с использ носителей уч инфы на СD или
флешке; 3) с использ телекоммуник сетей (всемир паутина, видеоконф)
+ дист обуч: независимо от возраста и места прож, индивидуализ и дифференц, исп
мультимед ср-в - дист обуч: перед не знания, а инфа, организация новой стр-ры уч мат,
необходимость навыков раб с компом Pr Higgins, Big Ben, English World, English Platinum.
Welcome to Engl

24. Новые информационные технологии в обучении языкам.


1. Распозн и синтез речи
2. Парал корпусы текстов (перевод)
3. Базы и банки данных для созд обуч прог – до 1000 зад на одно правило
4. ЛИР для обуч переводу
5. Системы поним и порожд текстов – перевод, составл реф и аннот
6. Исп сайтов для размещения дз, электрон учеб (комплекс обучающ. и
контролир. пр-м для обуч. больш. разделу курса или всему курсу.
7. Облачные технологии (парадигма, в рамках кот инфа постоянно хранится на
серверах и врем кэшир на пользов компе)
Сп-бы исп-ия комп-ра в обучении:
1) комп как помощник препода – обучение традицион, занятия проводит
преподаватель в комп. классе. Контроль знаний строится по жесткому сценарию.
2) комп как препод – комп. пр-мы направлены больше на индивидуальн. обучение
целому уч. курсу, моделир-ся традиционное обучение. Часто с пом. комп. учебника.
3) комп как источник и оцениватель знаний – обучаем. обращ-ся к компу, чтобы
добыть и оценить знания. Часто в рамках дистанционного обучения.
Мультимедийные пр-мы – пр-мы индивидуализированного обучения. Это
законченные курсы, кот. полностью заменяют препод-ля.
Харак-ки: - совмещение обучающ. и контролирующ. ф-ий, - опора на сценарий,
максимально приближ. к традиц. обучению, - исп-ие принципов наглядности и
доступности, - наличие ср-в быстрой и объективн. оценки знаний, - возм-ть настройки
на обучаемого.
Мульмедийн. комп. пр-ма – в кот. исп-ся все виды инф-ии: текст, звук, цвет, графика,
видео.Дидактич. параметры мультимед. пр-м: 1) тип польз-ля, 2) назначение пр-мы
( для чего, кол-во тем/подтем, комментарии и подсказки, объем ЛЕ, кол-во
иллюстраций, видео...)
25. Возможности систем автоматического чтения текста.
Машинн. распозн-ие образов – техническое зрение. Чтобы «понять» текст, т.е.
перевести графику в цифровой вид, нужна система автоматического распознавания
текста.OCR (Optical Character Recognition) – компьютерная программа, позволяющая
преобразовывать текст бумажного носителя в электронный текстовый файл. 1-ые исслед-
ия в этой области – 60-е г. в США.
Первые системы требовали обуч распознав нового начертания – мультифонтовые;
Совр имеют сист начертания – омнифонтовые
FR- прикладная прога, позвол преобразовать текст с бум носителя, слайда в электрон
текстовый файл, который потом можно обраб с пом прикл проги
60-70х гг. Марвин Минский и Патрик Уинстон предложили смоделировать
принципы распознания предметов человеком на искусственные системы. 1)
целостность – объект опис-ся как целое с пом. значимых эл-тов, 2) целенаправл-ть –
распознавание как процесс выдвижения и целенаправленной проверки гипотез, 3)
адаптивность – сп-ть комп-ра к самообучению.
Этапы работы систем АЧТ: 1) сканирование, 2) распознавание: а) анализ графич.
макета страницы (выделение областей для расп-ия, таблиц, картинок, строк и символов);
б) расп-ие кажд. символа на основе различн. классификаторов для печатн. символов.
Классификаторы расп-ия символов:
1) шаблонные – изображ. распознаваем. символа поочередно сравнив-ся с
изображ. из БД
2) признаковые – анализир-ся не все изображ. символа, а некот. признаки, кот.
вычисляются по формулам
3) структурные – содержат инф-ию не о точечн. изображ. символа. а о правилах
начертания или стр-ре. Обучать новым шрифтам пр-му не нужно.
4) структурно-пятенный – изображ. символа представлено в виде набора пятен,
связанных парами (соед. шаблонн. и стуктурн. кл-ры).
Возможности FR – 1)позволяет вводить документы, приготовленные а разных принтерах,
2) распознанный текст можно передать в текстовый редактор, или электр. Таблицу,
можно сохранить в разных форматах.
3) распозн штрих-кодов, визиток;
4) 2сторон сканирование;
5) система способна самообучаться и распознавать нечитабельные тексты на основе
читабельных.;
6) распознание текстов на неизвестных языках.
7) система имеет встроенный текстовый редактор;
8) распознавание можно проводить в фоновом режиме;
9) распознание рукописного текста.

26. Определение понятия «понимание текста компьютером». Уровни и типы систем


автоматического понимания письменного текста.
Понимание в комп системе – извлечение из текста наиболее сущ инфы и получ инфа м б
представлена пользователю или передана в БЗ. (БЗ – БД+знания (правила использования
БД) Считается, что комп-р понял текст, если он может:
1) кратко изложить его основное содержание (напр., реферат)
2) ответить на вопросы по тексту
3) подобрать / нарисовать к тексту изображение
4) приведенн. в тексте сведения представить в др. форме (#: в виде таблицы,
графика)
5) сравнить содерж-ие 2-ух текстов
6) выполнить перевод текста
7) извлечь из текста знания для БД или БЗ
В рамках узких специализир. систем понимания текста можно выделить ур-ни понимания
текста, кот. соотно. с языковыми ур-нями: 1) Морфол. понимание – приписание каждому
слову морф. характеристик; осуществляется в корпусных текстах) (КТ- совокупность
текстов по определенной тематике) (Анннотированный текст – кодовый, тегированный,
размеченный. 2) Синтаксическое п. – выделение в предложении главных и
второстепенных членов предл. и установление связи между ними. 3) Семантическое п. –
установление значения выделенных на синтакс. уровне составляющих. 4) Прагматическое
понимание - установление межфразовых связей, слова-скрепы.
Стр-ра комп. системы поним-ия текста: на вход в системы поступает некий текст, затем
он обрабатывается оператором понимания и на выходе имеется адекватн. рече./неречев.
поведение комп-ра. Здесь понимание может быть процессом, мех-мом адекватного
преобразования входного текста и рез-том этого преобраз-ия.
В операторе понимания могут нах-ся разн. по содерж. знания: 1) знания о языке, 2)
правила исп-ия знаний о языке, 3) знания об опред. фрагментах реальности, 4) правила исп-
ия предметн. знаний, 5) знания о польз-ле. В завис-ти от того, сколько видо представлено в
ОП, выделяют след. виды поним-ия текста комп-ром:
I. понимание – узнавание: в ОП только знания о языке
II. понимание – уподобление: знания о языке и о правилах их исп-ия. Счит-ся, что
текст понят, если комп-р может ответить на вопросы по тексту (в БЗ комп-ра содержатся и
вопросы, и ответы).
III. понимание – прогнозирование: знания 1-3. Комп-р поним. текст, если он
может сделать вывод о каком объекте (группе объектов, событии, явлении) идет речь.
Отличит. особ-ть таких систем – сп-ть прогнозировать.
IV. понимание – объяснение: знания 1-4. Система должна уметь объяснить польз-
лю, почему она пришла к такому выводу (экспертные системы).
V. понимание – объединение: все 5 видов знаний. В системе есть портрет польз-
ля, исп-ся диалоговый режим для его созд-ия (выяснение его требований, целей,
ожиданий..).

27. Автоматическое порождение письменного текста: определение, этапы, общая


структура.
Автоматическое порождение трактуется как генерация, синтез, написание или
создание текста. Проблемой порождения текста заним-ся с нач. 70-х г. (Эдинбургский,
Стенфордский, Колумбийский, Массачусетский, Монреальский ун-ты). Пока нет
единой теории текстообразования. Сущ-ет многочисл. подходы к процессу порождения
текста, в основе – цель создания. Часть из них исп-ся для созд-ия диалоговых систем. В
них текст рассм-ся как любая реплика, фраза, состоящ. из неск-ких слов. Др. подходы –
порождение жестких по стр-ре текстов. Большая часть работ напрвлена на порождение
практических докуметов/текстов(метео-сводка). Небольшая группа экспериментальных
систем создается с целью моделирования литературоведческих теорий
Два этапа текстообразования – стратегический (что писать? Результатом становится
семантическое представление) и тактический (как писать? Результат – сам текст)
Проблемы: Что является единицей текста? Что выступает в качестве лексической
единицы? (слово/словосочетание), Как ЛЕ связываются в единое целое? Каковы
критерии отбора единиц из БД.
Две группы систем порождения
- системы, работающие на основе шаблонов (работают с текстами деловой прозы)
- лингвистически мотивированное напис текста по аналогии с человеком (только
экспериментальные)
Считается, что в общем плане любая система порожд. текста должна иметь 3 тесно
взаимосвязанн. компонента:
1) оболочка – определяет назначение (стихотворение, сказка). В О. содержится
вся база знаний , к. состоит из а) предметных(нелингвистических) сведений, связи и
отношения между понятиями) б) лингвистические сведения (списки морфем словарь)
2) планировщик – опред. все пути построения и порождения текста, работает в
тесной связи с оболочкой. 1) опред. той инф-ии, кот. должна быть представлена в
тексте, и той, кот. можно опустить; 2) опред. В каком виде эта инф-и должна быть
представлена; 3) определяет порядок следования обхацев в тексте. 4) определяет
порядок следования синтаксических составляющих в пределах обзаца; 5) определяет
языковое оформление и взаимные связи предложений в абзаце 6) выбор
соответствющей лексики
3) лингвистический реализатор – отвеч. за правильн. грамматич. и лексич.
оформление текста.

28. Распознавание речи компьютером.


Под Р.Р. в узком объеме понимают преобразование речи в ее письменный вариант – в
текст.
Если компьютер сможет в полной мере распознавать речь, он сможет…
- поддерживать голосовой ввод инфы (система секретарь-референт)
- сможет обучать иностранным языкам
-сможет обучать родному языку с людей с потологией, дифектом речи
-определять по голосу личность человека
-определять настроение человека (проверка готовности летчиков перед вылетом)
-переводить устную речь на другой язык или в письменном варианте.
-обращение голосом к различным справочным системам (например, на вокзале)
- поддерживать голосовое управуление компьютерными системами (бортовой
компьютер, навигатор)
- осуществлять запись фонетической транскрипции устной речи
-вести в электронном варианте протоколы заседаний.
В полном объеме понимается распознавание речи любого человека в любых
условиях. Факторы, мешающие распознанию речи.:
-нет четкого теор. исследования по переработке речевых сигналов.
-слитно произнесенная речь обладает следующими свойствами: 1) границы слов
размыты (нужно говорить медленно с паузами); 2) в слитной речи соседние звуки
влияют друг на друга (эффект коартикуляции); 3) знаменательные слова произносятся
отчетливо, а служебные редуцируются или исчезают.
- экстралингвистическая информация (возраст, пол, национальность)
-паралингвистическая инфа (мимика, жесты, позы)
На сегодняшний день промышленные системы делятся на 4 группы:
1) средства речевого управления; 2) средства диктовки; 3) инф-справочные системы; 4)
средства идентифицирующие человека по образу речи; (IBM VIA VOICE – программа
для распознавания речи)
Перспективные направления: - управление компом по телефону, разработка
голосовых ключей, разработка средств распознавания в шумовых условиях. Виды
систем распознавания речи: -системы распознавания команд (открыть/закрыть); -
системы слитной речи; - системы распознавания дискретной речи; - системы
распознавания непрерывной диктовки.
Факторы , влияющие на качество распознавания речи:
- объем словаря, темп речи (прим. 120 слов.мин)
- зависимость от диктора(дикторозависимые системы, настраиваемые)
-экстралингвистические факторы (эстетическое напрвление, эмоциональное
направление, индивидуально-личностное, био-социальное, медицинское,
пространственное, психологическое (темперамент, самооценка)

29. Синтез речи с помощью компьютера


Сущ-ет 3 осн. методы генерации УР:
1) Кодир-ие сигналов с их послед. прямым восстан-ем: самый простой
подход. Комп-р – устройство для записи речи, пободно магнитофону. Чел-к
начитывает неск-ко слов, словосоч. и фраз, кот. запис. в память комп-ра. По команде
кажд. записанн. эл-т может быть воспроизведен. +: источник речи – чел-к, речь
качественная, но ограниченная (нужны огромные объемы памяти для хранения
звучащей УР).
2) Фонет. синтез УР, или акуст моделир – самый прогрессивный подход.
Любое слово, состоящ. из букв, может быть разбито на фонемы, а фонема в контексте
переходит в опред. аллофон. Чел-к не явл-ся источником речи, он вводит в комп-р эл-
ты письменн. текста, кот. озвучиваются комп-ром. – синтезированная речь звучит
неестественно, +: можно озвучить любую инф-ию без ограничений. Формантные
частоты – у звука есть осн. и доп. формантная частота, исходя из доп. формантных
частот опред-ся окраска звука.
3) Матем. моделир-ие голосового тракта человека – источник речи –
человек. Набор фраз может быть очень больш. Комп-р сохраняет физ. и просодич.
харак-ки звуков и интонации. Эти харак-ки вычисляются опред. матем. формулами.
При вопроизведенмии эти числов. параметры снова преобраз-ся в звуки и интонацию.
– при преобраз-ии могут быть утеряны к-л харак-ки речи и голоса., +: УР естественная,
без ограничений по объему.
Области применения речи, синтезир. комп-ром:
1) говорящ. аппаратура, техника
2) системы оповещения
3) телекоммуникации
4) специализир. аппаратн. и программн. обеспеч. для слабослышащих,
слабовидящих и немых
5) обучение языку
6) клонирование голоса человека

30. Виды угроз безоп. информационных систем и инф.ресурсов. Совр.техн. защиты ИР.
Угрозы информационным системам представляют:
1) Хакеры.
2) Некомпетентные служащие.
3) Неудовлетворенные своим статусом служащие.
4) Инициативный шпионаж.
5) Организованная преступность.
6) Террористические группы.
7) Шпионаж экономический, политический, военный.
Виды угроз: 1) несанкционированный доступ к информации; 2) разработка и
распространение вирусов (*компьютерный вирус – прога, которая м. создавать свои копии и
внедрять их в файлы, изменять состояние дисков, наносить др. вредоносные действия.) ; Вирусы:
по среде обитания : сетевые, файловые, загрузочные, файлово-загрузочные;
по принципу функционирования: студенческие, черви, трояны, стелсы)
3) подделка компьютерной инфы; 4) хищение компьютерной инфы; 5) ввод
логических бомб (программа, которая запускается при определённых временных или
информационных условиях для осуществления вредоносных действий (как правило,
несанкционированного доступа к информации, искажения или уничтожения данных).
Средства защиты делятся на
1. Программные (антивирусные программы, программы удаления информации и т.д.).
2. Аппаратные.
3. Аппаратно-программные.
4. Криптография. (шифровка/дешифровка) Криптология делится на два направления:1.
Криптография (обеспечить конфиденциальность) 2. Криптоанализ (раскрытие
зашифрованных текстов)
5. Биометрические технологии. (используются поведенческие и физиологические
параметры человека)
1. папиллярный узор пальца;
2. форма кисти руки;
3. узор радужной оболочки глаза;
4. параметры голоса;
5. черты лица;
6. термограмма лица (схема кровеносных сосудов);
7. форма и способ подписи и т.д.

Вам также может понравиться