Вы находитесь на странице: 1из 12

Вопросы по ИТ в лингвистике

1. Какие основные направления в лингвистике существуют?


Cегодня многие ученые разделяют всю отрасль лингвистической науки на
два больших направления: теоретическую и прикладную лингвистику.
2. Каковы задачи прикладной лингвистики?
К основным задачам прикладной лингвистики можно отнести:
1. создание и совершенствование письменности,
2. разработку систем транскрипции устной речи,
3. систем транслитерации иноязычных слов,
4. унификацию и стандартизацию научно-технической терминологии,
создание словарей различных типов,
5. перевод с языка на язык,
6. обучение языку и т.д..
3. Назовите современные отрасли прикладного языкознания.
Что касается современных разделов прикладной лингвистики, то среди них
можно назвать прежде всего такие дисциплины, как компьютерная,
корпусная и когнитивная лингвистика, психо- и нейролингвистика, социо- и
этнолингвистика, юрислингвистика.
4. Что такой информационные технологии в лингвистике?
Информационные технологии в лингвистике — это совокупность законов,
методов и средств получения, хранения, передачи, распространения,
преобразования информации о языке и законах его функционирования с
помощью компьютеров.
5. Когда состоялось принятие протоколов TCP/IP, позволяющих
разнородным сетям обмениваться данными?
С 1 января 1983 года ARPANET перешла на новый протокол. Этот день
принято считать официальной датой рождения Интернета. (Википедия)
6. За счет чего осуществляется регулирование направления и объемов
потоков данных в Интернете?

В сетях TCP/IP соответствие между доменными именами и IP-адресами


определяется централизованной службой DNS (Domain Name Service),
использующей распределенную базу отображений "доменное имя – IP ". Под
распределенностью базы подразумевается то, что DNS-серверы
распределены по всему миру, на каждом из которых находится какая-то
часть от этой базы.
7. Для чего предназначены справочники (рубрикаторы, каталоги) ресурсов
Интернета?
Справочники, называемые еще каталогами или рубрикаторами,
представляют собой электронные справочные системы, имеющие четкую
иерархическую систематическую или логико-тематическую структуру, во
многом напоминающую структуру систематического каталога
библиотеки.
8. Что представляют из себя поисковые системы?
Задача поисковых машин - обеспечивать детальное разыскание информации
в электронной вселенной, что может быть достигнуто только за счет
учета (индексирования) всего содержания максимально возможного числа
web-страниц. В отличие от справочников, все они функционируют в
автоматизированном режиме и имеют одинаковый принцип действия.
9. Назовите самые известные глобальные и российские справочники
(рубрикаторы, каталоги)
К наиболее значительным справочникам всемирного масштаба относятся
Yahoo! (www.yahoo.com), Open Directory (dmoz.org), About (www.about.com).
Среди российских разработок в этой области значатся Апорт
(www.aport.ru), List.ru (list.mail.ru), Улитка (www.ulitka.ru).
10. Для чего предназначены мета-поисковые системы?
Мета-поисковые системы не имеют собственных поисковых роботов и баз
данных (индексных файлов). Их достоинство заключается в умении
рассылать вводимые в них запросы по другим системам, а затем
суммировать результаты.
11. В каких случаях лучше воспользоваться мета-поисковыми системами?
12. Назовите крупнейший энциклопедический портал.
РУБРИКОН - крупнейший энциклопедический портал не только России, но и
мира.
13. Назовите бесплатные онлайн энциклопедии.
«Кругосвет» — универсальная онлайн-энциклопедия на русском языке.
Britannica — наиболее полная и старейшая универсальная энциклопедия на
английском языке.
14. Что относится к библиографическим ресурсам Интернета?
Библиографические ресурсы глобальных сетей обширны и разнообразны. В
них входят многочисленные списки литературы на персональных
страницах, списки новых поступлений или тематические указатели на
сайтах библиотек, перечни источников в различных электронных
публикациях и еще многие подобные материалы. Но главными их
составляющими являются электронные каталоги библиотек и
библиографические базы данных.
15. Назовите наиболее известные каталоги зарубежных и российских
электронных библиотек. Что Вы знаете о каталогах электронных библиотек?
 Каталог Библиотеки Конгресса США
 Каталог Британской библиотеки
 Сводный каталог университетов Англии и Ирландии
ТРЕБОВАНИЯ К ЭЛЕКТРОННЫМ КАТАЛОГОМ БИБЛИОТЕК
- осуществление поиска по всем значимым полям с возможностью усечения
терминов запроса или вариативностью их употребления (любой из
терминов, все термины только вместе, точная фраза);
возможность ограничения поиска по формальным критериям (годы издания,
вид издания, место издания, язык документа и т.д.);
наличие словарей с возможностью автоматического переноса термина
словаря в форму запроса (поисковое предписание);
возможность формирования списка релевантных записей из общего перечня
результатов поиска;
возможность отправки отобранных результатов поиска по электронной
почте или сохранения на локальном диске пользователя;
наличие гипертекстовых ссылок на такие элементы библиографической
записи, как авторы (индивидуальные или коллективные), предметные
рубрики и название серии.
16. В чем суть работы корпоративных каталогов?
17. Назовите наиболее известные библиографические базы данных и
опишите их суть.
В Интернете представлено большое число библиографических баз данных,
главная ценность которых заключается в том, что, в отличие от
электронных каталогов библиотек, они содержат сведения, главным
образом, об аналитических материалах, т.е. о статьях из журналов,
сборников и, реже, газет.
18. Определите термин «электронная библиотека».
По мнению некоторых авторов, электронные библиотеки можно
определить как упорядоченные коллекции разнородных электронных
документов, снабженные средствами навигации и поиска. Подобное
толкование позволяет выделить столь важную отличительную черту
электронных библиотек как обязательное наличие заданной структуры и
навигационно-поисковых средств, обеспечивающих ориентирование в
документах. Это дает возможность исключить из понятия "электронная
библиотека" беспорядочные файловые массивы, не объединенные единой
иерархической структурой и системой индексации
19. Когда и в какой стране положено начало созданию первых электронных
библиотек?
Начало созданию электронных библиотек было положено в 60-е годы в
Соединенных Штатах Америки. Собрания разнообразных электронных
документов формировались в военных, академических и образовательных
организациях, а также крупнейших промышленных корпорациях под
конкретные задачи.
20. Каким образом комплектуются открытые электронные библиотеки?
Пополняется главным образом усилиями пользователей Интернета,
присылающих в библиотеку оцифрованные ими тексты. (Википедия)
21. Каково качество текста в открытых электронных библиотеках? С чем это
связано?
Качество текста большинства источников, размещаемых в бесплатных
электронных библиотеках, весьма невысоко. С самого начала
существования электронных коллекций текст в них был представлен в виде
простейших ASCII-файлов. Файлы в формате .txt, как известно, не
содержат таких излишеств форматирования, как выделение фрагментов
курсивом, жирным шрифтом или подчеркиванием. Естественно, в txt-
документах отсутствуют и все другие элементы в виде таблиц, графиков
или иллюстраций, которые в значительной мере обогащают содержание
произведения. Любое повышение качества текста, например, простейшая
его разметка с применением HTML, связано с повышением стоимости
производства документа, что чаще всего неприемлемо для проектов,
положивших в основу своей деятельности бесплатность.
22. Какую основную цель преследуют разработчики образовательных
порталов?
Образовательные порталы, создаваемые в сети Интернет, оказывают все
большее влияние на повышение эффективности использования средств ИКТ
в обучении студентов.
Использование системы порталов позволяет более эффективно
организовать работу педагогов, поскольку на порталах собраны и
систематизированы наиболее востребованные ресурсы. Используя их,
преподаватели, студенты, аспиранты и все заинтересованные лица могут
получить доступ к качественным учебным и методическим материалам,
сократить время на поиск требуемой информации, изучить особенности
классификации информационных ресурсов сети Интернет.
Полезными являются собранные на порталах ссылки на ресурсы,
содержащие контактную информацию об учреждениях образования и
отдельных педагогах, новости сферы образования, объявления об
олимпиадах, конкурсах, конференциях и других мероприятиях, в которых
регулярно принимают участие и педагоги, и студенты.
Современный этап развития сферы образования характеризуется массовым
внедрением информационных и телекоммуникационных технологий в
деятельность всех участников образовательного процесса.
Информатизация является одним из основных факторов, заставляющих
образование совершенствоваться. Развиваются содержание и методы
обучения, меняется роль педагога, который постепенно превращается из
транслятора знаний в организатора деятельности обучаемых по
приобретению новых знаний, умений и навыков. Существенным средством
информатизации выступают образовательные информационные ресурсы,
опубликованные в сети Интернет.
23. Опишите организационную схему создания образовательных порталов.
Порталы разделяются на общероссийские, межрегиональные и
региональные. Корпоративные порталы/сайты подразделяются на
коллективные порталы образовательных организаций (ассоциаций,
консорциумов и т. п.) и порталы (чаще, сайты) учебных заведений. Таким
образом, в формируемой российской системе образовательных порталов
возможно выделение нескольких основных уровней.
Верхний уровень представлен ведущим горизонтальным порталом
«Российское образование», предусматривающим систему его
полнофункциональных копий в федеральных округах. Общая структура и
сервисы портала «Российское образование» и его копий совпадают, но
информационное содержание может варьироваться за счет того, что в
копиях могут содержаться специфические региональные компоненты и
мультимедиа-ресурсы.
На следующем уровне располагаются региональные образовательные
порталы, которые объединяют ресурсы нижних уровней - порталы и сайты
вузов, школ и других организаций. Важными элементами в системе
являются порталы-спутники, связанные с образованием и создаваемые в
рамках крупных самостоятельных коммерческих или некоммерческих
проектов.
24. Назовите основные филологические порталы.
Philology.ru - Русский филологический портал

Filologia.su - Филология и лингвистика. Новый всеобъемлющий каталог


ссылок с десятками тематических рубрик.

ruthenia.ru - Филология в Сети - Поиск по филологическим сайтам

Грамота. Ру - универсальный интернет-проект, посвященный русскому


языку
25. Какие возможности повышения эффективности процесса обучения
предоставляют мельтимедийные технологии?
Мультимедийные продукты и услуги Интернета предоставляют
широчайшие возможности повышения эффективности процесса обучения:
• одновременное использование нескольких каналов восприятия
обучающихся в процессе обучения, за счет чего достигается
интеграция информации, доставляемой несколькими различными
органами чувств;
• возможность имитации сложных реальных ситуаций и
экспериментов;
• визуализация абстрактной информации за счет динамического
представления процессов;
• возможность развить когнитивные структуры и интерпретации
учащихся, обрамляя изучаемый материал в широкий учебный,
общественный, исторический контекст, и связывая учебный
материал с интерпретацией учащегося.
Фактически мы имеем дело с принципом наглядности в обучении, который
разработан давно, но требует дальнейшего научного развития в новых
условиях применения ИТ в образовании.
26. Каким образом использование мультимедиа индивидуализирует процесс
обучения?
Использование мультимедиа позволяет обучающимся самостоятельно
работать над учебными материалами и самостоятельно решать, как
изучать материалы, в какой последовательности и как использовать
интерактивные возможности мультимедийных программ, как реализовать
совместную работу с другими членами учебной группы. Таким образом,
обучающиеся становятся активными участниками образовательного
процесса.
Обучающиеся могут влиять на свой собственный процесс обучения,
подстраивая его под свои индивидуальные способности и предпочтения. Они
могут изучать именно тот материал, который их интересует, повторять
материал столько раз, сколько им нужно, и это помогает устранить
многие препятствия их индивидуальному восприятию.
27. Каковы основные проблемы использования мультимедиа в образовании?
Чрезмерная «автономия» обучающихся. Некоторые обучающихся
неспособны воспользоваться той свободой, которую предоставляют
самостоятельное обучение посредством мультимедийных материалов,
основанных на гипертексте.
28. Что такое коммуникация?
Коммуникация - (лат. communicatio, от communico — делаю общим,
связываю, общаюсь) — общение, обмен мыслями, сведениями, идеями и т.д.
— специфическая форма взаимодействия людей в процессе их
познавательно-трудовой деятельности.
29. Что понимается под компьютерно-человеческим взаимодействием?
Взаимодействие компьютер-человек, как правило, осуществляется в
диалогической форме. Следует, однако, учитывать ограниченность такого
диалога, т.е. невозможность предусмотреть все нюансы реального диалога
обучаемого с обучающим, в данном случае с компьютером. В отличие от
любых других технических средств обучения компьютерные обучающие
системы обладают интерактивностью, т.е. способностью немедленно
реагировать на вопрос или действие обучаемого или предъявлять вопрос,
сообщение, информацию обучаемому. (см. презентацию №8)
30. Что называется вопросно-ответными системами?
Вопросно-ответная система – это информационная система, являющаяся
гибридом поисковых, справочных и интеллектуальных систем, которая
использует естественно-языковой интерфейс.
На вход такой системе подаётся запрос, сформулированный на
естественном языке, после чего он обрабатывается с использованием
методов NLP, и генерируется естественноязыковой ответ.
31. Какие основные этапы функционирования QA системы?
В качестве базового подхода к задаче поиска ответа на вопрос обычно
применяется следующая схема: сначала система тем или иным образом
(например, поиском по ключевым словам) отбирает документы,
содержащие информацию, связанные с поставленным вопросом, затем
фильтрует их, выделяя отдельные текстовые фрагменты, потенциально
содержащие ответ, после чего из отобранных фрагментов генерирующий
модуль синтезирует ответ на вопрос.
32. В чем заключалась особенность систем BASEBALL, LUNAR, ELIZA1,
UNIX, SNUKA, RESEARCHER, TAILOR и ПОЭТ?
(см. Презентацию 9)
33. Каково место естественного перевода в комплексе вопросов прикладной
лингвистики?
34. Чем «естественный» перевод отличается от машинного?
Первоначально предполагалось, что системы машинного перевода смогут
осуществлять перевод научно-технических текстов любых типов, что
позволит отказаться от дорогостоящего труда обычных переводчиков.
Оказалось, однако, что создание систем машинного перевода требует
существенной и нетривиальной информации о функционировании
естественного языка, которая отсутствовала в традиционных
грамматических описаниях. Кроме того, компьютерное моделирование
способности человека к переводу с одного языка на другой требовало учета
не только лингвистических, но и психологических, социальных и других
факторов. Первые попытки разработки программ автоматического
перевода оказались неудовлетворительными: результаты перевода ЭВМ
требовали серьезного редактирования, а стоимость машинного перевода
зачастую была выше оплаты труда обычного переводчика.
35. Каковы основные этапы машинного перевода?
В алгоритме машинного переводчика выявляются следующие основные
части, используемые для подготовки и анализа перевода слов.
Тут выделяются две главные части: анализ переводимого текста и синтез
перевода. Перевод осуществляется, обычно, пофразно.

Этапы анализа таковы: ввод фразы, лексический анализ (на уровне слов и
частей речи), поверхностный анализ (на уровне членов предложения),
глубинный синтаксический анализ (учитывающий смысловые связи между
словами).
В результате возникает внутреннее представление фразы, отражающее ее
смысл.
Логика работы электронного переводчика лежит в рамках правил
«истинно» и «ложно».
36. Каковы формы организации взаимодействия ЭВМ и человека при
машинном переводе.
Формы организации взаимодействия ЭВМ и человека
при машинном переводе
С постредактированием: исходный текст перерабатывается машиной, а
человек-редактор исправляет результат.
С предредактированием: человек приспосабливает текст к обработке
машиной (устраняет возможные неоднозначные прочтения, упрощает и
размечает текст), после чего начинается программная обработка.
С интерредактированием: человек вмешивается в работу системы
перевода, разрешая трудные случаи.
Смешанные системы (например, одновременно с пред- и
постредактированием).
Частично автоматизированный перевод: например, использование
переводчиком-человеком компьютерных словарей.
Системы с разделением труда: компьютер обучен переводить только
фразы жёстко заданной структуры (но делает это так, чтобы исправлять
за ним не требовалось), а всё не уложившееся в схему отдает человеку.
37. Чем занимается корпусная лингвистика?
Корпусная лингвистика, разрабатывающая общие принципы построения
лингвистических корпусов данных с использованием современных
компьютерных технологий, связана с оптимизацией гносеологической
функции языка и является одной из перспективных областей прикладной
лингвистики. Кроме собственно конструирования корпусов данных,
корпусная лингвистика занимается созданием компьютерных
инструментов, предназначенных для их обработки.
38. Что представляет собой корпус текстов?
Частным случаем корпуса данных является корпус текстов. В качестве
единиц последнего выступают тексты или их достаточно значительные
фрагменты.
39. Какими бывают корпусы текстов?
Среди корпусов текстов выделяются «исследовательские корпусы» и
«иллюстративные корпусы». Первые предназначены преимущественно для
изучения различных аспектов функционирования языковой системы; они
строятся до проведения какого-либо исследования. Иллюстративные
корпусы создаются после проведения научного исследования: их цель не
столько выявить новые факты, сколько подтвердить и обосновать уже
полученные результаты.
Второе важное разграничение касается динамических (мониторных) и
статических корпусов. Первоначально корпусы текстов создавались как
статические образования, отражающие определенный временной срез
языковой системы. Типичными представителями этого вида корпусов
являются авторские корпусы – коллекции текстов писателей, например
Корпус художественных текстов Ф.М.Достоевского (Институт русского
языка РАН).
Однако значительная часть чисто лингвистических и не только
лингвистических задач требует выявления исторических изменений в
функционировании языковых явлений – например, изменений значения слов,
частоты использования тех или иных синтаксических конструкций и т.д.
Для этого была разработана специальная технология построения и
эксплуатации динамического корпуса текстов. В имеющейся литературе
такие корпусы получили также название мониторных. Особенность сборки
мониторных корпусов заключается в том, что они не предполагают раз и
навсегда заданного набора текстов. В течение заранее фиксированного
промежутка времени происходит обновление и/или дополнение множества
текстов корпуса. Иначе говоря, корпус текстов – это собрание текстов в
электронной форме, представляющих данный язык (на определенном этапе
его существования), отображающий данный язык во всем многообразии
жанров, стилей, территориальных и социальных вариантов и т.п.
40. В чем отличие корпуса текстов от электронной библиотеки?
Среди множества определений корпуса можно выделить его главные
свойства:
электронный — в современном понимании корпус должен быть в
электронном виде
репрезентативный — должен хорошо «представлять» объект, который
моделирует
размеченный — главное отличие корпуса от коллекции текстов
прагматически ориентированный — должен быть создан под
определённую задачу (Википедия)
41. Какими качествами должны обладать национальные корпусы языков?
Среди множества определений корпуса можно выделить его главные
свойства:
электронный — в современном понимании корпус должен быть в
электронном виде
репрезентативный — должен хорошо «представлять» объект, который
моделирует
размеченный — главное отличие корпуса от коллекции текстов
прагматически ориентированный — должен быть создан под
определённую задачу (Википедия)
42. Для чего предназначены лингвистические базы данных?
В современной лингвистике компьютерное представление информации на
основе технологии БД используется в самых разных областях: в
типологических и сравнительных, фонетических, лексических,
грамматических исследованиях; лексикографии; семантических
исследованиях, включая составление тезаурусов; в компьютерной
лингвистике и для решения прикладных лингвистических задач
(лингводидактических, автоматизированного перевода, автоматического
распознавания и синтеза речи).
Технология БД используется в процессе создания как традиционных, так и
электронных словарей. Активно разрабатываются словарные БД
специальной и терминологической лексики.
43. Чем занимается компьютерная лексикография?
Компью́терная лексикогра́фия — прикладная научная дисциплина в
языкознании, которая изучает методы использования компьютерной
техники для составления словарей . Это временная дисциплина периода
перехода от ручной и рукописной лексикографической практики к новым
безбумажным информационным технологиям[1]. (Википедия)
44. Что представляют собой автоматические словари?
An electronic dictionary is a dictionary whose data exists in digital form and can
be accessed through a number of different media.[1] Electronic dictionaries can be
found in several forms, including software installed on tablet or desktop
computers, mobile apps, web applications, and as a built-in function of E-readers.
They may be free or require payment. (Википедия)

Вам также может понравиться