Открыть Электронные книги
Категории
Открыть Аудиокниги
Категории
Открыть Журналы
Категории
Открыть Документы
Категории
Этапы анализа таковы: ввод фразы, лексический анализ (на уровне слов и
частей речи), поверхностный анализ (на уровне членов предложения),
глубинный синтаксический анализ (учитывающий смысловые связи между
словами).
В результате возникает внутреннее представление фразы, отражающее ее
смысл.
Логика работы электронного переводчика лежит в рамках правил
«истинно» и «ложно».
36. Каковы формы организации взаимодействия ЭВМ и человека при
машинном переводе.
Формы организации взаимодействия ЭВМ и человека
при машинном переводе
С постредактированием: исходный текст перерабатывается машиной, а
человек-редактор исправляет результат.
С предредактированием: человек приспосабливает текст к обработке
машиной (устраняет возможные неоднозначные прочтения, упрощает и
размечает текст), после чего начинается программная обработка.
С интерредактированием: человек вмешивается в работу системы
перевода, разрешая трудные случаи.
Смешанные системы (например, одновременно с пред- и
постредактированием).
Частично автоматизированный перевод: например, использование
переводчиком-человеком компьютерных словарей.
Системы с разделением труда: компьютер обучен переводить только
фразы жёстко заданной структуры (но делает это так, чтобы исправлять
за ним не требовалось), а всё не уложившееся в схему отдает человеку.
37. Чем занимается корпусная лингвистика?
Корпусная лингвистика, разрабатывающая общие принципы построения
лингвистических корпусов данных с использованием современных
компьютерных технологий, связана с оптимизацией гносеологической
функции языка и является одной из перспективных областей прикладной
лингвистики. Кроме собственно конструирования корпусов данных,
корпусная лингвистика занимается созданием компьютерных
инструментов, предназначенных для их обработки.
38. Что представляет собой корпус текстов?
Частным случаем корпуса данных является корпус текстов. В качестве
единиц последнего выступают тексты или их достаточно значительные
фрагменты.
39. Какими бывают корпусы текстов?
Среди корпусов текстов выделяются «исследовательские корпусы» и
«иллюстративные корпусы». Первые предназначены преимущественно для
изучения различных аспектов функционирования языковой системы; они
строятся до проведения какого-либо исследования. Иллюстративные
корпусы создаются после проведения научного исследования: их цель не
столько выявить новые факты, сколько подтвердить и обосновать уже
полученные результаты.
Второе важное разграничение касается динамических (мониторных) и
статических корпусов. Первоначально корпусы текстов создавались как
статические образования, отражающие определенный временной срез
языковой системы. Типичными представителями этого вида корпусов
являются авторские корпусы – коллекции текстов писателей, например
Корпус художественных текстов Ф.М.Достоевского (Институт русского
языка РАН).
Однако значительная часть чисто лингвистических и не только
лингвистических задач требует выявления исторических изменений в
функционировании языковых явлений – например, изменений значения слов,
частоты использования тех или иных синтаксических конструкций и т.д.
Для этого была разработана специальная технология построения и
эксплуатации динамического корпуса текстов. В имеющейся литературе
такие корпусы получили также название мониторных. Особенность сборки
мониторных корпусов заключается в том, что они не предполагают раз и
навсегда заданного набора текстов. В течение заранее фиксированного
промежутка времени происходит обновление и/или дополнение множества
текстов корпуса. Иначе говоря, корпус текстов – это собрание текстов в
электронной форме, представляющих данный язык (на определенном этапе
его существования), отображающий данный язык во всем многообразии
жанров, стилей, территориальных и социальных вариантов и т.п.
40. В чем отличие корпуса текстов от электронной библиотеки?
Среди множества определений корпуса можно выделить его главные
свойства:
электронный — в современном понимании корпус должен быть в
электронном виде
репрезентативный — должен хорошо «представлять» объект, который
моделирует
размеченный — главное отличие корпуса от коллекции текстов
прагматически ориентированный — должен быть создан под
определённую задачу (Википедия)
41. Какими качествами должны обладать национальные корпусы языков?
Среди множества определений корпуса можно выделить его главные
свойства:
электронный — в современном понимании корпус должен быть в
электронном виде
репрезентативный — должен хорошо «представлять» объект, который
моделирует
размеченный — главное отличие корпуса от коллекции текстов
прагматически ориентированный — должен быть создан под
определённую задачу (Википедия)
42. Для чего предназначены лингвистические базы данных?
В современной лингвистике компьютерное представление информации на
основе технологии БД используется в самых разных областях: в
типологических и сравнительных, фонетических, лексических,
грамматических исследованиях; лексикографии; семантических
исследованиях, включая составление тезаурусов; в компьютерной
лингвистике и для решения прикладных лингвистических задач
(лингводидактических, автоматизированного перевода, автоматического
распознавания и синтеза речи).
Технология БД используется в процессе создания как традиционных, так и
электронных словарей. Активно разрабатываются словарные БД
специальной и терминологической лексики.
43. Чем занимается компьютерная лексикография?
Компью́терная лексикогра́фия — прикладная научная дисциплина в
языкознании, которая изучает методы использования компьютерной
техники для составления словарей . Это временная дисциплина периода
перехода от ручной и рукописной лексикографической практики к новым
безбумажным информационным технологиям[1]. (Википедия)
44. Что представляют собой автоматические словари?
An electronic dictionary is a dictionary whose data exists in digital form and can
be accessed through a number of different media.[1] Electronic dictionaries can be
found in several forms, including software installed on tablet or desktop
computers, mobile apps, web applications, and as a built-in function of E-readers.
They may be free or require payment. (Википедия)