Вы находитесь на странице: 1из 3

Лабораторная работа №3.1.

Корпус COCA

10 баллов

Создайте гугл-документа отчета ЛР3.1_Фамилия.doc. В качестве отчета по каждому заданию –


сделайте скриншоты (составленного запроса и полученной поисковой выдачи) и вставьте их в
файл отчета под соответствующим номером задания. В случае, если в задании имеются
вопросы (курсивом) – в отчете необходимо написать ответ на вопрос текстом.

Зайдите на сайт https://www.english-corpora.org/coca/. Он представляет собой один из


интерфейсов для доступа к корпусу COCA.
Зарегистрируйтесь на сайте (как студент) и авторизуйтесь со своим логином и паролем.

Синтагматика и парадигматика слов в корпусе


Поиск по корпусу с помощью вкладки SEARCH

1. Составьте список однокоренных слова с корнем faith (пункт List, запрос в поле ввода
*faith*1).
2. Составьте таблицу распределений однокоренных слов со связанной морфемой –duct–
по жанрам и годам (пункт Chart, запрос *duct*).
3. Составьте:
a. список однокоренных слов со связанной морфемой –duct– (пункт List, запрос
*duct*).
b. конкорданс для одного из слов из найденного списка (кликнуть по слову)
4. Для выбранного слова из найденного списка составьте сводку информации по (пункт
Word, запрос – впечатать слово). На основе полученной выдачи, покажите
(скриншоты) и охарактеризуйте:
a. синонимы слова
b. жанр (подкорпус), в котором лексема наиболее/наименее распространена
c. коллокаты (также пройдите по ссылке Collocates в верхней части выдачи, для
количественных данных)
d. тематически связанной лексики (также пройдите по ссылке Topics, для
количественных данных)
e. кластеры (n-граммы c данной единицей; также пройдите по ссылке Clusters)
f. словарная информация (определение, однокоренные слова, словоформы,
синонимы; ссылка Dictionary)
g. фрагмент конкорданса
5. Найдите слова, в словарных дефинициях которых встречается компонент furniture
(пункт Browse, поле Meaning – furniture, галка напротив Definition)
6. Найдите гипонимы к слову colour (пункт Browse, поле Meaning – colour, галка
напротив SPECIFIC)
7. Найдите гиперонимы к глагольной единице cry (пункт Browse, поле Meaning – cry,
галка напротив GENERAL, поле Part of speech – Verb)
8. Поиск словосочетаний:
a. Найдите существительные, с которыми сочетается глагол design в пределах
одного или двух слов справа (пункт Collocates)
b. Составьте конкорданс для одного из таких сочетаний (кликнуть на слово в
списке)
1
? – в запросе заменяет один любой символ; * - заменяет последовательность любых символов
9. Составьте сравнительные списки прилагательных, показывающих использование
существительного sketch и одного из его синонимов (см. словарную карточку) с
этими прилагательными в пределах одного или двух слов слова от него (пункт
Compare). Какие прилагательные используются с обоими словами? Какие только с
одним из синонимов?
10. Составьте конкорданс любого слова на выбор в формате KWIC, установите
сортировку по контексту слева от слова (пункт KWIC). Какие выводы о
сочетаемости слева для выбранного слова можно сделать?
11. Сравните использование слова однокоренных слов с корнем –light– в подкорпусе
академических (Academic) и разговорных (Spoken) текстов (пункт List, опция
Sections)
12. Создайте виртуальный корпус, включающий обзор из интернета и блогов (пункт
List, опция Texts/Virtual  Create corpus). Сохраните составленный корпус под
именем Reviews (Save as  Submit). Найдите список ключевых слов-
существительных, характеризующих составленный подкорпус (List  Texts/Virtual
 Find Keywords  пункт NOUN в строке корпуса с именем Reviews).

Корпусный анализ текста


Поиск на вкладке Analyze Text

13. Проанализируйте отрывок англоязычного текста. Для начала выберите текст-пример


(sample) из подкорпуса газетных текстов, нажмите Search. По полученной выдаче:
a. Укажите процентное распределение высоко, средне и низкочатотных слов в
отрывке (скриншот).
b. Просмотрите текст с размеченными цветами словами. Какие слова в большей
степени характеризуют тематику текста (высоко-, средне- или
низкочастотные)?
c. Приведите списки высоко, средне и низкочастотных слов с их частотами
(скриншот). Какие из низкочатотных (согласно корпусу) слов встречаются во
фрагменте часто (чаще чем 1)? Можно ли сказать, что эти слова
характеризуют тематику отрывка?
d. Представьте словарную информацию (скриншот) об одной выбранной
единице, низкочастотной в COCA, но частотной в выбранном отрывке
(кликнуть по единице в тексте или в частотном списке)

Работа с синтагмами: поставьте точку напротив пункта PHRASE


14. Составьте перечень словоформ произвольной (3-4-х-словной) глагольной группы из
проанализированного текста, при этом главное существительное во фразе следует
искать во всех ее парадигматических формах (во всех лицах, числах и т.д. глагола)
(скриншот запроса и поисковой выдачи).
Напр., скриншот запроса, где BE – во всех формах

Составьте конкорданс для наиболее частотного из найденных морфологических


вариантов (скриншот).
15. Замените одно из слов в запросе на перечень синонимов (скриншот запроса и
поисковой выдачи). Напр.,

16. Составьте диаграмму распределения данного словосочетания по жанрам и годам


(опция chart). Напр.,

17. Составьте запрос на поиск словосочетания, где часть компонентов выражения в


терминах частей речи (скриншот запроса и выдачи). Например:

Составьте конкорданс наиболее частотного из найденных словосочетаний (скриншот)


18. Составьте словосочетание с использованием подстановок wildcard (*), синонима,
части речи в отдельные позиции сочетания. Например,

(В отчете – скриншота запроса, списка выдачи, конкорданса наиболее частотного


сочетания).

ОТЧЕТ. Ссылка на гугл-документ с отчетом по заданиям.

Вам также может понравиться