Вы находитесь на странице: 1из 5

Вопрос Ответ

Что такое DraCor? Программируемый корпус текстов на 11-ти


языках, с помощью которого можно прочитать
пьесу, наглядно рассмотреть отношения между
персонажами и даже поиграть в карточную
игру.
Команда разработчиков Франк Фишер, Даниил Андреевич Скоринкин,
Борис Валерьевич Орехов, Иван Сергеевич
Поздняков.

Easy Linavis это - … приложение, которое позволяет легко


визуализировать социальные сети.
преимущество «программируемых корпусов» Технически они получаются менее сложными,
чем программы «все-в-одном».
DraCor Shiny app также служит для…? для визуализации социальных сетей, однако это
приложение использует не пользовательские
данные, а информацию из DraCor.

/Исследование на основе текста трагедии А.П. Сумароков «Хорев»/


Предмет исследования: текст трагедии А.П. Сумароков «Хорев»
Задача: проследить распределение речи персонажей (выражающееся количеством монологов,
диалогов, полилогов) по сценам по методике Ярхо.
Материал: корпус текстов DraCor.
Ход выполнения: перейти по адресу https://dracor.org, во вкладке Corpora выбрать Russian
Drama Corpus, в корпусе найти текст трагедии «Хорев», в разделе Speech Distribution в правой
вкладке выбрать Yarkho, в поле с графиком выбрать Speech distribution. Проанализировать
полученный результат.
Результат исследования: речь персонажей трагедии «Хорев» распределяется крайне
неравномерно: от 2 персонажей в 12 сценах до 5 персонажей в 1 сцене.
Вопрос Ответ
Сервис Voyant Tools создан для…? для анализа текстовых данных в Digital
Humanities.
Какая проблема может возникнуть при работе с «Зашумленность» текста из-за затрудненной
корпусом японских текстов в Voyant Tools? токенизации японского языка
Каким образом её можно решить? Удалить все вспомогательные глаголы и
частицы, добавить (или редактировать уже
существующий) список стоп-слов
Принцип взаимодействия Voyant Tools и текста Слова текста распределяются по частотным
блокам: Cirrus (облако слов), TermsBerry
(визуализация, которая показывает связи слов
друг с другом), и Summary (статистика корпуса)
Каким образом были получены данные для Получены при помощи парсера YouTube Data
анализа? Tools, модуля сбора данных о видео и
комментариям к нему.

/Исследование на основе текста трагедии А.П. Сумароков «Хорев»/


Предмет исследования: текст трагедии А.П. Сумароков «Хорев»
Задача: проследить количество упоминаний персонажа Хорева в тексте трагедии А.П.
Сумароков «Хорев»
Материал: сервис Voyant Tools, текст произведения «Хорев» в формате txt
Ход исследования: перейти по адресу https://voyant-tools.org, нажав кнопку Upload, загрузить
документ в формате txt с текстом произведения, нажать на кнопку Reveal. В левой части выбрать
вкладку Terms, в строке поиска ввести «Хорев».
Результат исследования: в тексте произведения обнаружено 8 упоминаний фамилии Хорев.
/Отчёт о прохождении курса/
Курс «Основы Компьютерной Лингвистики» прошёл для Синчука Владислава
Александровича очень быстро и интересно. Синчук Владислав Александрович узнал очень много
новых вещей, познакомился с различными сервисами и проектами, направленными на КЛ.
С точки зрения сложности, курс довольно прост и легок на подъём. Синчук Владислав
Александрович считает, что, если студенты говорят, что курс трудный, просто не хотят начать в нём
разбираться и вникнуть в саму его суть. Признаюсь, были трудные работы, но невыполнимых – нет.
С точки зрения количества работа – тут полный порядок. Каждая работа курса затрагивала
определённый аспект «Компьютерной Лингвистики». Синчук Владислав Александрович считает это
правильным.
С точки зрения трудозатрат, то тут всё очевидно – если «тупить» и не желать вникать в
ситуацию, то и за неделю ничего не сделаешь. Но стоит немного «расшевелить» мозг, как сразу всё
становилось простым. Синчуку Владиславу Александровичу приходилось очень часто «напрягать»
мозги
Самыми объёмными были работы с корпусами. Бесчисленное количество материала, ссылок,
заданий – и всё это надо пройти за несколько пар. Но познакомиться было довольно интересно и
занимательно. Синчук Владислав Александрович очень доволен своим результатом прохождения
курса и полученными знаниями тоже.
Недостатки курса я считаю очень незначительны, на фоне всего пособия, такие как: битые
ссылки, опечатки и т.п. Синчук Владислав Александрович считает, что это всё незначительные
помарки, которые никак не влияют на качество и доступность. Оформление приятно глазам,
навигация до безобразия проста.
Синчук Владислав Александрович желает курсу только дальнейшего развития и пополнения
новыми разделами и источниками. Кроме того, будет не лишним введение большего количества
работ связанных с созданием голосовых ассистентов. Так как эта отрасль довольно широко
применяется во многих сферах деятельности.
/Исследование на основе текста сочинения «Отчёт о прохождении курса»/
Предмет изучения: текст сочинения «Отчёт о прохождении курса».
Задача: посчитать количество упоминаний фамилии Синчук в тексте сочинения.
Материал исследования: сервис Voyant-tools.org, txt-файл сочинения.
Ход исследования: перейти по адресу https://voyant-tools.org, нажав кнопку Upload, загрузить
документ в формате txt с текстом сочинения, нажать на кнопку Reveal. В левой части выбрать
вкладку Terms, в строке поиска ввести фамилию Синчук.
Результат исследования: обнаружено 6 упоминаний фамилии Синчук в тексте сочинения.

Вам также может понравиться