Что такое DraCor? Программируемый корпус текстов на 11-ти
языках, с помощью которого можно прочитать пьесу, наглядно рассмотреть отношения между персонажами и даже поиграть в карточную игру. Команда разработчиков Франк Фишер, Даниил Андреевич Скоринкин, Борис Валерьевич Орехов, Иван Сергеевич Поздняков.
Easy Linavis это - … приложение, которое позволяет легко
визуализировать социальные сети. преимущество «программируемых корпусов» Технически они получаются менее сложными, чем программы «все-в-одном». DraCor Shiny app также служит для…? для визуализации социальных сетей, однако это приложение использует не пользовательские данные, а информацию из DraCor.
/Исследование на основе текста трагедии А.П. Сумароков «Хорев»/
Предмет исследования: текст трагедии А.П. Сумароков «Хорев» Задача: проследить распределение речи персонажей (выражающееся количеством монологов, диалогов, полилогов) по сценам по методике Ярхо. Материал: корпус текстов DraCor. Ход выполнения: перейти по адресу https://dracor.org, во вкладке Corpora выбрать Russian Drama Corpus, в корпусе найти текст трагедии «Хорев», в разделе Speech Distribution в правой вкладке выбрать Yarkho, в поле с графиком выбрать Speech distribution. Проанализировать полученный результат. Результат исследования: речь персонажей трагедии «Хорев» распределяется крайне неравномерно: от 2 персонажей в 12 сценах до 5 персонажей в 1 сцене. Вопрос Ответ Сервис Voyant Tools создан для…? для анализа текстовых данных в Digital Humanities. Какая проблема может возникнуть при работе с «Зашумленность» текста из-за затрудненной корпусом японских текстов в Voyant Tools? токенизации японского языка Каким образом её можно решить? Удалить все вспомогательные глаголы и частицы, добавить (или редактировать уже существующий) список стоп-слов Принцип взаимодействия Voyant Tools и текста Слова текста распределяются по частотным блокам: Cirrus (облако слов), TermsBerry (визуализация, которая показывает связи слов друг с другом), и Summary (статистика корпуса) Каким образом были получены данные для Получены при помощи парсера YouTube Data анализа? Tools, модуля сбора данных о видео и комментариям к нему.
/Исследование на основе текста трагедии А.П. Сумароков «Хорев»/
Предмет исследования: текст трагедии А.П. Сумароков «Хорев» Задача: проследить количество упоминаний персонажа Хорева в тексте трагедии А.П. Сумароков «Хорев» Материал: сервис Voyant Tools, текст произведения «Хорев» в формате txt Ход исследования: перейти по адресу https://voyant-tools.org, нажав кнопку Upload, загрузить документ в формате txt с текстом произведения, нажать на кнопку Reveal. В левой части выбрать вкладку Terms, в строке поиска ввести «Хорев». Результат исследования: в тексте произведения обнаружено 8 упоминаний фамилии Хорев. /Отчёт о прохождении курса/ Курс «Основы Компьютерной Лингвистики» прошёл для Синчука Владислава Александровича очень быстро и интересно. Синчук Владислав Александрович узнал очень много новых вещей, познакомился с различными сервисами и проектами, направленными на КЛ. С точки зрения сложности, курс довольно прост и легок на подъём. Синчук Владислав Александрович считает, что, если студенты говорят, что курс трудный, просто не хотят начать в нём разбираться и вникнуть в саму его суть. Признаюсь, были трудные работы, но невыполнимых – нет. С точки зрения количества работа – тут полный порядок. Каждая работа курса затрагивала определённый аспект «Компьютерной Лингвистики». Синчук Владислав Александрович считает это правильным. С точки зрения трудозатрат, то тут всё очевидно – если «тупить» и не желать вникать в ситуацию, то и за неделю ничего не сделаешь. Но стоит немного «расшевелить» мозг, как сразу всё становилось простым. Синчуку Владиславу Александровичу приходилось очень часто «напрягать» мозги Самыми объёмными были работы с корпусами. Бесчисленное количество материала, ссылок, заданий – и всё это надо пройти за несколько пар. Но познакомиться было довольно интересно и занимательно. Синчук Владислав Александрович очень доволен своим результатом прохождения курса и полученными знаниями тоже. Недостатки курса я считаю очень незначительны, на фоне всего пособия, такие как: битые ссылки, опечатки и т.п. Синчук Владислав Александрович считает, что это всё незначительные помарки, которые никак не влияют на качество и доступность. Оформление приятно глазам, навигация до безобразия проста. Синчук Владислав Александрович желает курсу только дальнейшего развития и пополнения новыми разделами и источниками. Кроме того, будет не лишним введение большего количества работ связанных с созданием голосовых ассистентов. Так как эта отрасль довольно широко применяется во многих сферах деятельности. /Исследование на основе текста сочинения «Отчёт о прохождении курса»/ Предмет изучения: текст сочинения «Отчёт о прохождении курса». Задача: посчитать количество упоминаний фамилии Синчук в тексте сочинения. Материал исследования: сервис Voyant-tools.org, txt-файл сочинения. Ход исследования: перейти по адресу https://voyant-tools.org, нажав кнопку Upload, загрузить документ в формате txt с текстом сочинения, нажать на кнопку Reveal. В левой части выбрать вкладку Terms, в строке поиска ввести фамилию Синчук. Результат исследования: обнаружено 6 упоминаний фамилии Синчук в тексте сочинения.