Вы находитесь на странице: 1из 6

134 Вопросы языкознания 2017.

№ 2

1 N. Levshina. How to do linguistics with R. Amsterdam: John Benjamins, 2015. xii + 443 p. 1
2 ISBN 978-90-272-1224-5 *. 2
3 3
4 Александр Чедович Пиперски Alexander Ch. Piperski 4
5 5
Национальный исследовательский университет National Research University Higher School of
6 6
«Высшая школа экономики», Москва, 101000, Economics, Moscow, 101000, Russian Federation;
7 Российская Федерация; apiperski@gmail.com apiperski@gmail.com 7
8 8
9 Рецензируемая книга — введение в статистику для лингвистов с упором на использо- 9
10 вание популярной статистической среды R [R Core Team 2014]. Книга содержит 20 глав 10
11 и два приложения, посвященных техническим аспектам работы с R. В главе 1 обсуждаются 11
12 основные понятия статистики: нулевая и альтернативная гипотеза, статистическая значи- 12
13 мость, типы ошибок, двусторонние и односторонние тесты, типы переменных. В главе 2 13
14 автор предлагает краткое введение в язык R, а последующие 18 глав посвящены примене- 14
15 нию различных статистических методов к лингвистическим данным. 15
16 В главах 3 и 4 обсуждается описательная статистика в применении к количественным 16
17 и категориальным переменным. В главе 5 автор переходит к сравнению выборок с по- 17
18 мощью параметрических и непараметрических методов. В главах 6—7 речь идет о кор- 18
19 реляции и линейной регрессии, а глава 8 посвящена дисперсионному анализу (ANOVA). 19
20 В главе 9 рассказывается о связях между категориальными переменными; пожалуй, это 20
21 самая важная глава книги, поскольку анализ таблиц сопряженности — едва ли не самое 21
22 распространенное применение статистики в лингвистических работах. Главы 10—11 по- 22
23 священы коллокациям и коллострукциям (collostructions), в них подробно анализируются 23
24 различные меры ассоциации. В главах 12—13 речь идет о логистической регрессии — как 24
25 бинарной, так и мультиномиальной. В главе 14 автор рассказывает про деревья решений 25
26 и random forests. В главах 15—16 описывается кластеризация на основе различных мето- 26
27 дов измерения расстояний между объектами. В главах 17—19 представлены различные 27
28 методы уменьшения размерности данных: многомерное шкалирование, факторный анализ, 28
29 метод главных компонент, анализ соответствий. Глава 20 посвящена динамической визуа- 29
30 лизации языковых изменений. 30
31 Н. Левшина использует примеры из самых разных областей лингвистики и из разных 31
32 языков (хотя по большей части все-таки из английского). Так, в главе 7 анализируются пси- 32
33 холингвистические данные (время реакции на стимулы разной длины, разных частей речи 33
34 и разной частотности), в главе 8 речь идет о синтаксических особенностях никарагуан- 34
35 ского жестового языка, в главе 9 — об употреблении метафор в различных типах англий- 35
36 ских текстов, в главе 12 — о нидерландских каузативных конструкциях с глаголами doen 36
37 ‘делать’ и laten ‘позволять’, в главе 16 — о дистрибутивной семантике. Разумеется, через 37
38 всю книгу, хотя и ненавязчиво, проходят идеи и методы корпусной лингвистики: источни- 38
39 ками данных для примеров преимущественно являются не эксперименты, а корпуса. Раз- 39
40 нообразие анализируемых данных выгодно отличает книгу Н. Левшиной от некоторых дру- 40
41 гих книг по статистике для лингвистов, например [Gries 2009; Larson-Hall 2010], которые 41
42 намеренно ограничивают себя одной узкой областью, будь то корпусная лингвистика или 42
43 освоение второго языка. Впрочем, из этого же следует, что данная книга вряд ли сможет 43
44 служить настольной книгой по статистике для специалистов в какой бы то ни было узкой 44
45 области знания: психолингвистов, компьютерных лингвистов и т. д. 45
46 Книга Н. Левшиной — превосходный практический справочник по работе с R. Все ста- 46
47 тистические выкладки снабжены кодом, который читатель может тестировать на своем 47
48 собственном компьютере, а инструкции по использованию среды R отличаются четко- 48
49 стью и ясностью. Левшина уделяет большое внимание визуализации данных, предлагая 49
50 читателю пользоваться не только базовыми графическими возможностями R, но и пакетом 50
51 51
52 * Автор рецензии благодарит А. А. Сорокина за ценные замечания и дополнения. 52

Версия 02.02.2017 (20:36)


А. Ч. Пиперски 135

1 ggplot2. Изложение наглядно показывает, что лингвисту полезно помнить, что нужные 1
2 ему статистические методы чаще всего уже реализованы в одном из бесчисленных суще- 2
3 ствующих дополнительных пакетов для R: автор предлагает пользоваться более чем 30 та- 3
4 кими пакетами разной степени известности. Разумеется, запомнить все эти пакеты и входя- 4
5 щие в них функции невозможно, да и не нужно — всегда можно справиться в документа- 5
6 ции. Но, конечно, даже то, что упомянуто в этой книге, лишь капля в море: так, например, 6
7 в главе 17 из пакетов для картографирования упоминаются только fields и rworldmaps, 7
8 хотя число таких пакетов на момент написания рецензии заметно превышает сотню [Мо- 8
9 роз 2015; Bivand 2016]. 9
10 Рецензируемая книга примечательна обилием и высоким качеством электронных сопро- 10
11 водительных материалов, которые собраны на сайте http://dx.doi.org/10.1075/z.195.website. 11
12 Там можно найти 44 упражнения и 93 вопроса на понимание прочитанного, все фрагменты 12
13 программного кода, представленные в книге (так что читателю не придется перенабирать 13
14 их вручную), а также пакет Rling для R, содержащий в себе все наборы данных, исполь- 14
15 зованные в книге, и написанные автором функции. Жаль, правда, что этот пакет не выложен 15
16 ни в какой публичный репозиторий, например [CRAN], и поэтому его приходится устанав- 16
17 ливать вручную, а не при помощи простейшей команды install.packages(«Rling»). 17
18 Благодаря большому количеству упражнений и наборов данных эта книга может сильно 18
19 облегчить жизнь преподавателям статистики для лингвистов: даже не будучи лингвистами, 19
20 они смогут использовать в своей работе готовые примеры, связанные с языкознанием. 20
21 Как и любую другую книгу такого объема, работу Н. Левшиной можно подловить на мел- 21
22 ких непоследовательностях, неточностях и некорректностях. Так, для обозначения катего- 22
23 риальных переменных принято неудачное терминологическое решение: на с. 18 термины 23
24 «qualitative» и «categorical» вводятся как синонимы, затем слово «qualitative» используется 24
25 в заглавии главы 4, специально посвященной именно таким переменным, после чего не- 25
26 сколько раз упоминается в главах 18 и 19, тогда как во всех остальных главах употребля- 26
27 ется «categorical». На с. 166 обнаруживается некоторая небрежность в использовании 27
28 статистических терминов: «В идеале всякая построенная модель должна тестироваться 28
29 на новых данных (это называется скользящим контролем» 1. Однако термин cross-validation 29
30 (скользящий контроль, перекрестная проверка) применяется именно что не к тестирова- 30
31 нию на новых данных, а к разделению одного и того же набора входных данных на обу- 31
32 чающую и тестовую выборку разными способами, которое позволяет удостовериться, что 32
33 модель во всех этих случаях работает примерно одинаково, а значит, не оказалась переоб- 33
34 ученной (то есть чрезмерно подогнанной под обучающие данные). На с. 200, где речь идет 34
35 о связях между категориальными переменными, говорится, что цель исследования состоит 35
36 в том, чтобы установить, являются ли переменные Variety и Construction независимыми 36
37 или зависимыми (связанными). Однако термин «зависимая переменная» (и его англий- 37
38 ский аналог «dependent variable») так не употребляется: обычно одну переменную назы- 38
39 вают зависимой, а другую или несколько других — независимыми. На с. 209 и 217 автор 39
40 упрекает коэффициент φ за то, что он может давать значения в более широком диапазоне, 40
41 чем от −1 до 1, для таблиц, больших, чем 2 × 2. Однако это не так: только для таблиц 2 × 2 41
42 этот коэффициент и определен; правда, функция assocstats в пакете vcd той версии, 42
43 которую использовала Н. Левшина, видимо, выдавала для бо́льших таблиц те же значения, 43
44 что и V Крамера, однако сейчас это уже исправлено, и в таких случаях сообщается Phi- 44
45 Coefficient: NA. На с. 224 приводится статистика поиска по Британскому националь- 45
46 ному корпусу (BNC) слов bonsai и tree в сочетании и не в сочетании друг с другом, од- 46
47 нако воспроизвести приведенные автором результаты в точности мне не удалось ни по од- 47
48 ному из распространенных интерфейсов поиска по BNC, будь то BYU-BNC, BNCWeb или 48
49 SketchEngine, а Н. Левшина, к сожалению, не указывает, какой именно системой поиска 49
50 она пользовалась (возможно, что это собственный поиск по публично доступным файлам 50
51 51
52 1 «Ideally, every fitted model should be tested on new data (this is called cross-validation)». 52

Версия 02.02.2017 (20:36)


136 Вопросы языкознания 2017. № 2

1 BNC, но тогда это стоило бы упомянуть). Впрочем, для содержательной интерпретации 1


2 результатов едва ли важно, встречается ли слово tree 5982 раза (как в BYU-BNC), 6124 2
3 раза (как в SketchEngine), 6132 раза (как в BNCWeb) или 6136 раз (как у Н. Левшиной). 3
4 Немного странным выглядит выбор методов определения коллокаций в главе 10, где лишь 4
5 упомянуты, но не используются две наиболее популярных метрики: взаимная информация 5
6 и z-мера. В программном коде встречаются незначительные опечатки: так, в сноске на с. 159 6
7 предлагается использовать формулы вида y ~ I(x2), хотя в R невозможно ввести над- 7
8 строчный символ и должно быть написано y ~ I(x^2). 8
9 Однако такие мелочи не самое интересное, что можно обсуждать в связи с этой книгой. 9
10 Работа Н. Левшиной заставляет задуматься о гораздо более важных вещах, а именно о том, 10
11 как надо учить лингвистов статистике. Вопрос, как преподавать математику лингвистам, — 11
12 один из важнейших вызовов, стоящих перед российским и мировым лингвистическим об- 12
13 разованием, и готового ответа на него нет. 13
14 Математика проникла в лингвистическое образование в 1950-е — 1960-е гг., но тогда 14
15 наиболее перспективной казалась дискретная математика, а вовсе не статистические ме- 15
16 тоды. Например, в книге [Ахманова и др. 1961] статистике посвящена лишь одна глава, на- 16
17 писанная Р. М. Фрумкиной, да и та удостоилась довольно скептического отзыва от Д. Хейза 17
18 и Д. Мор в предисловии к английскому переводу той же книги [Akhmanova et al. 1963: v— 18
19 vi]. Однако в дальнейшем оказалось, что дискретная математика, в частности математиче- 19
20 ская логика, важна лишь для некоторых узких областей лингвистики (например, для фор- 20
21 мальной семантики), тогда как без статистики сейчас немыслимы ни фонетика, ни психо- 21
22 лингвистика, ни корпусная лингвистика, ни почти что никакая другая область науки о языке. 22
23 Лингвистика в этом отношении сблизилась с социологией, психологией, медициной и мно- 23
24 гими другими науками — как социально-гуманитарными, так и естественными. 24
25 Первый учебник статистики специально для лингвистов, по-видимому, появился в начале 25
26 1970-х гг., причем на русском языке [Головин 1970], а его первый англоязычный аналог — 26
27 лишь спустя 15 лет [Butler 1985] 2. Незадолго до этого, впрочем, вышла книга [Kenny 1982], 27
28 которая предназначалась для литературоведов, но, конечно, стилеметрическую проблема- 28
29 тику, стоящую в центре этой книги, можно с тем же успехом назвать и лингвистической. 29
30 Как бы то ни было, массовой популярности эти книги не достигли, и те, кто желал приме- 30
31 нять статистические методы к языковым данным, так и оставались по большей части ав- 31
32 тодидактами: 32
33 33
В таблицах сумма по столбцам и сумма по строкам никак не хотели сходиться; ка-
34 34
кими хитростями я их одолевал — не буду об этом рассказывать. Доверительные ин-
35 35
тервалы надежности результатов я (как и мои предшественники и сверстники) под-
36 36
считывал очень редко, здесь потомки еще сделают охлаждающие оговорки к нашим
37 37
открытиям [Гаспаров 2001: 316].
38 38
39 Конечно, надо сделать скидку на скромность М. Л. Гаспарова, но, в общем, эта цитата 39
40 не слишком утрирует реальное положение дел, которое стало меняться только начиная 40
41 с конца первого десятилетия XXI в., когда в лингвистике произошел «количественный по- 41
42 ворот» [Janda 2013], а учебники по статистике для лингвистов наконец-то начали появляться 42
43 массово [Baayen 2008; Johnson 2008; Rasinger 2008 / 2013; Gries 2009; 2010 / 2013; Larson-Hall 43
44 2010; Meindl 2011; Cantos Gómez 2012; Jockers 2014; Eddington 2015]. Правда, стоит отме- 44
45 тить, что, хотя издательство «John Benjamins» и выпускает 84 серии книг по лингвистике 45
46 46
47 47
2 Я не упоминаю другую традицию, сформировавшуюся примерно в те же годы — восточноевро-
48 48
пейскую квантитативную лингвистику, представленную, например, работами Г. Альтмана, Р. Г. Пиот-
49 49
ровского, Р. Кёлера (ср. [Пиотровский и др. 1977]), поскольку она явно не стала лингвистическим
50 мейнстримом и, что даже важнее, развивалась и продолжает развиваться вне всякой связи со стати- 50
51 стическими методами, используемыми в большинстве социально-гуманитарных и естественных наук, 51
52 а скорее примыкает к физике и математике. 52

Версия 02.02.2017 (20:36)


А. Ч. Пиперски 137

1 и смежным дисциплинам, рецензируемая книга вышла вне серий, так что совсем уж типо- 1
2 вым этот жанр пока не стал. 2
3 Все перечисленные учебники отличает одно важное свойство: они предназначены для 3
4 читателя с математической подготовкой на школьном уровне и почти не требуют понима- 4
5 ния математических основ того, что в них описывается. Это идет вразрез с российской тра- 5
6 дицией преподавания статистики лингвистам, которая обычно предусматривает глубокое 6
7 погружение в математику. При этом математики, преподающие лингвистам, предпочитают 7
8 не замечать, что даже простые и понятные на их взгляд книги — например [Лагутин 2009] 8
9 с характерным названием «Наглядная математическая статистика» — остаются совершенно 9
10 недоступны лингвистам. 10
11 Книга Н. Левшиной хороша (или, наоборот, плоха — это уж как посмотреть) тем, что она 11
12 написана не для математика, а для лингвиста, который нуждается в статистике, но не пы- 12
13 тается дойти в этой области до самой сути. Ее целевая аудитория — это человек, который 13
14 пусть и не разбирается досконально в устройстве стиральной машины, но был бы не прочь 14
15 носить чистые вещи и даже готов ради этого прочитать инструкцию. Никаких предвари- 15
16 тельных знаний ни по математике, ни по программированию автор от читателя не ожидает 16
17 (так, на с. 259 она специально уточняет, что экспонента — это операция, обратная лога- 17
18 рифмированию). 18
19 Уровень непрозрачности инструкций, которые дает Н. Левшина, возрастает по мере про- 19
20 движения вперед по книге. В начальных главах еще приводятся формулы (например, для 20
21 вычисления выборочного стандартного отклонения на с. 48, для вычисления стандартной 21
22 ошибки и доверительных интервалов при применении z-теста и t-теста на с. 99), но дальше 22
23 их становится все меньше, и, соответственно, все больше информации приходится прини- 23
24 мать на веру. Так, на с. 201 описывается κ Коэна (мера согласия аннотаторов), но опреде- 24
25 ление ей дается только самое общее и притом вербальное, без всяких формул, и остается 25
26 только верить, что если эта мера близка к 1, то это хорошо, а если нет, то плохо. Это же каса- 26
27 ется и некоторых указаний по использованию R: например, на с. 166 говорится, что при ис- 27
28 пользовании функции ols из пакета rms необходимо к обычному перечню аргументов для 28
29 функции lm, которая отвечает за линейную регрессию, добавить x = TRUE и y = TRUE — 29
30 но что означают эти аргументы и для чего они нужны, не объясняется. На с. 328 автор для 30
31 удобства преобразует объект типа data frame в матрицу, однако не уточняет, можно ли без 31
32 этого обойтись или помимо удобства имеются другие соображения. В результате у дале- 32
33 кого от программирования читателя может сложиться впечатление, что при пользовании 33
34 языком R иногда следует выполнять ничем не объяснимые магические действия. Впрочем, 34
35 автор специально оговаривает (с. 2, 21), что обучение программированию на R не входит 35
36 в задачи книги. Лишь однажды (на с. 168) приводится пример пользовательской функции. 36
37 Это позволяет сфокусироваться на основной цели, однако означает, что желающему полно- 37
38 ценно изучить язык R лингвисту неминуемо придется обращаться дополнительно к другим 38
39 учебникам или руководствам. 39
40 Но следует признать, что иногда непрозрачность выглядит вполне оправданно для книги 40
41 такого жанра. Так, Н. Левшина не раз апеллирует к практическому правилу, что количе- 41
42 ство элементов в выборках, которые предполагается сравнивать статистическими мето- 42
43 дами, должно быть больше 30 (с. 88, 95, 99, 109, 126). Откуда берется число 30, читатель 43
44 так и не узнает: упоминания центральной предельной теоремы в книге нет — но, может 44
45 быть, это и к лучшему, потому что сам смысл этого математического утверждения рискует 45
46 остаться непонятным лингвисту даже после долгого объяснения (что уж говорить о его до- 46
47 казательстве). А тем, кто все-таки захочет узнать поподробнее, почему именно 30, можно 47
48 порекомендовать [Johnson 2008: 38—49] или одну из более общих книг по статистике: на- 48
49 пример, [Urdan 2010; Salkind 2014], к которым сама Н. Левшина адресует читателя в конце 49
50 главы 1, посвященной базовым понятиям статистики. Стоит упомянуть в том же ряду 50
51 книгу [Field A. et al. 2012], на которую автор неоднократно ссылается, но не приводит в ка- 51
52 честве рекомендуемой литературы, хотя кажется, что стоило бы это сделать, потому что 52

Версия 02.02.2017 (20:36)


138 Вопросы языкознания 2017. № 2

1 хулиганский стиль Э. Филда (с историями из его детства и примерами про то, имеет ли кока- 1
2 кола спермицидное действие или нет) вполне может привлечь даже читателя, стороняще- 2
3 гося математики. 3
4 Вообще говоря, литературу по статистике можно разделить на три больших класса: для 4
5 математиков, для не-математиков в целом и для специалистов в одной конкретной обла- 5
6 сти науки. Среднему лингвисту, желающему как следует освоить и научиться применять 6
7 статистику, книги первого типа бесполезны или даже вредны, потому что они не дают по- 7
8 нимания, но отбивают интерес. А вот книги второго и третьего типа, кажется, полезно со- 8
9 четать: все-таки есть ощущение, что для усвоения базовых понятий специализированной 9
10 лингвистической книги мало. Я смею усомниться в том, что одной 19-страничной вво- 10
11 дной главы в книге Н. Левшиной окажется достаточно, чтобы понять, что такое, напри- 11
12 мер, статистическая значимость — но, если уже иметь об этом некоторое, хотя бы смут- 12
13 ное представление, эта четкая и ясно написанная глава позволит его упрочить. Более того, 13
14 она вполне может быть полезна и исследователям, прослушавшим курс математической 14
15 статистики, но не применявшим ее методы на практике. На протяжении практически всей 15
16 книги прослеживается одна четкая мысль, важная при применении статистики: нужно 16
17 не просто получить результат, но и правильно проинтерпретировать как его содержание, 17
18 так и значимость. 18
19 Цитировавшийся выше М. Л. Гаспаров вспоминает один свой разговор с С. С. Аверин- 19
20 цевым: 20
21 21
«Послушайте, — сказал он, — был такой фильм с Брижит Бардо, “Бабетта идет
22 22
на войну”: там героиню легкого поведения готовили быть великосветской шпионкой
23 23
и учили ее: “Запомните: Корнель — это сила, Расин — это высокость, Франс — это
24 24
тонкость…” Вам не кажется, что вы зовете именно к такому уровню?» — «Господи! —
25 25
сказал я. — Да если бы у нас все усвоили, что Корнель — это сила, а Франс — это
26 26
тонкость, разве это не было бы уже полпути к идеалу!» Он улыбнулся и не стал спо-
27 27
рить [Гаспаров 2001: 107—108].
28 28
29 То же можно сказать и о книге Н. Левшиной: она, пожалуй, не обеспечит читателю глубо- 29
30 кого понимания статистики, но может быть, не всякий лингвист может и должен достигать 30
31 такого понимания. А вот с тем, чтобы продвинуть лингвиста к идеалу хотя бы на полпути 31
32 и обеспечить его инструментарием для проведения квантитативных исследований, книга 32
33 несомненно справляется очень успешно. 33
34 34
35 35
36 СПИСОК ЛИТЕРАТУРЫ / REFERENCES 36
37 37
38 38
Ахманова и др. 1961 — Ахманова О. С., Мельчук И. А., Падучева Е. В., Фрумкина Р. М. О точных ме-
39 тодах исследования языка (о так называемой «математической лингвистике»). М.: Издательство 39
40 Московского университета, 1961. [Akhmanova O. S., Mel’chuk I. A., Paducheva E. V., Frumkina R. M. 40
41 O tochnykh metodakh issledovaniya yazyka (o tak nazyvaemoi “matematicheskoi lingvistike”) [Exact 41
42 methods in linguistic research: On the so-called “mathematical linguistics”]. Moscow: Izdatel’stvo 42
43 Moskovskogo universiteta, 1961.] 43
44 Гаспаров 2001 — Гаспаров М. Л. Записи и выписки. М.: НЛО, 2001. [Gasparov M. L. Zapisi i vypiski 44
45
[Notes and excerpts]. Moscow: NLO, 2001.] 45
Головин 1970 — Головин Б. Н. Язык и статистика. М.: Просвещение, 1970. [Golovin B. N. Yazyk i
46 46
statistika [Language and statistics]. Moscow: Prosveshchenie, 1970.]
47 47
Лагутин 2009 — Лагутин М. Б. Наглядная математическая статистика. 2-е изд. М.: Бином. Лабора-
48 48
тория знаний, 2010. [Lagutin M. B. Naglyadnaya matematicheskaya statistika [Vivid mathematical
49 statistics]. 2nd ed. Moscow: Binom. Laboratoriya znanii, 2009.] 49
50 Мороз 2015 — Мороз Г. А. Лингвокартографирование: от статических карт к динамическим базам 50
51 данных. Доклад на Открытом научном семинаре Института лингвистики РГГУ, 2015. [Moroz G 51
52 . A. Lingvokartografirovanie: ot staticheskikh kart k dinamicheskim bazam dannykh [Cartography for 52

Версия 02.02.2017 (20:36)


А. Ч. Пиперски 139

1 linguistics: From static maps to dynamic databases]. Talk given at the Open Scientific Seminar of the 1
2 Institute of Linguistics, Russian State University for the Humanities, 2015.] 2
3 Пиотровский и др. 1977 — Пиотровский Р. Г., Бектаев К. Б., Пиотровская А. А. Математиче- 3
4
ская лингвистика. М.: Высшая школа, 1977. [Piotrowski R. G., Bektaev K. B, Piotrowska A. A. 4
Matematicheskaya lingvistika [Mathematical linguistics]. Moscow: Vysshaya shkola, 1977.]
5 5
Akhmanova et al. 1963 — Akhmanova O. S., Mel’chuk I. A., Frumkina R. M, Paducheva E. V. Exact
6 6
methods in linguistic research. Los Angeles: Univ. of California Press, 1963.
7 7
Baayen 2008 — Baayen R. H. Analyzing linguistic data: A practical introduction to statistics using R.
8 Cambridge: Cambridge Univ. Press, 2008. 8
9 Bivand 2016 — Bivand R. CRAN task view: Analysis of spatial data. 2016. Available at: https://cran.r-project. 9
10 org/web/views/Spatial.html [25.09.2016]. 10
11 Butler 1985 — Butler C. Statistics in linguistics. Oxford: Blackwell, 1985. 11
12 Cantos Gómez 2012 — Cantos Gómez P. Statistical methods in language and linguistic research. Oakville: 12
13 Equinox, 2012. 13
14
CRAN — The Comprehensive R Archive Network. Available at: https://cran.r-project.org [25.09.2016]. 14
15
Eddington 2015 — Eddington D. Statistics for linguists: A step-by-step guide for novices. Newcastle-up- 15
on-Tyne: Cambridge Scholars Publishing, 2015.
16 16
Field A. et al. 2012 — Field A. P., Miles J., Field Z. Discovering statistics using R. London: SAGE, 2012.
17 17
Gries 2009 — Gries S. T. Quantitative corpus linguistics with R: A practical introduction. New York (NY):
18 Routledge, 2009. 18
19 Gries 2010 / 2013 — Gries S. T. Statistics for linguistics with R: A practical introduction. 1st ed. Berlin: De 19
20 Gruyter Mouton, 2010. 2nd ed. Berlin: De Gruyter Mouton, 2013. 20
21 Janda 2013 — Janda L. A. (ed.). Cognitive linguistics: The quantitative turn. The essential reader. Berlin: 21
22 De Gruyter Mouton, 2013. 22
23 Jockers 2014 — Jockers M. L. Text analysis with R for students of literature. Cham: Springer, 2014. 23
24 Johnson 2008 — Johnson K. Quantitative methods in linguistics. Malden (MA): Blackwell, 2008. 24
25
Kenny 1982 — Kenny A. The computation of style: An introduction to statistics for students of literature 25
and humanities. Oxford: Pergamon Press, 1982.
26 26
Larson-Hall 2010 — Larson-Hall J. A guide to doing statistics in second language research using SPSS.
27 27
New York: Routledge, 2010.
28 28
Meindl 2011 — Meindl C. Methodik für Linguisten: eine Einführung in Statistik und Versuchsplanung.
29 Tübingen: Narr, 2011. 29
30 R Core Team 2014 — R Core Team. R: A language and environment for statistical computing. Vienna: R 30
31 Foundation for Statistical Computing, 2014. Available at: http://www.R-project.org/ [24.06.2016]. 31
32 Rasinger 2008 / 2013 — Rasinger M. S. Quantitative research in linguistics: an introduction. 1st ed. London: 32
33 Continuum, 2008. 2nd ed. London: Bloomsbury, 2013. 33
34 Salkind 2014 — Salkind N. J. Statistics for people who (think they) hate statistics. 5th ed. Thousand Oaks: 34
35
SAGE, 2014. 35
Urdan 2010 — Urdan T. C. Statistics in plain English. 3rd ed. New York: Routledge, 2010.
36 36
37 37
38 38
39 39
40 40
41 I. A. Seržant, B. Wiemer (eds.). Contemporary approaches to dialectology: The area 41
42 of North, North-West Russian and Belarusian dialects. Bergen: University of Bergen, 42
43 2014. 401 p. (Slavica Bergensia 13). ISBN 978-82-90249-38-5. 43
44 44
Дмитрий Владимирович Сичинава Dmitri V. Sitchinava
45 45
46 Институт русского языка им. В. В. Виноградова Vinogradov Russian Language Institute, Russian 46
47 РАН, Москва, 119019, Российская Федерация; Academy of Sciences, Moscow, 119019, Russian 47
48 Национальный исследовательский университет Federation; National Research University Higher 48
49 «Высшая школа экономики», Москва, 101000, School of Economics, Moscow, 101000, Russian 49
50 Российская Федерация; mitrius@gmail.com Federation; mitrius@gmail.com 50
51 Сборник, имеющий параллельное русское название «Современные методы в диалекто- 51
52 логии: ареал северных, северозападных (sic) русских и белорусских говоров», вышел под 52

Версия 02.02.2017 (20:36)