Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры. Эрец Эйден

Чтение книги онлайн.

Читать онлайн книгу Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры - Эрец Эйден страница 15

Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры - Эрец Эйден Наука XXI век

Скачать книгу

drove (от глагола drive – «ехать») – удалось? [62]

      У лингвистов уже есть несколько отличных идей относительно того, почему неправильные глаголы имеют столь высокую частотность. Они предположили, что чем меньше мы сталкиваемся с неправильным глаголом, тем сложнее его запомнить и тем проще забыть[63]. Вследствие чего редкие неправильные глаголы вроде throve исчезают быстрее, чем частые, вроде drove. Со временем неправильные глаголы с низкой частотой употребления полностью исчезали, а неправильные глаголы как группа становились более частыми.

      Эта гипотеза показалась нам в высшей степени интересной, поскольку предполагала, что неправильные глаголы проходят через определенный процесс, аналогичный эволюции, путем естественного отбора[64]. Почему неправильные глаголы встречаются настолько часто, когда, в полном соответствии с законом Ципфа, во всех остальных лексических классах доминируют редкие слова? Потому что естественный отбор, в форме ненасытного правила – ed, обеспечивает простым неправильным глаголам эволюционное преимущество. Чем чаще глагол используется, тем выше его шансы на выживание.

      Созданный Ципфом «компас» был на тот момент самым идеальным примером естественного отбора, действующего в человеческой культуре, с которым нам только доводилось сталкиваться. Компас Ципфа указал нам на увлекательную проблему: может ли сформироваться лингвистическое чутье при столь тщательном изучении материала? Это могло бы стать простой, но доходчивой иллюстрацией того, что человеческая культура способна развиваться путем естественного отбора. Теперь нам, как и Ципфу, требовалось лишь найти подтверждение.

      Для помощи в поисках мы привлекли к работе двух невероятно талантливых старшекурсников Гарвардского колледжа, Джо Джексона и Тину Тан. В идеале мы надеялись, что Джо и Тина смогут прочитать все источники, когда-либо опубликованные на английском языке, и записать каждый пример неправильного глагола, с которым они сталкивались. Однако оба они сказали нам, что все же хотели бы поработать над своими дипломами (для нас как аспирантов это уже был пройденный и забытый этап). Для решения задачи нам пришлось импровизировать.

      К счастью, Джо и Тина учли историю Ципфа, поэтому предложили альтернативный подход. Вместо того чтобы читать абсолютно все, почему бы не ограничиться учебниками по истории английской грамматики? Грамматические тексты, относящиеся, скажем, к средневековому английскому языку, наверняка касались бы вопроса неправильных глаголов и упоминали бы многие из них. Не исключено, что где-то можно было найти и список таких глаголов. Изучив в библиотеке каждый учебник, посвященный истории английского языка различных периодов, мы могли получить довольно точную картину того, какие глаголы считались неправильными и когда[65]. Учебники могли бы дать нам то же самое, что дало Ципфу проведенное Хенли исследование «Улисса».

      Разумеется, сказать проще, чем сделать. Джо и Тина посвятили несколько месяцев кропотливой работе, читая учебники

Скачать книгу


<p>62</p>

На самом деле в современном английском языке нет такого понятия, как полностью неправильный глагол. Правильная форма глагола существует всегда (даже если почти не употребляется и спокойно ждет своего часа). Огромное влияние на это явление оказывает частотность употребления, поскольку часто используемые неправильные глаголы довольно успешно подавляют конкурирующие правильные формы. К примеру, в сравнении с формой drove форма drived почти не используется. Напротив, форма throve на протяжении многих столетий была достаточно уязвимой. Правильная форма thrived, давно бывшая для нее серьезным конкурентом, начала брать верх в XX веке. Это случается довольно часто. В наших списках словных последовательностей («1-грамах») слово found (от глагола find – «находить») (частота 1 на 2000) встречалось в 200 000 раз чаще, чем finded. При этом форма dwelt (от глагола dwell – «обитать») (частота 1 на 100 000) встречалась всего в 60 раз чаще формы dwelled. См. Michel2011. Для целей исследования, проведенного в 2007 году, нам время от времени был нужен список современных неправильных глаголов английского языка, который можно было бы считать «авторитетным». Мы использовали этот список для определения того, какие глаголы приобрели правильную форму, а какие – нет. Самостоятельное составление этого списка лишало нас должной объективности, поэтому мы выбрали список из работы Pinker S., Prince A. On Language and Connectionism: Analysis of a Parallel Distributed Processing Model of Language Acquisition // Cognition 28 (1988). P. 73–193. Мы считали неправильным любой глагол, у которого с точки зрения данного списка была хотя бы одна неправильная форма. Нужно отметить, что время от времени между словарями и другими источниками возникает разногласие в отношении того, какие глаголы считаются неправильными, а какие – нет. К примеру, wed – wed («женить») в указанном выше списке относится к неправильным, но во всех современных словарях приводятся иные формы (кое-кто из носителей языка уже отдает предпочтение форме wed – wedded).

<p>63</p>

Дети осваивают неправильные глаголы особенно интересным образом, постепенно, по мере развития мышления. Поначалу они спрягают все глаголы по-своему. Затем они начинают признавать правила языка, на котором говорят люди вокруг. Когда они понимают, что большинство глаголов следует правилу – ed, то переходят на стадию, называемую «гиперкорректностью», при которой воспринимают каждый глагол как правильный и используют формы типа goed, knowed и runned (от глаголов go – «идти», know – «знать» и run – «бежать»). Со временем они понимают, что некоторые глаголы представляют собой исключения из правила – ed, и начинают включать «правильные» неправильные формы в свою речь.

<p>64</p>

По этой теме имеется масса интересной литературы. См., к примеру, Sabeti P. C. et al. Detecting Recent Positive Selection in the Human Genome from Haplotype Structure // Nature 419, no. 6909 (2002). P. 832–837. Доступно в сети Интернет: http://goo.gl/TW6SYJ. Varilly P. et al. Genome-Wide Detection and Characterization of Positive Selection in Human Populations // Nature 449, no. 7164 (2007). P. 913–918. Доступно в сети Интернет: http://goo.gl/NfnzeU.

<p>65</p>

К примеру, к этим источникам относятся Emerson Oliver Farrar. A Middle English Reader. New York: Macmillan, 1909, и Sweet Henry. An Anglo-Saxon Primer. Oxford: Clarendon Press, 1887.