Дистрибутивно-статистический анализ языка русской прозы 1850—1870-х гг. Том 3. А. Я. Шайкевич
Скачать книгу в различных форматах или читать онлайн на сайте.
Том 3 монографии посвящен анализу среднего интервала текста. Исследуемый корпус прозы автоматически членится на фрагменты по 40 слов. Если совместная встречаемость двух слов во фрагментах существенно превышает величину, подсчи1анную на основе нулевой гипотезы, делается вывод о наличии связи между этими словами. В результате возникает огромная сеть текстуальных связей слов. Показан способ выявления кластеров в этой сети.