Код бестселлера. Мэттью Джокерс
Чтение книги онлайн.
Читать онлайн книгу Код бестселлера - Мэттью Джокерс страница 17
Вот важный вывод из этого блиц-анализа, который следует запомнить: тема шире границ жанра. Первое, что нужно сделать, если вы хотите писать, публиковать или распознавать бестселлеры, – вообще забыть о понятии жанра, несмотря на его роль в книжном деле. Свадьба и супружеская жизнь могут фигурировать в книге любого жанра. Любовь и преступление – тоже. Пропорции тем в разных жанрах могут отличаться, но важно, чтобы где-то в тексте эти ключевые темы были. Вся проделанная нами работа доказывает, что концепция жанра подобна смирительной рубашке. Забудьте о ней. Если вы готовы взять на вооружение подобный образ мыслей, значит, вы уже начали мыслить как наш компьютер, строящий прогностическую модель.
Проверка
Для каждой книги в нашей коллекции были вычислены процентные значения, указывающие на содержание в ней той или иной из 500 тем, попавших в наш список. Конечно, в некоторых книгах какие-то темы не появляются вообще – например, в «Коде да Винчи» нет ковбоев. Но для каждого текста мы получили диаграмму вроде той, что изображена на рис. 3. Эта диаграмма – для книги Джоди Пиколт «Последнее правило»[63]: 23 % объема занимает тема, которую мы условно назвали «Дети и школа», 10 % – «Преступления», 7 % – «Судебные процессы и юридические вопросы», 6 % – «Домашние дела» и 2 % – «Близкие отношения».
Рис. 3. Основные темы романа Джоди Пиколт «Последнее правило»
После того как наш компьютер выделил основные темы, каталогизировал их и определил пропорцию каждой темы в каждой книге, мы обработали случайно выбранное подмножество результатов с помощью алгоритма машинного обучения, которому было заранее известно, какие книги в коллекции являются бестселлерами, а какие – нет. Используя эту информацию, программа подсчитала, какие темы и в каких пропорциях наиболее вероятно встретить в случайно выбранном бестселлере. Более того, эта же программа может определить, в использовании каких тем наиболее ярко проявляется различие между бестселлерами и небестселлерами.
Хороший пример – тема секса, о которой мы уже говорили раньше. В среднем она возникает в небестселлерах вдвое чаще, чем в бестселлерах. Компьютер способен уловить эту разницу и использовать полученные данные, чтобы спрогнозировать вероятность успеха доселе неизвестной рукописи. Согласно нашей модели, книга, в которой секс фигурирует почти в каждой главе, имеет мало шансов стать по-настоящему популярной. Конечно, из этого принципа есть исключения – трудно не заметить Сильвию Дэй или Э. Л. Джеймс, – но два автора не могут заметно повлиять на общие результаты исследования
63
House Rules, Jodi Picoult.