Oleg А. Chagin (olegchagin) wrote,
Oleg А. Chagin
olegchagin

Чехов — «скука», Толстой — «любовь», Достоевский — «страсть»

Если вам предложат прочитать следующие три отрывка и определить, какой написал А.

П. Чехов, какой — Л. Н. Толстой, а какой — Ф. М. Достоевский, скорее всего, вы сделаете это без ошибки, даже если не будете смотреть в интернете

1) «Если бы можно было вернуть прошлые дни и годы, он ложь в них заменил бы правдой, праздность ― трудом, скуку ― радостью, он вернул бы чистоту тем, у кого взял ее, нашел бы бога и справедливость, но это так же невозможно, как закатившуюся звезду вернуть опять на небо»

2) «Любовь к самому себе, горячая, полная надежд, молодая любовь ко всему, что только было хорошего в его душе (а ему казалось теперь, что только одно хорошее было в нем), заставляла его плакать и бормотать несвязные слова»

3) «В его душе будто бы странно сошлись страсть и ненависть, и он хотя и дал наконец, после мучительных колебаний, согласие жениться на "скверной женщине", но сам поклялся в душе горько отмстить ей за это и "доехать" ее потом, как он будто бы сам выразился»

Почему? Дело в том, что мы видим здесь определенные слова-сигналы, которые твердо закреплены в нашем сознании за каждым из этих писателей:

Чехов — «скука»,

Толстой — «любовь»,

Достоевский — «страсть»

Можно статистическим методом проверить эту интуитивную идею

Из представленных в Национальном корпусе русского языка художественных произведений трех писателей извлекли все контексты с существительными «скука», «любовь», «страсть» — и высчитали для получившейся таблицы переменных Pearson residuals

Результат можно увидеть на прикрепленном графике

Растущие вверх, подобно сталагмитам, столбцы обозначают, что наблюдаемая частота встречаемости слова у данного автора больше ожидаемой

И наоборот, столбцы, растущие, подобно сталактитам, вниз, указывают на то, что наблюдаемая частота меньше ожидаемой

Цветовые выделения (синие для положительных значений и красные для отрицательных) маркируют случаи наиболее существенных расхождений

Тест хи-квадрат доказывает, что распределение является статистически значимым, то есть не может быть объяснено случайным совпадением: X-squared = 129.44, df = 4, p-value < 2.2e-16

Таким образом, наша интуиция нас не обманывает:

Чехов — действительно певец скуки,

Толстой — любви, а

Достоевский — страсти

Subscribe
Comments for this post were disabled by the author