Oleg А. Chagin (olegchagin) wrote,
Oleg А. Chagin
olegchagin

«Закон Зипфа»

MIT Technology Review: анализ больших массивов данных проливает свет на фундаментальную структуру человеческого мышления

Человеческий язык - сложная, но чрезвычайно увлекательная штука.

Знаете ли вы, что в подавляющем большинстве языков самые распространённые слова составляют половину от всех используемых в речи и письме, и таких слов всего чуть больше 130. Вторая по распространённости группа слов встречается в два раза реже, а третья - совсем редкие - составляют треть объёма от второй группы. Эта закономерность была открыта ещё в 1935 году и получила имя по имени её исследователя - Закон Зипфа.

Долгое время на практике не представлялось возможным проверить найденную закономерность на большом количестве разных языков, однако современные технологии и упорство китайских учёных позволили установить корректность закона Зипфа для самых разных языковых групп. Более того, исследователи определили причину возникновения этой закономерности: всё дело в особенностях человеческого мышления.

"Теория двойного процесса мышления предполагает, что обычные слова, такие как «the», «and», «if» в английском языке обрабатываются быстрым, интуитивным мышлением и поэтому используются чаще. Эти слова образуют своего рода основу для предложений. Однако менее распространенные слова и словосочетания, такие как «гипотеза» и «Закон Зипфа», требуют гораздо более глубокого мышления. И из-за этого встречаются реже. Действительно, когда учёные сымитировали этот двойной процесс, то в результате получили ту же трехсегментную структуру в распределении употребления слов, которые обнаружили в 50 разных языках. Первый сегмент отражает распределение общих слов, последний сегмент — распределение необычных, а средний сегмент является результатом взаимодействия двух предыдущих. «Эти результаты показывают, что Закон Зипфа в языках обусловлен когнитивными механизмами, такими как двойное мышление, которые управляют человеческим вербальным поведением» — говорят учёные."

https://theidealist.ru/languagepatterns/

Subscribe
Comments for this post were disabled by the author