Form of presentation | Articles in Russian journals and collections |
Year of publication | 2013 |
|
Lerner Eduard Yulevich, author
|
Bibliographic description in the original language |
Proverka zakona Khipsa po dannym korpusa Google Books Ngram.
Uchenye zapiski Kazanskogo universiteta. Seriya Fiz.-mat. Nauki, 2013. Tom 155, Kn. 4, str. 16-23 |
Annotation |
Работа посвящена проверке выполнения эмпирического закона Хипса в европейских языках на материале корпуса текстов Google Books Ngram. Показано, что закон Хипса выполняется лишь для текстов ограниченного объёма и относящихся к небольшому историческому интервалу; показатель Хипса убывает со временем, а также испытывает значительные колебания с характерными временами 60?100 лет. В рамках простой вероятностной модели порождения текста рассмотрена связь между распределением частот словоупотребления и ожидаемой зависимостью числа уникальных слов в тексте от объёма текста. Эта модель даёт объяснение наблюдаемого нисходящего тренда показателя Хипса. |
Keywords |
Закон Хипса, закон Ципфа, вероятностные модели текста, корпус Google Books Ngram.
Summ |
The name of the journal |
Уч. записки Казанского госуниверситета
|
URL |
http://old.kpfu.ru/uz_r/bin_files2/155_4_phys-mat_2.pdf |
Please use this ID to quote from or refer to the card |
https://repository.kpfu.ru/eng/?p_id=95308&p_lang=2 |
Full metadata record |
Field DC |
Value |
Language |
dc.contributor.author |
Lerner Eduard Yulevich |
ru_RU |
dc.date.accessioned |
2013-01-01T00:00:00Z |
ru_RU |
dc.date.available |
2013-01-01T00:00:00Z |
ru_RU |
dc.date.issued |
2013 |
ru_RU |
dc.identifier.citation |
Проверка закона Хипса по данным корпуса Google Books Ngram.
Ученые записки Казанского университета. Серия Физ.-мат. Науки, 2013. Том 155, Кн. 4, стр. 16-23 |
ru_RU |
dc.identifier.uri |
https://repository.kpfu.ru/eng/?p_id=95308&p_lang=2 |
ru_RU |
dc.description.abstract |
Уч. записки Казанского госуниверситета |
ru_RU |
dc.description.abstract |
Работа посвящена проверке выполнения эмпирического закона Хипса в европейских языках на материале корпуса текстов Google Books Ngram. Показано, что закон Хипса выполняется лишь для текстов ограниченного объёма и относящихся к небольшому историческому интервалу; показатель Хипса убывает со временем, а также испытывает значительные колебания с характерными временами 60?100 лет. В рамках простой вероятностной модели порождения текста рассмотрена связь между распределением частот словоупотребления и ожидаемой зависимостью числа уникальных слов в тексте от объёма текста. Эта модель даёт объяснение наблюдаемого нисходящего тренда показателя Хипса. |
ru_RU |
dc.language.iso |
ru |
ru_RU |
dc.subject |
Закон Хипса |
ru_RU |
dc.subject |
закон Ципфа |
ru_RU |
dc.subject |
вероятностные модели текста |
ru_RU |
dc.subject |
корпус Google Books Ngram.
Summ |
ru_RU |
dc.title |
Проверка закона Хипса по данным корпуса Google Books Ngram |
ru_RU |
dc.type |
Articles in Russian journals and collections |
ru_RU |
|