FantLab ru



  Лингвистический анализ произведения
Произведение: Аргонавт
Автор: Александр Бушков
Дата проведения анализа: 24 июля 2018 года

Общая статистика

Длина текста, знаков:357367
Слов в произведении (СВП):49555
Приблизительно страниц:185
Средняя длина слова, знаков:5.64
Средняя длина предложения (СДП), знаков:79.25
СДП авторского текста, знаков:115.93
СДП диалога, знаков:60.16
Доля диалогов в тексте:50.1%
Доля авторского текста в диалогах:5.64%
Использование диалогов по тексту
(по горизонтали: счётчик знаков; по вертикали: процент диалогов;
размер скользящего окна: 10000 знаков, шаг: 1000 знаков)
Максимальный фрагмент авторского текста, знаков: 14025 (в страницах — примерно 7; начинается где-то на 10-й)

Активный словарный запас

Использовано уникальных слов:7505
Активный словарный запас (АСЗ):7221
Активный несловарный запас (АНСЗ):284
Удельный АСЗ на 3000 слов текста:1251.74
Удельный АСЗ на 10000 слов текста:2871.39 —> 4302-е место в рейтинге УАСЗ-10000
Динамика изменения УАСЗ-3000 от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: УАСЗ-3000)
Максимальное значение УАСЗ-3000 (1471) приходится приблизительно на 32-ю страницу текста.
Миниимальное значение УАСЗ-3000 (1044) приходится приблизительно на 158-ю страницу текста.
Рост АСЗ от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: АСЗ)

Части речи

Неопределённых частей речи (НОЧР), слов:11232 (22.67% от СВП)
Определённых частей речи (ОЧР), слов:38323 (77.33% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное10411 (27.17%)
          Прилагательное4492 (11.72%)
          Глагол7482 (19.52%)
          Местоимение-существительное3007 (7.85%)
          Местоименное прилагательное1909 (4.98%)
          Местоимение-предикатив4 (0.01%)
          Числительное (количественное)143 (0.37%)
          Числительное (порядковое)99 (0.26%)
          Наречие1294 (3.38%)
          Предикатив101 (0.26%)
          Предлог4035 (10.53%)
          Союз1727 (4.51%)
          Междометие30 (0.08%)
          Вводное слово4 (0.01%)
          Частица1517 (3.96%)
          Причастие681 (1.78%)
          Деепричастие29 (0.08%)
Служебных слов:12233 (31.92%)

Биграммы частей речи

В таблице показаны частоты словопар типа «существительное+прилагательное», «прилагательное+глагол» и т.д. Для удобства восприятия частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

С
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
П
р
и
л
а
г
а
т
е
л
ь
н
о
е
Г
л
а
г
о
л
М
е
с
т
о
и
м
е
н
и
е
-
с
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
н
о
е

п
р
и
л
а
г
а
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
и
е
-
п
р
е
д
и
к
а
т
и
в
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
к
о
л
и
ч
е
с
т
в
е
н
н
о
е
)
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
п
о
р
я
д
к
о
в
о
е
)
Н
а
р
е
ч
и
е
П
р
е
д
и
к
а
т
и
в
П
р
е
д
л
о
г
С
о
ю
з
М
е
ж
д
о
м
е
т
и
е
В
в
о
д
н
о
е

с
л
о
в
о
Ч
а
с
т
и
ц
а
П
р
и
ч
а
с
т
и
е
Д
е
е
п
р
и
ч
а
с
т
и
е
Существительное4426511213.0011.410.773623.12.008.48.2.27
Прилагательное9513172.6.93.00.04.04.89.154.75.7.00.001.32.2.12
Глагол4223231511.12.46.398.7.46457.00.047.73.2.12
Местоимение-существительное6.78.1353.62.8.04.23.045.8.158.62.9.00.007.6.70.04
Местоименное прилагательное301253.11.8.00.46.00.89.121.7.74.00.001.1.31.08
Местоимение-предикатив.00.04.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Числительное (колич-ое)2.2.58.35.27.12.00.12.08.04.00.43.00.00.00.08.04.00
Числительное (порядковое)2.7.04.08.00.00.00.04.00.04.00.12.08.00.00.00.08.00
Наречие2.17.19.53.3.54.00.08.001.2.464.11.3.04.003.4.85.00
Предикатив.04.082.6.04.04.00.00.00.00.00.15.08.00.00.12.00.00
Предлог6725.931220.00.851.21.1.00.12.08.00.00.082.2.00
Союз117.3144.62.6.00.35.082.503.9.35.00.004.8.62.12
Междометие.00.00.04.15.00.00.00.00.00.00.00.00.00.00.04.00.00
Вводное слово.04.00.00.00.00.00.00.00.04.00.04.00.00.00.00.00.00
Частица2.43.132.89.50.00.00.121.6.043.4.43.00.00.461.6.08
Причастие7.33.11.1.77.66.00.04.00.70.005.3.46.00.00.35.27.00
Деепричастие.35.12.00.04.00.00.00.00.00.00.35.00.00.00.04.00.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах.

В каждом столбце максимальное значение отмечено жирным шрифтом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»


 Номер слова в предложении
 1234567891011121314151617181920
Существительное1520242627303230323031323130313334313133
Прилагательное7.899.79.613131112141316141314131511151613
Глагол2228262522202018191816171817171618171716
Местоимение-существительное221410108.485.26.26.15.66.955.85.24.25.15.62.83.94.6
Местоименное прилагательное3.45.35.34.66.25.95.65.864.85.84.74.54.76.14.34.55.47.64.1
Местоимение-предикатив.00.00.00.00.00.00.00.00.00.00.00.00.10.00.00.00.00.00.00.00
Числительное (колич-ое).40.30.30.10.40.20.20.70.30.70.50.50.40.80.20.30.50.70.50.00
Числительное (порядковое).10.10.40.00.10.40.20.50.40.50.60.40.10.30.20.20.30.40.20.50
Наречие5.44.543.33.63.32.83.32.633.13.53.53.82.33.32.73.82.12.9
Предикатив.10.30.40.60.40.10.10.40.00.00.30.30.20.40.00.20.10.10.50.30
Предлог108.59.5111110121210149.1111211131213149.812
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Союз7.24.33.44.13.33.94.454.14.95.55.15.15.44.54.94.84.75.55.5
Междометие.90.00.00.00.00.00.00.10.00.00.00.10.10.10.00.00.00.00.00.00
Вводное слово.00.00.00.00.00.00.00.10.00.00.00.00.00.00.00.00.00.00.00.00
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Частица3.95.25.44.5444.43.53.43.23.33.33.74.75.23.53.63.43.54.6
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Причастие.70.801.41.11.81.92.41.32.122.32.12.32.62.51.82.21.92.42.6
Деепричастие.00.10.10.10.00.10.00.10.20.10.10.10.10.10.10.00.00.00.00.20

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая136.56
          .    точка45.14
          -    тире30.94
          !    восклицательный знак3.23
          ?    вопросительный знак11.95
          ...    многоточие30.01
          !..    воскл. знак с многоточием0.00
          ?..    вопр. знак с многоточием0.02
          !!!    тройной воскл. знак0.08
          ?!    вопр. знак с восклицанием0.06
          "    кавычка8.60
          ()    скобки0.77
          :    двоеточие6.88
          ;    точка с запятой0.02




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Александр Бушков
 43
2. Андрей Столяров
 39
3. Николай Романецкий
 38
4. [Для текстов по лингвоанализу]
 38
5. Александр Громов
 38
6. Сергей Абрамов
 37
7. Андрей Валентинов
 37
8. Александр Зорич
 37
9. Виктор Пелевин
 37
10. Роман Глушков
 37
...смотреть весь список >>
⇑ Наверх