fantlab ru



  Лингвистический анализ произведения
Произведение: Архканцлер империи. Начало
Автор: Евгений Шепельский
Дата проведения анализа: 18 сентября 2022 года

Общая статистика

Длина текста, знаков:534673
Слов в произведении (СВП):80513
Приблизительно страниц:279
Средняя длина слова, знаков:5.23
Средняя длина предложения (СДП), знаков:61.71
СДП авторского текста, знаков:71.77
СДП диалога, знаков:46.31
Доля диалогов в тексте:29.72%
Доля авторского текста в диалогах:3.82%
Использование диалогов по тексту
(по горизонтали: счётчик знаков; по вертикали: процент диалогов;
размер скользящего окна: знаков, шаг: 1000 знаков)

Активный словарный запас

Использовано уникальных слов:11235
Активный словарный запас (АСЗ):10405
Активный несловарный запас (АНСЗ):830
Удельный АСЗ на 3000 слов текста:1276.42
Удельный АСЗ на 10000 слов текста:3070.88 —> 2736-е место в рейтинге УАСЗ-10000
Динамика изменения УАСЗ-3000 от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: УАСЗ-3000)
Максимальное значение УАСЗ-3000 (0) приходится приблизительно на 0-ю страницу текста.
Миниимальное значение УАСЗ-3000 (10000000) приходится приблизительно на 0-ю страницу текста.

Части речи

Неопределённых частей речи (НОЧР), слов:18007 (22.37% от СВП)
Определённых частей речи (ОЧР), слов:62506 (77.63% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное20581 (32.93%)
          Прилагательное7358 (11.77%)
          Глагол14781 (23.65%)
          Местоимение-существительное6495 (10.39%)
          Местоименное прилагательное2854 (4.57%)
          Местоимение-предикатив5 (0.01%)
          Числительное (количественное)784 (1.25%)
          Числительное (порядковое)109 (0.17%)
          Наречие3274 (5.24%)
          Предикатив668 (1.07%)
          Предлог7504 (12.01%)
          Союз6174 (9.88%)
          Междометие1298 (2.08%)
          Вводное слово310 (0.50%)
          Частица4546 (7.27%)
          Причастие1055 (1.69%)
          Деепричастие227 (0.36%)
Служебных слов:29413 (47.06%)

Биграммы частей речи

В таблице показаны частоты словопар типа «существительное+прилагательное», «прилагательное+глагол» и т.д. Для удобства восприятия частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

С
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
П
р
и
л
а
г
а
т
е
л
ь
н
о
е
Г
л
а
г
о
л
М
е
с
т
о
и
м
е
н
и
е
-
с
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
н
о
е

п
р
и
л
а
г
а
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
и
е
-
п
р
е
д
и
к
а
т
и
в
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
к
о
л
и
ч
е
с
т
в
е
н
н
о
е
)
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
п
о
р
я
д
к
о
в
о
е
)
Н
а
р
е
ч
и
е
П
р
е
д
и
к
а
т
и
в
П
р
е
д
л
о
г
С
о
ю
з
М
е
ж
д
о
м
е
т
и
е
В
в
о
д
н
о
е

с
л
о
в
о
Ч
а
с
т
и
ц
а
П
р
и
ч
а
с
т
и
е
Д
е
е
п
р
и
ч
а
с
т
и
е
Существительное441945118.7.011.9.25101.832285.31.1134.3.95
Прилагательное529.6132.21.01.32.061.7.4546.2.94.192.82.4.26
Глагол461724147.4.011.9.198.1137163.1.509.42.6.45
Местоимение-существительное9.77.8404.42.1.00.60.014.8.755.43.9.38.519.9.44.23
Местоименное прилагательное194.35.62.79.00.28.011.441.71.6.23.062.4.26.03
Местоимение-предикатив.00.00.04.00.00.00.00.00.00.00.00.01.00.00.00.00.00
Числительное (колич-ое)5.81.98.44.21.00.31.18.21.12.88.79.09.04.32.07.01
Числительное (порядковое).88.06.15.03.06.00.00.00.00.01.04.18.00.00.10.01.00
Наречие4.25.3144.87.00.51.012.4.373.62.9.38.013.5.88.18
Предикатив1.1.752.1.88.26.00.07.00.43.25.56.72.13.01.75.04.00
Предлог58173.48.812.002.1.40.48.07.131.1.04.00.452.1.12
Союз157.821123.2.01.73.155.515.95.62.627.6.63.22
Междометие5.5.971.53.8.95.00.13.00.88.23.911.1.25.041.1.06.03
Вводное слово.75.32.78.54.15.00.09.01.21.04.32.45.13.03.29.09.00
Частица8.44.5254.51.5.011.2.062.9.853.55.3.43.355.54.15
Причастие7.32.2.53.26.16.00.06.00.32.012.6.34.10.04.29.29.01
Деепричастие.47.23.44.34.06.00.01.00.07.01.78.35.03.01.25.00.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах.

В каждом столбце максимальное значение отмечено жирным шрифтом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»


 Номер слова в предложении
 12345678910
Существительное18202429282928283028
Прилагательное6.98.18.89.29.99.711101010
Глагол11292420201819181817
Местоимение-существительное21118.58.16.365.6665.8
Местоименное прилагательное23.63.33.23.73.63.5444
Местоимение-предикатив.00.00.00.00.00.00.00.00.00.00
Числительное (колич-ое).901.901.11.211.311.21
Числительное (порядковое).20.10.10.20.10.10.20.10.10.10
Наречие65.14.23.844.13.73.93.14
Предикатив1.81.1.80.80.70.80.60.90.50.80
Предлог7.16.31110101010111011
Союз116.36.46.17.47.87.887.28.6
Междометие5.3.901.31.11.51.51.31.21.71.7
Вводное слово.80.40.40.30.40.40.30.70.30.30
Частица6.96.76.15.55.65.454.95.45.2
Причастие.40.70.901.11.41.71.51.71.62
Деепричастие.40.20.20.20.20.30.30.30.30.40

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая126.43
          .    точка78.93
          -    тире26.65
          !    восклицательный знак8.76
          ?    вопросительный знак10.00
          ...    многоточие16.42
          !..    воскл. знак с многоточием0.43
          ?..    вопр. знак с многоточием0.52
          !!!    тройной воскл. знак0.06
          ?!    вопр. знак с восклицанием0.07
          "    кавычка5.86
          ()    скобки0.22
          :    двоеточие6.01
          ;    точка с запятой0.81




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Евгений Шепельский
 59
2. Никита Аверин
 43
3. Александр Сивинских
 43
4. Zотов
 42
5. Сергей Волков
 42
6. Александр и Людмила Белаш
 42
7. Александр Рудазов
 42
8. Кирилл Бенедиктов
 42
9. Александр Бушков
 41
10. Павел Марушкин
 41
...смотреть весь список >>
⇑ Наверх