fantlab ru



  Лингвистический анализ произведения
Произведение: Зов из бездны
Автор: Михаил Ахманов
Дата проведения анализа: 19 сентября 2022 года

Общая статистика

Длина текста, знаков:468965
Слов в произведении (СВП):72895
Приблизительно страниц:241
Средняя длина слова, знаков:4.99
Средняя длина предложения (СДП), знаков:73.79
СДП авторского текста, знаков:91.3
СДП диалога, знаков:51.27
Доля диалогов в тексте:30.5%
Доля авторского текста в диалогах:6.73%
Использование диалогов по тексту
(по горизонтали: счётчик знаков; по вертикали: процент диалогов;
размер скользящего окна: знаков, шаг: 1000 знаков)

Активный словарный запас

Использовано уникальных слов:8605
Активный словарный запас (АСЗ):7997
Активный несловарный запас (АНСЗ):608
Удельный АСЗ на 3000 слов текста:1155.85
Удельный АСЗ на 10000 слов текста:2569.86 —> 9569-е место в рейтинге УАСЗ-10000
Динамика изменения УАСЗ-3000 от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: УАСЗ-3000)
Максимальное значение УАСЗ-3000 (0) приходится приблизительно на 0-ю страницу текста.
Миниимальное значение УАСЗ-3000 (10000000) приходится приблизительно на 0-ю страницу текста.

Части речи

Неопределённых частей речи (НОЧР), слов:15220 (20.88% от СВП)
Определённых частей речи (ОЧР), слов:57675 (79.12% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное19793 (34.32%)
          Прилагательное5551 (9.62%)
          Глагол12133 (21.04%)
          Местоимение-существительное5016 (8.70%)
          Местоименное прилагательное3043 (5.28%)
          Местоимение-предикатив8 (0.01%)
          Числительное (количественное)789 (1.37%)
          Числительное (порядковое)162 (0.28%)
          Наречие2169 (3.76%)
          Предикатив480 (0.83%)
          Предлог6860 (11.89%)
          Союз7157 (12.41%)
          Междометие1317 (2.28%)
          Вводное слово166 (0.29%)
          Частица4067 (7.05%)
          Причастие929 (1.61%)
          Деепричастие120 (0.21%)
Служебных слов:27754 (48.12%)

Биграммы частей речи

В таблице показаны частоты словопар типа «существительное+прилагательное», «прилагательное+глагол» и т.д. Для удобства восприятия частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

С
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
П
р
и
л
а
г
а
т
е
л
ь
н
о
е
Г
л
а
г
о
л
М
е
с
т
о
и
м
е
н
и
е
-
с
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
н
о
е

п
р
и
л
а
г
а
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
и
е
-
п
р
е
д
и
к
а
т
и
в
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
к
о
л
и
ч
е
с
т
в
е
н
н
о
е
)
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
п
о
р
я
д
к
о
в
о
е
)
Н
а
р
е
ч
и
е
П
р
е
д
и
к
а
т
и
в
П
р
е
д
л
о
г
С
о
ю
з
М
е
ж
д
о
м
е
т
и
е
В
в
о
д
н
о
е

с
л
о
в
о
Ч
а
с
т
и
ц
а
П
р
и
ч
а
с
т
и
е
Д
е
е
п
р
и
ч
а
с
т
и
е
Существительное5018428.69.2.002.5571.534515.8.68145.3.24
Прилагательное474.781.71.1.00.41.051.2.294.481.1.082.6.85.15
Глагол461315188.1.052.335.11.332173.8.168.42.1.34
Местоимение-существительное125.9284.32.4.03.78.152.6.596.34.3.62.248.3.63.08
Местоименное прилагательное25462.3.72.00.20.07.80.151.72.4.39.033.1.42.05
Местоимение-предикатив.00.00.07.02.00.00.00.00.00.00.03.00.00.00.02.00.00
Числительное (колич-ое)5.2.931.2.29.47.00.52.11.21.03.99.70.15.00.57.11.02
Числительное (порядковое)1.4.29.24.02.02.00.02.07.05.00.15.08.02.00.10.02.00
Наречие4.24.19.63.88.00.41.03.94.262.92.3.41.112.6.49.03
Предикатив1.1.391.3.62.23.00.11.00.23.10.59.83.29.00.63.10.00
Предлог58143.29.512.001.9.60.50.05.42.65.00.02.261.2.03
Союз279.9289.85.4.031.5.285.518.63.4.99.298.51.6.28
Междометие6.61.52.13.71.6.00.05.02.78.13.781.1.11.071.2.28.03
Вводное слово.42.21.47.28.07.00.02.02.13.00.18.31.05.02.26.08.00
Частица9.84.7263.81.9.021.3.131.9.393.94.1.54.114.5.93.31
Причастие5.5.91.52.93.34.00.15.00.39.073.4.86.42.03.31.05.02
Деепричастие.37.10.20.16.02.00.03.00.05.00.36.13.03.00.34.03.02

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах.

В каждом столбце максимальное значение отмечено жирным шрифтом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»


 Номер слова в предложении
 12345678910
Существительное16212528292930292829
Прилагательное5.56.77.47.478.68.17.98.28.2
Глагол16262219181816171817
Местоимение-существительное1312108.67.15.95.95.45.95.8
Местоименное прилагательное3.554.54.94.64.544.44.25
Местоимение-предикатив.00.00.00.00.00.00.00.00.00.00
Числительное (колич-ое)1.211.111.21.11.311.21.2
Числительное (порядковое).10.20.20.30.20.40.20.30.20.40
Наречие6.842.72.632.72.72.93.12.7
Предикатив1.8.90.60.60.60.60.70.60.50.60
Предлог7.56.59.610109.510111010
Союз137.56.98.69.91111121111
Междометие5.91.41.51.51.71.81.71.91.71.8
Вводное слово.80.20.20.20.20.20.20.10.20.10
Частица8.47.36.65.355.45.65.25.95.2
Причастие.4011.21.21.21.11.31.51.31.4
Деепричастие.30.20.10.10.20.20.30.10.20.10

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая140.39
          .    точка61.09
          -    тире23.73
          !    восклицательный знак10.77
          ?    вопросительный знак8.64
          ...    многоточие7.30
          !..    воскл. знак с многоточием0.34
          ?..    вопр. знак с многоточием1.66
          !!!    тройной воскл. знак0.00
          ?!    вопр. знак с восклицанием0.01
          "    кавычка3.62
          ()    скобки1.07
          :    двоеточие6.93
          ;    точка с запятой2.41




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Михаил Ахманов
 44
2. Игорь Недозор
 37
3. Владимир Свержин
 37
4. Александр Зорич
 36
5. Борис Акунин
 36
6. Александр и Людмила Белаш
 36
7. Елена Хаецкая
 36
8. Кирилл Бенедиктов
 35
9. Олег Никитин
 35
10. Владимир Лещенко
 35
...смотреть весь список >>
⇑ Наверх