FantLab ru



  Лингвистический анализ произведения
Произведение: Королевская гончая
Автор: Оливия Штерн
Дата проведения анализа: 18 сентября 2022 года

Общая статистика

Длина текста, знаков:482795
Слов в произведении (СВП):70643
Приблизительно страниц:246
Средняя длина слова, знаков:5.26
Средняя длина предложения (СДП), знаков:52.01
СДП авторского текста, знаков:58.85
СДП диалога, знаков:42.67
Доля диалогов в тексте:34.81%
Доля авторского текста в диалогах:9.73%
Использование диалогов по тексту
(по горизонтали: счётчик знаков; по вертикали: процент диалогов;
размер скользящего окна: знаков, шаг: 1000 знаков)

Активный словарный запас

Использовано уникальных слов:8516
Активный словарный запас (АСЗ):8090
Активный несловарный запас (АНСЗ):426
Удельный АСЗ на 3000 слов текста:1210.07
Удельный АСЗ на 10000 слов текста:2765.49 —> 6839-е место в рейтинге УАСЗ-10000
Динамика изменения УАСЗ-3000 от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: УАСЗ-3000)
Максимальное значение УАСЗ-3000 (0) приходится приблизительно на 0-ю страницу текста.
Миниимальное значение УАСЗ-3000 (10000000) приходится приблизительно на 0-ю страницу текста.

Части речи

Неопределённых частей речи (НОЧР), слов:17012 (24.08% от СВП)
Определённых частей речи (ОЧР), слов:53631 (75.92% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное15944 (29.73%)
          Прилагательное6419 (11.97%)
          Глагол13501 (25.17%)
          Местоимение-существительное6021 (11.23%)
          Местоименное прилагательное2655 (4.95%)
          Местоимение-предикатив3 (0.01%)
          Числительное (количественное)406 (0.76%)
          Числительное (порядковое)60 (0.11%)
          Наречие3497 (6.52%)
          Предикатив672 (1.25%)
          Предлог6414 (11.96%)
          Союз5786 (10.79%)
          Междометие1071 (2.00%)
          Вводное слово254 (0.47%)
          Частица4658 (8.69%)
          Причастие1005 (1.87%)
          Деепричастие187 (0.35%)
Служебных слов:27049 (50.44%)

Биграммы частей речи

В таблице показаны частоты словопар типа «существительное+прилагательное», «прилагательное+глагол» и т.д. Для удобства восприятия частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

С
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
П
р
и
л
а
г
а
т
е
л
ь
н
о
е
Г
л
а
г
о
л
М
е
с
т
о
и
м
е
н
и
е
-
с
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
н
о
е

п
р
и
л
а
г
а
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
и
е
-
п
р
е
д
и
к
а
т
и
в
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
к
о
л
и
ч
е
с
т
в
е
н
н
о
е
)
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
п
о
р
я
д
к
о
в
о
е
)
Н
а
р
е
ч
и
е
П
р
е
д
и
к
а
т
и
в
П
р
е
д
л
о
г
С
о
ю
з
М
е
ж
д
о
м
е
т
и
е
В
в
о
д
н
о
е

с
л
о
в
о
Ч
а
с
т
и
ц
а
П
р
и
ч
а
с
т
и
е
Д
е
е
п
р
и
ч
а
с
т
и
е
Существительное35174786.4.00.82.039.31.124223.4.519.64.6.67
Прилагательное487191.71.00.15.052.334.26.72.093.12.1.19
Глагол401822139.9.031.19111.640153.1.39103.1.50
Местоимение-существительное8.19.4347.33.2.02.65.037.2.985.15.1.58.7514.58.19
Местоименное прилагательное175.56.42.41.00.14.021.7.392.21.9.27.022.8.50.07
Местоимение-предикатив.00.00.00.02.00.00.00.00.00.00.00.00.00.00.00.00.00
Числительное (колич-ое)2.2.68.96.21.07.00.10.02.14.14.65.44.03.00.65.07.00
Числительное (порядковое).67.03.03.02.00.00.03.00.00.02.05.10.00.02.03.02.00
Наречие3.67.5175.41.5.00.36.053.864.13.8.58.144.9.80.07
Предикатив.86.552.2.96.19.00.05.00.56.21.79.94.09.031.1.07.00
Предлог56162.51112.001.2.39.56.19.101.2.02.00.992.4.03
Союз137.620153.4.00.56.057.91.27.26.21.3.628.9.98.22
Междометие5.51.874.8.75.00.03.001.15.621.2.05.00.98.10.03
Вводное слово.29.24.70.92.19.00.03.00.26.09.17.58.05.02.34.00.00
Частица6.94.4296.11.7.00.89.093.81.14.48.3.51.218.65.26
Причастие7.81.7.51.31.34.00.02.00.48.033.1.67.10.00.27.21.03
Деепричастие.31.29.44.21.07.00.03.00.15.00.98.14.07.03.39.00.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах.

В каждом столбце максимальное значение отмечено жирным шрифтом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»


 Номер слова в предложении
 12345678910
Существительное16162022242626262728
Прилагательное6.68.78.69.19.49.59.99.51111
Глагол12252523211920191819
Местоимение-существительное16129.28.77.37.26.56.75.96.8
Местоименное прилагательное23.23.844.145.14.44.33.9
Местоимение-предикатив.00.00.00.00.00.00.00.00.00.00
Числительное (колич-ое).40.80.70.50.70.60.50.60.50.50
Числительное (порядковое).10.10.10.10.20.10.10.10.10.00
Наречие6.275.154.94.74.24.843.9
Предикатив21.21.80.80.80.70.80.80.80
Предлог6.86.28.910101010119.812
Союз167.86.87.17.38.16.87.87.77.5
Междометие4.9.90.901.11.31.21.2.901.51.3
Вводное слово1.60.30.30.20.30.30.20.20.20
Частица8.28.68.16.66.56.46.45.56.74.9
Причастие.5011.11.21.51.61.91.921.8
Деепричастие.50.30.20.30.40.10.20.30.20.30

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая128.19
          .    точка105.74
          -    тире29.49
          !    восклицательный знак3.26
          ?    вопросительный знак15.15
          ...    многоточие10.39
          !..    воскл. знак с многоточием0.04
          ?..    вопр. знак с многоточием0.10
          !!!    тройной воскл. знак0.00
          ?!    вопр. знак с восклицанием0.25
          "    кавычка6.06
          ()    скобки0.04
          :    двоеточие2.53
          ;    точка с запятой0.01




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Оливия Штерн
 46  – ожидает пересчёта
2. Мария Галина
 42  – ожидает пересчёта
3. Марина и Сергей Дяченко
 42  – ожидает пересчёта
4. Дмитрий Емец
 41  – ожидает пересчёта
5. Сергей Лукьяненко
 40  – ожидает пересчёта
6. Елена Хаецкая
 40  – ожидает пересчёта
7. Анна Гурова
 40  – ожидает пересчёта
8. Наталья Щерба
 40  – ожидает пересчёта
9. Татьяна Корсакова
 40  – ожидает пересчёта
10. Кир Булычев
 40  – ожидает пересчёта
...смотреть весь список >>
⇑ Наверх