FantLab ru



  Лингвистический анализ произведения
Произведение: Сестра печали
Автор: Вадим Шефнер
Дата проведения анализа: 23 июля 2018 года

Общая статистика

Длина текста, знаков:497986
Слов в произведении (СВП):76595
Приблизительно страниц:253
Средняя длина слова, знаков:4.98
Средняя длина предложения (СДП), знаков:59.18
СДП авторского текста, знаков:74.65
СДП диалога, знаков:41.26
Доля диалогов в тексте:32.4%
Доля авторского текста в диалогах:9.09%
Использование диалогов по тексту
(по горизонтали: счётчик знаков; по вертикали: процент диалогов;
размер скользящего окна: 10000 знаков, шаг: 1000 знаков)
Максимальный фрагмент авторского текста, знаков: 19094 (в страницах — примерно 10; начинается где-то на 215-й)

Активный словарный запас

Использовано уникальных слов:9695
Активный словарный запас (АСЗ):8974
Активный несловарный запас (АНСЗ):721
Удельный АСЗ на 3000 слов текста:1157.28
Удельный АСЗ на 10000 слов текста:2719.03 —> 6265-е место в рейтинге УАСЗ-10000
Динамика изменения УАСЗ-3000 от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: УАСЗ-3000)
Максимальное значение УАСЗ-3000 (1288) приходится приблизительно на 180-ю страницу текста.
Миниимальное значение УАСЗ-3000 (1053) приходится приблизительно на 64-ю страницу текста.
Рост АСЗ от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: АСЗ)

Части речи

Неопределённых частей речи (НОЧР), слов:16385 (21.39% от СВП)
Определённых частей речи (ОЧР), слов:60210 (78.61% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное14997 (24.91%)
          Прилагательное5390 (8.95%)
          Глагол12993 (21.58%)
          Местоимение-существительное6557 (10.89%)
          Местоименное прилагательное2237 (3.72%)
          Местоимение-предикатив27 (0.04%)
          Числительное (количественное)402 (0.67%)
          Числительное (порядковое)122 (0.20%)
          Наречие2428 (4.03%)
          Предикатив90 (0.15%)
          Предлог7119 (11.82%)
          Союз2870 (4.77%)
          Междометие16 (0.03%)
          Вводное слово6 (0.01%)
          Частица2053 (3.41%)
          Причастие731 (1.21%)
          Деепричастие37 (0.06%)
Служебных слов:20885 (34.69%)

Биграммы частей речи

В таблице показаны частоты словопар типа «существительное+прилагательное», «прилагательное+глагол» и т.д. Для удобства восприятия частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

С
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
П
р
и
л
а
г
а
т
е
л
ь
н
о
е
Г
л
а
г
о
л
М
е
с
т
о
и
м
е
н
и
е
-
с
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
н
о
е

п
р
и
л
а
г
а
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
и
е
-
п
р
е
д
и
к
а
т
и
в
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
к
о
л
и
ч
е
с
т
в
е
н
н
о
е
)
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
п
о
р
я
д
к
о
в
о
е
)
Н
а
р
е
ч
и
е
П
р
е
д
и
к
а
т
и
в
П
р
е
д
л
о
г
С
о
ю
з
М
е
ж
д
о
м
е
т
и
е
В
в
о
д
н
о
е

с
л
о
в
о
Ч
а
с
т
и
ц
а
П
р
и
ч
а
с
т
и
е
Д
е
е
п
р
и
ч
а
с
т
и
е
Существительное361560157.021.4.108.3.423727.00.026.75.7.10
Прилагательное6412141.6.97.00.10.02.65.023.36.2.00.00.941.6.07
Глагол432221227.9.151.4.309.9.40579.00.025.93.15
Местоимение-существительное87.4594.53.1.07.60.159.10124.2.02.0010.52.10
Местоименное прилагательное227.35.22.41.00.10.02.92.021.2.52.00.00.92.32.00
Местоимение-предикатив.02.00.27.15.00.00.00.00.00.00.00.05.00.00.00.00.00
Числительное (колич-ое)3.7.80.80.15.17.00.40.15.12.00.32.15.00.00.02.07.00
Числительное (порядковое)1.7.12.07.02.00.00.05.00.00.00.05.07.00.00.02.00.00
Наречие2.94.7166.2.85.00.12.021.4.104.71.2.00.002.7.60.05
Предикатив.02.051.3.12.00.00.00.00.05.02.05.00.00.00.02.00.00
Предлог83241.91817.0031.1.15.00.00.00.00.00.051.7.00
Союз9.36.6176.41.6.07.30.153.4.174.9.27.00.003.3.65.15
Междометие.12.00.02.00.00.00.00.00.00.00.02.02.00.00.02.00.00
Вводное слово.12.00.00.00.00.00.00.00.00.00.02.00.00.00.00.00.00
Частица1.82.328.97.87.00.02.001.5.052.6.25.02.00.17.52.07
Причастие5.81.8.82.50.10.00.00.00.42.003.9.37.00.00.12.15.00
Деепричастие.15.00.07.00.00.00.00.00.02.00.27.02.00.00.02.02.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах.

В каждом столбце максимальное значение отмечено жирным шрифтом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»


 Номер слова в предложении
 1234567891011121314151617181920
Существительное1619222527282929263030292830333032313331
Прилагательное4.86.88.29.610101010119.21011111112128.1129.68.9
Глагол1830282523212121222120212019191920181722
Местоимение-существительное2819119.49.688.48.17.48.577.17.87.66.35.87.36.37.27.2
Местоименное прилагательное2.743.74.24.44443.43.93.84.33.24.54.23.74.43.64.53.3
Местоимение-предикатив.20.00.00.00.00.00.00.00.00.00.00.10.10.20.10.00.10.00.00.00
Числительное (колич-ое).70.60.80.80.80.80.70.30.90.60.50.301.70.70.60.70.50.50.60
Числительное (порядковое).40.30.10.20.30.30.10.20.20.40.00.00.20.00.20.20.10.30.00.20
Наречие7.95.54.23.73.53.73.93.73.83.53.32.72.92.82.94.133.63.94.7
Предикатив.20.30.20.10.20.20.10.10.20.00.00.20.20.20.00.00.00.30.20.40
Предлог137.7131312131212141313141413121312141213
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Союз5.52.53.13.54.75.45.96.76.35.56.15.66.25.65.35.86.55.96.85.4
Междометие.20.00.00.00.00.00.00.00.00.00.00.00.00.00.10.00.00.00.00.00
Вводное слово.10.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Частица2.23.94.83.93.43.73.13.543.14.23.33.33.23.23.72.22.73.51.6
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Причастие.50.50.90.901.11.61.51.81.71.61.61.71.51.122.52.81.41.21.9
Деепричастие.20.00.10.10.00.00.10.20.00.00.00.00.00.10.00.00.00.00.00.00

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая117.23
          .    точка86.60
          -    тире32.56
          !    восклицательный знак7.95
          ?    вопросительный знак7.48
          ...    многоточие6.16
          !..    воскл. знак с многоточием0.56
          ?..    вопр. знак с многоточием0.25
          !!!    тройной воскл. знак0.01
          ?!    вопр. знак с восклицанием0.09
          "    кавычка11.03
          ()    скобки0.31
          :    двоеточие4.75
          ;    точка с запятой2.09




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Вадим Шефнер
 51
2. Валерий Алексеев
 43
3. Владислав Крапивин
 42
4. Мария Галина
 42
5. Аркадий и Борис Стругацкие
 42
6. Эдуард Веркин
 42
7. Сергей Лукьяненко
 42
8. Кир Булычев
 41
9. Константин Сергиенко
 41
10. Андрей Валентинов
 41
...смотреть весь список >>
⇑ Наверх