FantLab ru



  Лингвистический анализ произведения
Произведение: Жизнь как год
Автор: Виктор Колупаев
Дата проведения анализа: 18 сентября 2022 года

Общая статистика

Длина текста, знаков:196846
Слов в произведении (СВП):32118
Приблизительно страниц:101
Средняя длина слова, знаков:4.76
Средняя длина предложения (СДП), знаков:42.57
СДП авторского текста, знаков:46.72
СДП диалога, знаков:25.84
Доля диалогов в тексте:12.07%
Доля авторского текста в диалогах:9.24%
Использование диалогов по тексту
(по горизонтали: счётчик знаков; по вертикали: процент диалогов;
размер скользящего окна: знаков, шаг: 1000 знаков)

Активный словарный запас

Использовано уникальных слов:4787
Активный словарный запас (АСЗ):4620
Активный несловарный запас (АНСЗ):167
Удельный АСЗ на 3000 слов текста:970.18
Удельный АСЗ на 10000 слов текста:2276.96 —> 11386-е место в рейтинге УАСЗ-10000
Динамика изменения УАСЗ-3000 от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: УАСЗ-3000)
Максимальное значение УАСЗ-3000 (0) приходится приблизительно на 0-ю страницу текста.
Миниимальное значение УАСЗ-3000 (10000000) приходится приблизительно на 0-ю страницу текста.

Части речи

Неопределённых частей речи (НОЧР), слов:9164 (28.53% от СВП)
Определённых частей речи (ОЧР), слов:22954 (71.47% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное6628 (28.88%)
          Прилагательное2227 (9.70%)
          Глагол5745 (25.03%)
          Местоимение-существительное3742 (16.30%)
          Местоименное прилагательное1402 (6.11%)
          Местоимение-предикатив4 (0.02%)
          Числительное (количественное)372 (1.62%)
          Числительное (порядковое)43 (0.19%)
          Наречие1821 (7.93%)
          Предикатив403 (1.76%)
          Предлог2557 (11.14%)
          Союз3540 (15.42%)
          Междометие589 (2.57%)
          Вводное слово139 (0.61%)
          Частица2335 (10.17%)
          Причастие284 (1.24%)
          Деепричастие79 (0.34%)
Служебных слов:14387 (62.68%)

Биграммы частей речи

В таблице показаны частоты словопар типа «существительное+прилагательное», «прилагательное+глагол» и т.д. Для удобства восприятия частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

С
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
П
р
и
л
а
г
а
т
е
л
ь
н
о
е
Г
л
а
г
о
л
М
е
с
т
о
и
м
е
н
и
е
-
с
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
н
о
е

п
р
и
л
а
г
а
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
и
е
-
п
р
е
д
и
к
а
т
и
в
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
к
о
л
и
ч
е
с
т
в
е
н
н
о
е
)
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
п
о
р
я
д
к
о
в
о
е
)
Н
а
р
е
ч
и
е
П
р
е
д
и
к
а
т
и
в
П
р
е
д
л
о
г
С
о
ю
з
М
е
ж
д
о
м
е
т
и
е
В
в
о
д
н
о
е

с
л
о
в
о
Ч
а
с
т
и
ц
а
П
р
и
ч
а
с
т
и
е
Д
е
е
п
р
и
ч
а
с
т
и
е
Существительное2914329.36.9.001.5.18101.622275.73112.7.48
Прилагательное286.3122.41.2.04.48.002.2.8136.2.48.373.21.4.15
Глагол339.4211511.072.5.07111.530192.7.1891.2.48
Местоимение-существительное138.6439.94.3.001.1.15111.76.48.311.117.73.11
Местоименное прилагательное194.85.43.11.5.00.40.182.1.881.92.6.51.072.8.48.04
Местоимение-предикатив.00.00.11.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Числительное (колич-ое)6.551.4.40.26.00.22.07.29.00.51.92.22.07.77.11.04
Числительное (порядковое).55.04.18.07.04.00.00.04.00.00.07.29.00.00.07.00.00
Наречие4.15.5167.31.3.00.59.044.21.13.56.4.92.224.9.51.18
Предикатив.73.702.61.1.18.00.11.00.55.33.841.4.22.04.95.04.07
Предлог489.42.61213.002.7.40.44.00.11.73.00.00.661.1.59
Союз218.922214.3.041.2.229.21.58.7101.2.3714.84.29
Междометие4.81.116.51.4.00.18.041.5.22.591.9.26.041.5.04.00
Вводное слово.55.26.88.88.22.00.04.00.44.07.37.73.04.00.37.07.00
Частица8.74.2327.32.001.2.074.214.88.1.62.517.1.55.04
Причастие4.11.2.37.37.07.00.04.00.59.001.7.26.07.00.33.18.04
Деепричастие.22.04.33.26.07.00.11.00.11.00.44.48.04.00.33.00.04

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах.

В каждом столбце максимальное значение отмечено жирным шрифтом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»


 Номер слова в предложении
 12345678910
Существительное12161722232425262625
Прилагательное3.85.97.26.77.37.58.96.68.18
Глагол10212022202018171919
Местоимение-существительное2415139.99.17.5888.56.9
Местоименное прилагательное1.93.24.34.55.85.35.64.95.45.5
Местоимение-предикатив.00.00.00.00.00.00.00.00.00.00
Числительное (колич-ое).701.31.21.51.41.61.111.21
Числительное (порядковое).10.20.20.10.10.00.20.30.00.10
Наречие5.38.16.15.25.44.74.75.94.75.9
Предикатив2.41.611.31.4.80.70.70.901.4
Предлог55.38.88.98.19.1109.98.97.8
Союз21119.68.88.39.19.7108.48.9
Междометие51.21.31.71.61.61.1.70.701.1
Вводное слово.80.60.70.40.40.20.20.10.30.70
Частица6.79.88.66.77.56.85.87.267.1
Причастие.30.40.60.80.701.1.901.71.51.4
Деепричастие.20.20.10.20.10.20.30.30.40.30

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая112.99
          .    точка114.14
          -    тире11.52
          !    восклицательный знак10.87
          ?    вопросительный знак12.80
          ...    многоточие7.16
          !..    воскл. знак с многоточием0.09
          ?..    вопр. знак с многоточием0.06
          !!!    тройной воскл. знак0.03
          ?!    вопр. знак с восклицанием0.78
          "    кавычка5.70
          ()    скобки0.19
          :    двоеточие2.65
          ;    точка с запятой0.62




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Виктор Колупаев
 42  – ожидает пересчёта
2. Зиновий Юрьев
 34  – ожидает пересчёта
3. Константин Якименко
 34  – ожидает пересчёта
4. Валерий Владимирович Медведев
 33  – ожидает пересчёта
5. Ксения Букша
 33  – ожидает пересчёта
6. Эдуард Николаевич Веркин
 33  – ожидает пересчёта
7. Мария Галина
 32  – ожидает пересчёта
8. Кира Измайлова
 32  – ожидает пересчёта
9. Дмитрий Глуховский
 32  – ожидает пересчёта
10. Валерий Алексеев
 32  – ожидает пересчёта
...смотреть весь список >>
⇑ Наверх