fantlab ru



  Лингвистический анализ произведения
Произведение: Я убил смерть
Автор: Георгий Бальдыш
Дата проведения анализа: 19 сентября 2022 года

Общая статистика

Длина текста, знаков:281797
Слов в произведении (СВП):42211
Приблизительно страниц:142
Средняя длина слова, знаков:5.1
Средняя длина предложения (СДП), знаков:57.43
СДП авторского текста, знаков:67.21
СДП диалога, знаков:45.77
Доля диалогов в тексте:36.43%
Доля авторского текста в диалогах:8.31%
Использование диалогов по тексту
(по горизонтали: счётчик знаков; по вертикали: процент диалогов;
размер скользящего окна: знаков, шаг: 1000 знаков)

Активный словарный запас

Использовано уникальных слов:8047
Активный словарный запас (АСЗ):7607
Активный несловарный запас (АНСЗ):440
Удельный АСЗ на 3000 слов текста:1230.10
Удельный АСЗ на 10000 слов текста:3030.35 отсутствует в рейтинге УАСЗ-10000
Динамика изменения УАСЗ-3000 от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: УАСЗ-3000)
Максимальное значение УАСЗ-3000 (0) приходится приблизительно на 0-ю страницу текста.
Миниимальное значение УАСЗ-3000 (10000000) приходится приблизительно на 0-ю страницу текста.

Части речи

Неопределённых частей речи (НОЧР), слов:9823 (23.27% от СВП)
Определённых частей речи (ОЧР), слов:32388 (76.73% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное9626 (29.72%)
          Прилагательное3217 (9.93%)
          Глагол8228 (25.40%)
          Местоимение-существительное4831 (14.92%)
          Местоименное прилагательное1931 (5.96%)
          Местоимение-предикатив4 (0.01%)
          Числительное (количественное)341 (1.05%)
          Числительное (порядковое)59 (0.18%)
          Наречие1832 (5.66%)
          Предикатив288 (0.89%)
          Предлог3918 (12.10%)
          Союз3272 (10.10%)
          Междометие593 (1.83%)
          Вводное слово146 (0.45%)
          Частица2713 (8.38%)
          Причастие552 (1.70%)
          Деепричастие121 (0.37%)
Служебных слов:17529 (54.12%)

Биграммы частей речи

В таблице показаны частоты словопар типа «существительное+прилагательное», «прилагательное+глагол» и т.д. Для удобства восприятия частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

С
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
П
р
и
л
а
г
а
т
е
л
ь
н
о
е
Г
л
а
г
о
л
М
е
с
т
о
и
м
е
н
и
е
-
с
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
н
о
е

п
р
и
л
а
г
а
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
и
е
-
п
р
е
д
и
к
а
т
и
в
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
к
о
л
и
ч
е
с
т
в
е
н
н
о
е
)
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
п
о
р
я
д
к
о
в
о
е
)
Н
а
р
е
ч
и
е
П
р
е
д
и
к
а
т
и
в
П
р
е
д
л
о
г
С
о
ю
з
М
е
ж
д
о
м
е
т
и
е
В
в
о
д
н
о
е

с
л
о
в
о
Ч
а
с
т
и
ц
а
П
р
и
ч
а
с
т
и
е
Д
е
е
п
р
и
ч
а
с
т
и
е
Существительное361343139.4.00.82.307.61.125213.22114.68
Прилагательное415.4132.51.00.38.001.6.224.24.3.47.083.21.3.27
Глагол3915252013.032.088.31.137163.5.71112.5.66
Местоимение-существительное9.29.5519.43.4.05.79.059.1.997.761.3.8514.60.25
Местоименное прилагательное226.36.12.31.6.00.16.11.96.252.42.2.30.143.11.08
Местоимение-предикатив.03.00.08.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Числительное (колич-ое)3.3.901.1.30.27.00.19.03.14.001.1.82.03.03.25.05.05
Числительное (порядковое).96.05.25.03.00.00.00.00.00.00.00.08.03.00.03.03.00
Наречие3.251461.2.03.19.053.2.5243.1.44.113.9.60.16
Предикатив.68.441.7.90.27.00.05.00.22.19.44.47.19.00.71.00.00
Предлог54143.51214.001.9.79.55.05.191.1.00.00.492.00
Союз106.318172.5.00.77.086.5.995.95.5.96.858.81.36
Междометие4.5.66.604.9.93.00.08.00.90.14.331.7.11.00.74.19.03
Вводное слово.33.30.55.68.14.00.03.00.47.03.47.36.14.00.25.00.00
Частица8.83.9288.21.5.00.68.003.1.604.74.6.44.196.8.77.11
Причастие6.61.6.36.66.55.00.05.00.38.002.5.66.14.00.36.33.03
Деепричастие.77.25.25.25.16.00.00.00.08.00.71.33.00.00.33.00.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах.

В каждом столбце максимальное значение отмечено жирным шрифтом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»


 Номер слова в предложении
 12345678910
Существительное15162023242627272727
Прилагательное3.56.97.17.88.78.78.89.38.39.1
Глагол13302422202018171818
Местоимение-существительное2514119.78.99.48.49.298
Местоименное прилагательное23.64.14.454.65.15.15.55.4
Местоимение-предикатив.00.00.00.00.00.00.00.00.00.00
Числительное (колич-ое).90.70.6011.1.80.70.501.11.2
Числительное (порядковое).10.20.20.10.20.20.10.10.20.10
Наречие5.16.25.44.73.43.53.944.23.2
Предикатив1.3.70.80.80.60.70.80.70.50.30
Предлог75.5119.9119.410109.310
Союз155.95.37.66.87.27.97.36.27.1
Междометие4.90.9011.51.61.111.51
Вводное слово.60.60.30.30.20.30.30.30.20.10
Частица6.37.87.65.46.65.95.65.96.56.8
Причастие.40.601.41.31.91.61.71.71.91.9
Деепричастие.40.20.20.30.30.30.30.40.20.10

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая119.21
          .    точка87.70
          -    тире33.57
          !    восклицательный знак5.66
          ?    вопросительный знак11.63
          ...    многоточие19.78
          !..    воскл. знак с многоточием0.28
          ?..    вопр. знак с многоточием1.66
          !!!    тройной воскл. знак0.05
          ?!    вопр. знак с восклицанием0.36
          "    кавычка11.54
          ()    скобки1.09
          :    двоеточие9.50
          ;    точка с запятой0.59




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


Внимание! У Георгия Бальдыша пока не сформирован лингвистический паспорт, а значит этого автора в списке результатов не будет в любом случае. Проверка авторства для данного произведения не может претендовать на верный результат.

АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Вячеслав Рыбаков
 38
2. Василий Аксёнов
 37
3. Дмитрий Вересов
 36
4. Олег Рой
 36
5. Марина и Сергей Дяченко
 36
6. Аркадий и Борис Стругацкие
 36
7. Юлия Остапенко
 36
8. Сергей Лукьяненко
 36
9. Юлий Буркин
 36
10. Ольга Онойко
 36
...смотреть весь список >>
⇑ Наверх