FantLab ru



  Лингвистический анализ произведения
Произведение: Скользящий по лезвию
Автор: Юлия Зонис
Дата проведения анализа: 25 июля 2018 года

Общая статистика

Длина текста, знаков:438163
Слов в произведении (СВП):63870
Приблизительно страниц:229
Средняя длина слова, знаков:5.41
Средняя длина предложения (СДП), знаков:61.91
СДП авторского текста, знаков:72.26
СДП диалога, знаков:40.83
Доля диалогов в тексте:21.79%
Доля авторского текста в диалогах:10.62%
Использование диалогов по тексту
(по горизонтали: счётчик знаков; по вертикали: процент диалогов;
размер скользящего окна: 10000 знаков, шаг: 1000 знаков)
Максимальный фрагмент авторского текста, знаков: 11620 (в страницах — примерно 6; начинается где-то на 109-й)

Активный словарный запас

Использовано уникальных слов:10100
Активный словарный запас (АСЗ):9396
Активный несловарный запас (АНСЗ):704
Удельный АСЗ на 3000 слов текста:1335.77
Удельный АСЗ на 10000 слов текста:3206.64 —> 1334-е место в рейтинге УАСЗ-10000
Динамика изменения УАСЗ-3000 от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: УАСЗ-3000)
Максимальное значение УАСЗ-3000 (1435) приходится приблизительно на 78-ю страницу текста.
Миниимальное значение УАСЗ-3000 (1224) приходится приблизительно на 34-ю страницу текста.
Рост АСЗ от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: АСЗ)

Части речи

Неопределённых частей речи (НОЧР), слов:12369 (19.37% от СВП)
Определённых частей речи (ОЧР), слов:51501 (80.63% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное16357 (31.76%)
          Прилагательное4857 (9.43%)
          Глагол10814 (21.00%)
          Местоимение-существительное2883 (5.60%)
          Местоименное прилагательное1415 (2.75%)
          Местоимение-предикатив4 (0.01%)
          Числительное (количественное)316 (0.61%)
          Числительное (порядковое)86 (0.17%)
          Наречие1534 (2.98%)
          Предикатив51 (0.10%)
          Предлог5725 (11.12%)
          Союз2542 (4.94%)
          Междометие75 (0.15%)
          Вводное слово8 (0.02%)
          Частица1432 (2.78%)
          Причастие997 (1.94%)
          Деепричастие89 (0.17%)
Служебных слов:14084 (27.35%)

Биграммы частей речи

В таблице показаны частоты словопар типа «существительное+прилагательное», «прилагательное+глагол» и т.д. Для удобства восприятия частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

С
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
П
р
и
л
а
г
а
т
е
л
ь
н
о
е
Г
л
а
г
о
л
М
е
с
т
о
и
м
е
н
и
е
-
с
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
н
о
е

п
р
и
л
а
г
а
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
и
е
-
п
р
е
д
и
к
а
т
и
в
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
к
о
л
и
ч
е
с
т
в
е
н
н
о
е
)
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
п
о
р
я
д
к
о
в
о
е
)
Н
а
р
е
ч
и
е
П
р
е
д
и
к
а
т
и
в
П
р
е
д
л
о
г
С
о
ю
з
М
е
ж
д
о
м
е
т
и
е
В
в
о
д
н
о
е

с
л
о
в
о
Ч
а
с
т
и
ц
а
П
р
и
ч
а
с
т
и
е
Д
е
е
п
р
и
ч
а
с
т
и
е
Существительное5823837.34.3.03.96.209.5.264234.44.006.38.6.73
Прилагательное771018.87.47.00.15.00.52.033.54.4.06.00.491.8.12
Глагол622223116.2.031.5.296.3.15578.4.15.004.94.3.06
Местоимение-существительное6.54.3311.51.4.03.17.062.5.064.81.6.00.006.5.20.03
Местоименное прилагательное185.34.31.3.47.00.17.03.38.06.84.23.03.00.58.44.00
Местоимение-предикатив.00.00.09.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Числительное (колич-ое)4.1.61.61.17.03.00.41.06.03.00.41.20.00.00.09.26.00
Числительное (порядковое)1.5.17.26.03.00.00.03.00.00.00.00.06.00.00.00.00.00
Наречие3.22.9123.4.55.00.17.031.4.032.8.93.06.002.2.67.03
Предикатив.03.12.76.03.00.00.00.00.00.00.06.03.00.00.09.00.00
Предлог912418.812.001.6.76.09.00.00.00.06.00.033.7.00
Союз129202.81.4.00.26.062.7.123.8.23.09.003.71.5.52
Междометие.09.06.35.12.06.00.00.00.09.00.09.15.03.00.06.00.00
Вводное слово.03.03.06.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Частица2126.70.76.00.03.00.70.001.4.29.00.00.41.38.03
Причастие122.41.2.23.26.00.03.00.26.005.8.70.00.00.03.41.03
Деепричастие.90.23.35.12.00.00.00.00.00.00.35.23.00.00.00.09.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах.

В каждом столбце максимальное значение отмечено жирным шрифтом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»


 Номер слова в предложении
 1234567891011121314151617181920
Существительное3325273133353537353637393836393537384036
Прилагательное6.47.67.29.61111119.7121212121012111213111114
Глагол1233322724211919191918161818171819181518
Местоимение-существительное1610764.34.33.53.433.53.32.52.83.82.54.13.333.11.7
Местоименное прилагательное3.23.72.82.82.92.52.72.82.72.53.62.92.52.92.72.932.62.12.5
Местоимение-предикатив.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Числительное (колич-ое).50.80.50.60.60.70.70.70.60.60.601.701.60.20.70.70.20.50
Числительное (порядковое).30.20.10.00.10.10.30.20.20.30.20.10.20.20.20.00.30.00.40.50
Наречие6.23.73.72.12.62.63.32.22.53.12.23.12.52.22.12.43.322.93.9
Предикатив.30.10.10.10.10.20.10.10.10.00.10.10.00.10.00.00.10.00.00.20
Предлог12711121212131213111313131313129.9131313
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Союз6.42.42.93.44.66.46.36.96.56.65.46.16.45.75.17.25.166.25.9
Междометие.70.20.00.10.10.10.00.10.20.00.10.10.20.20.20.00.00.20.40.00
Вводное слово.10.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Частица1.94.64.33.92.92.12.82.42.72.12.11.62.32.63.12.23.32.33.11.5
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Причастие.801.31.51.61.82.322.42.43.32.72.42.92.72.63.61.93.62.53.2
Деепричастие.40.30.20.20.10.10.10.20.20.10.10.10.10.20.00.30.00.20.00.20

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая115.95
          .    точка93.36
          -    тире18.71
          !    восклицательный знак2.25
          ?    вопросительный знак8.63
          ...    многоточие3.43
          !..    воскл. знак с многоточием0.00
          ?..    вопр. знак с многоточием0.09
          !!!    тройной воскл. знак0.00
          ?!    вопр. знак с восклицанием0.08
          "    кавычка10.93
          ()    скобки0.45
          :    двоеточие4.38
          ;    точка с запятой0.02




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Юлия Зонис
 50
2. Алексей Иванов
 46
3. Сергей Волков
 45
4. Андрей Левицкий
 44
5. Марина и Сергей Дяченко
 44
6. Александр Етоев
 44
7. Максим Хорсун
 43
8. Владимир Васильев
 43
9. Генри Лайон Олди
 43
10. Александр Житинский
 43
...смотреть весь список >>
⇑ Наверх