FantLab ru



  Лингвистический анализ произведения
Произведение: Чердак Вселенной
Автор: Сергей Павлов
Дата проведения анализа: 23 июля 2018 года

Общая статистика

Длина текста, знаков:129414
Слов в произведении (СВП):17446
Приблизительно страниц:67
Средняя длина слова, знаков:5.79
Средняя длина предложения (СДП), знаков:51.36
СДП авторского текста, знаков:69.18
СДП диалога, знаков:38.39
Доля диалогов в тексте:43.41%
Доля авторского текста в диалогах:6.32%
Использование диалогов по тексту
(по горизонтали: счётчик знаков; по вертикали: процент диалогов;
размер скользящего окна: 10000 знаков, шаг: 1000 знаков)
Максимальный фрагмент авторского текста, знаков: 10120 (в страницах — примерно 5; начинается где-то на 6-й)

Активный словарный запас

Использовано уникальных слов:4358
Активный словарный запас (АСЗ):4020
Активный несловарный запас (АНСЗ):338
Удельный АСЗ на 3000 слов текста:1299.95
Удельный АСЗ на 10000 слов текста:2961.00 —> 3358-е место в рейтинге УАСЗ-10000
Динамика изменения УАСЗ-3000 от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: УАСЗ-3000)
Максимальное значение УАСЗ-3000 (1468) приходится приблизительно на 1-ю страницу текста.
Миниимальное значение УАСЗ-3000 (1201) приходится приблизительно на 34-ю страницу текста.
Рост АСЗ от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: АСЗ)

Части речи

Неопределённых частей речи (НОЧР), слов:3352 (19.21% от СВП)
Определённых частей речи (ОЧР), слов:14094 (80.79% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное4104 (29.12%)
          Прилагательное1574 (11.17%)
          Глагол2967 (21.05%)
          Местоимение-существительное816 (5.79%)
          Местоименное прилагательное416 (2.95%)
          Местоимение-предикатив0 (0.00%)
          Числительное (количественное)106 (0.75%)
          Числительное (порядковое)32 (0.23%)
          Наречие490 (3.48%)
          Предикатив35 (0.25%)
          Предлог1377 (9.77%)
          Союз622 (4.41%)
          Междометие19 (0.13%)
          Вводное слово7 (0.05%)
          Частица365 (2.59%)
          Причастие179 (1.27%)
          Деепричастие8 (0.06%)
Служебных слов:3622 (25.70%)

Биграммы частей речи

В таблице показаны частоты словопар типа «существительное+прилагательное», «прилагательное+глагол» и т.д. Для удобства восприятия частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

С
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
П
р
и
л
а
г
а
т
е
л
ь
н
о
е
Г
л
а
г
о
л
М
е
с
т
о
и
м
е
н
и
е
-
с
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
н
о
е

п
р
и
л
а
г
а
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
и
е
-
п
р
е
д
и
к
а
т
и
в
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
к
о
л
и
ч
е
с
т
в
е
н
н
о
е
)
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
п
о
р
я
д
к
о
в
о
е
)
Н
а
р
е
ч
и
е
П
р
е
д
и
к
а
т
и
в
П
р
е
д
л
о
г
С
о
ю
з
М
е
ж
д
о
м
е
т
и
е
В
в
о
д
н
о
е

с
л
о
в
о
Ч
а
с
т
и
ц
а
П
р
и
ч
а
с
т
и
е
Д
е
е
п
р
и
ч
а
с
т
и
е
Существительное6335626.69.1.002.3.807.4.803626.00.235.36.00
Прилагательное949.8211.7.91.00.23.00.45.2355.5.00.0011.3.11
Глагол612430156.4.001.4.2310.23518.6.00.006.33.9.00
Местоимение-существительное5.17.8331.9.80.00.11.004.8.345.22.11.236.57.00
Местоименное прилагательное196.72.71.51.4.00.11.001.1.001.1.23.00.11.68.57.00
Местоимение-предикатив.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Числительное (колич-ое)31.3.68.00.34.00.57.91.45.00.57.34.00.00.00.00.00
Числительное (порядковое)1.8.11.23.11.00.00.00.00.00.00.23.11.00.00.00.00.00
Наречие3.35.9154.45.00.23.001.5.112.7.91.00.002.2.34.11
Предикатив.11.112.5.11.00.00.00.00.11.00.00.00.00.00.00.00.00
Предлог82251.45.611.001.8.45.00.00.00.00.00.00.001.4.00
Союз9.48.6153.51.7.00.68.004.4.112.5.34.00.002.8.68.45
Междометие.11.00.11.23.00.00.00.00.00.00.00.11.00.00.11.00.00
Вводное слово.00.11.23.00.00.00.00.00.00.00.00.00.00.00.23.00.00
Частица1.51.525.45.45.00.00.001.8.001.9.00.00.00.23.11.00
Причастие7.52.41.1.34.23.00.00.00.57.002.4.23.00.00.00.11.00
Деепричастие.11.00.00.00.00.00.00.00.00.00.68.00.00.00.00.11.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах.

В каждом столбце максимальное значение отмечено жирным шрифтом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»


 Номер слова в предложении
 1234567891011121314151617181920
Существительное2223283232343636353634384242323636344544
Прилагательное8.711109.613121212161414141212201819221216
Глагол243426262121191917181915171717152013157.6
Местоимение-существительное149.27.84.55.63.94.24.134.543.42.71.82.91.82.52.32.53.8
Местоименное прилагательное2.13.92.73.43.23.43.62.93.72.83.23.73.13.14.94.71.93.12.51.9
Местоимение-предикатив.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Числительное (колич-ое)1.1.201.1.90.901.2.70.70.70.60.50.601.901.002.5.801.7.00
Числительное (порядковое).60.20.20.30.10.20.20.10.00.40.00.00.00.40.00.60.00.00.80.00
Наречие5.84.54.13.54.23.13.23.22.72.63.72.63.83.12.92.91.91.51.73.8
Предикатив.30.20.50.50.40.00.10.10.00.00.20.00.70.00.00.601.2.00.00.00
Предлог9.26.3111211101312121012159.31114148.7129.912
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Союз8.12.14.33.74.65.83.755.15.45.74.35.54.44.42.94.36.95.83.8
Междометие1.1.10.10.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Вводное слово.10.20.00.10.00.00.10.10.00.00.00.00.00.00.00.00.00.00.00.00
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Частица1.73.83.62.63.22.92.72.53.22.622.62.13.5.001.81.23.8.804.8
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Причастие.801.2.601.31.32.21.51.62.12.12.90.701.3.502.41.21.52.51.9
Деепричастие.10.00.10.10.00.00.10.00.00.20.00.30.30.00.00.00.00.00.00.00

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая113.32
          .    точка100.20
          -    тире42.53
          !    восклицательный знак9.00
          ?    вопросительный знак11.52
          ...    многоточие17.94
          !..    воскл. знак с многоточием2.52
          ?..    вопр. знак с многоточием1.09
          !!!    тройной воскл. знак0.00
          ?!    вопр. знак с восклицанием0.34
          "    кавычка20.00
          ()    скобки0.46
          :    двоеточие6.19
          ;    точка с запятой0.40




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Сергей Павлов
 38  – ожидает пересчёта
2. Андрей Столяров
 35  – ожидает пересчёта
3. Аркадий и Борис Стругацкие
 35  – ожидает пересчёта
4. Владимир Васильев
 34  – ожидает пересчёта
5. Андрей Валентинов
 34  – ожидает пересчёта
6. Евгений Велтистов
 34
7. Генри Лайон Олди
 34  – ожидает пересчёта
8. Геннадий Прашкевич
 34  – ожидает пересчёта
9. Валентин Леженда
 33
10. Александр Беляев
 33  – ожидает пересчёта
...смотреть весь список >>
⇑ Наверх