FantLab ru



  Лингвистический анализ произведения
Произведение: Режим человека
Автор: Сергей Вольнов
Дата проведения анализа: 26 июля 2018 года

Общая статистика

Длина текста, знаков:580553
Слов в произведении (СВП):80726
Приблизительно страниц:298
Средняя длина слова, знаков:5.57
Средняя длина предложения (СДП), знаков:75.39
СДП авторского текста, знаков:90.89
СДП диалога, знаков:54.65
Доля диалогов в тексте:31.06%
Доля авторского текста в диалогах:13.67%

Активный словарный запас

Использовано уникальных слов:11896
Активный словарный запас (АСЗ):10575
Активный несловарный запас (АНСЗ):1321
Удельный АСЗ на 3000 слов текста:1362.61
Удельный АСЗ на 10000 слов текста:3289.96 —> 918-е место в рейтинге УАСЗ-10000

Части речи

Неопределённых частей речи (НОЧР), слов:16634 (20.61% от СВП)
Определённых частей речи (ОЧР), слов:64092 (79.39% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное18155 (28.33%)
          Прилагательное6597 (10.29%)
          Глагол12407 (19.36%)
          Местоимение-существительное3309 (5.16%)
          Местоименное прилагательное2769 (4.32%)
          Местоимение-предикатив19 (0.03%)
          Числительное (количественное)301 (0.47%)
          Числительное (порядковое)165 (0.26%)
          Наречие2276 (3.55%)
          Предикатив118 (0.18%)
          Предлог6922 (10.80%)
          Союз3122 (4.87%)
          Междометие35 (0.05%)
          Вводное слово13 (0.02%)
          Частица2263 (3.53%)
          Причастие1649 (2.57%)
          Деепричастие42 (0.07%)
Служебных слов:18452 (28.79%)

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая127.91
          .    точка72.37
          -    тире24.65
          !    восклицательный знак6.28
          ?    вопросительный знак4.42
          ...    многоточие12.46
          !..    воскл. знак с многоточием0.10
          ?..    вопр. знак с многоточием0.50
          !!!    тройной воскл. знак0.12
          ?!    вопр. знак с восклицанием0.71
          "    кавычка12.70
          ()    скобки0.09
          :    двоеточие1.24
          ;    точка с запятой1.19




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Сергей Вольнов
 54
2. Александр Бушков
 46
3. Владимир Васильев
 46
4. Вячеслав Шалыгин
 45
5. Андрей Столяров
 44
6. Сергей Тармашев
 44
7. [Для текстов по лингвоанализу]
 44
8. Андрей Щупов
 44
9. Владислав Выставной
 44
10. Дмитрий Силлов
 44
...смотреть весь список >>
⇑ Наверх