FantLab ru



  Лингвистический анализ произведения
Произведение: Тень Скорпиона
Автор: Александр Плахотин
Дата проведения анализа: 24 июля 2018 года

Общая статистика

Длина текста, знаков:540514
Слов в произведении (СВП):78592
Приблизительно страниц:275
Средняя длина слова, знаков:5.29
Средняя длина предложения (СДП), знаков:55.53
СДП авторского текста, знаков:73.97
СДП диалога, знаков:43
Доля диалогов в тексте:46.31%
Доля авторского текста в диалогах:6.01%

Активный словарный запас

Использовано уникальных слов:9980
Активный словарный запас (АСЗ):9372
Активный несловарный запас (АНСЗ):608
Удельный АСЗ на 3000 слов текста:1303.84
Удельный АСЗ на 10000 слов текста:3023.59 —> 2826-е место в рейтинге УАСЗ-10000

Части речи

Неопределённых частей речи (НОЧР), слов:16953 (21.57% от СВП)
Определённых частей речи (ОЧР), слов:61639 (78.43% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное17941 (29.11%)
          Прилагательное4842 (7.86%)
          Глагол14322 (23.24%)
          Местоимение-существительное4065 (6.59%)
          Местоименное прилагательное2250 (3.65%)
          Местоимение-предикатив15 (0.02%)
          Числительное (количественное)286 (0.46%)
          Числительное (порядковое)107 (0.17%)
          Наречие1860 (3.02%)
          Предикатив95 (0.15%)
          Предлог6572 (10.66%)
          Союз2672 (4.33%)
          Междометие52 (0.08%)
          Вводное слово14 (0.02%)
          Частица2086 (3.38%)
          Причастие1304 (2.12%)
          Деепричастие110 (0.18%)
Служебных слов:17726 (28.76%)

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая124.06
          .    точка74.77
          -    тире39.94
          !    восклицательный знак11.80
          ?    вопросительный знак15.84
          ...    многоточие20.50
          !..    воскл. знак с многоточием1.25
          ?..    вопр. знак с многоточием0.70
          !!!    тройной воскл. знак0.65
          ?!    вопр. знак с восклицанием1.82
          "    кавычка13.13
          ()    скобки0.53
          :    двоеточие3.69
          ;    точка с запятой0.22




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Александр Плахотин
 50
2. Марина и Сергей Дяченко
 44
3. Виктор Ночкин
 44
4. Андрей Валентинов
 43
5. Галина Романова
 43
6. Елена Хаецкая
 43
7. Генри Лайон Олди
 43  – ожидает пересчёта
8. Александр Мазин
 43
9. Диана Удовиченко
 43
10. Александр Рудазов
 43
...смотреть весь список >>
⇑ Наверх