FantLab ru



  Лингвистический анализ произведения
Произведение: Высшая раса
Автор: Дмитрий Казаков
Дата проведения анализа: 23 июля 2018 года

Общая статистика

Длина текста, знаков:621555
Слов в произведении (СВП):82691
Приблизительно страниц:306
Средняя длина слова, знаков:5.59
Средняя длина предложения (СДП), знаков:66.2
СДП авторского текста, знаков:82.68
СДП диалога, знаков:51.85
Доля диалогов в тексте:41.98%
Доля авторского текста в диалогах:18.69%

Активный словарный запас

Использовано уникальных слов:9913
Активный словарный запас (АСЗ):9376
Активный несловарный запас (АНСЗ):537
Удельный АСЗ на 3000 слов текста:1340.95
Удельный АСЗ на 10000 слов текста:3051.10 —> 2567-е место в рейтинге УАСЗ-10000

Части речи

Неопределённых частей речи (НОЧР), слов:15925 (19.26% от СВП)
Определённых частей речи (ОЧР), слов:66766 (80.74% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное21549 (32.28%)
          Прилагательное6465 (9.68%)
          Глагол14316 (21.44%)
          Местоимение-существительное3406 (5.10%)
          Местоименное прилагательное2123 (3.18%)
          Местоимение-предикатив5 (0.01%)
          Числительное (количественное)470 (0.70%)
          Числительное (порядковое)173 (0.26%)
          Наречие1753 (2.63%)
          Предикатив76 (0.11%)
          Предлог7539 (11.29%)
          Союз2979 (4.46%)
          Междометие29 (0.04%)
          Вводное слово1 (0.00%)
          Частица1543 (2.31%)
          Причастие1572 (2.35%)
          Деепричастие48 (0.07%)
Служебных слов:17625 (26.40%)

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая134.54
          .    точка88.92
          -    тире42.11
          !    восклицательный знак9.60
          ?    вопросительный знак8.76
          ...    многоточие3.18
          !..    воскл. знак с многоточием0.00
          ?..    вопр. знак с многоточием0.00
          !!!    тройной воскл. знак0.00
          ?!    вопр. знак с восклицанием0.05
          "    кавычка4.70
          ()    скобки0.13
          :    двоеточие2.37
          ;    точка с запятой0.08




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Дмитрий Казаков
 46
2. Алексей Живой
 43  – ожидает пересчёта
3. Владимир Васильев
 43
4. Андрей Фролов
 42
5. Сергей Синякин
 42
6. [Для текстов по лингвоанализу]
 42
7. Сергей Тармашев
 42
8. Евгений Коршунов
 42
9. Сергей Волков
 41
10. Максим Хорсун
 41
...смотреть весь список >>
⇑ Наверх