FantLab ru



  Лингвистический анализ произведения
Произведение: Скалолазка и Камень Судеб
Автор: Олег Синицын
Дата проведения анализа: 23 июля 2018 года

Общая статистика

Длина текста, знаков:586723
Слов в произведении (СВП):84710
Приблизительно страниц:309
Средняя длина слова, знаков:5.5
Средняя длина предложения (СДП), знаков:49.62
СДП авторского текста, знаков:55.22
СДП диалога, знаков:38.81
Доля диалогов в тексте:26.76%
Доля авторского текста в диалогах:6.49%

Активный словарный запас

Использовано уникальных слов:10870
Активный словарный запас (АСЗ):10418
Активный несловарный запас (АНСЗ):452
Удельный АСЗ на 3000 слов текста:1313.68
Удельный АСЗ на 10000 слов текста:3107.48 —> 2051-е место в рейтинге УАСЗ-10000

Части речи

Неопределённых частей речи (НОЧР), слов:16318 (19.26% от СВП)
Определённых частей речи (ОЧР), слов:68392 (80.74% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное20919 (30.59%)
          Прилагательное6241 (9.13%)
          Глагол14991 (21.92%)
          Местоимение-существительное5255 (7.68%)
          Местоименное прилагательное2390 (3.49%)
          Местоимение-предикатив8 (0.01%)
          Числительное (количественное)425 (0.62%)
          Числительное (порядковое)115 (0.17%)
          Наречие1931 (2.82%)
          Предикатив120 (0.18%)
          Предлог8239 (12.05%)
          Союз2466 (3.61%)
          Междометие34 (0.05%)
          Вводное слово6 (0.01%)
          Частица2053 (3.00%)
          Причастие1215 (1.78%)
          Деепричастие34 (0.05%)
Служебных слов:20451 (29.90%)

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая91.45
          .    точка102.08
          -    тире22.93
          !    восклицательный знак12.89
          ?    вопросительный знак9.89
          ...    многоточие10.73
          !..    воскл. знак с многоточием1.07
          ?..    вопр. знак с многоточием0.41
          !!!    тройной воскл. знак0.00
          ?!    вопр. знак с восклицанием0.28
          "    кавычка8.75
          ()    скобки0.18
          :    двоеточие2.95
          ;    точка с запятой0.11




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Олег Синицын
 54
2. Сергей Лукьяненко
 44
3. Генри Лайон Олди
 44  – ожидает пересчёта
4. Дмитрий Янковский
 43
5. Александр Житинский
 43
6. Марина и Сергей Дяченко
 43
7. Валентина Савенко
 43
8. Север Гансовский
 43  – ожидает пересчёта
9. Виталий Сертаков
 43
10. Сергей Волков
 42
...смотреть весь список >>
⇑ Наверх