FantLab ru



  Лингвистический анализ произведения
Произведение: Жемчужина пустыни
Автор: Николай Андреев
Дата проведения анализа: 23 июля 2018 года

Общая статистика

Длина текста, знаков:532167
Слов в произведении (СВП):73734
Приблизительно страниц:278
Средняя длина слова, знаков:5.7
Средняя длина предложения (СДП), знаков:50.89
СДП авторского текста, знаков:56.84
СДП диалога, знаков:40.71
Доля диалогов в тексте:29.54%
Доля авторского текста в диалогах:10.6%

Активный словарный запас

Использовано уникальных слов:7700
Активный словарный запас (АСЗ):7226
Активный несловарный запас (АНСЗ):474
Удельный АСЗ на 3000 слов текста:1285.78
Удельный АСЗ на 10000 слов текста:2748.42 —> 6098-е место в рейтинге УАСЗ-10000

Части речи

Неопределённых частей речи (НОЧР), слов:13213 (17.92% от СВП)
Определённых частей речи (ОЧР), слов:60521 (82.08% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное19753 (32.64%)
          Прилагательное5794 (9.57%)
          Глагол13503 (22.31%)
          Местоимение-существительное2783 (4.60%)
          Местоименное прилагательное1408 (2.33%)
          Местоимение-предикатив4 (0.01%)
          Числительное (количественное)416 (0.69%)
          Числительное (порядковое)73 (0.12%)
          Наречие1929 (3.19%)
          Предикатив96 (0.16%)
          Предлог6411 (10.59%)
          Союз2625 (4.34%)
          Междометие4 (0.01%)
          Вводное слово0 (0.00%)
          Частица1913 (3.16%)
          Причастие759 (1.25%)
          Деепричастие35 (0.06%)
Служебных слов:15148 (25.03%)

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая86.04
          .    точка121.59
          -    тире25.05
          !    восклицательный знак3.80
          ?    вопросительный знак5.14
          ...    многоточие4.99
          !..    воскл. знак с многоточием0.20
          ?..    вопр. знак с многоточием0.03
          !!!    тройной воскл. знак0.00
          ?!    вопр. знак с восклицанием0.05
          "    кавычка6.37
          ()    скобки0.00
          :    двоеточие3.84
          ;    точка с запятой0.12




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Николай Андреев
 45
2. Генри Лайон Олди
 38  – ожидает пересчёта
3. Александр Прозоров
 38  – ожидает пересчёта
4. Виктор Ночкин
 38
5. Дмитрий Казаков
 38
6. [Для текстов по лингвоанализу]
 37
7. Владимир Васильев
 37
8. Руслан Мельников
 37
9. Юрий Корчевский
 37
10. Виталий Сертаков
 37
...смотреть весь список >>
⇑ Наверх