FantLab ru



  Лингвистический анализ произведения
Произведение: Аборигены Галактики
Авторы: Игорь Вереснев, Игорь Минаков
Дата проведения анализа: 26 июля 2018 года

Общая статистика

Длина текста, знаков:672973
Слов в произведении (СВП):93956
Приблизительно страниц:355
Средняя длина слова, знаков:5.7
Средняя длина предложения (СДП), знаков:56.1
СДП авторского текста, знаков:70.88
СДП диалога, знаков:38.15
Доля диалогов в тексте:30.83%
Доля авторского текста в диалогах:5.64%

Активный словарный запас

Использовано уникальных слов:12254
Активный словарный запас (АСЗ):11228
Активный несловарный запас (АНСЗ):1026
Удельный АСЗ на 3000 слов текста:1332.61
Удельный АСЗ на 10000 слов текста:3181.28 —> 1465-е место в рейтинге УАСЗ-10000

Части речи

Неопределённых частей речи (НОЧР), слов:17853 (19.00% от СВП)
Определённых частей речи (ОЧР), слов:76103 (81.00% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное22767 (29.92%)
          Прилагательное7580 (9.96%)
          Глагол16089 (21.14%)
          Местоимение-существительное5163 (6.78%)
          Местоименное прилагательное2459 (3.23%)
          Местоимение-предикатив16 (0.02%)
          Числительное (количественное)527 (0.69%)
          Числительное (порядковое)166 (0.22%)
          Наречие2384 (3.13%)
          Предикатив123 (0.16%)
          Предлог7719 (10.14%)
          Союз2997 (3.94%)
          Междометие51 (0.07%)
          Вводное слово17 (0.02%)
          Частица2805 (3.69%)
          Причастие1312 (1.72%)
          Деепричастие26 (0.03%)
Служебных слов:21227 (27.89%)

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая112.41
          .    точка93.36
          -    тире27.29
          !    восклицательный знак10.02
          ?    вопросительный знак11.97
          ...    многоточие7.21
          !..    воскл. знак с многоточием0.04
          ?..    вопр. знак с многоточием0.11
          !!!    тройной воскл. знак0.01
          ?!    вопр. знак с восклицанием1.26
          "    кавычка14.72
          ()    скобки0.02
          :    двоеточие5.82
          ;    точка с запятой0.05




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


Внимание! Это произведение писал не один автор, а два, поэтому анализ не может показать точные результаты из-за смешения авторских стилей. К тому же у Игоря Вереснева и Игоря Минакова пока не сформирован лингвистический паспорт, а значит этих авторов в списке результатов не будет в любом случае. Проверка авторства для данного произведения не может претендовать на верный результат.

АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Сергей Лукьяненко
 47
2. Вадим Панов
 47  – ожидает пересчёта
3. Александр Бушков
 46
4. Марина и Сергей Дяченко
 46
5. Владимир Васильев
 46
6. Василий Головачёв
 46
7. Генри Лайон Олди
 46  – ожидает пересчёта
8. Андрей Валентинов
 46
9. Николай Романецкий
 45
10. Сергей Синякин
 45
...смотреть весь список >>
⇑ Наверх