FantLab ru



  Лингвистический анализ произведения
Произведение: Первый поход
Автор: Андрей Посняков
Дата проведения анализа: 24 июля 2018 года

Общая статистика

Длина текста, знаков:491997
Слов в произведении (СВП):71117
Приблизительно страниц:245
Средняя длина слова, знаков:5.21
Средняя длина предложения (СДП), знаков:61.07
СДП авторского текста, знаков:76.74
СДП диалога, знаков:45.26
Доля диалогов в тексте:37.01%
Доля авторского текста в диалогах:12.37%
Использование диалогов по тексту
(по горизонтали: счётчик знаков; по вертикали: процент диалогов;
размер скользящего окна: 10000 знаков, шаг: 1000 знаков)
Максимальный фрагмент авторского текста, знаков: 13456 (в страницах — примерно 7; начинается где-то на 154-й)

Активный словарный запас

Использовано уникальных слов:9219
Активный словарный запас (АСЗ):8154
Активный несловарный запас (АНСЗ):1065
Удельный АСЗ на 3000 слов текста:1256.61
Удельный АСЗ на 10000 слов текста:2905.34 —> 4009-е место в рейтинге УАСЗ-10000
Динамика изменения УАСЗ-3000 от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: УАСЗ-3000)
Максимальное значение УАСЗ-3000 (1381) приходится приблизительно на 141-ю страницу текста.
Миниимальное значение УАСЗ-3000 (1123) приходится приблизительно на 79-ю страницу текста.
Рост АСЗ от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: АСЗ)

Части речи

Неопределённых частей речи (НОЧР), слов:16277 (22.89% от СВП)
Определённых частей речи (ОЧР), слов:54840 (77.11% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное15322 (27.94%)
          Прилагательное5647 (10.30%)
          Глагол10939 (19.95%)
          Местоимение-существительное2775 (5.06%)
          Местоименное прилагательное2062 (3.76%)
          Местоимение-предикатив23 (0.04%)
          Числительное (количественное)307 (0.56%)
          Числительное (порядковое)54 (0.10%)
          Наречие2023 (3.69%)
          Предикатив135 (0.25%)
          Предлог5673 (10.34%)
          Союз3047 (5.56%)
          Междометие126 (0.23%)
          Вводное слово9 (0.02%)
          Частица1941 (3.54%)
          Причастие998 (1.82%)
          Деепричастие56 (0.10%)
Служебных слов:15656 (28.55%)

Биграммы частей речи

В таблице показаны частоты словопар типа «существительное+прилагательное», «прилагательное+глагол» и т.д. Для удобства восприятия частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

С
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
П
р
и
л
а
г
а
т
е
л
ь
н
о
е
Г
л
а
г
о
л
М
е
с
т
о
и
м
е
н
и
е
-
с
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
н
о
е

п
р
и
л
а
г
а
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
и
е
-
п
р
е
д
и
к
а
т
и
в
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
к
о
л
и
ч
е
с
т
в
е
н
н
о
е
)
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
п
о
р
я
д
к
о
в
о
е
)
Н
а
р
е
ч
и
е
П
р
е
д
и
к
а
т
и
в
П
р
е
д
л
о
г
С
о
ю
з
М
е
ж
д
о
м
е
т
и
е
В
в
о
д
н
о
е

с
л
о
в
о
Ч
а
с
т
и
ц
а
П
р
и
ч
а
с
т
и
е
Д
е
е
п
р
и
ч
а
с
т
и
е
Существительное5927626.47.3.001.2.218.2.503427.12.097.57.2.38
Прилагательное7514231.11.1.00.18.001.4.124.73.8.06.001.33.4.15
Глагол561925127.7.351.1.2110.56549.5.06.037.63.5.18
Местоимение-существительное6.64.8212.72.00.32.033.7.185.33.7.06.004.1.23.00
Местоименное прилагательное217.34.81.91.1.00.44.00.94.061.6.94.03.001.2.56.00
Местоимение-предикатив.03.00.21.00.00.00.00.00.03.00.00.00.00.00.03.00.00
Числительное (колич-ое)3.21.1.53.21.35.00.03.00.23.03.41.12.00.00.06.06.00
Числительное (порядковое).70.03.18.00.00.00.00.00.00.00.03.00.00.00.06.03.00
Наречие36142.3.94.03.12.001.7.354.81.9.00.003.61.1.03
Предикатив.00.182.2.03.03.00.00.00.09.00.03.29.03.00.06.00.00
Предлог832429.713.00.97.53.47.00.06.03.00.00.003.4.00
Союз148.9182.63.5.03.62.063.8.234.9.97.00.005.31.1.15
Междометие.53.09.35.15.03.00.00.00.00.00.12.12.09.00.21.00.00
Вводное слово.03.00.03.00.00.00.00.00.00.00.03.00.00.00.00.00.00
Частица2.32.428.911.7.00.18.062.002.3.56.03.00.50.73.06
Причастие1131.1.26.09.03.00.03.68.006.1.44.00.00.15.23.00
Деепричастие.47.09.21.06.06.00.00.00.00.00.32.00.00.00.03.06.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах.

В каждом столбце максимальное значение отмечено жирным шрифтом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»


 Номер слова в предложении
 1234567891011121314151617181920
Существительное1923282831333333333432353232323735363231
Прилагательное8.78.68.29.210101212121212131414151214131517
Глагол2526262622232019191820191818181616171417
Местоимение-существительное109.49.16.45.44.34.13.94.13.12.63.13.22.52.722.82.43.51.7
Местоименное прилагательное4.14.73.84.643.43.73.54.84.83.93.83.743.14.42.844.95.5
Местоимение-предикатив.00.10.00.00.10.00.00.10.00.00.10.10.10.00.10.00.10.00.00.00
Числительное (колич-ое)1.1.50.40.40.80.40.40.70.70.90.50.40.601.90.30.20.30.801.2
Числительное (порядковое).20.00.10.10.10.00.20.10.10.10.10.10.10.00.20.10.10.10.20.00
Наречие6.15.53.93.83.43.43.32.93.13.93.73.344.13.73.24.12.84.24.3
Предикатив.30.20.30.40.20.30.40.20.20.30.20.10.20.20.30.50.10.00.30.20
Предлог8.69.79.6111212121312121311121212121413139.9
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Союз95.94.94.85.15.4675.84.96.75.56.45.96.65.55.7465.8
Междометие2.2.10.00.00.10.00.00.00.00.10.00.10.00.10.10.00.10.00.00.00
Вводное слово.10.00.00.00.00.00.00.00.00.00.10.00.00.00.00.00.00.00.20.00
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Частица3.95.34.94.53.73.53.42.73.63.13.23.13.32.83.23.13.43.33.13.6
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Причастие1.31.11.11.41.61.5222.42.72.42.32.332.23.82.43.72.63
Деепричастие.40.10.10.00.10.10.10.10.20.10.00.20.20.00.30.10.10.00.00.00

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая153.63
          .    точка78.48
          -    тире47.84
          !    восклицательный знак8.30
          ?    вопросительный знак12.66
          ...    многоточие13.58
          !..    воскл. знак с многоточием0.01
          ?..    вопр. знак с многоточием0.00
          !!!    тройной воскл. знак0.15
          ?!    вопр. знак с восклицанием0.14
          "    кавычка3.67
          ()    скобки0.27
          :    двоеточие2.08
          ;    точка с запятой0.27




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Андрей Посняков
 50  – ожидает пересчёта
2. Сергей Волков
 40  – ожидает пересчёта
3. Руслан Мельников
 40
4. Святослав Логинов
 40  – ожидает пересчёта
5. Андрей Валентинов
 40  – ожидает пересчёта
6. Генри Лайон Олди
 39  – ожидает пересчёта
7. Александр Мазин
 39
8. Михаил Бабкин
 39  – ожидает пересчёта
9. Андрей Белянин
 39  – ожидает пересчёта
10. Елена Хаецкая
 39  – ожидает пересчёта
...смотреть весь список >>
⇑ Наверх