FantLab ru



  Лингвистический анализ произведения
Произведение: Запоздалый стрелок, или Крылья провинциала
Автор: Вадим Шефнер
Дата проведения анализа: 23 июля 2018 года

Общая статистика

Длина текста, знаков:69469
Слов в произведении (СВП):10130
Приблизительно страниц:36
Средняя длина слова, знаков:5.47
Средняя длина предложения (СДП), знаков:78.49
СДП авторского текста, знаков:93.26
СДП диалога, знаков:48.37
Доля диалогов в тексте:20.38%
Доля авторского текста в диалогах:9.07%
Использование диалогов по тексту
(по горизонтали: счётчик знаков; по вертикали: процент диалогов;
размер скользящего окна: 10000 знаков, шаг: 1000 знаков)
Максимальный фрагмент авторского текста, знаков: 8269 (в страницах — примерно 4; начинается где-то на 12-й)

Активный словарный запас

Использовано уникальных слов:2898
Активный словарный запас (АСЗ):2680
Активный несловарный запас (АНСЗ):218
Удельный АСЗ на 3000 слов текста:1210.87
Удельный АСЗ на 10000 слов текста:2873.56 —> 4506-е место в рейтинге УАСЗ-10000
Динамика изменения УАСЗ-3000 от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: УАСЗ-3000)
Максимальное значение УАСЗ-3000 (1266) приходится приблизительно на 17-ю страницу текста.
Миниимальное значение УАСЗ-3000 (1169) приходится приблизительно на 2-ю страницу текста.
Рост АСЗ от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: АСЗ)

Части речи

Неопределённых частей речи (НОЧР), слов:2072 (20.45% от СВП)
Определённых частей речи (ОЧР), слов:8058 (79.55% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное2198 (27.28%)
          Прилагательное892 (11.07%)
          Глагол1489 (18.48%)
          Местоимение-существительное489 (6.07%)
          Местоименное прилагательное345 (4.28%)
          Местоимение-предикатив2 (0.02%)
          Числительное (количественное)41 (0.51%)
          Числительное (порядковое)19 (0.24%)
          Наречие278 (3.45%)
          Предикатив8 (0.10%)
          Предлог930 (11.54%)
          Союз449 (5.57%)
          Междометие0 (0.00%)
          Вводное слово2 (0.02%)
          Частица217 (2.69%)
          Причастие171 (2.12%)
          Деепричастие4 (0.05%)
Служебных слов:2434 (30.21%)

Биграммы частей речи

В таблице показаны частоты словопар типа «существительное+прилагательное», «прилагательное+глагол» и т.д. Для удобства восприятия частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

С
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
П
р
и
л
а
г
а
т
е
л
ь
н
о
е
Г
л
а
г
о
л
М
е
с
т
о
и
м
е
н
и
е
-
с
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
н
о
е

п
р
и
л
а
г
а
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
и
е
-
п
р
е
д
и
к
а
т
и
в
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
к
о
л
и
ч
е
с
т
в
е
н
н
о
е
)
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
п
о
р
я
д
к
о
в
о
е
)
Н
а
р
е
ч
и
е
П
р
е
д
и
к
а
т
и
в
П
р
е
д
л
о
г
С
о
ю
з
М
е
ж
д
о
м
е
т
и
е
В
в
о
д
н
о
е

с
л
о
в
о
Ч
а
с
т
и
ц
а
П
р
и
ч
а
с
т
и
е
Д
е
е
п
р
и
ч
а
с
т
и
е
Существительное5233541111.001.1.769.7.004034.00.385.37.8.00
Прилагательное8810212.1.57.00.00.38.76.003.25.7.00.00.761.7.00
Глагол402323128.3.38.38.387.19537.8.00.003.610.00
Местоимение-существительное4.24.9321.71.5.00.00.004.9.194.91.7.00.006.61.5.00
Местоименное прилагательное207.87.44.76.00.00.00.57.002.3.95.00.001.3.76.00
Местоимение-предикатив.00.00.00.00.00.00.00.00.00.00.19.00.00.00.00.00.00
Числительное (колич-ое)4.6.19.38.19.19.00.38.00.00.00.19.19.00.00.00.19.00
Числительное (порядковое)1.7.00.19.19.00.00.00.00.00.00.00.19.00.00.00.00.00
Наречие3.86.3135.1.95.00.19.19.95.192.81.1.00.003.4.38.19
Предикатив.00.001.1.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Предлог78241.58.220.002.5.95.00.00.19.19.00.00.00.95.00
Союз158.7192.52.3.00.95.005.1.005.7.19.00.002.82.1.00
Междометие.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Вводное слово.19.00.19.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Частица.951.722.76.38.00.00.001.5.003.00.00.00.00.76.00
Причастие9.55.31.9.19.38.00.19.00.38.006.31.1.00.00.19.76.00
Деепричастие.38.00.00.00.00.00.00.00.00.00.19.00.00.00.00.00.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах.

В каждом столбце максимальное значение отмечено жирным шрифтом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»


 Номер слова в предложении
 1234567891011121314151617181920
Существительное1922292530293230293533283227263631342837
Прилагательное6118.9129.81314111513141411111411129.71817
Глагол1825272521221719181619181920141614161719
Местоимение-существительное15128.27.55.94.24.87.333.54.25.85.94.96.41.16.45.23.15.5
Местоименное прилагательное4.27.9445.244.13.63.84.14.95.83.145.35.94.533.13.6
Местоимение-предикатив.00.00.00.00.20.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Числительное (колич-ое).201.3.80.70.60.80.90.00.50.30.301.5.40.40.00.00.00.00.80.00
Числительное (порядковое).50.20.50.30.20.20.20.00.30.30.00.40.00.00.50.00.60.00.00.00
Наречие9.93.43.932.42.42.92.95.43.83.64.72.84.53.25.33.23.801.8
Предикатив.00.30.20.20.40.00.00.00.00.00.00.00.00.00.50.00.00.00.00.90
Предлог18911131212141210131112131114131615146.4
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Союз6.42.62.34.75.87.15.77.56.56.87.16.97.187.54.37.197.13.6
Междометие.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Вводное слово.00.20.00.20.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Частица1.632.533.722.72.45.12.41.61.12.45.83.74.83.81.54.73.6
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Причастие.201.522.332.62.33.242.1.30.702.444.32.71.94.53.1.90
Деепричастие.20.20.20.00.00.20.00.00.00.00.00.00.00.00.00.00.00.00.00.00

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая97.83
          .    точка75.52
          -    тире23.49
          !    восклицательный знак2.96
          ?    вопросительный знак4.64
          ...    многоточие1.58
          !..    воскл. знак с многоточием0.39
          ?..    вопр. знак с многоточием0.00
          !!!    тройной воскл. знак0.00
          ?!    вопр. знак с восклицанием0.00
          "    кавычка17.57
          ()    скобки1.68
          :    двоеточие5.63
          ;    точка с запятой1.88




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Вадим Шефнер
 34
2. [Для текстов по лингвоанализу]
 34
3. Сергей Синякин
 33
4. Антон Первушин
 33
5. Андрей Столяров
 32
6. Аркадий и Борис Стругацкие
 32
7. Владимир Санин
 32
8. Роман Злотников
 32
9. Александр Житинский
 32
10. Александр Бушков
 32
...смотреть весь список >>
⇑ Наверх