FantLab ru



  Лингвистический анализ произведения
Произведение: Ангелы Ойкумены
Автор: Генри Лайон Олди
Дата проведения анализа: 25 июля 2018 года

Общая статистика

Длина текста, знаков:506631
Слов в произведении (СВП):71649
Приблизительно страниц:263
Средняя длина слова, знаков:5.54
Средняя длина предложения (СДП), знаков:44.49
СДП авторского текста, знаков:53.28
СДП диалога, знаков:32.3
Доля диалогов в тексте:30.5%
Доля авторского текста в диалогах:6.53%
Использование диалогов по тексту
(по горизонтали: счётчик знаков; по вертикали: процент диалогов;
размер скользящего окна: 10000 знаков, шаг: 1000 знаков)
Максимальный фрагмент авторского текста, знаков: 8299 (в страницах — примерно 4; начинается где-то на 212-й)

Активный словарный запас

Использовано уникальных слов:11778
Активный словарный запас (АСЗ):10757
Активный несловарный запас (АНСЗ):1021
Удельный АСЗ на 3000 слов текста:1436.74
Удельный АСЗ на 10000 слов текста:3522.81 —> 245-е место в рейтинге УАСЗ-10000
Динамика изменения УАСЗ-3000 от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: УАСЗ-3000)
Максимальное значение УАСЗ-3000 (1620) приходится приблизительно на 39-ю страницу текста.
Миниимальное значение УАСЗ-3000 (1212) приходится приблизительно на 87-ю страницу текста.
Рост АСЗ от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: АСЗ)

Части речи

Неопределённых частей речи (НОЧР), слов:12361 (17.25% от СВП)
Определённых частей речи (ОЧР), слов:59288 (82.75% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное19755 (33.32%)
          Прилагательное4647 (7.84%)
          Глагол11944 (20.15%)
          Местоимение-существительное4452 (7.51%)
          Местоименное прилагательное1493 (2.52%)
          Местоимение-предикатив8 (0.01%)
          Числительное (количественное)437 (0.74%)
          Числительное (порядковое)88 (0.15%)
          Наречие1264 (2.13%)
          Предикатив81 (0.14%)
          Предлог6329 (10.67%)
          Союз1739 (2.93%)
          Междометие38 (0.06%)
          Вводное слово4 (0.01%)
          Частица1914 (3.23%)
          Причастие710 (1.20%)
          Деепричастие44 (0.07%)
Служебных слов:15977 (26.95%)

Биграммы частей речи

В таблице показаны частоты словопар типа «существительное+прилагательное», «прилагательное+глагол» и т.д. Для удобства восприятия частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

С
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
П
р
и
л
а
г
а
т
е
л
ь
н
о
е
Г
л
а
г
о
л
М
е
с
т
о
и
м
е
н
и
е
-
с
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
н
о
е

п
р
и
л
а
г
а
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
и
е
-
п
р
е
д
и
к
а
т
и
в
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
к
о
л
и
ч
е
с
т
в
е
н
н
о
е
)
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
п
о
р
я
д
к
о
в
о
е
)
Н
а
р
е
ч
и
е
П
р
е
д
и
к
а
т
и
в
П
р
е
д
л
о
г
С
о
ю
з
М
е
ж
д
о
м
е
т
и
е
В
в
о
д
н
о
е

с
л
о
в
о
Ч
а
с
т
и
ц
а
П
р
и
ч
а
с
т
и
е
Д
е
е
п
р
и
ч
а
с
т
и
е
Существительное862682116.8.001.8.225.1.554816.08.039.38.3.47
Прилагательное7569.9.99.52.00.19.00.47.003.31.5.00.00.491.2.08
Глагол692027156.6.081.4.255.7.19525.6.03.006.72.1.11
Местоимение-существительное95.1464.41.8.05.44.053.2.276.72.1.00.0010.36.00
Местоименное прилагательное204.13.31.4.36.00.30.08.27.03.77.36.00.00.85.14.03
Местоимение-предикатив.00.00.05.00.00.00.00.00.00.00.00.03.00.00.00.00.00
Числительное (колич-ое)5.2.601.16.11.00.88.19.08.00.49.36.00.00.05.08.00
Числительное (порядковое)1.3.08.14.03.00.00.03.00.00.00.05.05.00.00.00.00.00
Наречие2.92.37.63.36.00.14.00.58.032.6.47.00.001.9.14.05
Предикатив.14.031.4.05.03.00.00.00.00.00.00.03.00.00.05.00.00
Предлог95201.998.8.002.2.77.08.00.00.03.00.00.032.1.00
Союз113.29.53.71.2.00.47.111.6.002.2.11.05.002.5.14.03
Междометие.22.00.00.11.00.00.00.00.03.00.03.03.00.00.03.00.00
Вводное слово.05.03.00.00.00.00.00.00.00.00.03.00.00.00.00.00.00
Частица3.41.6291.3.41.00.05.03.90.002.7.25.00.00.49.33.00
Причастие7.41.2.74.30.25.00.03.00.30.004.2.14.00.00.03.11.00
Деепричастие.58.08.00.00.00.00.03.00.00.00.30.03.00.00.03.00.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах.

В каждом столбце максимальное значение отмечено жирным шрифтом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»


 Номер слова в предложении
 1234567891011121314151617181920
Существительное3130323636403938424238424244434740474446
Прилагательное6.67.27.28.18.78.49.3101011119.8111110119.4101110
Глагол1829272422202020181719181516151418161614
Местоимение-существительное18118.26.66.15.65.44.3443.52.63.23.13.121.23.22.71.7
Местоименное прилагательное2.62.63.42.82.92.62.52.82.42.92.81.82.82.62.62.72.821.53.5
Местоимение-предикатив.00.00.00.00.00.00.00.00.00.00.10.10.00.00.00.00.00.00.00.00
Числительное (колич-ое)1.1.60.70.70.90.901.80.80.90.50.90.60.401.2.70.20.90.40.90
Числительное (порядковое).10.20.10.20.20.20.20.20.20.30.10.20.20.00.00.20.00.30.00.00
Наречие4.12.41.92.12.21.821.72.21.61.91.82.11.12.3.701.6.901.11.7
Предикатив.20.20.20.10.20.10.10.00.20.10.00.10.00.00.20.00.20.30.00.00
Предлог108.71111121212141311141413141414169.51412
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Союз42.32.32.533.13.43.63.24.14.34.33.14.23.94.24.73.44.23.5
Междометие.40.00.00.10.00.00.00.00.00.00.00.00.00.10.00.00.00.00.00.00
Вводное слово.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.20.00.00.00
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Частица2.24.84.23.93.63.33.832.93.23.12.73.43.22.22.63.13.42.74.3
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Причастие.50.901.11.31.21.41.81.61.61.71.722.7.902.21.61.92.33.13
Деепричастие.10.10.00.10.10.20.10.10.10.10.00.00.30.00.00.00.00.30.00.00

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая122.30
          .    точка100.25
          -    тире27.45
          !    восклицательный знак18.13
          ?    вопросительный знак19.48
          ...    многоточие11.81
          !..    воскл. знак с многоточием0.38
          ?..    вопр. знак с многоточием0.04
          !!!    тройной воскл. знак0.01
          ?!    вопр. знак с восклицанием3.08
          "    кавычка10.38
          ()    скобки0.91
          :    двоеточие14.18
          ;    точка с запятой0.80




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Генри Лайон Олди
 47
2. Zотов
 39
3. Сергей Лукьяненко
 38
4. Александр и Людмила Белаш
 38
5. Анатолий Дроздов
 38
6. Андрей Валентинов
 37
7. Георгий Гуревич
 37
8. Сергей Волков
 37
9. Борис Акунин
 37
10. Павел Шумил
 37
...смотреть весь список >>
⇑ Наверх