FantLab ru



  Лингвистический анализ произведения
Произведение: Магический кристалл
Автор: Сергей Т. Алексеев
Дата проведения анализа: 24 июля 2018 года

Общая статистика

Длина текста, знаков:332005
Слов в произведении (СВП):49575
Приблизительно страниц:174
Средняя длина слова, знаков:5.3
Средняя длина предложения (СДП), знаков:84.71
СДП авторского текста, знаков:160.3
СДП диалога, знаков:48.85
Доля диалогов в тексте:39.34%
Доля авторского текста в диалогах:5.2%
Использование диалогов по тексту
(по горизонтали: счётчик знаков; по вертикали: процент диалогов;
размер скользящего окна: 10000 знаков, шаг: 1000 знаков)
Максимальный фрагмент авторского текста, знаков: 10916 (в страницах — примерно 6; начинается где-то на 11-й)

Активный словарный запас

Использовано уникальных слов:7363
Активный словарный запас (АСЗ):6821
Активный несловарный запас (АНСЗ):542
Удельный АСЗ на 3000 слов текста:1210.16
Удельный АСЗ на 10000 слов текста:2757.55 —> 5766-е место в рейтинге УАСЗ-10000
Динамика изменения УАСЗ-3000 от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: УАСЗ-3000)
Максимальное значение УАСЗ-3000 (1381) приходится приблизительно на 46-ю страницу текста.
Миниимальное значение УАСЗ-3000 (981) приходится приблизительно на 126-ю страницу текста.
Рост АСЗ от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: АСЗ)

Части речи

Неопределённых частей речи (НОЧР), слов:9585 (19.33% от СВП)
Определённых частей речи (ОЧР), слов:39990 (80.67% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное11725 (29.32%)
          Прилагательное3612 (9.03%)
          Глагол7947 (19.87%)
          Местоимение-существительное2406 (6.02%)
          Местоименное прилагательное1557 (3.89%)
          Местоимение-предикатив11 (0.03%)
          Числительное (количественное)186 (0.47%)
          Числительное (порядковое)45 (0.11%)
          Наречие1203 (3.01%)
          Предикатив44 (0.11%)
          Предлог4069 (10.17%)
          Союз2743 (6.86%)
          Междометие17 (0.04%)
          Вводное слово7 (0.02%)
          Частица1305 (3.26%)
          Причастие908 (2.27%)
          Деепричастие36 (0.09%)
Служебных слов:12115 (30.30%)

Биграммы частей речи

В таблице показаны частоты словопар типа «существительное+прилагательное», «прилагательное+глагол» и т.д. Для удобства восприятия частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

С
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
П
р
и
л
а
г
а
т
е
л
ь
н
о
е
Г
л
а
г
о
л
М
е
с
т
о
и
м
е
н
и
е
-
с
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
н
о
е

п
р
и
л
а
г
а
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
и
е
-
п
р
е
д
и
к
а
т
и
в
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
к
о
л
и
ч
е
с
т
в
е
н
н
о
е
)
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
п
о
р
я
д
к
о
в
о
е
)
Н
а
р
е
ч
и
е
П
р
е
д
и
к
а
т
и
в
П
р
е
д
л
о
г
С
о
ю
з
М
е
ж
д
о
м
е
т
и
е
В
в
о
д
н
о
е

с
л
о
в
о
Ч
а
с
т
и
ц
а
П
р
и
ч
а
с
т
и
е
Д
е
е
п
р
и
ч
а
с
т
и
е
Существительное5319658.112.00.63.079.4.413346.07.008.812.41
Прилагательное728.7111.4.81.00.26.00.52.003.47.6.04.00.521.6.04
Глагол5821211510.04.48.156.195211.04.194.94.6.07
Местоимение-существительное8.75.9311.41.7.07.26.003.154.22.8.00.046.3.78.04
Местоименное прилагательное236.17.91.9.63.04.11.11.85.111.71.1.00.001.78.00
Местоимение-предикатив.00.00.22.00.00.00.00.00.00.00.00.04.00.00.00.00.00
Числительное (колич-ое)4.2.41.37.15.04.00.33.00.00.00.04.00.00.00.07.00.00
Числительное (порядковое).74.11.11.00.00.00.04.00.00.00.04.00.00.00.00.15.00
Наречие2.62.4132.5.41.04.11.00.93.004.71.7.00.003.11.3.07
Предикатив.00.001.3.00.00.00.00.00.07.00.04.00.00.00.00.00.00
Предлог702121114.00.96.70.26.00.00.00.00.00.071.6.00
Союз189.9254.52.8.11.30.195.7.115.7.59.04.004.71.7.30
Междометие.11.04.19.00.00.00.00.00.00.00.00.00.00.00.04.00.00
Вводное слово.00.04.04.04.00.00.00.00.00.00.00.07.00.00.00.00.00
Частица2.62.429.70.41.00.00.04.52.041.8.11.00.00.221.2.11
Причастие113.96.89.33.00.11.00.56.007.5.89.00.00.19.37.00
Деепричастие.33.26.00.00.04.00.00.00.04.00.44.00.00.00.00.04.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах.

В каждом столбце максимальное значение отмечено жирным шрифтом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»


 Номер слова в предложении
 1234567891011121314151617181920
Существительное1823283133333233323433343431343332343229
Прилагательное6.17.8899.99.68.69.49.610109.59.6119.99.91211119.9
Глагол1628292423202220202119211821172020202020
Местоимение-существительное20139.17.75.85.75.164.73.93.733.13.93.73.34.22.63.43.7
Местоименное прилагательное3.34.84.54.43.24.84.63.74.94.33.94.42.94.55.13.33.13.64.14.6
Местоимение-предикатив.00.00.00.00.00.00.10.10.00.00.10.00.00.00.00.00.00.00.00.00
Числительное (колич-ое)1.1.50.70.70.40.30.40.60.60.10.30.20.30.201.1.50.60.50.00.90
Числительное (порядковое).10.30.10.10.00.10.30.10.20.10.20.00.00.10.10.10.10.00.00.00
Наречие6.54.62.92.62.42.82.82.92.52.52.72.63.12.52.43.12.44.13.73.4
Предикатив.00.00.10.20.10.10.00.20.30.00.20.10.00.00.00.10.10.00.10.00
Предлог107.48.49.310111111121212101410121113121112
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Союз123.93.956.67.97.67.88.37.57.97.98.39.38965.79.68.4
Междометие.30.10.10.00.00.00.00.10.10.00.00.00.00.00.00.00.00.00.10.00
Вводное слово.00.00.00.00.00.00.00.00.10.00.00.00.10.00.00.00.10.00.00.00
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Частица3.94.94.54.33.32.83.23.132.93.433.72.84.143.732.13.7
.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Причастие1.21.21.51.61.92.122.22.32.73.33.62.22.72.82.23.13.12.73.7
Деепричастие.20.10.00.00.10.10.10.10.10.10.10.20.20.00.10.00.00.00.10.40

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая127.91
          .    точка53.21
          -    тире17.83
          !    восклицательный знак9.38
          ?    вопросительный знак8.92
          ...    многоточие5.08
          !..    воскл. знак с многоточием1.15
          ?..    вопр. знак с многоточием0.58
          !!!    тройной воскл. знак0.00
          ?!    вопр. знак с восклицанием0.14
          "    кавычка0.36
          ()    скобки0.06
          :    двоеточие2.22
          ;    точка с запятой0.52




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Сергей Т. Алексеев
 41  – ожидает пересчёта
2. [Для текстов по лингвоанализу]
 37  – ожидает пересчёта
3. Михаил Ахманов
 37  – ожидает пересчёта
4. Святослав Логинов
 37  – ожидает пересчёта
5. Александр Беляев
 36  – ожидает пересчёта
6. Сергей Синякин
 35  – ожидает пересчёта
7. Елена Хаецкая
 35  – ожидает пересчёта
8. Сергей Шведов
 35  – ожидает пересчёта
9. Владимир Контровский
 35  – ожидает пересчёта
10. Андрей Легостаев
 35  – ожидает пересчёта
...смотреть весь список >>
⇑ Наверх