FantLab.ru

регистрация | забыли пароль?


  вход
логин:
пароль:


авторы, книги

Авторы по алфавиту:
А Б В Г Д Е Ж З И Й К Л М Н О
П Р С Т У Ф Х Ц Ч Ш Щ Э Ю Я

– Межавторские циклы
– Антологии
– Поиск по жанру

– Планы издательств
– Книжные серии
– Сравнение изданий



информация, новости
19 мая 23:24
Составлена библиография
Уильяма Хоупа Ходжсона

07 мая 18:55
Сотавлена библиография
Дональда Уэстлейка

06 мая 23:37
Составлена библиография
Яна Бжехвы

04 мая 23:23
Составлена библиография
Чарлза Роберта Метьюрина

03 мая 19:25
Составлена библиография
Мэри Шелли

Лаборатория
Фантастики
Поиск авторов, произведений:


  Лингвистический анализ произведения
Произведение: Поле боя
Автор: Василий Головачёв
Дата проведения анализа: 04 сентября 2008 года

Общая статистика

  • Длина текста, знаков:
  • 874548
  • Слов в произведении (СВП):
  • 127018
  • Приблизительно страниц:
  • 469
  • Средняя длина слова, знаков:
  • 5.57
  • Средняя длина предложения (СДП), знаков:
  • 83.82
  • СДП авторского текста, знаков:
  • 119.81
  • СДП диалога, знаков:
  • 61.38
  • Доля диалогов в тексте:
  • 45.12%
  • Доля авторского текста в диалогах:
  • 14.9%
    Использование диалогов по тексту
    (по горизонтали: счётчик знаков; по вертикали: процент диалогов;
    размер скользящего окна: 10000 знаков, шаг: 1000 знаков)
  • Максимальный «кусок» авторского текста, знаков: 8354 (в страницах — примерно 4; начинается где-то на 304-й)
  • Активный словарный запас

  • Использовано уникальных слов:
  • 13260
  • Активный словарный запас (АСЗ):
  • 12192
  • Активный несловарный запас (АНСЗ):
  • 1068
  • Удельный АСЗ на 3000 слов текста:
  • 1304.27
  • Удельный АСЗ на 10000 слов текста:
  • 3063.89 —> 1329-е место в рейтинге УАСЗ-10000
  • Удельный АСЗ на 100000 слов текста:
  • 11651.70
    Динамика изменения УАСЗ-3000 от начала до конца произведения
    (по горизонтали: счётчик слов; по вертикали: УАСЗ-3000)
  • Максимальное значение УАСЗ-3000 (1448) приходится приблизительно на 12-ю страницу текста.
  • Миниимальное значение УАСЗ-3000 (1142) приходится приблизительно на 148-ю страницу текста.
  • Рост АСЗ от начала до конца произведения
    (по горизонтали: счётчик слов; по вертикали: АСЗ)

    Части речи

  • Неопределённых частей речи (НОЧР), слов:
  • 31238 (24.59% от СВП)
  • Определённых частей речи (ОЧР), слов:
  • 95780 (75.41% от СВП)
  • Из них (принимая ОЧР за 100%):
  •           Существительное34840 (36.38%)
              Прилагательное6761 (7.06%)
              Глагол15925 (16.63%)
              Местоимение-существительное6805 (7.10%)
              Местоименное прилагательное2880 (3.01%)
              Местоимение-предикатив7 (0.01%)
              Числительное (количественное)705 (0.74%)
              Числительное (порядковое)155 (0.16%)
              Наречие2509 (2.62%)
              Предикатив141 (0.15%)
              Предлог11408 (11.91%)
              Послелог0 (0.00%)
              Союз432 (0.45%)
              Междометие29 (0.03%)
              Вводное слово12 (0.01%)
              Фразовый глагол22 (0.02%)
              Частица3168 (3.31%)
              Краткое прилагательное0 (0.00%)
              Причастие2045 (2.14%)
              Деепричастие1468 (1.53%)
              Краткое причастие0 (0.00%)
              Инфинитив3517 (3.67%)
  • Служебных слов:
  • 24741 (25.83%)

    Биграммы частей речи

    В таблице показаны частоты словопар типа «существительное+прилагательное», «прилагательное+глагол» и т.д. Для удобства восприятия частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

    С
    у
    щ
    е
    с
    т
    в
    и
    т
    е
    л
    ь
    н
    о
    е
    П
    р
    и
    л
    а
    г
    а
    т
    е
    л
    ь
    н
    о
    е
    Г
    л
    а
    г
    о
    л
    М
    е
    с
    т
    о
    и
    м
    е
    н
    и
    е
    -
    с
    у
    щ
    е
    с
    т
    в
    и
    т
    е
    л
    ь
    н
    о
    е
    М
    е
    с
    т
    о
    и
    м
    е
    н
    н
    о
    е

    п
    р
    и
    л
    а
    г
    а
    т
    е
    л
    ь
    н
    о
    е
    М
    е
    с
    т
    о
    и
    м
    е
    н
    и
    е
    -
    п
    р
    е
    д
    и
    к
    а
    т
    и
    в
    Ч
    и
    с
    л
    и
    т
    е
    л
    ь
    н
    о
    е

    (
    к
    о
    л
    и
    ч
    е
    с
    т
    в
    е
    н
    н
    о
    е
    )
    Ч
    и
    с
    л
    и
    т
    е
    л
    ь
    н
    о
    е

    (
    п
    о
    р
    я
    д
    к
    о
    в
    о
    е
    )
    Н
    а
    р
    е
    ч
    и
    е
    П
    р
    е
    д
    и
    к
    а
    т
    и
    в
    П
    р
    е
    д
    л
    о
    г
    П
    о
    с
    л
    е
    л
    о
    г
    С
    о
    ю
    з
    М
    е
    ж
    д
    о
    м
    е
    т
    и
    е
    В
    в
    о
    д
    н
    о
    е

    с
    л
    о
    в
    о
    Ф
    р
    а
    з
    о
    в
    ы
    й

    г
    л
    а
    г
    о
    л
    Ч
    а
    с
    т
    и
    ц
    а
    К
    р
    а
    т
    к
    о
    е

    п
    р
    и
    л
    а
    г
    а
    т
    е
    л
    ь
    н
    о
    е
    П
    р
    и
    ч
    а
    с
    т
    и
    е
    Д
    е
    е
    п
    р
    и
    ч
    а
    с
    т
    и
    е
    К
    р
    а
    т
    к
    о
    е

    п
    р
    и
    ч
    а
    с
    т
    и
    е
    И
    н
    ф
    и
    н
    и
    т
    и
    в
    Существительное1082369129.12.579.4.43541.3.05.03.1311138.56.5
    Прилагательное666.83.3.77.56.10.03.43.023.2.10.03.57.93.291.6
    Глагол56118.2115.2.021.3.215.4.0339.49.02.054.72.52.318
    Местоимение-существительное6.843542.3.02.19.033.3.297.2.137.8.88.612.3
    Местоименное прилагательное224.34.81.7.38.03.03.32.22.85.08.51.24.16.21
    Местоимение-предикатив.02
    Числительное (колич-ое)5.3.43.51.24.13.51.19.19.48.03.05.16.02.06
    Числительное (порядковое)1.8.11.16.03.02.06.02.02.03
    Наречие2.63.19.73.6.54.02.10.02.69.103.06.031.5.69.46.83
    Предикатив.03.08.05.03.02.02.02.75
    Предлог10117.05139.62.8.54.21.03.02.063.2.02
    Послелог
    Союз.73.141.11.22.03.08.02.511.3.03.03.19
    Междометие.16.05.03.08.02
    Вводное слово.06.02.02.03.02
    Фразовый глагол.35
    Частица2.2227.88.29.02.06.892.381.22.52.5
    Краткое прилагательное
    Причастие122.3.26.75.29.19.567.03.14.37.83
    Деепричастие6.81.4.48.48.49.13.02.385.1.02.18.54.101.2
    Краткое причастие
    Инфинитив112.61.42.71.5.14.96.1312.081.4.33.301.2

    Подсказка: для корректного отображения вертикального текста в шапке таблицы используйте обозреватель Internet Explorer версии 5.5 и выше.

    Части речи на позициях в предложении

    Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах.

    В каждом столбце максимальное значение отмечено жирным шрифтом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»


     Номер слова в предложении
     1234567891011121314151617181920
    Существительное3025303437383940414140404141414240434242
    Прилагательное3.44.25.35.86.87.77.37.77.588.19.18.28.79.58.59.49.18.98.7
    Глагол1530252219181616151515141314131313121413
    Местоимение-существительное1914108.46.966.65.55.75.64.456.24.34.44.34.84.54.43.8
    Местоименное прилагательное3.53.23.13.23.12.72.93.33.73.43.33.23.22.93.32.63.42.92.92.9
    Местоимение-предикатив.10
    Числительное (колич-ое).70.90.80.60.70.60.80.70.90.701.60.70.701.50.70.90.601.2
    Числительное (порядковое).40.20.20.20.10.10.10.20.10.10.10.10.10.10.20.10.30.10.10.10
    Наречие5.83.52.62.52.22.32.42.32.32.12.52.12.22.62.52.81.922.32.2
    Предикатив.20.10.20.20.10.20.20.20.10.20.20.40.20.20.30.30.20
    Предлог118.3121212121313131214151313121314141313
    Послелог
    Союз2.3.70.20.20.20.30.30.20.30.30.40.20.40.30.50.20.20.40.40.20
    Междометие.30
    Вводное слово.10.10
    Фразовый глагол.10.10.10.10.10
    Частица3.45.14.73.93.13.23.42.82.83.43.53.43.13.33.13.42.92.92.62.5
    Краткое прилагательное
    Причастие.6011.31.22.12.22.42.32.42.72.62.22.62.82.83.63.22.72.93.3
    Деепричастие2.1.801.11.31.821.82.31.821.81.51.81.51.71.41.6.901.41.6
    Краткое причастие
    Инфинитив1.92.63.84.54.54.43.43.83.33.943.54.34.44.33.84.23.745.3

    Знаки препинания

  • Частоты знаков препинания (среднее количество на 1000 слов):
  •           ,    запятая124.72
              .    точка68.82
              -    тире23.97
              !    восклицательный знак3.27
              ?    вопросительный знак13.82
              ...    многоточие5.17
              !..    воскл. знак с многоточием0.15
              ?..    вопр. знак с многоточием0.08
              !!!    тройной воскл. знак0.00
              ?!    вопр. знак с восклицанием0.71
              "    кавычка21.73
              ()    скобки0.56
              :    двоеточие4.65
              ;    точка с запятой0.41




    Распознавание автора текста

    Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

    Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

    Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


    АвторСовпадение с лингвопрофилем автора
    1. Василий Головачёв  80%
    2. Александр Казанцев  60%
    3. Вячеслав Шалыгин  60%
    4. Сергей Синякин  59%
    5. Сергей Т. Алексеев  59%
    6. Антон Первушин  59%
    7. Алексей Калугин  58%
    8. Генри Лайон Олди  58%
    9. Данил Корецкий  58%
    10. Алекс Орлов  57%
    ...смотреть весь список >>
     
    о сайте (русский) | about this site (english) | avant-propos (français)



    Любое использование материалов сайта допускается только с указанием активной ссылки на источник

    Copyright © 2005-2012 «Лаборатория Фантастики»