FantLab.ru

регистрация | забыли пароль?


  вход
логин:
пароль:


авторы, книги

Авторы по алфавиту:
А Б В Г Д Е Ж З И Й К Л М Н О
П Р С Т У Ф Х Ц Ч Ш Щ Э Ю Я

– Межавторские циклы
– Антологии
– Поиск по жанру

– Планы издательств
– Книжные серии
– Сравнение изданий



информация, новости
19 мая 23:24
Составлена библиография
Уильяма Хоупа Ходжсона

07 мая 18:55
Сотавлена библиография
Дональда Уэстлейка

06 мая 23:37
Составлена библиография
Яна Бжехвы

04 мая 23:23
Составлена библиография
Чарлза Роберта Метьюрина

03 мая 19:25
Составлена библиография
Мэри Шелли

Лаборатория
Фантастики
Поиск авторов, произведений:


  Лингвистический анализ произведения
Произведение: Встречники
Автор: Владимир Савченко
Дата проведения анализа: 04 сентября 2008 года

Общая статистика

  • Длина текста, знаков:
  • 109373
  • Слов в произведении (СВП):
  • 16495
  • Приблизительно страниц:
  • 57
  • Средняя длина слова, знаков:
  • 5.25
  • Средняя длина предложения (СДП), знаков:
  • 78.21
  • СДП авторского текста, знаков:
  • 86.51
  • СДП диалога, знаков:
  • 65.86
  • Доля диалогов в тексте:
  • 33.85%
  • Доля авторского текста в диалогах:
  • 8.21%
    Использование диалогов по тексту
    (по горизонтали: счётчик знаков; по вертикали: процент диалогов;
    размер скользящего окна: 10000 знаков, шаг: 1000 знаков)
  • Максимальный «кусок» авторского текста, знаков: 12729 (в страницах — примерно 7; начинается где-то на 39-й)
  • Активный словарный запас

  • Использовано уникальных слов:
  • 4163
  • Активный словарный запас (АСЗ):
  • 3882
  • Активный несловарный запас (АНСЗ):
  • 281
  • Удельный АСЗ на 3000 слов текста:
  • 1240.59
  • Удельный АСЗ на 10000 слов текста:
  • 2967.19 —> 1821-е место в рейтинге УАСЗ-10000
    Динамика изменения УАСЗ-3000 от начала до конца произведения
    (по горизонтали: счётчик слов; по вертикали: УАСЗ-3000)
  • Максимальное значение УАСЗ-3000 (1334) приходится приблизительно на 35-ю страницу текста.
  • Миниимальное значение УАСЗ-3000 (1181) приходится приблизительно на 6-ю страницу текста.
  • Рост АСЗ от начала до конца произведения
    (по горизонтали: счётчик слов; по вертикали: АСЗ)

    Части речи

  • Неопределённых частей речи (НОЧР), слов:
  • 4858 (29.45% от СВП)
  • Определённых частей речи (ОЧР), слов:
  • 11637 (70.55% от СВП)
  • Из них (принимая ОЧР за 100%):
  •           Существительное3879 (33.33%)
              Прилагательное1002 (8.61%)
              Глагол1778 (15.28%)
              Местоимение-существительное851 (7.31%)
              Местоименное прилагательное537 (4.61%)
              Местоимение-предикатив3 (0.03%)
              Числительное (количественное)100 (0.86%)
              Числительное (порядковое)21 (0.18%)
              Наречие369 (3.17%)
              Предикатив33 (0.28%)
              Предлог1531 (13.16%)
              Послелог0 (0.00%)
              Союз35 (0.30%)
              Междометие17 (0.15%)
              Вводное слово1 (0.01%)
              Фразовый глагол0 (0.00%)
              Частица430 (3.70%)
              Краткое прилагательное0 (0.00%)
              Причастие153 (1.31%)
              Деепричастие65 (0.56%)
              Краткое причастие0 (0.00%)
              Инфинитив389 (3.34%)
  • Служебных слов:
  • 3405 (29.26%)

    Биграммы частей речи

    В таблице показаны частоты словопар типа «существительное+прилагательное», «прилагательное+глагол» и т.д. Для удобства восприятия частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

    С
    у
    щ
    е
    с
    т
    в
    и
    т
    е
    л
    ь
    н
    о
    е
    П
    р
    и
    л
    а
    г
    а
    т
    е
    л
    ь
    н
    о
    е
    Г
    л
    а
    г
    о
    л
    М
    е
    с
    т
    о
    и
    м
    е
    н
    и
    е
    -
    с
    у
    щ
    е
    с
    т
    в
    и
    т
    е
    л
    ь
    н
    о
    е
    М
    е
    с
    т
    о
    и
    м
    е
    н
    н
    о
    е

    п
    р
    и
    л
    а
    г
    а
    т
    е
    л
    ь
    н
    о
    е
    М
    е
    с
    т
    о
    и
    м
    е
    н
    и
    е
    -
    п
    р
    е
    д
    и
    к
    а
    т
    и
    в
    Ч
    и
    с
    л
    и
    т
    е
    л
    ь
    н
    о
    е

    (
    к
    о
    л
    и
    ч
    е
    с
    т
    в
    е
    н
    н
    о
    е
    )
    Ч
    и
    с
    л
    и
    т
    е
    л
    ь
    н
    о
    е

    (
    п
    о
    р
    я
    д
    к
    о
    в
    о
    е
    )
    Н
    а
    р
    е
    ч
    и
    е
    П
    р
    е
    д
    и
    к
    а
    т
    и
    в
    П
    р
    е
    д
    л
    о
    г
    П
    о
    с
    л
    е
    л
    о
    г
    С
    о
    ю
    з
    М
    е
    ж
    д
    о
    м
    е
    т
    и
    е
    В
    в
    о
    д
    н
    о
    е

    с
    л
    о
    в
    о
    Ф
    р
    а
    з
    о
    в
    ы
    й

    г
    л
    а
    г
    о
    л
    Ч
    а
    с
    т
    и
    ц
    а
    К
    р
    а
    т
    к
    о
    е

    п
    р
    и
    л
    а
    г
    а
    т
    е
    л
    ь
    н
    о
    е
    П
    р
    и
    ч
    а
    с
    т
    и
    е
    Д
    е
    е
    п
    р
    и
    ч
    а
    с
    т
    и
    е
    К
    р
    а
    т
    к
    о
    е

    п
    р
    и
    ч
    а
    с
    т
    и
    е
    И
    н
    ф
    и
    н
    и
    т
    и
    в
    Существительное87285916131.7.148.81.162.69.41115.92.19.4
    Прилагательное807.241.2.83.14.555.4.14.83.971.9
    Глагол371113117.21.4.556.538.285.81.51.110
    Местоимение-существительное7.63.3353.91.9.554.4.2811.286.2.28.282.3
    Местоименное прилагательное307.47.231.81.11.52.3.281.2.41.41
    Местоимение-предикатив.14.14
    Числительное (колич-ое)6.2.831.2.28.41.28.97.28.28
    Числительное (порядковое)1.4.28.14.14
    Наречие3.43.4104.41.691.1.285.4.141.4.55.55.83
    Предикатив.14.14.14.41.141.7
    Предлог1062313173.97.14.28.141.9
    Послелог
    Союз.28.14.28.69.14.281.1.41
    Междометие.55.28.14
    Вводное слово
    Фразовый глагол
    Частица3.63.6231.21.7.141.74.3.411.1.832.5
    Краткое прилагательное
    Причастие6.21.5.55.41.41.144.1.28.55
    Деепричастие2.8.41.55.55.55.141.9.14
    Краткое причастие
    Инфинитив9.51.9.831.22.1.14.14.97.838.1.141.9.55.411.4

    Подсказка: для корректного отображения вертикального текста в шапке таблицы используйте обозреватель Internet Explorer версии 5.5 и выше.

    Части речи на позициях в предложении

    Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах.

    В каждом столбце максимальное значение отмечено жирным шрифтом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»


     Номер слова в предложении
     1234567891011121314151617181920
    Существительное2128283731364035403334353940344041424040
    Прилагательное5.967.75.98.11099.87.79.3129.39.8811118.2101110
    Глагол172321191716141714161616131113121515129.9
    Местоимение-существительное19108.66.39.74.36.57.66.28.466.47.35.83.47.45.85.74.25.5
    Местоименное прилагательное64.36.55.443.45.252.56.95.35.433.76.84.46.63.33.26
    Местоимение-предикатив.20.20
    Числительное (колич-ое)2.4.501.31.21.81.2.60.70.80.90.70.50.80.90.30.40.40.50.50
    Числительное (порядковое).60.20.10.10.10.40.20.20.20.20.30
    Наречие7.15.12.73.32.93.72.53.12.92.62.83.931.53.71.8.803.31.62.7
    Предикатив.20.70.10.10.40.80.50.20.40.30.30.30.30.40
    Предлог1111141314151213151413151517151215131515
    Послелог
    Союз1.1.80.10.10.10.50.30.20.60.20.70.40.50
    Междометие1.9.10.10.20.20
    Вводное слово.10
    Фразовый глагол
    Частица3.64.84.44.74.44.14.93.142.83.22.64.32.54.13.73.9.902.64.4
    Краткое прилагательное
    Причастие.901.2.60.601.81.51.71.2.601.92.5.801.13.11.72.2.401.91.61.1
    Деепричастие.30.80.90.501.50.50.60.70.30.301.21.401.41.6.50
    Краткое причастие
    Инфинитив1.933.43.63.83.71.73.64.833.74.43.55.24.73.31.93.36.33.8

    Знаки препинания

  • Частоты знаков препинания (среднее количество на 1000 слов):
  •           ,    запятая118.52
              .    точка67.47
              -    тире37.71
              !    восклицательный знак8.97
              ?    вопросительный знак6.61
              ...    многоточие13.52
              !..    воскл. знак с многоточием1.64
              ?..    вопр. знак с многоточием0.67
              !!!    тройной воскл. знак0.00
              ?!    вопр. знак с восклицанием0.85
              "    кавычка12.79
              ()    скобки4.24
              :    двоеточие13.03
              ;    точка с запятой6.43




    Распознавание автора текста

    Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

    Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

    Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


    АвторСовпадение с лингвопрофилем автора
    1. Владимир Савченко  50%
    2. Сергей Абрамов  45%
    3. Вадим Шефнер  45%
    4. Геннадий Прашкевич  45%
    5. Владимир Санин  44%
    6. Аркадий и Борис Стругацкие  44%
    7. Михаил Веллер  44%
    8. Сергей Лукьяненко  44%
    9. Андрей Валентинов  44%
    10. Владимир Кунин  44%
    ...смотреть весь список >>
     
    о сайте (русский) | about this site (english) | avant-propos (français)



    Любое использование материалов сайта допускается только с указанием активной ссылки на источник

    Copyright © 2005-2012 «Лаборатория Фантастики»