Тема «Критерии единомыслия»

Вы здесь: Форумы fantlab.ru > Форум «Техподдержка и развитие сайта» > Тема «Критерии единомыслия»

Критерии единомыслия

Страницы: 1 2 🔍 поиск написать сообщение

автор

сообщение

гранд-мастер

6 апреля 2015 г. 09:07

цитировать

Отношусь к тем юзерам, которые с помощью данного сайта стараются выбрать себе чтиво. С этой целью и оценки ставлю — чтобы рекомендации получать. Согласно опросу в теме неподалеку, примерно у трети юзеров схожая цель. (Причем, мне кажется, среди "философов" и "гранд-мастеров" таких не треть, а минимум половина.)
К сожалению, математика рекомендаций работает очень слабо, на порядок слабее, чем могла бы. Первая причина — некорректный расчет корреляции, не учитывающий разницу шкал у разных юзеров. Я об этом уже создавал тему ( https://fantlab.ru/forum/forum2page2/topi... ), но понят почему-то не был.
Ладно, как есть так есть, подгоняю свою шкалу под ту, что у большинства, со средним баллом примерно 8 и дисперсией примерно 2... и закономерно получаю совершенно неадекватный отбор единомышленников. Точнее, практически полное отсутствие оного отбора. Антиподов, понятно, нет как класса. Но даже тех, кто не мыслит со мной едино, весьма немного — причем это скорее случайные выбросы, юзеры со странной, нетипичной манерой оценки (напр., 1 и 10), чем те, чье мнение вправду расходится с моим. Те, чье расходится, обретаются на самом деле в районе мер подобия 0,3-0,4 и скопом назначаются системой мне в приятели, хотя мне они ни разу не приятели.
Вот для статистического подтверждения взял произвольную страницу из списка юзеров с развитием, близким к моему. Выписал меры подобия. Результаты таковы. Из 50 читателей с 15-ю у меня недостаточно парных оценок. (Это хотя бы указывает на то, что мы читаем разное.) Из остальных у меня, оказывается, 18 друзей, 12 приятелей и только пятеро (!) не являются моими единомышленниками.

Можете провести эксперимент со своим акком. Если у вас "обычная" система оценки, когда подавляющее большинство баллов — в верхней части шкалы, от 5 до 10, получите примерно тот же результат. Ничего удивительного. При дисперсии порядка 2 — прикиньте — средняя мера подобия как раз и будет составлять примерно 0,4. (Возьмите две случайных выборки от 6 до 10 с примерно гауссовым распределением — и посчитайте.) А некое совпадение мнений с моими, как я подметил, начинается где-то с 0,55. И лишь мнение братьев, выбранные сайтом, вправду может служить мне ориентиром.

И теперь я выскажу просьбу от имени той трети юзеров, основная цель которых совпадает с моей и которым посему важен функционал рекомендаций. Поменять формулу расчета корреляции сложно, ладно, пусть. Но можно же поменять систему отбора единомышленников! Одной лишь возможности изменять число парных оценок — мало. Было бы очень, крайне полезным, если бы я мог установить самостоятельно ту границу меры подобия, выше которой для меня начинается "единомыслие".
Именно регулируя сразу два этих параметра, можно в условиях той математики и тех обычаев оценки, которые есть по факту, получать себе достаточно адекватный результат рекомендаций. Пока же "ожидаемая оценка" обоснована очень слабо, веры ей нет, и приходится лезть "внутрь" статистики каждой рекомендованной книги, искать там зеленые пятнышки, а если их мало, то разбираться, кто именно из синих поставил хорошие оценки, а кто плохие.
(То есть, пятнышки — тоже кое-какая помощь, конечно. Но смысл автоматизации все же в том, чтобы заменять ручной труд. :-)

)

–––
Был так болтлив, что уставали пальцы...

гранд-мастер

6 апреля 2015 г. 09:23

цитировать

цитата anagor1
Из 50 читателей с 15-ю у меня недостаточно парных оценок. (Это хотя бы указывает на то, что мы читаем разное.) Из остальных у меня, оказывается, 18 друзей, 12 приятелей и только пятеро (!) не являются моими единомышленниками.

Что я делаю не так:

цитата
— Клон. Мера подобия [0.75 .. 1.00] 1
— Брат. Мера подобия [0.60 .. 0.75) 20
— Друг. Мера подобия [0.45 .. 0.60) 1705
— Приятель. Мера подобия [0.30 .. 0.45) 2081
Итого единомышленников: 3807

А на сайте несколько десятков тысяч человек.

миротворец

6 апреля 2015 г. 09:40

цитировать

цитата anagor1
если бы я мог установить самостоятельно ту границу меры подобия, выше которой для меня начинается "единомыслие".

Едва ли поможет, ведь с увеличением подобия падает число единомышленников. Выборка будет уменьшаться и достоверность соответственно снизится. Скажем, при 100 парных оценках у Вас будет 10 единомышленников с подобием 0,5, а при 1000 парных оценках останется один. Можно работать и с малым числом пар, но ведь резко вырастет ошибка. Какой смысл в ручной настройке меры подобия?
Возможно, здесь бы помогло введение выбора вариантов кривых распределения оценок и уже в рамках типов кривых нужно бы выбирать меру и число пар.
Либо, как давно уже предлагают, возможность самому назначать себе единомышленников, не по мере подобия, а по интуитивному ощущению "родства".

–––
Взял надежду сухим пайком, соль со спичками бросил в ранец,
Я готов отправляться в путь - все, что нужно, уже при мне.

миродержец

6 апреля 2015 г. 10:09

цитировать

цитата Ny
Либо, как давно уже предлагают, возможность самому назначать себе единомышленников, не по мере подобия, а по интуитивному ощущению "родства".

Назначать и удалять самому, угу. Но и это не панацея. Однако способа автоматизировать поиск и отбор единомышленников я не знаю.

–––
Следующие рецензии в АК:
Краевская, Пауэлл, Голубева, Бобылева.

гранд-мастер

6 апреля 2015 г. 10:59

цитировать

цитата Dark Andrew

Что я делаю не так

А что Вы хотите сделать?

Но согласен, я был неточен. Точнее будет так: у 18-ти мера подобия как у друзей, у 12-ти как у приятелей. А в список внесены, конечно, далеко не все, т.к. норма парных оценок у меня высока, чтобы хоть кого-то лишнего убрать.
Единомышленников у меня всего 405 чел. Но увы, и в них "ходят в праздной суете разнообразные не те."

–––
Был так болтлив, что уставали пальцы...

гранд-мастер

6 апреля 2015 г. 11:26

цитировать

цитата Ny
Какой смысл в ручной настройке меры подобия?

Кхм... вроде всё разжевал...
Хорошо, еще раз: смысл в том, чтобы ожидаемая моя оценка рассчитывалась на основании оценок юзеров с похожим на мой вкусом, а не каких попало. Сейчас "приятель" — это почти каждый, у кого со мной достаточно парных оценок, вне зависимости от корреляции наших вкусов. Я бы "обрезал" половину нынешних единомышленников, подняв требуемую меру подобия, а затем снизил бы требование по парным оценкам, чтобы оставить количество единомышленников достаточным. Именно поэтому и нужны два подвижных параметра.
Из всех вариантов исправления недоразумения с ложным единомыслием я предложил самый простой.
Точнее, самый простой — тупо изменить в проге цифры: ряд 0.3, 0.45, 0.6, 0.75 заменить, например, на 0.5, 0.58, 0.65, 0.7, более адекватный законам статистики. Я не против, но это потребует уже от всех подстройки личной шкалы под типичную.
Вариант назначения друзей самому не слишком хорош: огромный труд нужен, чтобы получить достаточную статистику, сотни людей придется проверить и "назначить". Скорее уж оптимальным был бы вариант "назначения веса оценки". Скажем, "интуитивно ощущаемым" друзьям я назначаю вес 10, все прочие, обнаруженные программой, продолжают учитываться с весом 1.
Про кривые распределения — см. ссылку на мой первый пост на тему единомыслия.

–––
Был так болтлив, что уставали пальцы...

гранд-мастер

6 апреля 2015 г. 11:32

цитировать

anagor1
Я привёл свой расклад, чтобы вы увидели достаточное количество тех, кто совпадает со мной по вкусам. Зачем вы смотрите на "приятелей"? У вас есть "друзья", "братья" и прочие "клоны". Приятели — те, кто чуть-чуть пересекается по вкусам с вашим.

гранд-мастер

6 апреля 2015 г. 12:37

цитировать

цитата Dark Andrew
свой расклад

у вас какое минимальное число парных оценок стоит?

миротворец

6 апреля 2015 г. 13:07

цитировать

цитата anagor1
Я бы "обрезал" половину нынешних единомышленников, подняв требуемую меру подобия, а затем снизил бы требование по парным оценкам, чтобы оставить количество единомышленников достаточным. Именно поэтому и нужны два подвижных параметра.

Но разброс оценок, которые влияют на меру подобия нельзя учесть и вывести только от самого коэффициента. Каждый единомышленник будет совпадать с Вами в оценках иначе, чем любой другой. Таким образом, мера подобия 0,5 у одного участника, не эквивалентна по мере подобия 0,5 у другого по отношению к Вам. Указными выше манипуляциями "уровень шума неэквивалентности" всё равно нельзя снизить... Вы лишь попытаетесь нащупать наиболее "эквивалентных" посетителей буквально вслепую.

цитата anagor1
Точнее, самый простой — тупо изменить в проге цифры: ряд 0.3, 0.45, 0.6, 0.75 заменить, например, на 0.5, 0.58, 0.65, 0.7, более адекватный законам статистики.

Есть другой вариант для нынешней системы — поставить больше оценок популярным произведениям.

гранд-мастер

6 апреля 2015 г. 13:31

цитировать

цитата pilotus
у вас какое минимальное число парных оценок стоит?

по умолчанию который — 100, насколько я помню.

гранд-мастер

7 апреля 2015 г. 08:34

цитировать

цитата Dark Andrew
Зачем вы смотрите на "приятелей"?

Я не смотрю. Скрипт смотрит.

–––
Был так болтлив, что уставали пальцы...

гранд-мастер

7 апреля 2015 г. 08:48

цитировать

цитата Ny
Но разброс оценок, которые влияют на меру подобия нельзя учесть и вывести только от самого коэффициента. Каждый единомышленник будет совпадать с Вами в оценках иначе, чем любой другой. Таким образом, мера подобия 0,5 у одного участника, не эквивалентна по мере подобия 0,5 у другого по отношению к Вам. Указными выше манипуляциями "уровень шума неэквивалентности" всё равно нельзя снизить... Вы лишь попытаетесь нащупать наиболее "эквивалентных" посетителей буквально вслепую.
...
Есть другой вариант для нынешней системы — поставить больше оценок популярным произведениям.

Не понимаю, с чем Вы спорите. Совершенно очевидно, что если дисперсия оценок типичного юзера примерно 1,5-2, то мера подобия 0,3-0,4 — это просто шум. Но 0,5 уже означает некоторую корреляцию оценок. Голая математика. А что корреляция оценок не означает корреляцию вкусов — это совершенно третий вопрос, я и не думал ударяться тут в философию. То есть, именно шум я снижу, подняв порог меры подобия. Будет ли мне в итоге система рекомендовать что-то более адекватное... Гляжу я на оценки Сахновского, Геласимова, Водолазкина, Веркина в сравнении, например, с Олди — и понимаю, что надежд на это мало. Но это уже четвертый вопрос.
Что касается "вариантов для нынешней системы", то, во-первых, ваш для меня не катит, так как в оценках популярных произведений растет доля "фанатской накрутки", когда некто оценивает автора в стиле "не читал, но восхищаюсь". Во-вторых, что это вообще за совок такой? Я пишу о том, как "нынешнюю систему" исправить, Вы в ответ пишете, как к ней приспособиться. "Когда в конце концов заделают яму посреди тротуара?! Можно же упасть!" — "А Вы бочком ходите, бочком!"

–––
Был так болтлив, что уставали пальцы...

миротворец

7 апреля 2015 г. 10:49

цитировать

цитата anagor1
Будет ли мне в итоге система рекомендовать что-то более адекватное...

Так это и есть основной вопрос! Ну, улучшим мы формулу расчёта... А на сколько?
Получится как у Стругацких:

цитата
Лучше бы вы захотели колесо от троллейбуса! На космоскафы нельзя даже мне. А старательно поворачивая верньер, вы увеличиваете точность эксперимента на полтора процента.

Даже если математика позволит Вам работать и получать результаты только по исключительно более высокой мере подобия, гарантия заметного улучшения качества рекомендаций не прилагается автоматом. Поэтому не вижу особого резона менять одно не очень острое шило на другое не слишком скользкое мыло.

цитата anagor1
Что касается "вариантов для нынешней системы", то, во-первых, ваш для меня не катит, так как в оценках популярных произведений растет доля "фанатской накрутки", когда некто оценивает автора в стиле "не читал, но восхищаюсь".

Почему обязательно растёт? Наоборот, для популярных книг шанс настоящей оценки выше, чем для менее известных. Именно последним накрутчики лепят оценки в довесок, не читая, тогда как классика и популярное обычно более-менее вычитываются.

цитата anagor1
Во-вторых, что это вообще за совок такой? Я пишу о том, как "нынешнюю систему" исправить,

На мой взгляд, Вы советуете не засыпать яму, а лишь придать ей иную форму. А я к этой уже привык за 8 лет и могу рассказать как в ней комфортнее устроиться :-)

Теперь давайте прикинем как мера подобия увеличивается "качественно", если ставить оценки популярным книгам. Сейчас Вы ставите оценки всему подряд и получается: посетитель №1 совпадает (с высокой мерой подобия вообще и высокой корреляцией по конкретным оценкам) с Вами по оценкам книгам А, Б, В. Посетитель №2 совпадает с Вами по книгам Z, X, C. А между собой они совпадают лишь по единственной малоизвестной книге Ё, которой один поставил "4", а другой "7". Вот её Вам система и подсунет, как бы Вы с формулами не изощрялись. С предсказуемым результатом. И мера подобия (конкретно методики её расчёта) здесь существенной роли не играет.
Но если ставить оценки популярным произведениям целенаправленно и в первую очередь, Вы получите совпадение по оценкам одинаковым книгам (а не разным, как в первом случае) сразу у всех единомышленников (а не с отдельными, как в первом случае) с высокой мерой подобия. Шанс на это возрастает пропорционально количеству оценок у конкретного произведения, которому нужно (можно?) поставить оценку.
Вот тогда книги, рекомендованные единомышленниками, будут представлять для Вас интерес. Я предлагаю не изменять систему, а "программировать" её.

магистр

7 апреля 2015 г. 12:25

цитировать

цитата anagor1
установить самостоятельно ту границу меры подобия, выше которой для меня начинается "единомыслие"

Кстати, принято в работу. Но сроки пока не назову.
Также сообщаю, что будет возможность ручной корректировки списка единомышленников — удалять, добавлять, устанавливать веса доверия. Думаю, во многих случаях это простит корреляционному отбору всё его несовершенство.

–––
+7(996)730-00-00, Telegram https://t.me/crealist

миротворец

7 апреля 2015 г. 12:44

цитировать

цитата creator
Также сообщаю, что будет возможность ручной корректировки списка единомышленников

Замечательно! Люди столько лет ждали.

цитата creator
Думаю, во многих случаях это простит корреляционному отбору всё его несовершенство.

Если пошла такая пьянка, нельзя ли подключить к мере подобия ещё и коэффициенты типа "антинакрутчик" и "антимазохист", как сделано для рейтинга? Сейчас это дело, насколько я понял считается просто по распределению нормальности оценок и автоматически отражается на мере подобия. А можно ли сделать так, чтобы людей с высокими значениями коэффициентов можно было отсечь, поставив галочку?

магистр

7 апреля 2015 г. 12:49

цитировать

цитата Ny
Если пошла такая пьянка, нельзя ли подключить к мере подобия ещё и коэффициенты типа "антинакрутчик" и "антимазохист", как сделано для рейтинга?

Каким образом? Вообще исключить этих злодеев из единомышленников?

–––
+7(996)730-00-00, Telegram https://t.me/crealist

миротворец

7 апреля 2015 г. 12:51

цитировать

цитата creator
Вообще исключить этих злодеев из единомышленников?

Именно. Установил флажок и система рассчитывает рекомендации без них.

магистр

7 апреля 2015 г. 12:51

цитировать

Ny ок, учту

–––
+7(996)730-00-00, Telegram https://t.me/crealist

миротворец

7 апреля 2015 г. 12:53

цитировать

creator :cool!:

И, кстати, если все-таки будет возможность учитывать дисперсию оценок конкретного пользователя от его среднего уровня — это действительно позволит объективизировать результаты субъективных оценок.

Для одного средняя книга — это 5 баллов, а 7 уже хорошая; для другого 8 — середнячок, а 7 ниже среднего. Если они оба поставили какой-то книге по 7 баллов, то на самом деле они оценили ее совсем не одинаково в своей субъективной шкале, но будут считаться единомышленниками со 100%-ой корреляцией.

–––
Quos vult perdere, dementat

магистр

7 апреля 2015 г. 13:03

цитировать

цитата Mindover
Для одного средняя книга — это 5 баллов, а 7 уже хорошая; для другого 8 — середнячок, а 7 ниже среднего. Если они оба поставили какой-то книге по 7 баллов, то на самом деле они оценили ее совсем не одинаково в своей субъективной шкале, но будут считаться единомышленниками со 100%-ой корреляцией.

Программно нет возможности понять у кого что середнячок, а что хорошо. Если у меня либо средняя оценка, либо пик гистограммы приходится на 7, то это не значит, что для меня это середнячок. Это может быть и выше, и ниже среднего. Просто так вышло, что я таких книг больше читаю.

–––
+7(996)730-00-00, Telegram https://t.me/crealist

Страницы: 1 2 🔍 поиск

Вы здесь: Форумы fantlab.ru > Форум «Техподдержка и развитие сайта» > Тема «Критерии единомыслия»

Новое сообщение по теме «Критерии единомыслия»