catpad: (Default)
[personal profile] catpad

Меня посетила мысль о том, как улучшить амазоновские рецензии. Вообще, это важнейшая часть сайта, и я очень часто полагаюсь на оценки при покупке книги или фильма. Проблема в том, что часто очень много глупых людей пишет очень много рецензий (в основном, как правило, хвалебных), и тут-то покупателей и подстерегает опасность.

И вот прочитал я интересную статью в журнале Economist, в который написано следующее:

In "Formal Theories of Mass Behaviour", William McPhee noted that a disproportionate share of the audience for a hit was made up of people who consumed few products of that type. (Many other studies have since reached the same conclusion.) A lot of the people who read a bestselling novel, for example, do not read much other fiction. By contrast, the audience for an obscure novel is largely composed of people who read a lot. That means the least popular books are judged by people who have the highest standards, while the most popular are judged by people who literally do not know any better. An American who read just one book this year was disproportionately likely to have read "The Lost Symbol", by Dan Brown. He almost certainly liked it.

Отсюда можно вывести следующий простой алгоритм, который Амазону нужно было бы использовать при подсчёте средней оценки товара:
каждому рецензенту нужно давать коэффициент, на который бы умножалась его оценка. Этот коэффициент можно было бы подсчитывать так: чем больше книг (например) человек оценил и чем меньшее число рецензий имеют оценённые им книги, тем больше вес оценок этого рецензента. То есть, если человек читает много книг, которые мало кто читает, то к его голосу нужно прислушиваться больше, чем к голосу рецензента, который читает мало книг и притом только таких, которые читают все.

Это, конечно, не всегда верно, но статистически, я думаю, было бы оправдано.
Не знаю, есть ли у Амазона в их API возможность искать рецензии по людям, но если есть - можно было бы воплотить этот простой алгоритм и пересчитывать оценки, приведённые на сайте. Времени, как обычно нет, но может быть, кому-то интересно ?

Date: 2010-01-12 07:53 am (UTC)
From: [identity profile] avva.livejournal.com
That means the least popular books are judged by people who have the highest standards, while the most popular are judged by people who literally do not know any better.

Вот это мне кажется подозрительным выводом - что люди, которые читают больше, имеют более строгие стандарты.

Date: 2010-01-12 08:03 am (UTC)
From: [identity profile] redtigra.livejournal.com
Не столько более строгие стандарты, мне кажется, сколько бОльщую сравнительную базу. И эта база к тому же все время прирастает - чем больше базис, тем больше она склонна к развитию. Чем больше ты читаешь (слушаешь, пишешь, что угодно) следуя собственному зуду, а не списку бестселлеров (не минуя, впрочем, и список, разумеется) - тем выше выработанная планка, не потому что у тебя вкус так беспредельно хорош, а просто потому что ты таким образом вкладываешь в чтение силы и энергию, и они возвращаются, как и все вложенное. По-моему,так (с)

Date: 2010-01-12 08:13 am (UTC)
From: [identity profile] avva.livejournal.com
Бывают и другие варианты, когда много читают. В конце 90-х я часто покупал книги в одном магазине в Тель-Авиве, и договорился с ними о скидке в 30%. Я приезжал к ним время от времени, тщательно отбирал много книг и уходил с большой коробкой или двумя. Продавщица меня очень уважала за вкус и как-то сказала, что я на тот момент у них был один из самых значительных клиентов. Но не самый, спрашиваю? - нет, даже и не близко: женщины, закупающие женские романы пачками, били меня по количеству в разы. Одна приходила постоянно раз в неделю и брала 20 новых романов, каждую неделю.

Date: 2010-01-12 08:19 am (UTC)
From: [identity profile] catpad.livejournal.com
Именно поэтому при описании "алгоритма" я ввожу критерий "...чем меньшее число рецензий имеют оценённые им книги...", то есть человек читает книги, которые не являются популярными (женские романы таким образом отсекаются).

Date: 2010-01-12 08:22 am (UTC)
From: [identity profile] redtigra.livejournal.com
это правда; не приходится говорить об абсолютной надежности оценки, но все-таки, мне кажется, некоторая корреляция присутствует.
Проблема отчасти, конечно, в том. что тот же рынок дамского романа генерирует такое количество контента, что можно запросто "набрать рейтинг" только на них - никто не в состоянии прочесть их всех. С другой стороны, я вдруг подумала - насколько вероятно, что такая читательница сможет написать рецензию, которая заинтересует, например, вас? То есть появляется еще один критерий, в совокупности точность попадания повысится, вероятно.

Date: 2010-01-12 08:17 am (UTC)
From: [identity profile] catpad.livejournal.com
Только что написал практически то же самое ниже.

Date: 2010-01-12 08:16 am (UTC)
From: [identity profile] catpad.livejournal.com
Логика тут, наверное, такова: человек, читающий много, понимает больше хотя бы потому, что много всего прочёл и может сравнивать. Ну, по крайней мере может более или менее верно оценить The Lost Symbol по сравнению с чем-то другим.
Люди, которые ничего не читали, кроме The Lost Symbol, очевидно оценить его по достоинству не могут.
Я думаю, в большинстве случаев эта логика работает.

Page generated Feb. 6th, 2026 07:08 am
Powered by Dreamwidth Studios