?

Log in

No account? Create an account
official

Заводы стоят, одни мордоляпы в стране!


Previous Entry Share Next Entry
official

Технопост про топ записей

Как вы знаете, мы тут проводим эксперименты, определяющие, что же на самом деле влияет на попадание записи в топ ЖЖ. В каждой итерации теста одновременно участвует по 20-30 постов, поэтому хотелось бы иметь хороший инструмент для быстрого просмотра топа записей.

Перед проведением тестов я подробно изучил, как сервера ЖЖ выдают информацию со списком топовых записей. Очень не хотелось листать по 20 страниц, высматривая там нужные посты. И тут уютненькая преподнесла отличный подарок. Оказалось, что когда вы смотрите топ записей, сервер ЖЖ выдает их пачками по 500 штук, только показывает первые 25. Кроме того, выдача записей не зависит от того, личный вы смотрите топ, или чей-то еще. Фильтрация забаненых пользователей и скрытых записей производится на странице рейтинга а не на сервере.

В итоге, чтобы получить полный топ 2000 записей, нужно сделать всего 4 запроса типа:

http:// l-stat.livejournal.com/tools/endpoints/ratings.bml?callback=ratingsCache_#PageNumber#&homepage=0&sort=visitors&country=cyr&page=#PageNumber#&_=#UnixTimestamp#,

где #PageNumber# — номер страницы топа длинной в 500 записей, а #UnixTimestamp# — количество секунд, прошедшее с основания вселенной UNIX, то есть с первого января 1970-го года. И пробел после http:// надо убрать, я его поставил, чтобы текст не превратился в неполноценную ссылку.

Общий топ от личного отличается тем, что на странице полного общего рейтинга записей, и только на ней, в качестве #UnixTimestamp# всегда передается 0. То есть он отстает на максимальную глубину истории топа, которая равняется примерно 10-ти часам. Но поскольку на главной странице ЖЖ и на странице рейтингов параметры передаются правильно, и более того, абсолютно идентичные для общего топа и для частного (и ответ ничем не отличается), этой особенностью полного общего топа записей можно принебречь. Более того, по умолчанию, пользователь всегда видит личный топ (у которого с параметрами все нормально), что только придает веса нашему предположению не учитывать полный общий топ записей. Все равно его никто не смотрит.

PS. В предыдущем посте я писал, что будет мне наука не бежать впереди паровоза. Так вот выяснилось, что мои спринтерские характеристики тут ни при чем. Просто ЖЖ поменял формулу рассчета позиции поста в топе записей. Сразу после наших экспериментов, наглядно показавших, что главное — это сумма СК посмотревших запись пользователей. Из-за этого нам пришлось повторять все эксперименты заново. Дважды. А некоторые — трижды. Кроме того, мой прекрасный, многостраничный пост с результатами и доказательной базой стал неактуален. Пришлось писать новый. Скоро на ваших экранах, не переключайтесь.
Ну и ссылка для френжения, как всегда.

Buy for 100 tokens
Buy promo for minimal price.

  • 1
vmenshov October 31st, 2012
По моим наблюдениям homepage=1 задается только на главной странице ЖЖ, когда смотришь полный рейтинг, и тогда на самом деле не будет в топ 25 несколько записей одного и того же пользователя. Однако по умолчанию, даже если пользователь не залогинился, ему показывается "личный" рейтинг с повторяющимися записями. Параметр sort вообще, по моему ни на что не влияет, я сравнивал 2 недели назад списки, они что с visitors, что c hits были по записям и их позициям одинаковые.

live_imho October 31st, 2012
А скажите пожалуйста в каких процентных цифрах выражается занижающий фильтр установленный на мой жрунал по отошению к тем у кого фильтра нет?


vmenshov October 31st, 2012
Из-за недостатка данных точно посчитать невозможно. Но если учитывать примерный расчет, который я делал для arturonly4'а, то где-то 0,7 получалось. Но это оооочень приблизительно. Может быть и 0,6 и 0,8 и даже всего 0,9.

live_imho October 31st, 2012
просто реально вижу как в топ не пускает, а если и попадаю в 50 то при первом обновлении выкидывает миниму на 50 позиций, когда у других запись опускается плавно .

а как ваши данные мне применить для наглядного примера( ПРИБЛИЗИТЕЛЬНО) ?

ДОПУСТИМ:

сейчас с фильтром при 500 пользователей жж в час на запись выбиваю 100 место.

было бы без фильтра при этом трафике = ?

и да, когда уж будет официальное разоблачение? поддержу репостом!

Edited at 2012-10-31 12:27 pm (UTC)

vmenshov October 31st, 2012
1) По моим наблюдениям учитываются пользователи только с СК >= 200.

2) Некоторые пользователи даже с более высоким СК вообще не учитываются. Например, ваши заходы в нашем эксперименте вообще никак не повлияли на место записи в топе. Это может быть ошибкой эксперимента, если только вы открывали записи не залогинившись.

3) При просмотре записи учитывается только ее просмотр на странице журнала или клик по подкату (серый столбик в статистике записей). Просмотр в ленте без клика по подкату или по заголовку не учитываются (синий столбик в статистике записей).

То есть для достижения того же результата, что и для пользователей без бана, вам нужно чтобы на страницу вашей записи зашло, или открыло подкат в ленте приблизительно на 30% больше пользователей, с СК >= 200 и у которых нет бана на учет в статистике. Как это сделать, я не знаю, но кружки "Двинем в топ" тут не помогут, потому что у всех участников такого кружка уже либо стоит бан на учет статистики, либо очень скоро появится.

На счет поста. Пишу, стараюсь. Дохерища результатов, тонны перепроверок и сверок. А фигню непроверенную я выкладывать не хочу. Кроме того, ЖЖ поменял формулу рассчета рейтинга записей, что добавило мне адского геморроя.

Edited at 2012-10-31 01:08 pm (UTC)

(Deleted comment)
vmenshov October 31st, 2012
Хорошо, предупрежу.

live_imho October 31st, 2012
только сейчас попал на 63 место при слабом трафике

серый -2278
красный-879
синий-439

вроде как гуд?

vmenshov October 31st, 2012
В это время 439 синих маловато даже для 25-го места в топе. Что говорит серый столбик в статистике записи?

live_imho October 31st, 2012
20121031-174708

vmenshov October 31st, 2012
Это я понял. Там еще есть статистика записей. Надо открыть статистику нужной записи, почасовую и посмотреть там значения серого столбика. Их там два, серый и синий. А что у вас за браузер?

live_imho October 31st, 2012
опера

я понял где))

серое -273
синие -1043

vmenshov October 31st, 2012
Ну вот когда моя запись «Да простят меня френды» была на 24-м месте 3-го октября в это же время, у нее серый столбик был 272.

Журнал был 1056, 491, 494.

live_imho October 31st, 2012
что и требовалось доказать!!!понижение в два раза

live_imho October 31st, 2012
Ошибки быть не может!во время эксперимента все делал по инструкции!

  • 1