?

Log in

No account? Create an account
official

Заводы стоят, одни мордоляпы в стране!


Previous Entry Share Next Entry
winter kaktus

Уникальность аудитории ЖЖ. Неожиданные выводы.

Выложенный мной вчера рейтинг уникальности аудитории ЖЖ позволяет сделать весьма интересные выводы. Например, определить приблизительный процент ботов в аудитории блога. Как это можно вычислить?

Как вы знаете, у меня есть база данных всех пользователей кириллического ЖЖ и их связей. Включая их друзей, друзей друзей и так далее до бесконечности. Допустим, что на первом миллионе позиций рейтинга по социальному капиталу количество ботов существенно меньше чем в остальных. Это достаточно верное предположение, так как для получения СК нужны друзья, реальная посещаемость и наполняемость блога, а у ботов с этим очень туго. Так как пользователей в кириллической базе у меня получилось 9 811 720, то первые ~10% будут хорошей выборкой. Большинство ботов окажется за этими пределами.

Первый миллион рейтинга пользователей читают, с учетом повторов, 36 355 196 других . То есть можно сделать предположение, что каждый живой автор уютненькой подписан, примерно на 36,4 журналов. Тогда средняя доля «уникальности аудитории», которую он приносит своим читателям равняется 1/36,4. Умножив это число на количество читателей блога, мы получим эталонную уникальность его аудитории, без ботов. Боты характерны тем, что френдят в основном своих владельцев. Им незачем увеличивать популярность других журналов. Правда иногда, для запутывания систем контроля, они френдят себе подобных и случайных пользователей. Однако концентрация ботов у махровых ботоводов будет запредельная. Например, возьмем пользователя ios. У нее на конец ноября было 9 388 друзей, а уникальность (которая тоже измеряется в пользователях) была 7 925, при эталонной 258. То есть примерно 82,5% ((7—925 - 258) / 9 388) ее френдов не читают больше никого. Показательное ботоводство налицо.

Давайте применим те же самые рассуждения для наших 20-ти топовых блоггеров. Каков процент ботов у них в аудитории? Его мы рассчитаем по формуле 100 * (Ur - Ue) / FriendsOfCount, где Ur — реальная уникальность, Ue — эталонная, равная FriendsOfCount / 36,4, а FriendsOfCount — количество читателей блога. И вот чтополучится:

 ЖурналУникальностьЭталонная уник.В друзьях уБотов в друзьях% ботов в друзьях
1drugoi428121267739321552.8%
2tema589820307389338685.2%
3varlamov.ru241113825031310292.0%
4sergeydolya369717356315919623.1%
5navalny715718846858352737.7%
6mi3ch1116997363111190.3%
7shpilenok1248982357742650.7%
8miumau940774282061650.6%
9prostitutka_ket22927872865415045.3%
10belonika254111484180213923.3%
11eprst200013731075391572970.8%
12nicety743554201701890.9%
13ibigdan1593719262058733.3%
14borisakunin211310043657211083.0%
15radulova1053719261823341.3%
16pesen_net24861536559129501.7%
17dpmmax56150618419550.3%
18teh_nomad416969225223347613.8%
19avmalgin4294271556710.0%
20dolboeb16081048381715591.5%


Какой из этого можно сделать вывод? Получается, что вопреки расхожему мнению, топожители ботоводами не являются. Процент искусственной аудитории у них весьма не велик. Выделяется только teh_nomad с его 13%, но с таким техническим ником это неудевительно. Роботов так и тянет к нему. Так же относительно большой процент (7,7%) ботов у Главного оппозиционера. В политике, видимо, без этого никак. На третем месте почему-то идет tema с 5,8%. Я думал, что drugoi его обгонит, а оно вон как получается. Видимо Тёма гораздо больше известен за пределами ЖЖ, поэтому разработчики ботов тянутся к нему, а не к кому-нибудь другому.

PS. Ситуация с Навальным меня заинтересовала, и я решил проверить другую сторону баррикад, а именно пламенную активистку Едра krispotupchik. У нее все еще хуже:

 ЖурналУникальностьЭталонная уник.В друзьях уБотов в друзьях% ботов в друзьях
567krispotupchik13141856762112816.7%


Целых 16.7% ботов в аудитории. Да, политика дело такое, не слишком чистое.
Если хотите узнать, как обстоят дела с ботами у вас, пишите в каменты. Френдам вне очереди. Для тех кто еще не успел, можете добавить меня здесь.

Репосты всячески приветствуются.
Tags:

  • 1
vmenshov January 31st, 2013
Эх, у вас видимо слишком молодой журнал. У меня пока нет данных по нему. Данные обновлялись последний раз где-то в середине ноября.

viktormaclaud January 31st, 2013
Да,я здесь недавно)

ochendaje January 31st, 2013
Но скольо всего успел.)

viktormaclaud January 31st, 2013
Сколько дел ещё не сделано!А сколько предстоит ещё не сделать!)

  • 1