Глущенко Александр Григорьевич : другие произведения.

К вопросу о посещаемости раздела

Самиздат: [Регистрация] [Найти] [Рейтинги] [Обсуждения] [Новинки] [Обзоры] [Помощь|Техвопросы]
Ссылки:


 Ваша оценка:
  • Аннотация:
    О показателе рейтинга посещаемости и его смысле.

Александр ГЛУЩЕНКО

К ВОПРОСУ О ПОСЕЩАЕМОСТИ РАЗДЕЛА




        Стал невольным свидетелем диалога на техническом форуме1.

        Кто-то из авторов: «Уважаемый Модератор, скажите, пожалуйста, а куда может пропадать статистика посещения из раздела?».

        И модератор, видимо, в 157-й раз устало повторяет: «Вы задали найчастейший вопрос в этом форуме. Каждый месяц, первого-второго числа его задают раз по 10—20. Наблюдаю это столько, сколько я здесь, то есть почти 10 лет. Стабильность!»

        Странное дело: при такой-то стабильности и не написать внятный Help к таблице, которая размещается в каждом авторском разделе?..

        Давайте же мы попытаемся помочь одному человеку разобраться, не отвлекая другого от более насущных дел. А заодно поставим и свой вопрос.

        Вот три таблички некоего условного автора Пупкина за три разных периода его деятельности в «СИ»2. На строки, окрашенные жёлтым, пока обращать внимания не будем.
Таблица 1. Третий месяц работы в «СИ».

  A B C D E F G H I J K L M N O P Q R S T U V W X Y Z AA AB AC AD AE AF AG AH AI AJ AK AL AM AN AO AP AQ AR AS AT AU AV AW AX AY AZ BA BB BC BD BE BF BG BH BI BJ BK BL BM BN BO BP BQ BR BS BT BU BV BW BX BY BZ
1   Итого За последние 12 месяцев Nov Oct Sep
2 Всего 12 мес. Nov Oct Sep Aug Jul Jun May Apr Mar Feb Jan Dec 22 21 20 19 18 17 16 15 14 13 12 11 10 09 08 07 06 05 04 03 02 01 31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11 10 09 08 07 06 05 04 03 02 01 30 29 28 27 26 25 24 23 22 21
3 По разделу 281 165 88 69 8 0 0 0 0 0 0 0 0 0 2 4 5 5 5 5 5 4 4 2 2 5 5 4 4 1 3 2 5 5 5 5 2 3 4 1 1 4 4 4 4 1 0 4 3 4 3 4 3 1 2 1 1 2 0 2 1 1 1 2 2 2 2 1 1 1 1 0 0 1 1 1 1
4 Опус 1 48 48 15 25 8 0 0 0 0 0 0 0 0 0 1 1 0 0 1 1 1 0 1 1 0 1 0 1 0 1 1 1 0 1 1 1 1 0 1 1 1 1 1 1 1 1 0 1 1 0 1 1 1 1 1 1 1 0 0 0 1 1 1 1 1 1 1 1 1 1 1 0 0 1 1 1 1
5 Опус 2 54 54 24 30 0 0 0 0 0 0 0 0 0 0 2 2 2 2 0 0 0 2 2 2 2 2 0 0 0 0 2 2 0 2 0 0 2 0 0 0 0 0 2 2 0 0 0 0 2 2 2 2 2 0 2 0 0 2 0 2 0 0 0 2 2 2 2 0 0 0 0 0 0 0 0 0 0
6 Опус 3 48 48 21 27 0 0 0 0 0 0 0 0 0 0 0 0 3 0 3 3 0 0 3 0 0 3 0 0 0 0 3 0 3 0 0 0 0 3 0 0 0 3 3 3 0 0 0 0 3 3 3 3 3 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
7 Опус 4 76 76 44 32 0 0 0 0 0 0 0 0 0 0 0 4 0 0 4 4 0 4 4 0 0 4 0 4 4 0 0 0 4 4 4 0 0 0 4 0 0 4 4 4 4 0 0 4 0 4 0 4 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
8 Опус 5 55 55 55 0 0 0 0 0 0 0 0 0 0 0 0 0 5 5 5 5 5 0 0 0 0 5 5 0 0 0 0 0 5 5 5 5 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
9 Сумма 281 281 159 114 8 0 0 0 0 0 0 0 0 0 3 7 10 7 13 13 6 6 10 3 2 15 5 5 4 1 6 3 12 12 10 6 3 3 5 1 1 8 10 10 5 1 0 5 6 9 6 10 6 1 3 1 1 2 0 2 1 1 1 3 3 3 3 1 1 1 1 0 0 1 1 1 1
10 Рейтинг 1,1 1,1 1,4 1,2 0,8 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,6 1,4 2,0 1,4 2,6 2,6 1,2 1,2 2,0 0,6 0,4 3,0 1,0 1,0 0,8 0,2 1,2 0,6 2,4 2,4 2,0 1,2 0,8 0,8 1,3 0,3 0,3 2,0 2,5 2,5 1,3 0,3 0,0 1,3 1,5 2,3 1,5 2,5 2,0 0,5 1,5 0,5 0,5 1,0 0,0 1,0 0,5 0,5 0,5 1,5 1,5 1,5 1,5 1,0 1,0 1,0 1,0 0,0 0,0 1,0 1,0 1,0 1,0


Таблица 2. Спустя 5 месяцев.

  A B C D E F G H I J K L M N O P Q R S T U V W X Y Z AA AB AC AD AE AF AG AH AI AJ AK AL AM AN AO AP AQ AR AS AT AU AV AW AX AY AZ BA BB BC BD BE BF BG BH BI BJ BK BL BM BN BO BP BQ BR BS BT BU BV BW BX BY BZ
1   Итого За последние 12 месяцев Apr Mar Feb
2 Всего 12 мес. Apr Mar Feb Jan Dec Nov Oct Sep Aug Jul Jun May 22 21 20 19 18 17 16 15 14 13 12 11 10 09 08 07 06 05 04 03 02 01 31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11 10 09 08 07 06 05 04 03 02 01 29 28 27 26 25 24 23 22 21 20
3 По разделу 1094 656 74 96 91 104 95 119 69 8 0 0 0 0 3 4 4 2 5 2 2 3 5 5 2 5 2 0 4 0 5 3 5 4 4 5 4 1 5 0 3 3 5 5 4 0 1 1 5 4 0 5 5 3 4 2 2 3 4 4 2 1 5 4 2 4 5 2 4 3 2 4 5 4 5 1 5
4 Опус 1 114 114 7 12 10 15 18 19 25 8 0 0 0 0 0 0 0 0 1 1 1 0 0 0 0 0 1 0 0 0 1 1 0 0 0 1 0 1 0 0 1 1 0 0 1 0 1 1 1 0 0 0 1 0 1 0 0 0 1 0 0 1 0 0 0 1 0 1 0 0 0 0 1 0 1 1 0
5 Опус 2 194 194 22 24 22 36 28 32 30 0 0 0 0 0 0 2 0 2 0 2 2 0 0 0 2 2 2 0 0 0 0 2 2 2 0 2 0 0 0 0 2 0 0 2 2 0 0 0 2 2 0 0 0 0 2 2 2 0 0 2 2 0 0 0 2 0 2 2 0 0 2 0 0 2 0 0 2
6 Опус 3 210 210 27 36 21 36 30 33 27 0 0 0 0 0 3 0 0 0 3 0 0 3 3 0 0 0 0 0 3 0 3 3 3 0 3 0 0 0 0 0 3 3 0 3 3 0 0 0 0 3 0 0 3 3 3 0 0 3 0 3 0 0 0 3 0 0 3 0 0 3 0 0 0 3 3 0 3
7 Опус 4 296 296 36 40 28 52 48 60 32 0 0 0 0 0 0 4 4 0 4 0 0 0 4 0 0 4 0 0 4 0 4 0 0 4 4 0 4 0 0 0 0 0 4 0 4 0 0 0 4 4 0 0 0 0 4 0 0 0 4 4 0 0 0 4 0 4 0 0 4 0 0 4 4 4 0 0 4
8 Опус 5 280 280 35 40 25 55 50 75 0 0 0 0 0 0 0 0 0 0 5 0 0 0 5 5 0 5 0 0 0 0 5 0 5 0 0 5 0 0 5 0 0 0 5 5 0 0 0 0 5 0 0 5 5 0 0 0 0 0 0 0 0 0 5 0 0 0 5 0 0 0 0 0 5 0 5 0 5
9 Сумма 1094 1094 127 152 106 194 174 219 114 8 0 0 0 0 3 6 4 2 13 3 3 3 12 5 2 11 3 0 7 0 13 6 10 6 7 8 4 1 5 0 6 4 9 10 10 0 1 1 12 9 0 5 9 3 10 2 2 3 5 7 2 1 5 7 2 5 10 3 4 3 2 4 10 9 9 1 14
10 Рейтинг 1,1 1,1 1,2 1,0 0,7 1,3 1,1 1,5 1,2 0,8 0 0 0 0 0,6 1,2 0,8 0,4 2,6 0,6 0,6 0,6 2,4 1,2 0,4 2,2 0,6 0,0 1,4 0,0 2,6 1,2 2,0 1,2 1,4 1,6 0,8 0,2 1,0 0,0 1,2 0,8 1,8 2,0 2,0 0,0 0,2 0,2 2,4 1,8 0,0 1,0 1,8 0,6 2,0 0,4 0,4 0,6 1,0 1,4 0,4 0,2 1,0 1,4 0,4 1,0 2,0 0,6 0,8 0,6 0,4 0,8 2,0 1,8 1,8 0,2 2,8


Таблица 3. 13-й месяц работы в «СИ»

  A B C D E F G H I J K L M N O P Q R S T U V W X Y Z AA AB AC AD AE AF AG AH AI AJ AK AL AM AN AO AP AQ AR AS AT AU AV AW AX AY AZ BA BB BC BD BE BF BG BH BI BJ BK BL BM BN BO BP BQ BR BS BT BU BV BW BX BY BZ
1   Итого За последние 12 месяцев Nov Oct Sep
2 Всего 12 мес. Nov Oct Sep Aug Jul Jun May Apr Mar Feb Jan Dec 22 21 20 19 18 17 16 15 14 13 12 11 10 09 08 07 06 05 04 03 02 01 31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11 10 09 08 07 06 05 04 03 02 01 30 29 28 27 26 25 24 23 22 21
3 По разделу 1740 1010 67 65 63 76 86 83 89 95 96 91 104 95 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 0 0 1 2 3 4 5 0 0 0 1 2 3 4 5 0 0 0 1 2 3 4 5 0 0 1 2 3 4 5 0 0 1 2 3 4 5 1 2 3
4 Опус 1 168 116 4 4 6 8 9 9 11 10 12 10 15 18 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 1 0 0
5 Опус 2 314 252 8 8 12 14 18 22 30 30 24 22 36 28 0 0 0 0 2 0 0 0 0 2 0 0 0 0 2 0 0 0 0 2 0 0 0 0 0 0 2 0 0 0 0 0 0 0 2 0 0 0 0 0 0 0 2 0 0 0 0 0 0 2 0 0 0 0 0 0 2 0 0 0 0 2 0
6 Опус 3 336 276 15 12 18 15 18 24 21 30 36 21 36 30 3 0 0 0 0 3 0 0 0 0 3 0 0 0 0 3 0 0 0 0 3 0 0 0 0 0 0 3 0 0 0 0 0 0 0 3 0 0 0 0 0 0 0 3 0 0 0 0 0 0 3 0 0 0 0 0 0 3 0 0 0 0 3
7 Опус 4 452 360 20 16 12 24 24 28 36 32 40 28 52 48 0 4 0 0 0 0 4 0 0 0 0 4 0 0 0 0 4 0 0 0 0 4 0 0 0 0 0 0 4 0 0 0 0 0 0 0 4 0 0 0 0 0 0 0 4 0 0 0 0 0 0 4 0 0 0 0 0 0 4 0 0 0 0
8 Опус 5 470 395 20 25 15 30 30 25 35 45 40 25 55 50 0 0 5 0 0 0 0 5 0 0 0 0 5 0 0 0 0 5 0 0 0 0 5 0 0 0 0 0 0 5 0 0 0 0 0 0 0 5 0 0 0 0 0 0 0 5 0 0 0 0 0 0 5 0 0 0 0 0 0 5 0 0 0
9 Сумма 1740 1330 67 65 58 75 92 84 119 144 152 106 194 174 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 0 0 1 2 3 4 5 0 0 0 1 2 3 4 5 0 0 0 1 2 3 4 5 0 0 1 2 3 4 5 0 0 1 2 3 4 5 1 2 3
10 Рейтинг ? 0,75 0,6 0,4 0,4 0,5 0,6 0,6 0,8 1,0 1,0 0,7 1,3 1,1 0,6 0,8 1,0 0,2 0,4 0,6 0,8 1,0 0,2 0,4 0,6 0,8 1,0 0,2 0,4 0,6 0,8 1,0 0,2 0,4 0,6 0,8 1,0 0 0 0,2 0,4 0,6 0,8 1,0 0 0 0 0,2 0,4 0,6 0,8 1,0 0 0 0 0,2 0,4 0,6 0,8 1,0 0 0 0,2 0,4 0,6 0,8 1,0 0 0 0,2 0,4 0,6 0,8 1,0 0,2 0,4 0,6


        Исходные данные, на мой взгляд, абсолютно понятны: в таблице учитываются количества ежедневных открытий произведений Пупкина (столбцы P-BZ, начиная со строки 4 и ниже). Информация полезная, поскольку, в первую очередь, помогает самому автору понять, насколько востребованными являются его опусы. Очевидно, что на обозрении находятся данные за 62 дня, считая от текущей даты. Данные за эту дату в какой-то момент времени могут в таблице и отсутствовать — в зависимости от соотношения поясного времени местонахождений автора и сервера «СИ». Но в любом случае, в течение 24 часов данные в столбце текущей даты появятся.

        В левой части таблиц (столбцы D-O — «За последние 12 месяцев») находятся данные, просуммированные по соответствующим месяцам. Понятно, что данные текущего календарного месяца (столбец D) ежедневно (а точнее, один раз в сутки) корректируются в зависимости от числа посетителей за последний день. Построчные суммы этих данных выводятся в столбец C — «12 мес.». Одновременно на соответствующие величины увеличиваются данные в столбце B — «Всего» и итоговое за всё время существования раздела количество посещений (ячейка B3 — «По разделу, всего»). В течение первых 12-ти месяцев существования раздела данные в столбцах D и C совпадают, за исключением данных в ячейках B3 и С3 (о которой речь пойдёт ниже).

        Понятно и другое: количества посещений, указанные в столбце B «Всего», считаются нарастающим итогом с момента образования раздела и могут только увеличиваться3.

        В отличие от этого, через 12 месяцев существования раздела данные в столбце C «За 12 мес.» могут как увеличиваться, так и уменьшаться. Причина явления очевидна: при переходе в 13-й месяц данные за месяц 1-й из пространства D-O убираются, все месяцы как бы сдвигаются на один столбец вправо, а в столбце D начинают накапливаться данные о посещениях за текущий, 13-й месяц. Соответствующим образом изменяются и суммарные данные за последние 12 месяцев в столбце C. И если по тому или иному произведению посещаемость в 13-м месяце ниже, чем в 1-ом, естественно, величина в соответствующей произведению ячейке столбца C уменьшится. Как объясняется в одном из разделов помощи «СИ», «это сделано, чтобы уравнять в рейтинге новичков и старичков».

        Кроме того, в том же разделе утверждается, что, «если в прошлом январе автора читали активнее, то посещаемость за 12 месяцев у него будет идти на спад, если в этом январе "прибыль" больше "убытка", то раздел будет подниматься в общем рейтинге посещаемости».

        А вот соответствует ли истине это утверждение, надо бы уточнить.

        Для начала попытаемся выяснить, что за показатель находится в строке 3 «По разделу», начиная с ячейки C3, и вправо, до конца таблицы. Впрочем, ответ на этот вопрос даётся на «F.A.Q. журнала Самиздат», а также неоднократно звучит на страницах технического форума. Суть ответа сводится к следующему: ежедневно в строке C указывается наибольшая за данный день посещаемость «какой-либо одной работы» — не больше и не меньше. Назовём пока эту величину числом N (не путать с одноимённым столбцом).

        Безусловно, как некий показатель посещаемости раздела, N имеет право на существование — ровно в той же степени, в какой по размеру самой большой рыбы можно судить о количественных характеристиках работы рыболовецкого сейнера за день. Вот только отражают ли эти показатели реальную картину — что для сейнера, что для «Самиздата»?

        Приведу простейший пример.

 День 2День 1
По разделу2321
Опус 1020
Опус 2021
Опус 32319
Сумма2360
Рейтинг7,720,0


        Давайте сравним показатели двух дней. В существующей нынче схеме День 2 превзошёл по посещаемости День 1, поскольку показатель N Опуса 3 был максимальным и оказался даже выше, чем аналогичный показатель Опуса 2 за день предыдущий. Нормально? Возможно. Да вот только речь-то везде идёт о посещаемости, а она как раз в целом по разделу в первый день была чуть ли не в три раза выше, чем во второй. Справедливо ли в данной ситуации «пальму первенства» за посещаемость отдавать второму дню? Очевидно — нет!

        Не менее очевидно, что общая посещаемость раздела, указанная в одной из жёлтых строк таблиц, является более объективным показателем популярности раздела (а в конечном итоге, вся таблица, как понимается, направлена на определение именно этого параметра. Но, как совершенно справедливо отмечалось в F.A.Q., показатель общей посещаемости заведомо ставит авторов-новичков и пишущих на «СИ» уже много лет в изначально не равные условия: понятно, что суммарная посещаемость десяти произведений, скорее всего, будет выше, чем число посетителей одного-единственного опуса.

        И что же делать? Что брать за объективный показатель? Здесь наука статистика постаралась за нас. Есть в ней весьма подходящий, на мой взгляд, показатель — импакт-фактор. Определяет он, правда, численный показатель важности научного журнала и исходит из количества цитирований материалов данного журнала и общего количества статей, размещённых в нём. Но если мы слово «журнал» заменим на слово «раздел», а «количество цитирований» — на «количество посещений», то и непонятное название «импакт-фактор» вполне может быть заменено на «рейтинг посещаемости».

        Иначе говоря, достаточно суммарное количество посещений за день разделить на количество статей в разделе, как появляется достаточно объективный показатель дневной посещаемости раздела. Именно этот показатель указан во второй, нижней строке жёлтых пар. Достаточно беглого взгляда по всем таблицам, чтобы понять: приведённый «рейтинг» описывает посещаемость раздела гораздо более объективно, нежели существующий показатель N.

        Для получения месячного рейтинга достаточно сложить рейтинги по дням и разделить на соответствующее количество дней: для первого месяца существования раздела — на количество дней его существования, для остальных — на календарное количество дней в месяце. Таким образом решается вопрос об изменении суммарного количества посещений, связаном с размещением произведений в течение текущего месяца.

        Мне не до конца ещё понятно, как необходимо расчитывать рейтинг за год, спустя более 12-ти месяцев существования раздела. Поэтому в соответствующей ячейке B10 таблицы 3 стоит вопросительный знак. Но, думаю, светлые головы «Самиздата» смогли бы решить и этот вопрос.

        С позиций вычислительных ресурсов (ведь расчёты ежедневно выполняются для каждого автора), думаю, нагрузка увеличится незначительно, поскольку исходные данные для расчёта так или иначе обсчитываются и сегодня. Построение алгоритма — не вопрос, изменение интерфеса таблицы — тоже. Остановка за одним — «политической волей» командиров «Самиздата».


Магадан, 24 июля 2012 г.



* * *



ПРИМЕЧАНИЯ  




1 Отдельный вопрос ещё — как на этот форум попасть? Всякий ли прочувствует-догадается, что путь туда открывается исключительно со страниц комментариев (?!). М-да... Интуитивным такой пользовательский интерфейс уж явно не назовёшь. Да и нечего за каждой справкой на форум бегать, людей от важных дел отрывать! Какие проблемы? — кнопку «Помощь» контекстной сделать, а не отпихивать ею по любому поводу на общую информационную страницу, где эту самую информацию ещё о-очень поискать надо.

2 Понятно, что таблицы столь же условны, как и названный автор. Адресные строки и абсолютные значения исходных цифр указаны и приняты исключительно из соображений удобства.

3 Впрочем, существует одно исключение. Вот какой диалог по этой ситуации я нашёл на форуме:

        «Скажите, пожалуйста, если удалить произведение, то отразится ли это на статистике посещаемости в окошке «Всего»? То есть, уменьшится ли там цифра?

        Тут всё хитрее. Данные по посещаемости за последние два неполных месяца (скажем, сегодня — за апрель и май) считаются «честно». За следующие — просто хранится мертвая, ни к чему не привязанная цифра.

        Если вы удалите произведение, в которое два последних месяца заходило мало людей (в любой день было другое произведение, где посещаемость выше), то это не повлечет снижения общей посешаемости. Даже если в январе именно удаленное произведение было «паровозом» и посещалось чаще всего — итоговая цифра за январь и сумма за год не изменятся.

        Если же удаляемое произведение хотя бы один день за последние два месяца было на первом месте среди других ваших произведений по посещаемости — то да, снизится.

        Причина такого странного поведения: движок Самиздата создавался тогда, когда и место на диске, и вычислительные мощности, и широкие каналы были в дефиците. Поэтому «честной» базы данных с запросами здесь нет: вся статистика считается not-real-time скриптами, запускаемыми время от времени, а старые промежуточные данные стираются.»


©   Александр Глущенко, 2012.

 Ваша оценка:

Связаться с программистом сайта.

Новые книги авторов СИ, вышедшие из печати:
О.Болдырева "Крадуш. Чужие души" М.Николаев "Вторжение на Землю"

Как попасть в этoт список
Сайт - "Художники" .. || .. Доска об'явлений "Книги"