http://xen0n.livejournal.com/ ([identity profile] xen0n.livejournal.com) wrote in [community profile] useless_faq2010-06-24 05:57 am

О вечном

Еще много лет назад впервые услышал, и периодически натыкаюсь на высказывания, что N% интернет-трафика составляет порнография (где N - некое "удивительно большое" число от 30 до 80).

В общем-то легко могу поверить и в 30% и в 80%, но вопрос в другом - каким образом можно теоретически подсчитать это (как-то же подсчитали)? Логи порносайты не публикуют. Понять, какого рода трафик пролетает, из пакетов на на магистральных маршрутизаторах тоже нереально. Есть все таки какой-то метод, или же кто-то взял число с потолка, а все остальные просто бездумно цитируют его оценку, потому что "это общеизвестный факт"?

[identity profile] gornal.livejournal.com 2010-06-24 07:18 pm (UTC)(link)
Рискну предположить, что уж никак не меньше, чем процентов 98 трафика обеспечиваются 10000 сайтов. Получив их список (естественно не по каждому пользователю, а сразу по всем), категоризировать 10000 сайтов можно за 20000 минут = ~2 человеко-месяца, абсолютно достижимая цифра. При этом и 10000 сайтов для 98% трафика и 2 минуты на сайт - это скорее всего завышенные числа.
Т. е. было бы желание.

Кстати, экспертно, из общих соображений, даже 30% - заведомая брехня. Может быть, это было правдой лет 12 назад, но "мир изменился".