http://xzekytep.livejournal.com/ ([identity profile] xzekytep.livejournal.com) wrote in [community profile] useless_faq2006-02-19 01:13 am

Бредовая идея из детства:

Возможно ли сделать такой интернет-поисковик: рядом со строчкой кнопочка "Обзор", за ней - "Поиск". Вы нажимаете "Обзор" и выбираете графический файл, который недавно скачали из интернета. Суть в том, что поисковик ищет сайты, на которых встречается данная картинка. Понятно, что это отнимет кучу ресурсов, вообще неясно как проводить индексирование, много ещё вопросов, но в принципе - реально?
PS Знаю, что существуют подобные программы для поиска порно на компе, там анализируется процентное отношение цвета человеческой кожи к остальным цветам.

UPD Спонсоры, где вы...

[identity profile] glukinho.livejournal.com 2006-02-18 10:17 pm (UTC)(link)
В принципе, с помощью компьютера вообще абсолютно всё реально :)

[identity profile] dr-von-ozgg.livejournal.com 2006-02-18 10:20 pm (UTC)(link)
Ну есть же системы распознования образа. Вот думаю, что на их подобии можно.

[identity profile] ortemko.livejournal.com 2006-02-18 10:26 pm (UTC)(link)
Проще всего найти тот же самый (бит-в-бит) файл.

Чуть сложнее - "такую же" или очень похожую картинку. Но тоже можно. В целом, наука готова :)

А каков бюджет проекта с поисковика?

[identity profile] netp-npokon.livejournal.com 2006-02-18 10:33 pm (UTC)(link)
Индексирование проводить легко - достаточно посчитать хеш картинки и ее размер (чтобы уменьшить число нежелательных коллизий). Поскольку картинки обычно путешествуют по Сети в неизменном состоянии (в отличие от текстов), собирать и хранить их - одно удовольствие, даже ключевые слова не нужны.
Если вы таки имеете в виду поиск похожих картинок (или, к примеру, подкартинок в картинке), то задача эта куда сложнее. К примеру, существует поучительная байка о том, как губернатор одного американского штата приказал запретить распространение порно, а в качестве критерия выбрал одну из таких программ. Естественно, нашлись умники, которые скормили программе портрет самого губернатора. Результат предсказуем :)

[identity profile] f2065.livejournal.com 2006-02-18 10:36 pm (UTC)(link)
Найти не именно похожий сюжет, а именно такой-же файл - запросто. Индексировать файлы вполне можно, например по CRC64+Size.

я как-то в ЖЖ повесил картинку со своего сервера. И потом смотрел логи и IP тех кто её скачивал. Там было около 20 роботов в час!!!. Причём, я тогда только пришёл в ЖЖ и нигде не засветился. Какие-то американские зеркала-архиваторы картинок (куда потом можно было зайти и посмотерть картинку когда я её уже снял), и детекторы watermark-копирайтов...

и помнится некоторые фирмы - регистраторы watermark - предлагают на некое кол-во денег искать по всему инету кто выложил зарегистрированную картину...

вобщем, такие поисковики в инете давным-давно существует, но интерфейса для рядовых юзеров - у них нет.

[identity profile] bumper-11.livejournal.com 2006-02-18 11:07 pm (UTC)(link)
И ещё с музыкой и видео то же самое надо сделать!

[identity profile] grey-horse.livejournal.com 2006-02-19 04:39 am (UTC)(link)
http://labs.systemone.at/retrievr/ - поиск похожих картинок. Пока работает плохо.

[identity profile] da-pretzel.livejournal.com 2006-02-19 11:42 am (UTC)(link)
Я сейчас участвую в тестировании сервиса, который делае именно то, что здесь предложено. И что удивительно - делает замечательно. Ссылку пока дать не могу, но у меня есть сведения, что в течение ближайших недель они готовятся открыться