http://aligafriend.livejournal.com/ ([identity profile] aligafriend.livejournal.com) wrote in [community profile] useless_faq2011-03-08 01:51 pm

Распознование музыки

Есть программа для мобильного телефона, позволяющая по 10 секундам записи через штатный микрофон телефона определить какая песня играет. Определяет меньше, чем за полминуты. Очень редко ошибается. За период моего использования ни разу не ошиблась.В своей работе использует мобильный интернет(GPRS). По какому алгоритму она работает? хотя бы примерно.

[identity profile] unibasil.livejournal.com 2011-03-08 02:30 pm (UTC)(link)
Разумеется, они не сравниваются побитно и уж тем более не в реальном времени. Скорее всего, формируется некий цифровой «отпечаток» каждой композиции, поиск по которому уже совершенно тривиален.

[identity profile] radio-developer.livejournal.com 2011-03-08 03:59 pm (UTC)(link)
там сидят 1000000 китайцев.

[identity profile] eugene-m.livejournal.com 2011-03-08 04:32 pm (UTC)(link)
тысячи обезьянок трудятся над выполнением вашего запроса

[identity profile] xen0n.livejournal.com 2011-03-09 03:06 am (UTC)(link)
вот сами сравните.

если я ищу "рецепт пирог курица", то гуглю надо перелистать 100500 страниц чтобы найти подходящую, но все же он ищет те, где есть упоминания этих слов.

А если запись с копеечного микрофона телефона, тогда получается "ПШШЬ БЖЖЬси-пуси я не твКХЕ-КХЕ, ТЫ ЗА ХЛЕБОМ СХОДИЛ?я летела к тебе, я знала[ШУМ СЛИВАЕМОЙ ВОДЫ В ТУАЛЕТЕ]"
в общем тяжелее как-то, поэтому и возникает вопрос.

[identity profile] stairian.livejournal.com 2011-03-09 07:17 am (UTC)(link)
Ну, вообще говоря, гугл ничего не листает, он заранее индекс строит. Грубо говоря, он априори знает, что данное слово встречаются в конкретном списке страниц. Если задано 2 слова в поиске - он ищет пересечение в двух множествах. И т.п.

[identity profile] xen0n.livejournal.com 2011-03-09 10:25 am (UTC)(link)
я знаю :-)

в звуке - тяжелее выделить признаки, по которым индексировать можно, потому что любой звук в "мелодии" может оказаться шумом, фоновым звуком итд.

[identity profile] stairian.livejournal.com 2011-03-09 08:15 pm (UTC)(link)
Да, но зато избыточность аудиоматериала очень большая, по сравнению с разпознаванием текста, например.

[identity profile] unibasil.livejournal.com 2011-03-09 09:35 am (UTC)(link)
А уж как лица с камер слежения в толпе компьютеры различают, это же вообще мракъ, как тяжело…

[identity profile] stairian.livejournal.com 2011-03-09 07:15 am (UTC)(link)
Дык он не по битам сравнивает, а составляет закономерности. Если совсем грубо, то раскладывает по нотам.
А уж конкретная математика слишком сложна, чтобы ее в рамках данного комьюнити обсуждать.

А что касается меньшей ресурсоемкости - так и запросов к этому сервису в сотни тысяч раз реже происходят, чем к гуглу.

[identity profile] stairian.livejournal.com 2011-03-09 08:05 pm (UTC)(link)
Это миф :)
Никому ничего не нужно. Разве что на уровне "солнце - это желтая птица".