Как работает Shazam

Обзоры

Как работает шазам? Вопрос, интересующий многих пользователей. Действительно, каков принцип работы данного сервиса?

Это программа позволяющая распознавать музыкальные композиции. Для того чтобы запустить его, необходимо нажать на кнопку в появившемся окне приложения. Она запустит сканер, который отправит данные на сервер для распознавания.

То есть принцип работы шазам сервиса таков:

  • изначально была создана база данных с отпечатками музыки;
  • любой пользователь может «отметить» интересующую его композицию, посредством нажатия на кнопку в программе. Искомый отрывок должен длиться не менее 10 секунд;
Логотип Shazam
Логотип Shazam
  • приложение направляет его в сервис, где происходит процесс поиска;
  • если мелодия была найдена, на дисплее мгновенно отображается информация – название, исполнитель, жанр, если же совпадений найдено не было, то приходит уведомление об ошибке.

Это и есть основные принципы работы сервиса.

Для того чтобы шазам работал более эффективно, можно поднести устройство ближе к источнику музыки.

Основа основ

Для того чтобы лучше понять, как работает Shazam, необходимо обратиться к самой природе звука. Что происходит, когда человек слышит что-либо? И как вообще выглядит звук? У человека в ухе есть барабанные перепонки, а также слуховые косточки, которые помогают слышать. Звук перемещается волнами по воздуху, и именно когда этот воздух ударяется в перепонки, заставляя и вибрировать, человек слышит. «Удары» воздуха о перепонку возможны только благодаря миллиардам молекул, находящимся постоянно в нем. Звуковая волна, раздающаяся из динамиков (от музыкальных инструментов или иных источников звука) заставляет двигаться эти молекулы в определенном направлении.

Звуковые колебания можно изобразить синусоидной волной, но это будет не совсем верно – на самом деле звуковая волна одной ноты больше похожа на горные пики, а если речь идет о целой музыкальной дорожке или ее отрывка, то это, скорее, дремучий лес с отражением в водной глади. При воспроизведении звука динамик (или любой другой источник звука) движется именно так: быстрыми толчкообразными движениями вперед-назад, что и позволяет человеку услышать звучание.

При чем здесь Shazam? А при том, что вся его работа строится на обладании огромной базы музыкальных фрагментов – «отпечатков». Это короткие сгенерированные образцы звучания того или иного трека, по которым и определяется вся композиция. Но каким образом это связано со звуковыми волнами? Самым прямым: ведь именно на основании этих волн и создается образец.

Более подробно об «отпечатках»

Распознавание отпечатков пользователей
Распознавание отпечатков пользователей

Что такое «отпечатки»? Когда пользователь «отметил» заинтересовавшую его песню, программа генерирует для нее десятисекундный «отпечаток» — образец звука.

Вначале стоит определиться, как вообще выглядит «отпечаток» всей песни. Для этого должны быть определены частоты и их громкость, звучащие в конкретный момент времени, то есть, то самое отражение леса в водной глади должно стать горными пиками. Это возможно благодаря преобразованию Фурье – математическому методу, который буквально раскладывает звуковую волну на набор всех используемых частот и помогает определить громкость каждой из них. К слову, именно громкость выражается теми самыми пиками с различной амплитудой. Shazam работает именно по этому принципу – определяя в какой момент проявляются те или иные частоты и насколько велика их сила (громкость).

Но это лишь первый этап. Как правило, Shazam используется не в студии звукозаписи, а в повседневной жизни, где помимо интересующей мелодии есть еще масса различных звуков. Плюс, не стоит забывать и о расстоянии до источника звука – чем оно больше, тем труднее распознавать многие звуковые волны. Поэтому второй этап – переведение стерео в моно и удаление всех частот свыше 4000-5000 Гц. Эти цифры не случайны – человеческий слух распознает частоты в диапазоне 20 Гц- 20000 Гц, но основная слышимая мелодия, как правило, располагается в диапазоне 100-2000 Гц. Примечательно, что данные цифры применимы к устройству пользователя, однако в самой базе «отпечатков» Shazam все звуковые дорожки обладают частотой дискретизации звука в 44100 Гц на 16 бит.

Что происходит дальше? Если говорить о мелодии целиком, то следующим шагом является построение карты звука – то есть, какие частоты преобладают в конкретный момент времени трека. Но ведь музыкальная композиция может длиться до получаса (если речь идет о классической музыке)! Специально для этого в Shazam используется следующий принцип: привязка конкретных условных точек, отмечающих частоты не ко времени с начала воспроизведения трека, а друг к другу, где определяющим фактором выступает разница во времени между звучанием этих точек. Именно благодаря этому принципу Shazam способен распознавать мелодию всего за 10 секунд.

В эти 10 секунд приложение анализирует звук, выявляет ключевые точки и отправляет их на общий сервер Shazam, где происходит поиск соответствий. Если они найдены – пользователю выдается результат с названием песни и ее исполнителем, текстом, а также возможностью прослушать на удобном ресурсе (или приобрести). Или же, если совпадений не найдено – выдается соответствующее оповещение. Можно подвести краткий итог, как работает Шазам.

Множество композиций хранится в базе данных Shazam, информация регулярно пополняется. Во всех образцах выделяют три основных показателя – частота, время интенсивность. Когда человек начинает искать какую-либо мелодию, сканер генерирует ее в «отпечаток», который складывается из частоты, времени, интенсивности.

Таким образом, песня превращается в частотно-временной график, так называемую спектрограмму, точки которой должны соотнестись с одним из образцов в базе данных. Вот как работает шазам!

Интерфейс сервиса

Интерфейс Shazam
Интерфейс Shazam

Программа оформлена в синем тоне. Интерфейс сервиса очень прост. Запустив приложение, на экране мобильного телефона появится окно программы, с единственной большой кнопкой. Нажав на нее, запустится процесс сканирования композиции, на экране при этом появится анимация напоминающая загрузку.

После того, как мелодия отсканирована, информация о ней появится в отдельном окне, внизу которого есть дополнительная информация о трэке.

В приложении есть функция позволяющая поделиться трэком в социальных сетях – «рассказать друзьям».

В меню сохраняется история поиска, который можно просмотреть в любое время.

На официальном сайте разработчика можно зарегистрироваться и войти в личный кабинет, что позволяет просматривать историю поисков, делиться с друзьями понравившимися треками через социальные сети, просматривать хит-парады и рейтинги песен, созданные по поисковым запросам пользователей. Использовать зарегистрированную версию можно и на мобильном устройстве.

Shazam можно использовать и для составления собственного плейлиста благодаря большому выбору различных чартов. Они составляются исходя из данных, полученных от пользователей со всего мира, с конкретных стран или даже городов, могут быть составлены из популярных песен и исполнителей в целом или только в определенном жанре. Это отличная возможность расширить музыкальные горизонты и совершить приятные открытия.

Интересна также возможность установить приложение на ПК, используя создание образа мобильного устройства. Однако стоит сразу отметить, что официально у компании Shazam нет версии для компьютеров, поэтому подобные установки пользователь совершает под свою ответственность.

Как работает шазам мы уже разобрались, но у этой программы есть и другие преимущества:

  • программа способна работать вне сети,
  • интерфейс сервиса удобен и легок в использовании,
  • сервис выдает помимо подробной информации о трэке, еще и текст песни,
  • можно просматривать клипы песен на сервисе YouTube,
  • есть возможность поделиться композицией в социальных сетях.

Особая фишка Shazam – возможность использования функции «автошазам». С ее помощью можно определить все треки, играющие в течение поездки в автомобиле или даже в течение дня. При этом не обязательно держать приложение открытым – функция работает и после сворачивания окна. Результатом станет подборка треков, услышанных за день. Таким образом, выгодные отличия Shazam от конкурентных программ очевидны.

Стоит отметить, что, как и у любой другой программы, у Шазама есть некоторые недостатки. К ним относится:

  • периодические сбои в работе с выдачей результатов, далеких от изначального запроса;
  • случающиеся нарушения работоспособности по неизвестным причинам;
  • на некоторые устройства Шазам просто невозможно установить ввиду отсутствия соответствующей оптимизации;
  • если к устройству подключены наушники, то распознавание проводиться не будет;
  • падение громкости воспроизведения через гарнитуру Bluetooth.

Впрочем, на подавляющем большинстве устройств приложение работает корректно, чего не сказать о других приложениях «как Shazam». Указанные недостатки не сильно влияют на общее впечатление от Шазама, да и его преимущества перевешивают. В любом случае постоянные обновления, оптимизация и расширение возможностей дают надежду на то, что эти минусы в скором времени пропадут безвозвратно.

Что делать если Shazam не работает

В случае некорректной работы шазам, исправить положение можно несколькими способами. Итак, если, при необходимости распознать песню на экране мобильного телефона появляется сообщение – «К сожалению, мы не смогли распознать песню! Убедитесь, что вы держите телефон близко к источнику звука.

Музыка должна быть достаточно громкой, чтобы вы хорошо слышали ее» значит, shazam не работает. Чтобы исправить ситуацию попробуйте перезапустить мобильное устройство. Если это не помогло, попробуйте переустановить приложение. В случае если работоспособность к приложению не вернулась необходимо обратиться в службу поддержки и сообщить о том, что shazam не работает.

Примечательный факт заключается в том, что приложение работает как постоянно развивающаяся нейросеть: если в определенный момент Shazam не смог определить какую-то мелодию, то велика вероятность того, что через определенный промежуток времени мелодия появится в базе, особенно, если на нее поступает много запросов.

Не всегда негативный результат поиска свидетельствует о проблемах приложения или его неработоспособности. Иногда причина кроется лишь в качестве звука: большое количество помех или посторонних шумов (голос, смех, грохот) не дают верно выстроить ключевые точки «отпечатка». Схожая ситуация может возникнуть и в случае со слишком громкой музыкой.

Еще одна причина неработоспособности Shazam кроется не в приложении – если у устройства, записывающего мелодию, есть проблемы с динамиком, то результат будет негативным, по причине невозможности создать верный «отпечаток» проигрываемого трека.

Существуют и другие приложения, имеющие схожий функционал – «как Шазам», но зачастую у них нет настолько обширной библиотеки звуковых «отпечатков». За достаточно продолжительное существование Шазама (официально существует с 1999 года) его библиотека значительно расширилась и постоянно пополняется, а добавление дополнительных возможностей позволяет сохранять популярность.

Согласитесь, действительно полезное приложение для любителей музыки. Теперь, есть возможность быстро найти понравившуюся песню и узнать подробную информацию о ней.

Михаил Звягинцев

iOS-разработчик. Специалист в области машинного обучения и анализа данных.

Оцените автора
Андроид блог
Добавить комментарий

  1. арслан

    после установки шазам с плеймаркета на андроид шазам не запускается.что можно сделать?

    Ответить
  2. Андрей

    Не работает Shazam

    Ответить
  3. Ольга

    Шазам не работает!!! Не запускается!

    Ответить
  4. Андрей

    Ничего не распознает!

    Ответить
  5. Светлана

    на телефоне андроид самсунг а6 не работает шазам пишет нет соединения что-то не сработало, может попробовать снова еще рас? все возможные варианты устранения это проблемы не помогли это исправить

    Ответить
  6. Евгений

    Как включить авто-Shazam ? Не реагирует ни на что, помогает только перезагрузка программы с потерей всех данных, и до следующего произвольного включения…

    Ответить