Kako Shazam prepoznaje pjesmu u djeliću sekunde – detaljno objašnjenje

U eri pametnih telefona i interneta, aplikacije koje u tren oka otkriju nepoznatu melodiju postale su gotovo svakodnevni alat. Iako se čini da se radi o čaroliji, iza brzog prepoznavanja stoji složen skup matematičkih i računalnih postupaka. U nastavku ćemo na jednostavan i razumljiv način objasniti kako Shazam funkcionira, kako ga pravilno koristiti i što se događa „iza kulisa“ kada pritisnete tipku za prepoznavanje.

Sadržaj...

Kako Shazam pretvara zvuk u digitalni otisak

Kada odaberete opciju prepoznavanja, mikrofon vašeg uređaja snima kratki audiozapis – obično deset sekundi. Taj analogni zvučni signal pretvara se u digitalni oblik tako da se svaka sekunda podijeli na tisuće uzoraka. Svaki uzorak bilježi amplitudu zvučnog vala u određenom trenutku, čime se dobiva precizan prikaz promjena zvuka kroz vrijeme.

Nakon što je zvuk digitaliziran, primjenjuje se Fourierova transformacija. Ovaj matematički postupak razlaže zvuk na njegove osnovne frekvencije i stvara spektar koji pokazuje koliko je svaka frekvencija prisutna u snimku. Na temelju tog spektra generira se jedinstveni „zvučni otisak“ – skup numeričkih podataka koji opisuje karakteristike zvuka, a koji je dovoljno specifičan da razlikuje jednu pjesmu od druge.

Usporedba otiska s bazom podataka

Shazam posjeduje ogromnu bazu podataka koja sadrži otiske milijuna pjesama. Svaki otisak pohranjen je u obliku niza numeričkih vrijednosti, uz dodatne informacije poput naziva skladbe, izvođača i albuma. Kada aplikacija pošalje vaš otisak na poslužitelj, pokreće se algoritam koji uspoređuje vaš otisak s otiscima pohranjenim u bazi.

Algoritam ne traži savršeno podudaranje, već najbližu sličnost, uzimajući u obzir moguće šumove, razlike u glasnoći i druge varijable. Usporedba se provodi kroz sljedeće korake:

Filtriranje šuma: Uklanjaju se neželjeni zvučni signali poput pozadinske buke i zvukova okoline.
Izračunavanje sličnosti: Za svaki segment otiska izračunava se koeficijent sličnosti s otiscima u bazi.