U eri pametnih telefona i interneta, aplikacije koje u tren oka otkriju nepoznatu melodiju postale su gotovo svakodnevni alat. Iako se čini da se radi o čaroliji, iza brzog prepoznavanja stoji složen skup matematičkih i računalnih postupaka. U nastavku ćemo na jednostavan i razumljiv način objasniti kako Shazam funkcionira, kako ga pravilno koristiti i što se događa „iza kulisa“ kada pritisnete tipku za prepoznavanje.
Sadržaj...
Kako Shazam pretvara zvuk u digitalni otisak
Kada odaberete opciju prepoznavanja, mikrofon vašeg uređaja snima kratki audiozapis – obično deset sekundi. Taj analogni zvučni signal pretvara se u digitalni oblik tako da se svaka sekunda podijeli na tisuće uzoraka. Svaki uzorak bilježi amplitudu zvučnog vala u određenom trenutku, čime se dobiva precizan prikaz promjena zvuka kroz vrijeme.
Nakon što je zvuk digitaliziran, primjenjuje se Fourierova transformacija. Ovaj matematički postupak razlaže zvuk na njegove osnovne frekvencije i stvara spektar koji pokazuje koliko je svaka frekvencija prisutna u snimku. Na temelju tog spektra generira se jedinstveni „zvučni otisak“ – skup numeričkih podataka koji opisuje karakteristike zvuka, a koji je dovoljno specifičan da razlikuje jednu pjesmu od druge.
Usporedba otiska s bazom podataka
Shazam posjeduje ogromnu bazu podataka koja sadrži otiske milijuna pjesama. Svaki otisak pohranjen je u obliku niza numeričkih vrijednosti, uz dodatne informacije poput naziva skladbe, izvođača i albuma. Kada aplikacija pošalje vaš otisak na poslužitelj, pokreće se algoritam koji uspoređuje vaš otisak s otiscima pohranjenim u bazi.
Algoritam ne traži savršeno podudaranje, već najbližu sličnost, uzimajući u obzir moguće šumove, razlike u glasnoći i druge varijable. Usporedba se provodi kroz sljedeće korake:
- Filtriranje šuma: Uklanjaju se neželjeni zvučni signali poput pozadinske buke i zvukova okoline.
- Izračunavanje sličnosti: Za svaki segment otiska izračunava se koeficijent sličnosti s otiscima u bazi.




