Kako Shazam prepoznaje pjesmu u djeliću sekunde – detaljno objašnjenje

Kako Shazam prepoznaje pjesmu u djeliću sekunde – detaljno objašnjenje

U eri pametnih telefona i interneta, aplikacije koje u tren oka otkriju nepoznatu melodiju postale su gotovo svakodnevni alat. Iako se čini da se radi o čaroliji, iza brzog prepoznavanja stoji složen skup matematičkih i računalnih postupaka. U nastavku ćemo na jednostavan i razumljiv način objasniti kako Shazam funkcionira, kako ga pravilno koristiti i što se događa „iza kulisa“ kada pritisnete tipku za prepoznavanje.

Kako Shazam pretvara zvuk u digitalni otisak

Kada odaberete opciju prepoznavanja, mikrofon vašeg uređaja snima kratki audiozapis – obično deset sekundi. Taj analogni zvučni signal pretvara se u digitalni oblik tako da se svaka sekunda podijeli na tisuće uzoraka. Svaki uzorak bilježi amplitudu zvučnog vala u određenom trenutku, čime se dobiva precizan prikaz promjena zvuka kroz vrijeme.

Nakon što je zvuk digitaliziran, primjenjuje se Fourierova transformacija. Ovaj matematički postupak razlaže zvuk na njegove osnovne frekvencije i stvara spektar koji pokazuje koliko je svaka frekvencija prisutna u snimku. Na temelju tog spektra generira se jedinstveni „zvučni otisak“ – skup numeričkih podataka koji opisuje karakteristike zvuka, a koji je dovoljno specifičan da razlikuje jednu pjesmu od druge.

Usporedba otiska s bazom podataka

Shazam posjeduje ogromnu bazu podataka koja sadrži otiske milijuna pjesama. Svaki otisak pohranjen je u obliku niza numeričkih vrijednosti, uz dodatne informacije poput naziva skladbe, izvođača i albuma. Kada aplikacija pošalje vaš otisak na poslužitelj, pokreće se algoritam koji uspoređuje vaš otisak s otiscima pohranjenim u bazi.

Algoritam ne traži savršeno podudaranje, već najbližu sličnost, uzimajući u obzir moguće šumove, razlike u glasnoći i druge varijable. Usporedba se provodi kroz sljedeće korake:

  • Filtriranje šuma: Uklanjaju se neželjeni zvučni signali poput pozadinske buke i zvukova okoline.
  • Izračunavanje sličnosti: Za svaki segment otiska izračunava se koeficijent sličnosti s otiscima u bazi.

If you like this post you might also like these

More Reading

Post navigation

Zašto nas zvuk grebanja po krednoj ploči izluđuje – znanstveno objašnjenje

Svaki put kad čujete kako netko grebe po krednoj ploči, u trbuhu se pojavi neugodni osjećaj i instinktivna želja da se taj zvuk isključi. Iako se radi o svakodnevnoj radnji, taj neobičan zvuk već godinama intrigira znanstvenike koji pokušavaju otkriti što ga čini toliko neugodnim. U nastavku ćemo...

Prirodni suplementi i biljni pripravci – vodič za pametan izbor

U današnje vrijeme sve više ljudi traži dodatne načine za podršku zdravlju izvan tradicionalne prehrane i lijekova. Prirodni suplementi i biljni pripravci nude mogućnost da se organizmu dopru dodatni nutrijenti, antioksidansi i druge aktivne tvari koje mogu poboljšati imunitet, energiju ili opću...
back to top