U današnje vrijeme gotovo svako od nas ima u telefonu aplikaciju koja može otkriti naziv pjesme samo slušajući nekoliko sekundi zvuka. Ali kako to radi kad je audio izvor nejasan, šumovit ili prekriven drugim zvukovima? U ovom članku objasnit ćemo osnovne principe prepoznavanja glazbe, korake koje aplikacije koriste i zašto je moguće otkriti pjesmu čak i u najtežim uvjetima.
Sadržaj...
Što je prepoznavanje glazbe?
Prepoznavanje glazbe je proces u kojem računalni sustav analizira audio signal i uspoređuje ga s bazom podataka poznatih pjesama. Kada se uspješno pronađe podudarnost, aplikacija prikazuje naziv pjesme, izvođača i dodatne informacije. Ovaj proces je sličan prepoznavanju govora, ali se fokusira na karakteristike koje čine glazbu prepoznatljivom, poput ritma, harmonije i melodije.
Kako aplikacije rade kad je zvuk zamućen?
Glavni izazov je izvući značajne informacije iz zamućenog signala. Sustavi koriste nekoliko tehnika:
- Filtriranje šuma – algoritmi uklanjaju nepotrebne frekvencije koje ne pripadaju glazbi.
- Ekstrakcija značajki – iz zvuka se izdvaja kratak „fingerprint“ koji sadrži jedinstvene karakteristike pjesme.
- Usporedba s bazom podataka – fingerprint se uspoređuje s milijunima sličnih zapisa.
Ovaj proces je brz i učinkovit, pa aplikacija može prepoznati pjesmu u sekundi.
Koraci koje aplikacija koristi
1. Učitavanje audio signala – aplikacija snima ili prima audio iz mikrofona.
2. Preprocesiranje – uklanjanje šuma, normalizacija jačine zvuka.
3. Izračun fingerprinta – algoritam poput Shazama koristi spektrogram i izračunava jedinstveni kod.
4. Usporedba s bazom podataka – algoritam traži najbližu podudarnost.
5. Prikaz rezultata – aplikacija prikazuje naziv pjesme, izvođača i poveznice.
Zašto je moguće?
Glazbeni signali imaju određene karakteristike koje ostaju netaknute čak i kad je zvuk zamućen. Na primjer, ritam, harmonija i melodija ostaju prepoznatljivi. Algoritmi su dizajnirani da fokusiraju na te karakteristike, ignorirajući šum i druge smetnje.
Primjer: Ako se pjesma „Bože moj“ pjeva u pozadini automobila, aplikacija može prepoznati ključne akorde i melodijske linije, a zatim ih usporediti s bazom podataka.
Često postavljana pitanja
Kako brzo aplikacija može prepoznati pjesmu?
Proces traje samo nekoliko sekundi jer algoritmi rade na optimiziranim matematičkim modelima i koriste paralelne računarske resurse.
Može li aplikacija prepoznati pjesmu ako je izvorni snimak vrlo loš?
Da, ali postoji granica. Ako je šum prevelik ili ako je pjesma prekrivena drugim glasnim zvukovima, to može otežati prepoznavanje.
Koja je najpoznatija aplikacija za prepoznavanje glazbe?
Shazam je najpoznatiji primjer, ali postoje i druge aplikacije poput SoundHounda i Musixmatcha.




