Jeste li se ikada zapitali što se točno gubi tijekom kompresije iz lossless u mp3 128 kbps ili 320 kbps?
Provjerio sam i rezultat se učinio zanimljivim. Prije svega, predlažem da prođete anketu kako biste sami shvatili čujete li uopće razliku. Ako niste sigurni da čujete ili ste sigurni da ne čujete, onda vam skrećem pozornost na jednostavnu i elegantnu ideju: trebate uzeti i čelom gurnuti dva zvučna vala, od kojih će jedan biti u protufazi, odnosno, kada miksate dvije pjesme, uglavnom ćete čuti ono što nije ugašeno. Još ne obećavam zanimljivu grafiku, ali moći ćete čuti na svom sustavu koji su točno zvukovi izgubljeni prilikom komprimiranja iz flaca u mp3 128\320 kbps, arhivirajte s primjerima na kraju članka.

Intervju

Potrebno je preuzeti i poslušati 12 pjesama 30 sekundi. Zatim odredite jednu od 3 opcije za svaku od 4 pjesme (128 kbps, 320 kbps ili bez gubitaka).
Anketa je anonimna, ali možete navesti jedinstveni hash i reći mi ga, u krajnjem slučaju objavite svoje mišljenje ovdje, ali uvijek ispod spojlera. Anketa će trajati do 25. veljače, nakon čega ću objaviti ključ i statistiku.
Datoteke na Yandex disku, ogledalo na Dropboxu (~ 80Mb).

Početni podaci

The Black Keys - Everlasting Light (flac, 44100 Hz, 24-bita, 1613 kbps), dostupno na Youtube.
Ludovico Einaudi - Drop (flac, 96000 Hz, 24-Bit, 2354 kbps), možete je pronaći na Yandex Music.
CC Coletti - Rock and Roll (flac, 192000 Hz, 24-Bit, 4845 kbps), dostupno na Youtube.
Annihilator - Ultra-motion (flac, 44100 Hz, 16-bit, 1022 kbps), dostupno na Youtube.

mp3 mogućnosti konverzije

44,1 kHz, stereo, 128 kbps ili 320 kbps

Opis pokusa

Izvorne datoteke se režu na dijelove koji traju 10 sekundi, svaki od dijelova se izvozi u wav. Nakon uvoza primljenih pjesama, 2 sekunde tišine i signal drugog tona dodaju se na početak svake, zatim se pretvaraju u mp3. Nakon uvoza mp3 datoteka, ispada da je, u odnosu na izvornik, rezultirajuća datoteka "lijevo ispred." To nije greška, to je . Izvršavamo sinkronizaciju u odnosu na zadani tonski signal iz originalnog (probao sam nekoliko vrijednosti za svaku mp3 datoteku, koje sam kasnije doradio do najboljeg rezultata), riješimo se tonskog signala, utišamo i eksportiramo rezultirajuće pjesme u wav . Sada ostaje preokrenuti staze kako bi se dobili višesmjerni vrhovi i pomiješati s originalom.

Proizlaziti

Neću otkriti Ameriku... Da, postoji razlika. Da, posebno kada je komprimiran na 128 kbps. Da, ovisi o glazbi. Da, čak i više od audio putanje.
Možete donijeti neovisni zaključak i čuti razliku preuzimanjem datoteka na

Bitrate je naznačen kao jedna od glavnih karakteristika video i audio zapisa. Većina korisnika navikla je misliti da to određuje kvalitetu preuzete datoteke. Ali što su brzine prijenosa i kako one zapravo karakteriziraju glazbene datoteke i video zapise? Razmotrimo ovo detaljnije.

Što su bitrate?

Bitrate je vrijednost koja prikazuje broj jedinica informacija (megabita ili kilobita) sadržanih u jednoj sekundi reprodukcije datoteke. Sukladno tome, mjeri se u megabitima po sekundi (Mbps) ili kilobitima po sekundi (Kbps). U suprotnom, bitrate se može opisati kao širina pojasa. Ova karakteristika je važna za one koji žele pretvoriti datoteke, jer će za isto trajanje veća brzina prijenosa rezultirati većom datotekom. Osim veličine mijenja se i kvaliteta zvuka. Smanjenje veličine kako se brzina prijenosa smanjuje naziva se kompresija.

Uobičajena glazbena datoteka je audio datoteka komprimirana do te mjere da na standardni disk može stati do 12 sati glazbe. U isto vrijeme, kvaliteta ostaje prilično visoka zbog psihoakustičke kompresije: zvukovi s frekvencijama i razinama glasnoće koje ljudsko uho ne hvata uklanjaju se iz cijelog raspona. Odabrani zvukovi formiraju se u zasebne blokove koji se nazivaju okviri. Okviri imaju isto trajanje zvuka i kompresirani su prema zadanom algoritmu. Kada se svira glazba, signal se ponovno stvara iz dekodiranih blokova u određenom nizu.

Što je najčešće korištena kompresija?

Audio bitrate je najčešće 256 Kbps. Ova postavka komprimira audio zapis približno 6 puta u veličini, dopuštajući do 6 puta više glazbe da se snimi na jedan disk nego prije kompresije. Ako se bitrate spusti na 128 Kbps, tada će na jedan disk stati 12 puta više glazbe, ali će kvaliteta zvuka biti osjetno niža. Glazba snimljena pri 128 Kbps najčešće se nudi za slušanje na Internetu, jer vlasnici resursa podnose bilo kakve žrtve u potrazi za povećanjem brzine učitavanja stranica. Mnogi korisnici primjećuju da je njegova kvaliteta daleko od idealne.

Sada kada je postalo jasno što su bitrate, vrijeme je da odredimo njihovu optimalnu razinu. I amateri i profesionalci beskrajno se svađaju o tome kako bitrate utječe na kvalitetu zvuka i utječe li uopće. Na glazbenim albumima, u pravilu, bitrate je naznačen. Isti disk, snimljen u 128 Kbps i 256 Kbps, dva puta će se razlikovati u cijeni.

Optimalna brzina prijenosa u različitim uvjetima slušanja

Za mnoge ljude dvanaestostruka kompresija ne predstavlja nikakvu štetu, dok drugi tvrde da ne mogu slušati glazbu s brzinom nižom od 320 Kbps. Paradoksalno, obojica su u pravu. Činjenica je da u konačnici kvaliteta reprodukcije ne ovisi već o uvjetima reprodukcije pa čak i o vrsti glazbe.

Na primjer, pjesma se reproducira na magnetofonu instaliranom u domaćem automobilu. U ovom slučaju, kvaliteta na razini od 192 Kbps bit će sasvim dovoljna. Veća brzina prijenosa će poboljšati kvalitetu zvuka, ali razlika neće biti primjetna zbog visoke razine buke tijekom putovanja. Ako se glazba reproducira na kućnom računalu ili prijenosnom playeru, potrebno je najmanje 256 Kbps. Ako se signal ne mijenja, prenosi se na vanjske uređaje i izlazi na skupe uvezene zvučnike, tada biste trebali, ako je moguće, pribjeći minimalnoj kompresiji. Moguće je pri brzini prijenosa od 320 Kbps.

Optimalna brzina prijenosa za različite glazbene stilove

Glazba s velikom brzinom prijenosa nije uvijek potrebna. Popularna glazba obično zvuči dovoljno dobro pri 192-256 kbps. Može se podesiti i viša kvaliteta, ali to nema smisla: pop pjesme su kratkotrajne, pa bi štednja prostora na disku trebala biti prioritet. Osim toga, kvaliteta izvornih snimaka također je osrednja, tako da povećanje bitratea možda ni na koji način neće utjecati na kvalitetu datoteke za reprodukciju. Za slušanje u prijevozu i na neslužbenim zabavama dovoljna je prosječna kvaliteta.

Ako govorimo o klasičnoj glazbi, djelima legendarnih rock bendova ili rijetkim autorskim pjesmama, onda bi kvaliteta trebala biti iznad svega. Kada kupujete takvu glazbu, morate pogledati bitrate naveden na pakiranju diska. Ako je pjesma preuzeta s interneta, takve informacije moraju biti prisutne na stranici za preuzimanje. Osim toga, bitrate se prikazuje u playeru tijekom reprodukcije.

Bitrate video datoteke

Gore smo govorili o tome što su bitrate audio zapisa. Ali što je video bitrate? S obzirom na to da se video reproducira kao slijed zvukova i slika, definicija brzine prijenosa bit će slična. Prisutnost video sekvence čini datoteku težom, ali na kraju su slike za procesor iste nule i jedinice kao i zvukovi. Princip enkripcije podataka isti je za sve vrste datoteka.

U ovom ćemo članku govoriti o postavkama audio kodiranja koje utječu na kvalitetu zvuka. Razumijevanje postavki pretvorbe pomoći će vam da odaberete najbolju opciju kodiranja zvuka za vas u smislu omjera veličine datoteke i kvalitete zvuka.

Što je bitrate?

Bitrate je količina podataka po jedinici vremena koja se koristi za prijenos audio streama. Na primjer, 128 kbps označava 128 kilobita u sekundi i znači da se 128 tisuća bitova koristi za kodiranje jedne sekunde zvuka (1 bajt = 8 bitova). Ako ovu vrijednost prevedemo u kilobajte, ispada da jedna sekunda zvuka zauzima oko 16 KB.

Stoga, što je veća brzina prijenosa zapisa, to zauzima više prostora na vašem računalu. Ali u isto vrijeme, unutar istog formata, veći bitrate omogućuje snimanje zvuka s većom kvalitetom. Na primjer, ako pretvorite audio cd u mp3, tada će pri brzini prijenosa od 256 kbps zvuk biti mnogo bolji nego pri brzini prijenosa od 64 kbps.

Budući da je sada prostor na disku postao prilično jeftin, preporučujemo pretvaranje u mp3 s bitrateom od najmanje 192 kbps.

Također se pravi razlika između fiksne i promjenjive brzine prijenosa.

Razlika između konstantne brzine prijenosa (CBR) i promjenjive brzine prijenosa (VBR)

S konstantnom brzinom prijenosa, isti se broj bitova koristi za kodiranje svih dijelova zvuka. Ali struktura zvuka je obično drugačija i, na primjer, mnogo je manje bitova potrebno za kodiranje tišine nego za kodiranje bogatog zvuka. Varijabilni bitrate, za razliku od konstantnog, automatski prilagođava kvalitetu kodiranja, ovisno o složenosti zvuka u određenim intervalima. To jest, za odjeljke koji su jednostavni u smislu kodiranja koristit će se niža brzina prijenosa, a za složene koristit će se veća vrijednost. Korištenje varijabilne brzine prijenosa omogućuje postizanje veće kvalitete zvuka uz manju veličinu datoteke.

Što je stopa uzorkovanja?

Ovaj koncept nastaje kod pretvaranja analognog signala u digitalni i označava broj uzoraka (mjerenja razine signala) u sekundi koji se provode za pretvaranje signala.

Koliki je broj kanala?

Kanal je, u odnosu na audio kodiranje, neovisni audio tok. Mono je jedan tok, stereo su dva toka. Kratica n.m često se koristi za označavanje broja kanala, gdje je n broj punopravnih audio kanala, a m je broj niskofrekventnih kanala (na primjer, 5.1).

MP3 format. Kvaliteta. (jednostavno rečeno)
mp3 je digitalni prikaz analognog signala koji se diskreditira (digitalizira) u pravilnim intervalima (s frekvencijom navedenom u hercima) i prikazuje u binarnom obliku (sa zadanom točnošću - dubinom bita).
Izvođač - Naslov.mp3
192kbps 48kHz 16bit CBR stereo
1. Što znači 16kbps ili 320kbps ili 192kbps itd.
Broj označava koliko je digitalnih podataka bilo potrebno za kodiranje.
kbps - "kilobajt u sekundi" tj. kilobajta u sekundi.
Bitovi u sekundi, bps (engleski bits per second, bps) - osnovna mjerna jedinica brzine prijenosa informacija.
*Što je ova vrijednost veća, zvuk je bolji i voluminozniji (Mb).
* 1 bajt = 8 bita
* 1 kilobit = 1024 bita = 128 bajtova (B)
* 1 megabit = 1048576 bita = 131072 bajta = 128 KB
Početnici često brkaju kilobajte s kilobitima, očekujući brzinu od 256 KB / s od 256 Kbps kanala (na takvom kanalu brzina će biti 31,25 KB / s). Odnosno, za preuzimanje jednog megabajta (1 MB) informacija na takvom kanalu potrebno je 32,768 sekundi.
2. Što znači 44100 Hz ili 44 kHz.
Frekvencija uzorkovanja - frekvencija uzorkovanja pri pretvaranju analognog audio signala u digitalni. Izraženo u uzorcima po sekundi ili u hercima, brzina uzorkovanja vremena CD formata je 44,1 kHz.
(Jednostavnim riječima - kojom frekvencijom se zvuk digitalizira)
*Zvučne kartice podržavaju uobičajene frekvencije, kao i playeri.
Iako uređivači mogu uštedjeti od 2000 Hz do 192 000 Hz. Što je viša frekvencija, to je više (Mb) i bolji zvuk.
3.Što je 16bit ili 24bit.
Vrijednosti amplitude zvuka predstavljene su različitim brojem bitova (dubina bita); audio zapis se obično digitalizira s dubinom bita od 12 do 24 bita.
*Što je ta vrijednost bolja, to će se točnije i jasnije čuti različiti instrumenti, ali slični po zvuku, a također uvelike utječe na kvalitetu zvuka.
4. Što je ABR, CBR, VBR
ABR je skraćenica za Average Bit Rate, odnosno prosječnu bitsku brzinu, koja je hibrid VBR-a i CBR-a: bitsku brzinu u kbps postavlja korisnik, a program je mijenja, stalno prilagođavajući navedenoj bitskoj brzini.
*Jednostavno rečeno, pri spremanju mp3 zvuka i odabiru VBR 128kbps, to će značiti da će zvuk biti kodiran s varijabilnom (ako je potrebno) brzinom prijenosa koja ne prelazi 128kbps. S tišinom, to će biti oko 16kbps.
CBR je konstantna kvaliteta ne više od navedene, ali čak i uz tišinu bit će navedena vrijednost.
oni. kodiranje CBR 320kbps 1 minuta zvuka i 1 minuta tišine, konačne datoteke će zauzeti istu vrijednost Mb.
ABR - kodiran s konstantnom navedenom vrijednošću (na primjer 128kbps), ali ako je potrebno, 128kbps se krši i uzima se viša vrijednost.
*Što se tiče kvalitete, bolje je uzeti VBR frekvencije 48Hz, zatim CBR, ABR, VBR 44.1Hz.
5. Mono. Stereo. Kao što svi znaju.
Ostatak ću objaviti kasnije...

Za i protiv MP3 128 kbps

Sažimanje audio podataka je nezgodno. Ništa se ne može unaprijed reći ... Danas najčešći format - MPEG Layer3 sa streamom od 128 kbps - pruža kvalitetu koja se na prvi pogled ne razlikuje od originala. Zove se lagano - "CD-kvaliteta". No, gotovo svi znaju da mnogi vrte nos na takvu "CD kvalitetu". Što nije u redu? Zašto ova kvaliteta nije dovoljna? Vrlo teško pitanje. I sam sam protiv kompresije od 128 kb, jer rezultat ponekad ispadne glup. Ali imam niz zapisa od 128 kb kojima teško mogu naći zamjerku. Je li tok 128 prikladan za kodiranje ovog ili onog materijala - ispada, nažalost, tek nakon višestrukog slušanja rezultata. Ne mogu ništa unaprijed reći - osobno ne znam znakove koji bi mi omogućili da unaprijed odredim uspjeh rezultata. Ali često je stream 128 sasvim dovoljan za visokokvalitetno kodiranje glazbe.

Za kodiranje od 128 kbps, najbolje je koristiti Fraunhofer MP3 Producer 2.1 ili novije proizvode. Osim MP3enc 3.0, on ima dosadnu grešku koja rezultira vrlo lošim kodiranjem visokih frekvencija. Verzije iznad 3.0 nemaju ovaj nedostatak.

Prije svega, nekoliko općih riječi. Percepcija zvučne slike od strane osobe uvelike ovisi o simetričnom prijenosu dvaju kanala (stereo). Različita izobličenja u različitim kanalima puno su gora od istih. Općenito govoreći, osigurati koliko god je to moguće iste karakteristike zvuka u oba kanala, ali u međuvremenu različit materijal (inače kakav je to stereo) veliki je problem u snimanju zvuka, koji se obično podcjenjuje. Ako možemo koristiti 64 kbps za mono kodiranje, onda 64 kbps po kanalu nije dovoljno za stereo kodiranje u načinu rada od samo dva kanala - stereo rezultat će zvučati puno neispravnije nego svaki kanal zasebno. Većina Fraunhoferovih proizvoda općenito ograničava mono na 64 kbps - a ja još nisam vidio mono snimanje (čisto snimanje - bez šuma ili izobličenja) koje bi zahtijevalo veći stream. Iz nekog razloga, naše ovisnosti o monofonijskom zvuku su iz nekog razloga puno slabije nego o stereofonijskom - očito ga jednostavno ne shvaćamo ozbiljno :) - s psihoakustičke točke gledišta, to je samo zvuk koji dolazi iz zvučnika, a ne pokušaj potpunog prenošenja nekakvih slika.

Pokušaj prijenosa stereo signala postavlja mnogo strože zahtjeve - uostalom, jeste li ikada čuli za psihoakustički model koji uzima u obzir maskiranje jednog kanala drugim? Također se zanemaruju neki reverzni, recimo, efekti - na primjer, određeni stereo efekt koji je dizajniran za oba kanala odjednom. Jedan lijevi kanal maskira svoj dio efekta u sebi – nećemo ga čuti. Ali prisutnost desnog kanala - drugog dijela efekta - mijenja našu percepciju lijevog kanala: podsvjesno očekujemo da ćemo više čuti lijevu stranu efekta, a tu promjenu u našoj psihoakustici također moramo uzeti u obzir. S niskom kompresijom - 128 kbps po kanalu (ukupno 256 kbps), ti učinci nestaju, budući da je svaki kanal predstavljen prilično u potpunosti kako bi se pokrila potreba za simetrijom prijenosa s marginom, ali za tokove od oko 64 kbps po kanalu, to je velik problem - prijenos suptilnih nijansi zajedničke percepcije oba kanala zahtijeva točniji prijenos nego što je trenutno moguće u takvim tokovima.

Bilo je moguće, naravno, napraviti potpuni akustični model za dva kanala, ali industrija je krenula drugim putem, koji je općenito ekvivalentan ovome, ali puno jednostavniji. Skup algoritama općeg naziva Joint Stereo djelomično je rješenje gore opisanih problema. Većina algoritama se svodi na isticanje središnjeg kanala i kanala razlike - srednji/bočni stereo. Središnji kanal nosi glavnu audio informaciju i obični je mono kanal formiran od dva izvorna kanala, dok kanal razlike nosi ostatak informacija koje vam omogućuju vraćanje izvornog stereo zvuka. Sama po sebi, ova je operacija potpuno reverzibilna - to je samo drugačiji način predstavljanja dva kanala, s kojim je lakše raditi pri komprimiranju stereo informacija.

Dalje, središnji i diferencijalni kanal obično se komprimiraju odvojeno, koristeći činjenicu da je diferencijalni kanal u stvarnoj glazbi relativno loš - oba kanala imaju mnogo toga zajedničkog. Ravnoteža kompresije u korist središnjeg i diferencijalnog kanala odabire se u hodu, ali općenito se mnogo veći protok dodjeljuje središnjem kanalu. Složeni algoritmi odlučuju što je za nas u ovom trenutku bolje - točnija prostorna slika ili kvaliteta prijenosa informacija zajednička za oba kanala ili jednostavno kompresija bez srednjeg / bočnog stereoa - to jest, u dvokanalnom načinu rada.

Čudno, ali stereo kompresija je najslabija točka kompresijskog rezultata u Layer3 128 kbps. Nemoguće je kritizirati tvorce formata – to je ipak manje moguće zlo. Suptilne stereo informacije gotovo da se ne percipiraju svjesno (ako ne uzmemo u obzir očite stvari - grubi raspored instrumenata u prostoru, umjetne efekte itd.), pa je stereo kvaliteta zadnja stvar koju čovjek procjenjuje. Obično vas nešto uvijek sprječava da dođete do toga: zvučnici računala, na primjer, unose mnogo značajnije nedostatke, a stvari jednostavno ne dopiru do takvih suptilnosti kao što je netočan prijenos prostornih informacija.

Nemojte misliti da ono što vas sprječava da čujete ovaj nedostatak na akustici računala je to što su zvučnici razmaknuti na udaljenosti od 1 metra, sa strane monitora, bez stvaranja dovoljne stereo baze. Nije čak ni u tome poanta, nikada nećete moći izolirati točan prostorni raspored zvukova (nije riječ o zvučnoj slici, koju, naprotiv, zvučnici računala nikada neće izgraditi, već o izravnoj, svjesnoj, percepciji razlike između kanali). Računalni zvučnici (u standardnoj upotrebi) ili slušalice pružaju puno jasnije izravno stereo iskustvo od konvencionalnih glazbenih zvučnika.

Iskreno rečeno, za izravnu, informativnu i kognitivnu percepciju zvuka zapravo nam nisu potrebne točne stereo informacije. Vrlo je teško izravno otkriti razliku u ovom aspektu između originala i Layer3 128 kbps, iako je moguće. Trebate ili puno iskustva ili povećanje učinaka interesa. Najjednostavnije što se može učiniti je virtualno raširiti kanale dalje nego što je fizički moguće. Obično se ovaj efekt uključuje u jeftinoj računalnoj tehnologiji pomoću gumba "3D zvuk". Ili u boom box-ovima, čiji se zvučnici ne odvajaju od tijela uređaja i preslabo su razmaknuti da bi prirodnim putem prenijeli prekrasan stereo. Dolazi do prijelaza prostornih informacija u specifične audio informacije oba kanala - razlika između kanala se povećava.

Primijenio sam jači efekt nego inače kako bih bolje čuo razliku. Pogledajte kako bi trebao zvučati nakon kodiranja pri 256 kbps s dvostrukim kanalom (256_channels_wide.mp3 , 172 kB), a kako zvuči nakon kodiranja pri 128 kbps sa zajedničkim stereom (128_channels_wide.mp3 , 172 kB).

Povlačenje. Obje ove datoteke su mp3 datoteke od 256 kbps kodirane s mp3 Producer 2.1. Nemojte se zabuniti: ja, prvo, testiram mp3, a drugo, objavljujem rezultate testiranja mp3 u mp3 ;). Bilo je ovako: prvo sam kodirao glazbeni komad u 128 i 256. Zatim sam te datoteke dekomprimirao, primijenio obradu (stereo ekspander), komprimirao u 256 - samo da uštedim prostor - i objavio to ovdje.

Usput, tek pri 256 kbps u mp3 Producer 2.1 isključuje se zajednički stereo i uključuje dvostruki kanal - dva neovisna kanala. Čak je i 192 kbps u Produceru 2.1 neka vrsta joint stereoa, jer su moji primjeri vrlo netočno komprimirani u manje od 256 kbps streama. To je glavni razlog što "puna" kvaliteta počinje na 256 kbps - povijesno gledano, svaki niži tok u standardnim komercijalnim proizvodima Fraunhofera (prije 98.) je zajednički stereo, što je u svakom slučaju neprihvatljivo za potpuno ispravan prijenos. Drugi (ili noviji) proizvodi, u načelu, omogućuju vam da proizvoljno odaberete - zajednički stereo ili dvokanalni - za bilo koji tok.

O rezultatima

U originalu (koji u ovom slučaju odgovara točno 256 kbps), čuli smo zvuk s pojačanim razlikovnim kanalom i oslabljenim središnjim kanalom. Vrlo dobro se čula reverberacija glasa, kao i općenito sve vrste umjetnih reverberacija i odjeka - ti prostorni efekti idu uglavnom u diferencijski kanal. Točnije, u ovom slučaju bilo je 33% središnjeg kanala i 300% razlike. Apsolutni učinak - 0% središnjeg kanala - uključuje se na opremi kao što su glazbeni centri s gumbom poput "karaoke vocal fader", "voice cancelation / remove" ili slično, čije je značenje ukloniti glas iz fonogram. Značenje operacije je da se glas obično snima samo na središnjem kanalu - ista prisutnost u lijevom i desnom kanalu. Uklanjanjem središnjeg kanala, uklanjamo glas (i puno više, tako da je ova značajka prilično beskorisna u stvarnom životu). Ako imate takvu stvar - možete sami slušati svoje mp3 s njom - dobit ćete smiješan zajednički stereo detektor.

U ovom primjeru već posredno možemo shvatiti što smo izgubili. Prvo, svi prostorni efekti postali su osjetno gori - jednostavno su izgubljeni. Ali drugo, grgljanje je rezultat prijelaza prostornih informacija u zvuk. Čemu je to odgovaralo u prostoru – da, samo cijelo vrijeme gotovo nasumično pomicanje zvučnih komponenti, nekakav „prostorni šum“ kojeg nije bilo u izvornom fonogramu (podnosi barem potpuni prijelaz prostorne informacije u zvuk bez pojave stranih učinaka). Poznato je da se ova vrsta izobličenja kod kodiranja u niske tokove često pojavljuje izravno, bez ikakve dodatne obrade. Samo što se izravna izobličenja zvuka (kojih gotovo uvijek nema) percipiraju svjesno i odmah, dok se stereofonska (koja su uvijek i u velikim količinama sa zajedničkim stereom) samo podsvjesno iu procesu slušanja neko vrijeme.

Ovo je glavni razlog zašto se zvuk Layer3 od 128 kbps ne smatra punom CD kvalitetom. Činjenica je da pretvaranje stereo zvuka u mono samo po sebi daje jake negativne efekte - često se isti zvuk ponavlja u različitim kanalima s malim kašnjenjem, što kada se miješa jednostavno daje zvuk koji je zamagljen u vremenu. Mono zvuk napravljen od stereo zvuči puno lošije od izvorne mono snimke. Kanal razlike, uz središnji (mješoviti mono) kanal, daje potpuno obrnuto razdvajanje na desni i lijevi, ali djelomično odsustvo kanala razlike (nedovoljno kodiranje) donosi ne samo nedovoljnu prostornu sliku, već i ove neugodne efekte. miješanja stereo zvuka u jedan mono kanal.

Kada se uklone sve druge prepreke - oprema je dobra, tonska boja i dinamika su nepromijenjeni (ima dovoljno protoka za kodiranje središnjeg kanala) - to će i dalje ostati. Ali postoje fonogrami snimljeni na takav način da se ne pojavljuju negativni učinci kompresije temeljene na srednjem / bočnom stereou - i tada 128 kbps daje istu punu kvalitetu kao 256 kbps. Poseban je slučaj fonogram, možda bogat stereoinformacijama, ali siromašan zvučnim informacijama - na primjer, sporo sviranje glasovira. U ovom slučaju, za kodiranje diferencijalnog kanala, dodjeljuje se tok koji je sasvim dovoljan za prijenos točne prostorne informacije. Ima i teže objašnjivih slučajeva - aktivan aranžman pun raznih instrumenata ipak zvuči vrlo dobro na 128 kbps - ali to je rijetkost, možda u jednom od pet do deset slučajeva. Međutim, događa se.

Zapravo na zvuk. Teško je izolirati trenutne nedostatke u zvuku središnjeg kanala u Layer3 128 kbps. Nedostatak prijenosa frekvencija iznad 16 kHz (usput, vrlo su rijetke, ali se još uvijek prenose) i određeno smanjenje amplitude vrlo visokih - strogo govoreći samo po sebi - samo je besmislica. Osoba se u nekoliko minuta potpuno navikne na ne takve tonske distorzije, to se jednostavno ne može smatrati jakim negativnim čimbenicima. Da, to su distorzije, ali za percepciju "pune kvalitete" daleko su od sekundarne važnosti. Na dijelu središnjeg, izravno audio kanala, mogući su problemi druge vrste - oštro ograničenje dostupnog toka za kodiranje ovog kanala, uzrokovano jednostavno spletom okolnosti - vrlo obilne prostorne informacije, trenutak opterećen raznim zvukovima , česti neučinkoviti kratki blokovi i, kao rezultat svega toga, potpuno potrošen rezervni međuspremnik toka. To se događa, ali relativno rijetko, a zatim - ako se takva činjenica i dogodi, onda je to obično vidljivo na velikim fragmentima kontinuirano.

Vrlo je teško prikazati nedostatke ove vrste u eksplicitnom obliku tako da ih bilo tko može primijetiti. Oni se lako uočavaju i bez obrade od strane osobe koja je navikla baratati zvukom, ali za običnog nekritičnog slušatelja to može izgledati kao potpuno nerazlučivanje zvuka od originala i nekakvo apstraktno kopanje po nečemu što zapravo nije tamo.. Ipak, pogledajte primjer. Da bi se izdvojio, bilo je potrebno primijeniti snažnu obradu - jako smanjiti sadržaj srednjih i visokih frekvencija nakon dekodiranja. Uklanjanjem ovih frekvencijskih nijansi koje ometaju sluh mi, naravno, remetimo rad modela kodiranja, ali time ćemo bolje razumjeti što gubimo. Dakle - kako bi trebao zvučati (256_bass.mp3 , 172 kB), i što se događa nakon dekodiranja i obrade streama od 128 kbps (128_bass.mp3 , 172 kB). Obratite pažnju na primjetan gubitak kontinuiteta basa, glatkoće i neke druge anomalije. Prijenos niskih frekvencija u ovom je slučaju žrtvovan u korist viših frekvencija i prostornih informacija.

Treba napomenuti da se rad modela akustične kompresije može promatrati (uz pažljivo proučavanje i uz određeno iskustvo sa zvukom) pri 256 kbps, ako se primijeni više ili manje jak ekvilizator. Ako to učinite i zatim slušate, ponekad (prilično često) možete primijetiti neugodne učinke (zvonjenje / grgljanje). Što je još važnije, zvuk nakon takvog postupka imat će neugodan, neujednačen karakter, što je vrlo teško primijetiti odmah, ali će biti vidljivo kod duljeg slušanja. Jedina razlika između 128 i 256 je ta što u streamu od 128 kbps ovi efekti često postoje bez ikakve obrade. Također ih je teško odmah primijetiti, ali oni su tu - primjer basa daje neku ideju o tome gdje ih potražiti. To je jednostavno nemoguće čuti u visokim streamovima (iznad 256 kbps) bez obrade. Ovaj se problem ne odnosi na visoke streamove, ali postoji nešto što ponekad (vrlo rijetko) ne dopušta čak ni Layer3 da se broji - 256 kbps originala - to su vremenski parametri (više detalja bit će kasnije u zasebnom članku: vidi MPEG Layer3 - 256 / poveznica na drugi članak/).

Postoje fonogrami na koje ovaj problem ne utječe. Najlakši način je navesti čimbenike koji, naprotiv, dovode do pojave gore navedenih distorzija. Ako se ništa od toga ne napravi, velike su šanse za potpuno uspješno, u ovom aspektu, kodiranje u Layer3 - 128 kbps. Sve ipak ovisi o konkretnom materijalu...

Prije svega - buka, recimo, hardver. Ako je fonogram primjetno bučan, vrlo je nepoželjno kodirati ga u male tokove, budući da se previše toka koristi za kodiranje nepotrebnih informacija, što, osim toga, nije baš podložno razumnom kodiranju pomoću akustičnog modela.

Samo buka - sve vrste stranih zvukova. Monotona buka grada, ulice, restorana i sl., uz koju se odvija glavna radnja. Ove vrste zvukova pružaju vrlo obilan protok informacija koje treba kodirati, a algoritam će morati nešto žrtvovati u glavnom materijalu.
Neprirodni jaki stereo efekti. Ovo je prilično povezano s prethodnom točkom, ali u svakom slučaju, previše toka ide u kanal razlike, a kodiranje središnjeg kanala je uvelike degradirano.
Jaka fazna distorzija, različita za različite kanale. U principu, to se više odnosi na nedostatke trenutno uobičajenih algoritama kodiranja nego na standard, ali ipak. Najluđe distorzije počinju zbog potpunog poremećaja cijelog procesa. U većini slučajeva, snimanje na kasetofonsku opremu i naknadna digitalizacija dovode do takvih izobličenja izvornog fonograma, posebno kada se reproducira na jeftinim magnetofonima s obrnutim dijelom loše kvalitete. Glave su zakrivljene, traka je namotana koso, a kanali su malo odmaknuti jedan u odnosu na drugi.
Jednostavno je preopterećeno. Sasvim grubo rečeno - veliki simfonijski orkestar svira odjednom :). Obično se kao rezultat kompresije pri 128 kbps dobije nešto vrlo shematično - komora, limena glazba, bubnjevi, solist. Javlja se, naravno, ne samo u klasicima.

Drugi pol je nešto što se obično dobro stisne:

Solo instrument relativno jednostavnog zvuka - gitara, klavir. Violina, na primjer, ima prepun spektar i obično ne zvuči baš dobro. Sam rad zapravo ovisi o violini violinista. Nekoliko instrumenata također je obično prilično dobro komprimirano - bardovi ili CSP, na primjer (instrument + glas).
Kvalitetna moderna glazbena produkcija. Ne mislim na glazbenu kvalitetu, već na kvalitetu zvuka - miksanje, raspored instrumenata, kategorički odsutnost složenih globalnih efekata, ukrašavanje zvukova i, općenito, sve suvišno. U ovu kategoriju, primjerice, lako upada sva moderna pop glazba, pa i poneki rock, i općenito dosta svega.
Agresivna, "električna" glazba. Pa, da nekako dam primjer - rana Metallica (i moderna, općenito). [zapamtite, ovdje se ne radi o glazbenim stilovima! samo primjer.]

Vrijedno je napomenuti da Layer3 kompresija gotovo nije impresionirana parametrima kao što su prisutnost / odsutnost visokih frekvencija, bas, mutna / zvona boja itd. Ovisnost postoji, ali je toliko slaba da se može zanemariti.

Nažalost (ili na sreću?), stvar ostaje na samoj osobi. Mnogi ljudi bez pripreme i prethodne selekcije čuju razliku između tokova od oko 128 kbps i originala, mnogi čak i sintetički ekstremni primjeri ne percipiraju na uho kao razlike. Prve ne treba ni u što uvjeravati, dok se druge takvim primjerima ne može uvjeriti... Moglo bi se jednostavno reći da za jedne postoji razlika, za druge ne, ako ne samo jedno: u procesu slušajući glazbu, s vremenom se naša percepcija vremena poboljšava. Ono što se jučer činilo kao dobra kvaliteta sutra se ne mora činiti tako - uvijek se dogodi. I ako je prilično besmisleno (barem po mom mišljenju) komprimirati na 320 kbps u odnosu na 256 kbps - dobitak više nije previše bitan, iako je razumljiv, onda se pohranjivanje glazbe barem na 256 kbps još uvijek isplati.

Što je bolje 128 ili 320 kbps. Najčešće zablude o digitalnom zvuku. Ono što se obično koristi kompresija