Codarea și procesarea informațiilor audio. Cum este codificat sunetul? Codificare și procesare audio digitală Tipuri de formate audio digitale

27.09.2021 Știri

Principalii parametri care afectează calitatea înregistrării audio digitale sunt:

§ Capacitatea de biți a ADC și DAC.

§ Rate de eșantionare ADC și DAC.

§ Jitter ADC și DAC

§ Supraeșantionarea

Parametrii căii analogice sunt de asemenea importanți. dispozitive digitaleînregistrarea și reproducerea sunetului:

§ Raportul semnal-zgomot

§ Factor de distorsiune armonică

§ Distorsiunea intermodulatiei

§ Caracteristici neuniforme amplitudine-frecvență

§ Interpenetrarea canalelor

§ Interval dinamic

Tehnologia de înregistrare audio digitală

Record audio digital desfășurate în prezent în studiouri de înregistrare, controlate de computere personale și alte echipamente scumpe și de înaltă calitate. Conceptul de „studio acasă” este, de asemenea, destul de dezvoltat, în care echipamente de înregistrare profesionale și semi-profesionale sunt folosite pentru a crea inregistrari de calitate acasă.

aplica plăci de sunet ca parte a computerelor care efectuează procesare în ADC-urile și DAC-urile lor - cel mai adesea pe 24 de biți și 96 kHz, creșterea în continuare a ratei de biți și a frecvenței de eșantionare practic nu crește calitatea înregistrării.

Există o întreagă clasă de programe de calculator - editori de sunet care vă permit să lucrați cu sunet:

§ înregistrați fluxul audio primit

§ crea (generează) sunet

§ Schimbare intrare existentă(adăugați mostre, schimbați timbrul, viteza sunetului, tăiați părți etc.)

§ rescrie dintr-un format în altul

§ converti convertește diferite codecuri audio

niste programe simple, permite doar conversia formatelor și codecurilor.

Tipuri de formate audio digitale

Există diferite concepte de format de sunet.

Formatul de reprezentare a datelor audio în formă digitală depinde de metoda de cuantizare utilizată de convertorul digital-analogic (DAC). În ingineria audio, două tipuri de cuantizare sunt în prezent cele mai comune:

§ modularea codului de impuls

§ modulatie sigma-delta

Adesea, adâncimea de biți de cuantizare și frecvența de eșantionare sunt indicate pentru diferite dispozitive de înregistrare și redare audio ca format de prezentare audio digitală (24 biți/192 kHz; 16 biți/48 kHz).

Formatul fișierului determină structura și caracteristicile de prezentare ale datelor audio atunci când sunt stocate pe un dispozitiv de stocare PC. Pentru a elimina redundanța datelor audio, codecurile audio sunt folosite pentru a comprima datele audio. Există trei grupuri de formate de fișiere de sunet:

§ Formate audio necomprimate, cum ar fi WAV, AIFF

§ formate audio cu compresie fără pierderi (APE, FLAC)

§ formate audio care utilizează compresie cu pierderi (mp3, ogg)

Formatele modulare de fișiere muzicale ies în evidență. Create sintetic sau din mostre de instrumente live preînregistrate, ele servesc în principal pentru a crea muzică electronică modernă (MOD). Acesta include și formatul MIDI, care nu este o înregistrare a sunetului, dar cu ajutorul unui secvențior vă permite să înregistrați și să redați muzică folosind un set specific de comenzi sub formă de text.

Formatele media audio digitale sunt utilizate atât pentru distribuția în masă a înregistrărilor audio (CD, SACD), cât și în înregistrarea profesională a sunetului (DAT, minidisc).

Pentru sistemele de sunet surround, este, de asemenea, posibil să se distingă formatele audio, care sunt în principal acompaniamente audio multicanal pentru filme. Astfel de sisteme au familii întregi de formate de la două mari companii concurente, Digital Theatre Systems Inc. - DTS și Dolby Laboratories Inc. - Dolby ® Digital.

Formatul este, de asemenea, numărul de canale din sistemele de sunet multicanal (5.1; 7.1). Inițial, un astfel de sistem a fost dezvoltat pentru cinematografe, dar ulterior a fost extins Software codec

Codec audio la nivel de program

§ G.723.1 - unul dintre codecurile de bază pentru aplicațiile de telefonie IP

§ G.729 este un codec proprietar de bandă îngustă care este utilizat pentru reprezentarea digitală a vorbirii

§ Internet Low Bitrate Codec (iLBC) - un codec gratuit popular pentru telefonia IP (în special, pentru Skype și Google Talk)

Codec audio(Engleză) Codec audio; codificator/decodor audio) - program de calculator sau hardware, conceput pentru a codifica sau decoda date audio.

Codec software

Codec audio la nivel de program este specializat program de calculator, un codec care comprimă (comprimă) sau decomprimă (decomprimă) datele audio digitale în conformitate cu un format audio de fișier sau un format audio în flux. Sarcina unui codec audio ca compresor este de a furniza un semnal audio cu o calitate/precizie specificată și cea mai mică dimensiune posibilă. Compresia reduce cantitatea de spațiu necesară pentru stocarea datelor audio și poate reduce, de asemenea, lățimea de bandă a canalului prin care sunt transmise datele audio. Majoritatea codecurilor audio sunt implementate ca biblioteci de software care interacționează cu unul sau mai multe playere audio, cum ar fi QuickTime Player, XMMS, Winamp, VLC media player, MPlayer sau Windows Media Player.

Codecuri audio software populare în funcție de aplicație:

§ MPEG-1 Layer III (MP3) - un codec proprietar pentru înregistrări audio (muzică, cărți audio etc.) pentru echipamente informaticeși playere digitale

§ Ogg Vorbis (OGG) - al doilea cel mai popular format, utilizat pe scară largă în jocuri pe calculatorși în rețelele de partajare a fișierelor pentru transmiterea muzicii

§ GSM-FR - primul standard digital codificarea vorbirii folosită în telefoane GSM

§ Adaptive multi rate (AMR) - înregistrarea vocii umane telefoane mobile si altii dispozitive mobile

Urechea umană percepe sunetul la frecvențe care variază de la 20 de vibrații pe secundă (zgomot scăzut) la 20.000 de vibrații pe secundă (zgomot înalt).

O persoană poate percepe sunetul într-o gamă uriașă de intensități, în care intensitatea maximă este de 10 14 ori mai mare decât cea minimă (de o sută de mii de miliarde de ori). O unitate specială este utilizată pentru a măsura volumul sunetului "decibel"(dbl) (Tabelul 5.1). O scădere sau creștere a volumului sunetului cu 10 dbl corespunde unei scăderi sau creșteri a intensității sunetului de 10 ori.

Eșantionarea sunetului în timp. Pentru ca computerul să proceseze sunetul, continuu semnal sonor trebuie convertit în formă digitală discretă folosind eșantionarea în timp. O undă sonoră continuă este împărțită în secțiuni mici temporare separate și pentru fiecare astfel de secțiune este setată o anumită valoare a intensității sunetului.

Astfel, dependența continuă a volumului sunetului de timpul A(t) este înlocuită cu o succesiune discretă de niveluri de zgomot. Pe grafic, aceasta arată ca înlocuirea unei curbe netede cu o secvență de „pași” (Fig. 1.2).


Orez. 1.2. Eșantionarea în timp a sunetului

Frecvența de eșantionare. Un microfon conectat la placa de sunet este folosit pentru a înregistra sunetul analogic și pentru a-l converti în formă digitală. Calitatea sunetului digital rezultat depinde de numărul de măsurători ale nivelului volumului sunetului pe unitatea de timp, adică. ratele de eșantionare. Cum cantitate mare măsurătorile se fac în 1 secundă (cu cât frecvența de eșantionare este mai mare), cu atât „scara” semnalului audio digital urmează cu mai multă acuratețe curba semnalului de dialog.

Rata de eșantionare audio este numărul de măsurători ale volumului sunetului într-o secundă.

Ratele de eșantionare audio pot varia de la 8.000 la 48.000 de măsurători ale volumului sunetului pe secundă.

Adâncimea codării audio. Fiecărui „pas” i se atribuie un anumit nivel de volum al sunetului. Nivelurile de sunet pot fi considerate ca un set de stări posibile N, a căror codificare necesită o anumită cantitate de informație I, care se numește adâncimea de codificare a sunetului.

Adâncimea codării audio- aceasta este cantitatea de informații care este necesară pentru codificare niveluri discrete volum audio digital.

Dacă se cunoaște adâncimea de codificare, atunci numărul de niveluri de volum al sunetului digital poate fi calculat folosind formula N = 2 I. Lăsați adâncimea de codificare audio de 16 biți, apoi numărul de niveluri de volum audio este egal cu:

N = 2 I = 2 16 = 65.536.

În timpul procesului de codificare, fiecărui nivel de volum al sunetului i se atribuie propriul cod binar de 16 biți, cel mai scăzut nivel al sunetului va corespunde codului 0000000000000000, iar cel mai mare - 1111111111111111.

Calitatea sunetului digitalizat. Cu cât frecvența și adâncimea de eșantionare a sunetului sunt mai mari, cu atât calitatea sunetului digitalizat este mai mare. Audio digitizat de cea mai scăzută calitate, corespunzător calității comunicare telefonică, obținut la o rată de eșantionare de 8000 de ori pe secundă, o adâncime de eșantionare de 8 biți și înregistrarea unei piese audio (mod mono). Audio digitizat de cea mai înaltă calitate, corespunzătoare calității CD-ului audio, se realizează cu o rată de eșantionare de 48.000 de ori pe secundă, o adâncime de eșantionare de 16 biți și înregistrarea a două piese audio (mod stereo).

Trebuie amintit că cu cât calitatea sunetului digital este mai mare, cu atât volumul de informații al fișierului de sunet este mai mare. Puteți estima volumul de informații al unui fișier audio digital stereo cu o durată a sunetului de 1 secundă cu o calitate medie a sunetului (16 biți, 24.000 de măsurători pe secundă). Pentru a face acest lucru, adâncimea de codificare trebuie înmulțită cu numărul de măsurători într-o secundă și înmulțită cu 2 (sunet stereo):

16 biți × 24.000 × 2 = 768.000 biți = 96.000 de biți = 93,75 KB.

Editori de sunet. Editorii de sunet vă permit nu numai să înregistrați și să redați sunetul, ci și să îl editați. Sunetul digitizat este prezentat în editori de sunetîntr-o formă vizuală, astfel încât copierea, mutarea și ștergerea părților pistei audio pot fi efectuate cu ușurință folosind mouse-ul. În plus, puteți suprapune piesele audio una peste alta (amestecați sunete) și puteți aplica diverse efecte acustice (eco, redare inversă etc.).

Editorii de sunet vă permit să modificați calitatea sunetului digital și dimensiunea fișierului audio prin modificarea ratei de eșantionare și a adâncimii de codificare. Audio digitizat poate fi salvat necomprimat în fișiere audio în format universal WAV sau în format comprimat MP3.

La salvarea sunetului în formate comprimate, frecvențele de sunet de intensitate scăzută care sunt „excesive” pentru percepția umană și coincid în timp cu frecvențele de sunet de intensitate mare sunt eliminate. Utilizarea acestui format vă permite să comprimați fișierele de sunet de zeci de ori, dar duce la pierderea ireversibilă a informațiilor (fișierele nu pot fi restaurate la forma lor originală).

Întrebări de control

1. Cum afectează rata de eșantionare și adâncimea de codificare calitatea sunetului digital?

Sarcini pentru realizarea independentă

1.22. Sarcină de răspuns selectiv. Placa de sunet produce codificare binară a semnalului audio analogic. Câte informații sunt necesare pentru a codifica fiecare dintre cele 65.536 de niveluri posibile de intensitate a semnalului?
1) 16 biți; 2) 256 de biți; 3) 1 bit; 4) 8 biți.

1.23. O sarcină cu un răspuns detaliat. Estimați volumul de informații al fișierelor audio digitale care durează 10 secunde la o adâncime de codare și o frecvență de eșantionare a semnalului audio care oferă o calitate minimă și maximă a sunetului:
a) mono, 8 biți, 8000 măsurători pe secundă;
b) stereo, 16 biți, 48.000 de măsurători pe secundă.

1.24. O sarcină cu un răspuns detaliat. Determinați durata fișierului de sunet care se va potrivi pe o dischetă de 3,5" (rețineți că 2847 de sectoare a câte 512 octeți sunt alocate pentru stocarea datelor pe o astfel de dischetă):
a) cu calitate scăzută a sunetului: mono, 8 biți, 8000 de măsurători pe secundă;
b) cu o calitate ridicată a sunetului: stereo, 16 biți, 48.000 de măsurători pe secundă.

Dependența volumului, precum și a înălțimii sunetului, de intensitatea și frecvența undei sonore

Hertz(indicată prin Hz sau Hz) - o unitate de măsură a frecvenței proceselor periodice (de exemplu, oscilații).
1 Hz înseamnă o execuție a unui astfel de proces într-o secundă: 1 Hz = 1/s.

Dacă avem 10 Hz, atunci aceasta înseamnă că avem zece execuții ale unui astfel de proces într-o secundă.

Urechea umană poate percepe sunetul la frecvențe care variază de la 20 de vibrații pe secundă (20 Herți, sunet scăzut) la 20.000 de vibrații pe secundă (20 KHz, sunet înalt).

În plus, o persoană poate percepe sunetul într-o gamă largă de intensități, în care intensitatea maximă este de 1014 ori mai mare decât cea minimă (de o sută de mii de miliarde de ori).

Pentru a măsura volumul sunetului, a fost inventată și folosită o unitate specială " decibel" (dB)

O scădere sau creștere a volumului sunetului cu 10 dB corespunde unei scăderi sau creșteri a intensității sunetului de 10 ori.

Volumul sunetului în decibeli

Pentru a sisteme informatice ar putea procesa sunetul, semnalul audio continuu trebuie convertit într-o formă digitală, discretă, folosind eșantionarea în timp.

Pentru a face acest lucru, o undă sonoră continuă este împărțită în secțiuni temporare mici separate și pentru fiecare astfel de secțiune este setată o anumită valoare a intensității sunetului.

Astfel, dependența continuă a volumului sunetului de timpul A(t) este înlocuită cu o succesiune discretă de niveluri de zgomot. Pe grafic, aceasta arată ca înlocuirea unei curbe netede cu o secvență de „pași”.


Eșantionarea în timp a sunetului

Un microfon conectat la placa de sunet este folosit pentru a înregistra sunetul analogic și pentru a-l converti în formă digitală.

Cu cât dungile discrete sunt mai dense pe grafic, cu atât o calitate mai bună vei putea în cele din urmă să recreați sunetul original.

Calitatea sunetului digital rezultat depinde de numărul de măsurători ale nivelului volumului sunetului pe unitatea de timp, adică de frecvența de eșantionare.

Rata de eșantionare audio este numărul de măsurători ale volumului sunetului într-o secundă.

Cu cât se efectuează mai multe măsurători într-o secundă (cu cât frecvența de eșantionare este mai mare), cu atât „scara” semnalului audio digital urmează cu mai multă acuratețe curba semnalului analogic.

Fiecărui „pas” din grafic i se atribuie o valoare specifică a nivelului de volum al sunetului. Nivelurile de volum al sunetului pot fi gândite ca un set de stări posibile N(gradații), pentru codificarea căreia este necesară o anumită cantitate de informații eu, care se numește adâncimea codării audio.

Adâncimea codării audio este cantitatea de informații necesară pentru a codifica niveluri discrete de volum ale sunetului digital.

Dacă se cunoaște adâncimea de codificare, atunci numărul de niveluri de volum al sunetului digital poate fi calculat folosind formula generală N=2I.

De exemplu, să fie adâncimea de codificare audio de 16 biți, caz în care numărul de niveluri de volum audio este egal cu:

N = 2 I = 2 16 = 65.536.

În timpul procesului de codificare, fiecărui nivel de volum al sunetului i se atribuie propriul cod binar de 16 biți, cel mai scăzut nivel al sunetului va corespunde codului 0000000000000000, iar cel mai mare - 1111111111111111.

Calitatea sunetului digitalizat

Deci, cu cât frecvența de eșantionare și adâncimea codificării audio sunt mai mari, cu atât sunetul digitizat va suna de calitate mai mare și cu atât mai bine puteți aduce sunetul digitizat mai aproape de sunetul original.

Audio digitizat de cea mai înaltă calitate, corespunzătoare calității CD-ului audio, se realizează cu o rată de eșantionare de 48.000 de ori pe secundă, o adâncime de eșantionare de 16 biți și înregistrarea a două piese audio (mod stereo).

Trebuie amintit că cu cât este mai mare calitatea sunetului digital, cu atât este mai mare volumul de informații al fișierului de sunet.

Puteți estima cu ușurință volumul de informații al unui fișier audio digital stereo cu o durată a sunetului de 1 secundă cu o calitate medie a sunetului (16 biți, 24.000 de măsurători pe secundă). Pentru a face acest lucru, adâncimea de codificare trebuie înmulțită cu numărul de măsurători pe secundă și înmulțită cu 2 canale (sunet stereo):

16 biți × 24.000 × 2 = 768.000 biți = 96.000 de biți = 93,75 KB.

Editori de sunet

Editorii de sunet vă permit nu numai să înregistrați și să redați sunetul, ci și să îl editați. Cel mai proeminent poate fi numit în siguranță, cum ar fi Sony Sound Forge, Adobe Audition, GoldWave si altii.

Sunetul digitizat este prezentat în editorii de sunet într-o formă vizuală clară, astfel încât copierea, mutarea și ștergerea unor părți ale pistei audio se pot face cu ușurință folosind un mouse de computer.

În plus, puteți suprapune și suprapune piste audio una peste alta (amesteca sunete) și aplica diverse efecte acustice (eco, redare inversă etc.).

La salvarea sunetului în formate comprimate, frecvențele de sunet de intensitate scăzută care sunt inaudibile și imperceptibile („excesive”) pentru percepția umană, care coincid în timp cu frecvențele de sunet de intensitate mare, sunt eliminate. Utilizarea acestui format vă permite să comprimați fișierele de sunet de zeci de ori, dar duce la pierderea ireversibilă a informațiilor (fișierele nu pot fi restaurate la forma lor originală, originală).

Obiective:

educational:

  • Familiarizați-vă cu tehnologia de codificare a fișierelor binare format wav
  • Învață să rezolvi problemele pentru a determina dimensiunea unui fișier audio WAV

Eșantionarea timpului - un proces în care, în timpul codificării unui semnal audio continuu, unda sonoră este împărțită în secțiuni de timp mici separate și pentru fiecare astfel de secțiune este setată o anumită valoare a amplitudinii. Cu cât amplitudinea semnalului este mai mare, cu atât sunetul este mai puternic.

Adâncime audio (adâncime de codificare) -numărul de biți per codificare audio.

Niveluri de volum (niveluri de semnal)- sunetul poate avea diferite niveluri de volum. Numărul de niveluri de volum diferite este calculat folosind formula N= 2 eu Undeeu- adâncimea sunetului.

Frecvența de eșantionare - numărul de măsurători ale nivelului semnalului de intrare pe unitatea de timp (pe 1 secundă). Cu cât este mai mare rata de eșantionare, cu atât este mai precisă procedura de codificare binară. Frecvența este măsurată în Herți (Hz). 1 măsurătoare la 1 secundă -1 Hz.

1000 de măsurători în 1 secundă 1 kHz. Să notăm rata de eșantionare prin literăD. Pentru codificare, alegeți una dintre cele trei frecvențe:44,1 KHz, 22,05 KHz, 11,025 KHz.

Se crede că gama de frecvențe pe care o aude o persoană provine 20 Hz până la 20 kHz.

Calitatea codificării binare -o valoare care este determinată de adâncimea de codificare și frecvența de eșantionare.

Adaptor audio (placa de sunet) - un dispozitiv care convertește vibrațiile electrice ale frecvenței sunetului într-un cod binar numeric la introducerea sunetului și invers (de la un cod numeric în vibrații electrice) la redarea sunetului.

Specificații adaptor audio:frecvența de eșantionare și adâncimea de biți a registrului.).

Dimensiunea registrului - numărul de biți din registrul adaptorului audio. Cu cât adâncimea de biți este mai mare, cu atât eroarea fiecărei valori individuale este mai mică curent electric la un număr și înapoi. Dacă adâncimea de biți este eu, atunci la măsurare se poate obține semnalul de intrare 2eu = N sensuri diferite.

Dimensiunea fișierului audio digital mono (A) se măsoară cu formula:

A= D* T* eu/8 , UndeD - frecvența de eșantionare (Hz),T- timpul redării sau înregistrării sunetului,eulățimea registrului (rezoluție). Conform acestei formule, dimensiunea este măsurată în octeți.

Dimensiunea fișierului audio digital stereo (A) se măsoară cu formula:

A=2* D* T* eu/8 , semnalul este înregistrat pentru două difuzoare, deoarece canalele de sunet stânga și dreapta sunt codificate separat.

Este util pentru elevi să ofere Tabelul 1, arătând câți MB va ocupa un minut codificat informații audio la diferite rate de eșantionare:

Algoritmul 1 (Calculează volumul de informații al unui fișier de sunet):

1) aflați câte valori totale sunt citite în memorie în timpul redării fișierului;

2) aflați capacitatea codului (câți biți în memorie ocupă fiecare valoare măsurată);

3) înmulțiți rezultatele;

4) convertiți rezultatul în octeți;

5) convertiți rezultatul în K octeți;

6) convertiți rezultatul în M octeți;

Algoritmul 2 (Calculați timpul de redare al fișierului.)

1) Convertiți volumul de informații al fișierului în K octeți.

2) Convertiți volumul de informații al fișierului în octeți.

3) Convertiți volumul de informații al fișierului în biți.

4) Aflați câte valori au fost măsurate (volumul de informații în biți împărțit la lungimea de biți a codului).

5) Calculați numărul de secunde de sunet. (Împărțiți rezultatul anterior la frecvența de eșantionare.)

1. Dimensiunea fișierului digital

Nivelul „3”

1. Determinați dimensiunea (în octeți) audio digital fișier, al cărui timp de redare este de 10 secunde la o frecvență de eșantionare de 22,05 kHz și o rezoluție de 8 biți. Fișierul nu este comprimat.

Soluţie:

Formula pentru calculul mărimii (în octeți) fișier audio digital: A= D* T* eu/8.

Pentru a converti în octeți, valoarea rezultată trebuie împărțită la 8 biți.

22,05 kHz = 22,05 * 1000 Hz = 22050 Hz

A= D* T* eu/8 = 22050 x 10 x 8 / 8 = 220500 octeți.

Răspuns: Dimensiunea fișierului este de 220500 octeți.

2. Determinați cantitatea de memorie pentru stocarea unui fișier audio digital, al cărui timp de redare este de două minute la o frecvență de eșantionare de 44,1 kHz și o rezoluție de 16 biți.

Soluţie:

A= D* T* eu/8. - cantitatea de memorie pentru stocarea unui fișier audio digital.

44100 (Hz) x 120 (s) x 16 (biți) / 8 (biți) = 10584000 octeți = 10335,9375 KB = 10,094 MB.

Răspuns: ≈ 10 MB

Nivelul „4”

3. Utilizatorul are o capacitate de memorie de 2,6 MB. Este necesar să înregistrați un fișier audio digital cu o durată a sunetului de 1 minut. Care ar trebui să fie frecvența de eșantionare și adâncimea de biți?

Soluţie:

Formula de calcul a frecvenței de eșantionare și a adâncimii de biți: D* I =A/T

(capacitatea memoriei în octeți) : (timpul sunetului în secunde):

2,6 MB = 2726297,6 octeți

D* I =A/T= 2726297,6 octeți: 60 = 45438,3 octeți

D=45438,3 octeți: I

Lățimea adaptorului poate fi de 8 sau 16 biți. (1 octet sau 2 octeți). Prin urmare, frecvența de eșantionare poate fi fie 45438,3 Hz = 45,4 kHz ≈ 44,1 kHz-frecvența de eșantionare caracteristică standard, sau 22719,15 Hz = 22,7 kHz ≈ 22,05 kHz- rata de eșantionare caracteristică standard

Răspuns:

Frecvența de eșantionare

Capacitate adaptor audio

1 opțiune

22,05 kHz

16 biți

Opțiunea 2

44,1 kHz

8 biți

4. Volumul memorie libera pe disc - 5,25 MB, adâncimea de biți a plăcii de sunet - 16. Care este durata sunetului unui fișier audio digital înregistrat cu o frecvență de eșantionare de 22,05 kHz?

Soluţie:

Formula de calcul a duratei sunetului: T=A/D/I

(capacitatea memoriei în octeți) : (frecvența de eșantionare în Hz) : (capacitatea plăcii de sunet în octeți):

5,25 MB = 5505024 octeți

5505024 octeți: 22050 Hz: 2 octeți = 124,8 secunde
Răspuns: 124,8 secunde

5. Un minut de înregistrare a unui fișier audio digital ocupă 1,3 MB de spațiu pe disc, capacitatea de biți a plăcii de sunet este de 8. La ce frecvență de eșantionare este înregistrat sunetul?

Soluţie:

Formula de calcul al ratei de eșantionare: D = A/T/I

(capacitatea memoriei în octeți) : (timp de înregistrare în secunde) : (capacitatea plăcii de sunet în octeți)

1,3 MB = 1363148,8 octeți

1363148,8 octeți: 60:1 = 22719,1 Hz

Răspuns: 22,05 kHz

6. Două minute de înregistrare a unui fișier audio digital ocupă 5,1 MB de spațiu pe disc. Frecvența de eșantionare - 22050 Hz. Care este adâncimea de biți a adaptorului audio?

Soluţie:

Formula pentru calcularea adâncimii de biți: (capacitatea memoriei în octeți): (timpul de sunet în secunde): (frecvența de eșantionare):

5,1 MB= 5347737,6 octeți

5347737,6 octeți: 120 sec: 22050 Hz= 2,02 octeți = 16 biți

Răspuns: 16 biți

7. Cantitatea de memorie liberă de pe disc este de 0,01 GB, adâncimea de biți a plăcii de sunet este de 16. Care este durata sunetului unui fișier audio digital înregistrat cu o frecvență de eșantionare de 44100 Hz?

Soluţie:

Formula de calcul a duratei sunetului T=A/D/I

(capacitatea memoriei în octeți) : (frecvența de eșantionare în Hz) : (capacitatea plăcii de sunet în octeți)

0,01 GB = 10737418,24 octeți

10737418,24 octeți: 44100: 2 = 121,74 sec = 2,03 min
Răspuns: 20,3 minute

8. Estimați volumul de informații al unui fișier audio mono cu o durată a sunetului de 1 minut. dacă „adâncimea” de codificare și frecvența de eșantionare a semnalului audio sunt egale, respectiv:
a) 16 biți și 8 kHz;
b) 16 biți și 24 kHz.

Soluţie:

A).

16 biți x 8.000 = 128.000 de biți = 16.000 de biți = 15,625 KB/s

15,625 KB/s x 60 s = 937,5 KB

b).
1) Volumul de informații al unui fișier de sunet care durează 1 secundă este egal cu:
16 biți x 24.000 = 384.000 de biți = 48.000 de biți = 46,875 KB/s
2) Volumul de informații al unui fișier de sunet care durează 1 minut este egal cu:
46,875 KB/s x 60 s = 2812,5 KB = 2,8 MB

Răspuns: a) 937,5 KB; b) 2,8 MB

Nivelul „5”

Se folosește tabelul 1

9. Câtă memorie este necesară pentru a stoca un fișier audio digital cu înregistrare audio de înaltă calitate, cu condiția ca timpul de redare să fie de 3 minute?

Soluţie:

Calitate superioară sunetul este realizat la o frecvență de eșantionare de 44,1 kHz și o adâncime de biți a adaptorului audio de 16.
Formula pentru calcularea capacității de memorie: (timpul de înregistrare în secunde) x (capacitatea plăcii de sunet în octeți) x (frecvența de eșantionare):
180 s x 2 x 44100 Hz = 15876000 octeți = 15,1 MB
Răspuns: 15,1 MB

10. Fișierul audio digital conține înregistrare audio de calitate scăzută (sunetul este întunecat și înfundat). Care este durata unui fișier dacă dimensiunea acestuia este de 650 KB?

Soluţie:

Următorii parametri sunt tipici pentru sunetul sumbru și înfundat: frecvența de eșantionare - 11,025 KHz, adâncimea de biți a adaptorului audio - 8 biți (vezi Tabelul 1). Atunci T=A/D/I. Să convertim volumul în octeți: 650 KB = 665600 octeți

Т=665600 octeți/11025 Hz/1 octet ≈60,4 s

Răspuns: durata sunetului este de 60,5 s

Soluţie:

Volumul de informații al unui fișier de sunet care durează 1 secundă este egal cu:
16 biți x 48.000 x 2 = 1.536.000 biți = 187,5 KB (înmulțit cu 2, deoarece stereo).

Volumul de informații al unui fișier de sunet care durează 1 minut este egal cu:
187,5 KB/s x 60 s ≈ 11 MB

Răspuns: 11 MB

Răspuns: a) 940 KB; b) 2,8 MB.

12. Calculați timpul de redare al unui fișier audio mono dacă, cu codificare pe 16 biți și o frecvență de eșantionare de 32 kHz, volumul acestuia este egal cu:
a) 700 KB;
b) 6300 KB

Soluţie:

A).
1) Volumul de informații al unui fișier de sunet care durează 1 secundă este egal cu:


700 KB: 62,5 KB/s = 11,2 s

b).
1) Volumul de informații al unui fișier de sunet care durează 1 secundă este egal cu:
16 biți x 32.000 = 512.000 de biți = 64.000 de biți = 62,5 KB/s
2) Timpul de redare al unui fișier audio mono de 700 KB este:
6300 KB: 62,5 KB/s = 100,8 s = 1,68 min

Răspuns: a) 10 secunde; b) 1,5 min.

13. Calculați câți octeți de informații ocupă o secundă de înregistrare stereo pe un CD (frecvență 44032 Hz, 16 biți pe valoare). Cât durează un minut? Care este capacitatea maximă a discului (presupunând o durată maximă de 80 de minute)?

Soluţie:

Formula pentru calcularea dimensiunii memoriei A= D* T* eu:
(timp de înregistrare în secunde) * (capacitatea plăcii de sunet în octeți) * (frecvența de eșantionare). 16 biți -2 octeți.
1) 1s x 2 x 44032 Hz = 88064 octeți (înregistrare CD stereo de 1 secundă)
2) 60s x 2 x 44032 Hz = 5283840 octeți (1 minut de înregistrare stereo CD)
3) 4800s x 2 x 44032 Hz = 422707200 octeți = 412800 KB = 403,125 MB (80 de minute)

Răspuns: 88064 octeți (1 secundă), 5283840 octeți (1 minut), 403,125 MB (80 minute)

2. Determinarea calității sunetului.

Pentru a determina calitatea sunetului, trebuie să găsiți frecvența de eșantionare și să utilizați tabelul nr. 1

256 (2 8) niveluri de intensitate a semnalului - calitatea sunetului transmisiei radio, folosind 65536 (2 16) niveluri de intensitate a semnalului - calitatea sunetului CD audio. Frecvența de cea mai înaltă calitate corespunde muzicii înregistrate pe un CD. Mărimea semnalului analogic este măsurată în acest caz de 44.100 de ori pe secundă.

Nivelul „5”

13. Determinați calitatea sunetului (calitate transmisie radio, calitate medie, calitate CD audio) dacă se știe că volumul unui fișier audio mono cu o durată a sunetului de 10 secunde. egal cu:
a) 940 KB;
b) 157 KB.

(, p. 76, nr. 2.83)

Soluţie:

A).
1) 940 KB = 962560 de biți = 7700480 de biți
2) 7700480 biți: 10 sec = 770048 biți/s
3) 770048 bps: 16 biți = 48128 Hz - frecvența de eșantionare - aproape de cea mai mare 44,1 kHz
Răspuns: calitate CD audio

b).
1) 157 KB = 160768 de biți = 1286144 de biți
2) 1286144 biți: 10 secunde = 128614,4 biți/s
3) 128614,4 bps: 16 biți = 8038,4 Hz
Răspuns: calitatea difuzării

Răspuns: a) calitate CD; b) calitatea emisiunii radio.

14. Determinați lungimea fișierului audio care se va potrivi pe o dischetă de 3,5”. Vă rugăm să rețineți că 2847 de sectoare de 512 octeți sunt alocate pentru a stoca date pe o astfel de dischetă.
a) cu calitate scăzută a sunetului: mono, 8 biți, 8 kHz;
b) cu o calitate ridicată a sunetului: stereo, 16 biți, 48 kHz.

(, p. 77, nr. 2.85)

Soluţie:

A).



8 biți x 8.000 = 64.000 de biți = 8.000 de biți = 7,8 KB/s
3) Timpul de redare al unui fișier audio mono cu un volum de 1423,5 KB este egal cu:
1423,5 KB: 7,8 KB/s = 182,5 s ≈ 3 min

b).
1) Volumul de informații al unei dischete este egal cu:
2847 sectoare x 512 octeți = 1457664 octeți = 1423,5 KB
2) Volumul de informații al unui fișier de sunet care durează 1 secundă este egal cu:
16 biți x 48.000 x 2= 1.536.000 de biți = 192.000 de biți = 187,5 KB/s
3) Timpul de redare al unui fișier audio stereo cu un volum de 1423,5 KB este egal cu:
1423,5 KB: 187,5 KB/s = 7,6 s

Răspuns: a) 3 minute; b) 7,6 secunde.

3. Codare audio binară.

La rezolvarea problemelor, el folosește următorul material teoretic:

Pentru a codifica audio, semnalul analogic prezentat în figură

planul se împarte în verticală şi linii orizontale. Partiționarea verticală este eșantionarea semnalului analogic (frecvența de măsurare a semnalului), partiționarea orizontală este cuantizarea după nivel. Acestea. Cu cât grila este mai fină, cu atât este mai bună aproximarea sunetului analogic folosind numere. Cuantizarea pe opt biți este utilizată pentru a digitiza vorbirea obișnuită ( conversație telefonică) și emisiuni radio pe unde scurte. Șaisprezece biți - pentru digitizarea muzicii și a transmisiilor radio VHF (undă ultrascurtă).

Nivelul „3”

15. Semnalul audio analogic a fost eșantionat mai întâi utilizând 256 de intensități ale semnalului (calitate a sunetului difuzat) și apoi folosind 65.536 de intensități de semnal (calitate audio CD). De câte ori diferă volumele de informații ale sunetului digitalizat? (, p. 77, nr. 2.86)

Soluţie:

Lungimea codului unui semnal analogic care utilizează 256 de niveluri de intensitate a semnalului este de 8 biți, iar utilizarea a 65536 de niveluri de intensitate a semnalului este de 16 biți. Deoarece lungimea codului unui semnal s-a dublat, volumele de informații ale sunetului digitizat diferă cu un factor de 2.

Raspuns: de 2 ori.

Nivelul "4"

16. Conform teoremei Nyquist-Kotelnikov, pentru ca un semnal analogic să fie reconstruit cu acuratețe din reprezentarea sa discretă (din mostrele sale), frecvența de eșantionare trebuie să fie de cel puțin două ori frecvența audio maximă a acestui semnal.

  • Care ar trebui să fie rata de eșantionare a sunetului perceptibil de om?
  • Care ar trebui să fie mai mare: rata de eșantionare a vorbirii sau rata de eșantionare a unei orchestre simfonice?

Scop: Introducerea studenților în caracteristicile hardware și software pentru lucrul cu sunetul. Tipuri de activități: atragerea de cunoștințe de la un curs de fizică (sau lucrul cu cărți de referință). (, p. ??, sarcina 2)

Soluţie:

Se crede că intervalul de frecvențe pe care oamenii le aud este de la 20 Hz la 20 kHz. Astfel, conform teoremei Nyquist-Kotelnikov, pentru ca un semnal analogic să fie reconstruit cu acuratețe din reprezentarea sa discretă (din mostrele sale), Rata de eșantionare trebuie să fie de cel puțin două ori frecvența audio maximă a semnalului respectiv. Frecvența maximă a sunetului pe care o poate auzi o persoană este de 20 KHz, ceea ce înseamnă că dispozitivul ra si software trebuie să ofere o rată de eșantionare de cel puțin 40 kHz, sau mai precis 44,1 kHz. Procesarea computerizată a sunetului unei orchestre simfonice implică mai mult frecventa inalta eșantionarea decât procesarea vorbirii, deoarece intervalul de frecvență în cazul unei orchestre simfonice este mult mai mare.

Răspuns: nu mai puțin de 40 kHz, frecvența de eșantionare a unei orchestre simfonice este mai mare.

Nivelul „5”

17. Figura arată sunetul de 1 secundă de vorbire înregistrat de un reportofon. Codificați-l în cod digital binar cu o frecvență de 10 Hz și o lungime a codului de 3 biți. (, p. ??, sarcina 1)

Soluţie:

Codificarea la 10 Hz înseamnă că trebuie să măsurăm înălțimea de 10 ori pe secundă. Să alegem momente echidistante de timp:

O lungime a codului de 3 biți înseamnă 2 3 = 8 nivele de cuantizare. Adică, ca cod numeric pentru înălțimea sunetului la fiecare moment selectat de timp, putem seta una dintre următoarele combinații: 000, 001, 010, 011, 100, 101, 110, 111. Există doar 8 dintre prin urmare, înălțimea sunetului poate fi măsurată la 8 „niveluri”:

Vom „rotunji” valorile pasului la cel mai apropiat nivel inferior:

Folosind aceasta metoda codificare, obținem următorul rezultat (spatiile sunt incluse pentru ușurința percepției): 100 100 000 011 111 010 011 100 010 110.

Notă. Este recomandabil să atrageți atenția elevilor asupra cât de inexacte transmite codul modificarea amplitudinii. Adică, rata de eșantionare de 10 Hz și nivelul de cuantizare de 2 3 (3 biți) sunt prea mici. În mod obișnuit, pentru sunet (voce), se alege o frecvență de eșantionare de 8 kHz, adică de 8000 de ori pe secundă, și un nivel de cuantizare de 2 8 (cod lung de 8 biți).

Raspuns: 100 100 000 011 111 010 011 100 010 110.

18. Explicați de ce nivelul de cuantizare este, alături de frecvența de eșantionare, principalele caracteristici ale reprezentării sunetului într-un calculator. Obiective: pentru a consolida înțelegerea de către studenți a conceptelor de „acuratețea reprezentării datelor”, „eroare de măsurare”, „eroare de reprezentare”; Examinați codarea binară și lungimea codului cu studenții. Tip de activitate: lucrul cu definiții de concepte. (, p. ??, sarcina 3)

Soluţie:

În geometrie, fizică și tehnologie, există conceptul de „precizie de măsurare”, care este strâns legat de conceptul de „eroare de măsurare”. Dar există și un concept „precizia reprezentării”. De exemplu, despre înălțimea unei persoane putem spune că este: a) aproximativ. 2 m, b) puțin mai mult de 1,7 m, c) egal cu 1 m 72 cm, d) egal cu 1 m 71 cm 8 mm. Adică, 1, 2, 3 sau 4 cifre pot fi folosite pentru a indica înălțimea măsurată.
Același lucru este valabil și pentru codificarea binară. Dacă doar 2 biți sunt utilizați pentru a înregistra înălțimea unui sunet la un anumit moment de timp, atunci, chiar dacă măsurătorile au fost precise, pot fi transmise doar 4 niveluri: scăzut (00), sub medie (01), peste medie ( 10), mare (11). Dacă utilizați 1 octet, puteți transfera 256 de niveluri. Cum nivel de cuantizare mai mare, sau, care este la fel ca Cu cât sunt alocați mai mulți biți pentru înregistrarea valorii măsurate, cu atât această valoare este transmisă mai precis.

Notă. Trebuie remarcat faptul că instrumentul de măsură trebuie să suporte și nivelul de cuantizare selectat (nu are rost să reprezinte lungimea măsurată cu o riglă cu diviziuni decimetrice cu o precizie de milimetru).

Ţintă.Înțelegeți procesul de conversie a informațiilor sonore, stăpâniți conceptele necesare pentru a calcula volumul informațiilor sonore. Învață să rezolvi probleme pe o temă.

Scop-motivare. Pregătirea pentru examenul de stat unificat.

Planul lecției

1. Vizualizați o prezentare pe subiect cu comentarii din partea profesorului. Anexa 1

Material de prezentare: Codarea informațiilor audio.

De la începutul anilor 90 calculatoare personale a avut ocazia de a lucra cu informații audio. Fiecare computer care are o placă de sunet, microfon și difuzoare poate înregistra, salva și reda informații audio.

Procesul de conversie a undelor sonore în cod binar în memoria computerului:

Procesul de reproducere a informațiilor audio stocate în memoria computerului:

Sunet este o undă sonoră cu amplitudine și frecvență în continuă schimbare. Cu cât amplitudinea este mai mare, cu atât este mai tare pentru o persoană; cu cât frecvența semnalului este mai mare, cu atât tonul este mai mare. Software-ul de calculator permite acum convertirea unui semnal audio continuu într-o secvență de impulsuri electrice care pot fi reprezentate în formă binară. În procesul de codificare a unui semnal audio continuu, este eșantionarea timpului . O undă sonoră continuă este împărțită în secțiuni temporare mici separate și pentru fiecare astfel de secțiune este setată o anumită valoare a amplitudinii.

Astfel, dependența continuă a amplitudinii semnalului de timp La) este înlocuită cu o secvență discretă de niveluri de volum. Pe grafic, aceasta arată ca înlocuirea unei curbe netede cu o secvență de „pași”. Fiecărui „pas” i se atribuie o valoare a nivelului de volum al sunetului, codul său (1, 2, 3 etc.

Mai departe). Nivelurile de volum al sunetului pot fi considerate ca un set de stări posibile; în consecință, cu cât sunt alocate mai multe niveluri de volum în timpul procesului de codificare, cu atât mai multe informații va conține valoarea fiecărui nivel și cu atât sunetul va fi mai bun.

Adaptor audio ( placa de sunet) este un dispozitiv special conectat la un computer, conceput pentru a converti vibrațiile electrice ale frecvenței audio într-un cod binar numeric la introducerea sunetului și pentru conversia inversă (dintr-un cod numeric în vibrații electrice) la redarea sunetului.

În procesul de înregistrare a sunetului, adaptorul audio măsoară amplitudinea curentului electric cu o anumită perioadă și introduce codul binar al valorii rezultate în registru. Apoi, codul rezultat din registru este rescris în memoria RAM a computerului. Calitatea sunetului computerului este determinată de caracteristicile adaptorului audio:

  • Frecvența de eșantionare
  • Adâncimea de biți (adâncimea sunetului).

Rata de eșantionare în timp

Acesta este numărul de măsurători ale semnalului de intrare într-o secundă. Frecvența este măsurată în Herți (Hz). O măsurătoare pe secundă corespunde unei frecvențe de 1 Hz. 1000 de măsurători într-o secundă – 1 kilohertz (kHz). Rate de eșantionare tipice ale adaptoarelor audio:

11 kHz, 22 kHz, 44,1 kHz etc.

Lățimea registrului (adâncimea sunetului) este numărul de biți din registrul adaptorului audio care specifică numărul de niveluri de sunet posibile.

Adâncimea de biți determină acuratețea măsurării semnalului de intrare. Cu cât adâncimea de biți este mai mare, cu atât mai mică este eroarea fiecărei conversii individuale a valorii semnalului electric într-un număr și înapoi. Dacă adâncimea de biți este 8 (16), atunci când se măsoară semnalul de intrare, 2 8 = 256 (2 16 = 65536) pot fi obținute valori diferite. Evident, un adaptor audio pe 16 biți codifică și reproduce sunetul mai precis decât unul pe 8 biți. Plăcile de sunet moderne oferă o adâncime de codificare audio de 16 biți. Numărul de niveluri de semnal diferite (stări pentru o anumită codificare) poate fi calculat folosind formula:

N = 2 I = 2 16 = 65536, unde I este adâncimea sunetului.

Astfel, plăcile de sunet moderne pot oferi codificare a 65536 nivele de semnal. Fiecărei valori de amplitudine a semnalului audio i se atribuie un cod de 16 biți. La codificare binară Un semnal audio continuu este înlocuit cu o succesiune de niveluri de semnal discrete. Calitatea codificării depinde de numărul de măsurători ale nivelului de semnal pe unitatea de timp, adică ratele de eșantionare. Cu cât se fac mai multe măsurători în 1 secundă (cu cât frecvența de eșantionare este mai mare, cu atât procedura de codificare binară este mai precisă.

Fișier de sunet - un fișier care stochează informații audio în formă binară numerică.

2. Repetați unitățile de măsură ale informațiilor

1 octet = 8 biți

1 KB = 2 10 octeți = 1024 octeți

1 MB = 2 10 KB = 1024 KB

1 GB = 2 10 MB = 1024 MB

1 TB = 2 10 GB = 1024 GB

1 PB = 2 10 TB = 1024 TB

3. Întăriți materialul învățat urmărind o prezentare sau un manual

4. Rezolvarea problemelor

Manual, arătând soluția la prezentare.

Sarcina 1. Determinați volumul de informații al unui fișier audio stereo cu o durată a sunetului de 1 secundă cu o calitate ridicată a sunetului (16 biți, 48 kHz).

Sarcina (in mod independent). Manual, arătând soluția la prezentare.
Determinați volumul de informații al unui fișier audio digital cu o durată a sunetului de 10 secunde la o frecvență de eșantionare de 22,05 kHz și o rezoluție de 8 biți.

5. Consolidare. Rezolvarea problemelor acasă, independent în lecția următoare

Determinați cantitatea de memorie pentru stocarea unui fișier audio digital al cărui timp de redare este de două minute la o frecvență de eșantionare de 44,1 kHz și o rezoluție de 16 biți.

Utilizatorul are o capacitate de memorie de 2,6 MB. Este necesar să înregistrați un fișier audio digital cu o durată a sunetului de 1 minut. Care ar trebui să fie frecvența de eșantionare și adâncimea de biți?

Cantitatea de memorie liberă de pe disc este de 5,25 MB, adâncimea de biți a plăcii de sunet este de 16. Care este durata sunetului unui fișier audio digital înregistrat cu o frecvență de eșantionare de 22,05 kHz?

Un minut de înregistrare a unui fișier audio digital ocupă 1,3 MB de spațiu pe disc, iar capacitatea de biți a plăcii de sunet este de 8. La ce frecvență de eșantionare este înregistrat sunetul?

Câtă memorie este necesară pentru a stoca un fișier audio digital de înaltă calitate cu un timp de redare de 3 minute?

Fișierul audio digital conține înregistrare audio de calitate scăzută (sunetul este întunecat și înfundat). Care este durata unui fișier dacă dimensiunea acestuia este de 650 KB?

Două minute de înregistrare a unui fișier audio digital ocupă 5,05 MB de spațiu pe disc. Frecvența de eșantionare - 22.050 Hz. Care este adâncimea de biți a adaptorului audio?

Cantitatea de memorie liberă de pe disc este de 0,1 GB, adâncimea de biți a plăcii de sunet este de 16. Care este durata sunetului unui fișier audio digital înregistrat cu o frecvență de eșantionare de 44.100 Hz?

Răspunsuri

Nr. 92. 124,8 secunde.

Nr. 93. 22,05 kHz.

Nr. 94. O calitate ridicată a sunetului este obținută cu o frecvență de eșantionare de 44,1 kHz și o adâncime de biți a adaptorului audio de 16. Dimensiunea necesară a memoriei este de 15,1 MB.

Nr. 95. Următorii parametri sunt tipici pentru un sunet sumbru și înfundat: frecvența de eșantionare - 11 kHz, adâncimea de biți a adaptorului audio - 8. Durata sunetului este de 60,5 s.

Nr. 96. 16 biți.

Nr. 97. 20,3 minute.

Literatură

1. Manual: Informatică, carte-atelier de probleme, volumul 1, editat de I.G.Semakin, E.K. Henner)

2. Festivalul ideilor pedagogice „Lecția deschisă” Sound. Codarea binară a informațiilor audio. Supryagina Elena Aleksandrovna, profesor de informatică.

3. N. Ugrinovich. Informatica si tehnologia informatiei. 10-11 clase. Moscova. Binom. Laboratorul de cunoștințe 2003.