Hangos információk kódolása és feldolgozása. Hogyan történik a hang kódolása. Digitális kódolás és hangfeldolgozás Különféle digitális hangformátumok

27.09.2021 hírek

A digitális hangrögzítés minőségét befolyásoló fő paraméterek:

§ Az ADC és a DAC bitmélysége.

§ ADC és DAC mintavételi frekvencia.

§ Jitter ADC és DAC

§ Újramintavételezés

Szintén fontosak az analóg útvonal paraméterei digitális eszközök hangfelvétel és hangreprodukció:

§ Jel-zaj arány

§ THD

§ Intermodulációs torzítás

§ Egyenetlen frekvenciamenet

§ Csatornák áthatolása

§ Dinamikus hatókör

Digitális audio technológia

Felvétel digitális hang jelenleg hangstúdiókban végzik, személyi számítógépek és egyéb drága és jó minőségű berendezések felügyelete alatt. Az „otthoni stúdió” koncepciója is meglehetősen széles körben kidolgozott, amelyben professzionális és félprofesszionális felvevőberendezéseket használnak, amelyek lehetővé teszik minőségi felvételek otthon.

Alkalmaz hangkártyák az ADC-ben és DAC-jukban feldolgozó számítógépek részeként - leggyakrabban 24 biten és 96 kHz-en - a bitmélység és a mintavételezési frekvencia további növelése gyakorlatilag nem javítja a felvétel minőségét.

A számítógépes programok egész osztálya létezik - hangszerkesztők, amelyek lehetővé teszik a hanggal való munkát:

§ rögzíti a bejövő hangfolyamot

§ hangot hoz létre (generál).

§ változás meglévő rekord(minták hozzáadása, hangszín megváltoztatása, hangsebesség, alkatrészek kivágása stb.)

§ felülírja egyik formátumról a másikra

§ konvertálja a különböző audio kodekeket

Néhány egyszerű programok, csak a formátumok és kodekek konvertálását engedélyezi.

Különféle digitális audio formátumok

Az audioformátumnak különböző fogalmai vannak.

Az audioadatok digitális formában történő megjelenítésének formátuma a digitális-analóg konverter (DAC) általi kvantálás módjától függ. A hangtechnikában jelenleg kétféle kvantálás a legelterjedtebb:

§ impulzuskód moduláció

§ szigma-delta moduláció

Gyakran a kvantálási bitmélység és a mintavételezési frekvencia különböző hangrögzítő és -lejátszó eszközöknél a digitális hang megjelenítési formátumaként van feltüntetve (24 bit/192 kHz; 16 bit/48 kHz).

A fájlformátum határozza meg a számítógépes tárolóeszközön tárolt hangadatok megjelenítésének szerkezetét és jellemzőit. Az audioadatok redundanciájának kiküszöbölése érdekében audiokodekeket használnak az audioadatok tömörítésére. A hangfájlformátumoknak három csoportja van:

§ tömörítetlen hangformátumok, például WAV, AIFF

§ veszteségmentes hangformátumok (APE, FLAC)

§ veszteséges tömörítést használó hangformátumok (mp3, ogg)

A moduláris zenei fájlformátumok különböznek egymástól. Szintetikusan vagy előre felvett élő hangszerek mintáiból készültek, elsősorban a modern elektronikus zene (MOD) létrehozását szolgálják. Ebbe beletartozik a MIDI formátum is, amely nem hangfelvétel, ugyanakkor egy szekvenszer segítségével lehetővé teszi a zene rögzítését és lejátszását egy bizonyos parancssor segítségével szöveges formában.

A digitális hanghordozó formátumokat hangfelvételek tömeges terjesztésére (CD, SACD) és professzionális hangrögzítésre (DAT, minilemez) egyaránt használják.

A térhatású hangrendszereknél lehetőség van hangformátumok megkülönböztetésére is, amelyek főleg filmek többcsatornás hangkíséretei. Az ilyen rendszerekben két nagy versengő cég, a Digital Theatre Systems Inc. teljes formátumcsaládja van. - DTS és Dolby Laboratories Inc. - Dolby Digital.

A formátumot a többcsatornás hangrendszerek csatornáinak számának is nevezik (5.1; 7.1). Kezdetben egy ilyen rendszert mozik számára fejlesztettek ki, de később kibővítették.Szoftver Codec

Audiokodek szoftver szinten

§ G.723.1 – az egyik alapvető kodek az IP-telefónia alkalmazásokhoz

§ G.729 - szabadalmaztatott keskeny sávú kodek, amelyet a beszéd digitális megjelenítésére használnak

§ Internet Low Bitrate Codec (iLBC) – népszerű ingyenes kodek az IP-telefonokhoz (különösen a Skype és a Google Talk számára)

Audiokodek(Angol) audio kodek; audio kódoló/dekódoló) - számítógépes program ill hardver A hangadatok kódolásához vagy dekódolásához.

Szoftver kodek

Audiokodek szoftver szinten szakosodott számítógépes program, egy kodek, amely egy fájl szerint tömöríti (tömöríti) vagy kicsomagolja (kicsomagolja) a digitális audio adatokat hangformátum vagy streaming audio formátumban. Az audiokodek, mint tömörítő feladata, hogy adott minőségű/hűségű és a lehető legkisebb méretű hangjelet biztosítson. A tömörítés csökkenti az audioadatok tárolásához szükséges helyet, és lehetőség van annak a csatornának a sávszélességének csökkentésére is, amelyen keresztül az audioadatokat továbbítják. A legtöbb audiokodek szoftverkönyvtárként van megvalósítva, amelyek kölcsönhatásba lépnek egy vagy több audiolejátszóval, mint például a QuickTime Player, XMMS, Winamp, VLC médialejátszó, MPlayer vagy Windows Media Player.

Népszerű szoftveres audiokodekek alkalmazás szerint:

§ MPEG-1 Layer III (MP3) - szabadalmaztatott kodek hangfelvételekhez (zene, hangoskönyvek stb.) számítógépes technológiaés digitális lejátszók

§ Ogg Vorbis (OGG) – a második legnépszerűbb formátum, amelyet széles körben használnak számítógépes játékokés fájlmegosztó hálózatokban zeneátvitel céljából

§ A GSM-FR az első olyan digitális beszédkódolási szabvány, amelyet Magyarországon használnak GSM telefonok

§ Adaptív többsebességű (AMR) – az emberi hang felvétele mobiltelefonokés mások mobil eszközök

Az emberi fül 20 rezgés/másodperc (alacsony hang) és 20 000 rezgés/másodperc (magas hang) közötti frekvenciájú hangot érzékel.

Az ember hatalmas intenzitástartományban képes érzékelni a hangot, amelyben a maximális intenzitás 10 14-szer nagyobb, mint a minimum (százezer milliárdszor). Egy speciális egységet használnak a hangerősség mérésére. "decibel"(dbl) (5.1. táblázat). A hangerő 10 dB-lel történő csökkentése vagy növelése a hangintenzitás 10-szeres csökkenésének vagy növekedésének felel meg.

Hang időmintavételezése. Annak érdekében, hogy a számítógép hangot dolgozzon fel, folyamatos hangjelzés időbeli mintavételezéssel digitális diszkrét formára kell konvertálni. A folyamatos hanghullám külön kis időszakaszokra van felosztva, minden ilyen szakaszhoz beállítanak egy bizonyos hangintenzitásértéket.

Így a hangerősség A(t) időtől való folyamatos függőségét a hangerőszintek diszkrét sorozata váltja fel. A grafikonon ez úgy néz ki, mintha egy sima görbét "lépések" sorozatára cserélnénk (1.2. ábra).


Rizs. 1.2. Időbeli hangmintavétel

Mintavételi gyakoriság. A hangkártyához csatlakoztatott mikrofon az analóg hang rögzítésére és digitális formátumra való konvertálására szolgál. A vett digitális hang minősége függ a hangerőszint méréseinek számától időegységenként, pl. mintavételi ráta. Hogyan nagy mennyiség A mérések 1 másodperc alatt történnek (minél magasabb a mintavételezési frekvencia), annál pontosabban ismétli meg a digitális audiojel "létrája" a párbeszédes jel görbéjét.

Hang mintavételi frekvencia a hangerő méréseinek száma egy másodperc alatt.

Az audio mintavételi frekvencia 8000 és 48000 hangerőmérés között lehet másodpercenként.

Hangkódolási mélység. Minden „lépéshez” hozzá van rendelve a hangerőszint egy bizonyos értéke. A hangerősségi szintek az N lehetséges állapotok halmazának tekinthetők, amelyek kódolásához bizonyos mennyiségű I információra van szükség, amit hangkódolási mélységnek nevezünk.

Hangkódolási mélység a kódoláshoz szükséges információ mennyisége diszkrét szintek digitális hangerő.

Ha ismert a kódolási mélység, akkor a digitális hangerőszintek száma kiszámítható az N = 2 I képlettel. Legyen a hangkódolási mélység 16 bit, akkor a hangerőszintek száma:

N = 2 I = 2 16 = 65536.

A kódolási folyamat során minden hangerőszinthez saját, 16 bites bináris kódot rendelnek, a legalacsonyabb hangszint a 0000000000000000 kódnak, a legmagasabb pedig a 11111111111111111 kódnak felel meg.

A digitalizált hang minősége. Minél nagyobb a hang frekvenciája és mintavételi mélysége, annál jobb lesz a digitalizált hang minősége. A minőségnek megfelelő legalacsonyabb minőségű digitalizált hang telefonos kommunikáció, másodpercenként 8000-szeres mintavételezési sebességgel, 8 bites mintavételi mélységgel és egy hangsáv rögzítésével (monó mód) érhető el. A digitalizált hang legmagasabb minősége, amely megfelel az audio CD minőségének, 48 000 másodpercenkénti mintavételezési sebességgel, 16 bites mintavételi mélységgel és két hangsáv rögzítésével érhető el (sztereó mód).

Emlékeztetni kell arra, hogy minél jobb a digitális hang minősége, annál nagyobb a hangfájl információmennyisége. Megbecsülheti egy 1 másodperces hangtartamú digitális sztereó hangfájl információs mennyiségét, átlagos hangminőséggel (16 bit, 24 000 mérés másodpercenként). Ehhez a kódolási mélységet meg kell szorozni az 1 másodpercenkénti mérések számával, és meg kell szorozni 2-vel (sztereó hang):

16 bit × 24 000 × 2 = 768 000 bit = 96 000 bájt = 93,75 KB.

hangszerkesztők. A hangszerkesztők segítségével nem csak hangot rögzíthet és lejátszhat, hanem szerkesztheti is. A digitalizált hang ben jelenik meg hangszerkesztők vizuális formában, így a hangsáv részeinek másolása, mozgatása és törlése egyszerűen elvégezhető az egér segítségével. Ezenkívül a hangsávokat egymásra helyezheti (hangok keverése), és különféle akusztikus effektusokat alkalmazhat (visszhang, visszajátszás stb.).

A hangszerkesztők lehetővé teszik a digitális hang minőségének és az audiofájl méretének megváltoztatását a mintavételi gyakoriság és a kódolási mélység változtatásával. A digitalizált hanganyag tömörítetlenül menthető hangfájlokba univerzális formátum WAV vagy tömörített formátumban MP3.

A hang tömörített formátumba mentésekor az alacsony intenzitású hangfrekvenciákat, amelyek "túlzóak" az emberi érzékelés szempontjából, és időben egybeesnek a nagy intenzitású hangfrekvenciákkal, a rendszer elveti. Ennek a formátumnak a használata lehetővé teszi az audiofájlok több tucatszori tömörítését, de visszafordíthatatlan információvesztéshez vezet (a fájlok nem állíthatók vissza eredeti formájukban).

tesztkérdések

1. Hogyan befolyásolja a mintavételezési sebesség és a kódolási mélység a digitális hangminőséget?

Önmegvalósítási feladatok

1.22. Szelektív válaszú feladat. A hangkártya az analóg audiojel bináris kódolását állítja elő. Mennyi információra van szükség a 65 536 lehetséges jelintenzitásszint mindegyikének kódolásához?
1) 16 bit; 2) 256 bit; 3) 1 bit; 4) 8 bites.

1.23. Kérdés részletes válasszal. Becsülje meg a 10 másodpercig tartó digitális audiofájlok információmennyiségét az audiojel kódolási mélységénél és mintavételezési gyakoriságánál, biztosítva a minimális és maximális hangminőséget:
a) monó, 8 bit, 8000 mérés másodpercenként;
b) sztereó, 16 bit, 48 000 mérés másodpercenként.

1.24. Kérdés részletes válasszal. Határozza meg egy hangfájl hosszát, amely elfér egy 3,5"-es hajlékonylemezen (vegye figyelembe, hogy 2847, egyenként 512 bájtos szektor van lefoglalva az adatok tárolására egy ilyen hajlékonylemezen):
a) alacsony hangminőséggel: monó, 8 bit, 8000 mérés másodpercenként;
b) kiváló hangminőséggel: sztereó, 16 bit, 48 000 mérés másodpercenként.

A hangerő, valamint a hang magasságának függősége a hanghullám intenzitásától és frekvenciájától

Hertz(Hz vagy Hz jelöli) - a periodikus folyamatok (például rezgések) frekvenciájának mértékegysége.
Az 1 Hz egy ilyen folyamat egy másodperc alatti végrehajtását jelenti: 1 Hz = 1/s.

Ha 10 Hz-ünk van, akkor ez azt jelenti, hogy egy másodperc alatt tíz ilyen folyamatot hajtunk végre.

Az emberi fül másodpercenként 20 rezgés (20 Hertz, alacsony hang) és másodpercenként 20 000 rezgés (20 kHz, magas hang) közötti frekvenciájú hangot képes érzékelni.

Ezen túlmenően, az ember a hangokat széles intenzitástartományban érzékeli, amelyben a maximális intenzitás 1014-szer nagyobb, mint a minimum (százezer milliárdszor).

A hangerősség mérésére egy speciális egységet találtak ki és használtak. decibel" (dB)

A hangerő 10 dB-lel történő csökkentése vagy növelése a hangintenzitás 10-szeres csökkenésének vagy növekedésének felel meg.

Hangerő decibelben

Nak nek számítógépes rendszerek képes feldolgozni a hangot, a folyamatos hangjelet időbeli mintavételezéssel digitális, diszkrét formává kell alakítani.

Ehhez egy folyamatos hanghullámot külön kis időszakaszokra osztanak fel, minden ilyen szakaszhoz beállítanak egy bizonyos hangintenzitást.

Így a hangerősség A(t) időtől való folyamatos függőségét a hangerőszintek diszkrét sorozata váltja fel. A grafikonon ez úgy néz ki, mintha egy sima görbét „lépések” sorozatára cserélnénk.


Időbeli hangmintavétel

A hangkártyához csatlakoztatott mikrofon az analóg hang rögzítésére és digitális formátumra való konvertálására szolgál.

Minél sűrűbbek a különálló csíkok a grafikonon, annál jobb lesz az eredeti hang visszaállítása.

A vett digitális hang minősége az időegységenkénti hangerőszint méréseinek számától, azaz a mintavételezési frekvenciától függ.

Hang mintavételi frekvencia a hangerő méréseinek száma egy másodperc alatt.

Minél több mérést végeznek egy másodperc alatt (minél nagyobb a mintavételi frekvencia), annál pontosabban ismétli meg a digitális audiojel "létrája" az analóg jel görbéjét.

A grafikonon minden egyes „lépéshez” hozzá van rendelve a hangerőszint egy bizonyos értéke. A hangerőszinteket a lehetséges állapotok halmazának tekinthetjük N(gradációk), amelyek kódolásához bizonyos mennyiségű információra van szükség én, amelyet hangkódolási mélységnek neveznek.

Hangkódolási mélység a diszkrét digitális hangerőszintek kódolásához szükséges információ mennyisége.

Ha ismert a kódolási mélység, akkor a digitális hangerőszintek száma az általános képlet segítségével kiszámítható N = 2 I.

Például, ha a hangkódolási mélység 16 bit, akkor a hangerőszintek száma:

N = 2 I = 2 16 = 65536.

A kódolási folyamat során minden hangerőszinthez saját, 16 bites bináris kódot rendelnek, a legalacsonyabb hangszint a 0000000000000000 kódnak, a legmagasabb pedig a 11111111111111111 kódnak felel meg.

A digitalizált hang minősége

Tehát minél nagyobb a mintavételezési frekvencia és a hangkódolási mélység, annál jobb lesz a digitalizált hang minősége, és annál jobban közelíthető a digitalizált hang az eredeti hanghoz.

A digitalizált hang legmagasabb minősége, amely megfelel az audio CD minőségének, 48 000 másodpercenkénti mintavételezési sebességgel, 16 bites mintavételi mélységgel és két hangsáv rögzítésével érhető el (sztereó mód).

Emlékeztetni kell arra minél jobb a digitális hang minősége, annál nagyobb a hangfájl információmennyisége.

Könnyen megbecsülheti egy 1 másodperces, közepes hangminőségű (16 bit, 24 000 minta/másodperc) digitális sztereó hangfájl információmennyiségét. Ehhez a kódolási mélységet meg kell szorozni az 1 másodpercenkénti mérések számával, és meg kell szorozni 2 csatornával (sztereó hang):

16 bit × 24 000 × 2 = 768 000 bit = 96 000 bájt = 93,75 KB.

Hangszerkesztők

A hangszerkesztők segítségével nem csak hangot rögzíthet és lejátszhat, hanem szerkesztheti is. A legkiemelkedőbbek nyugodtan nevezhetők, mint pl Sony Sound Forge, Adobe Audition, GoldWaveés mások.

A digitalizált hang a hangszerkesztőkben áttekinthető vizuális formában jelenik meg, így a hangsáv részeinek másolása, mozgatása és törlése egyszerűen elvégezhető számítógépes egér segítségével.

Ezenkívül átfedheti, átfedheti a hangsávokat egymásra (hangok keverése), és különféle akusztikus effektusokat alkalmazhat (visszhang, visszajátszás stb.).

A hang tömörített formátumban történő mentésekor az alacsony intenzitású hangfrekvenciák, amelyek nem hallhatók és észrevehetetlenek ("túlzott"), amelyek időben egybeesnek a nagy intenzitású hangfrekvenciákkal. Ennek a formátumnak a használata lehetővé teszi a hangfájlok több tucatszori tömörítését, de visszafordíthatatlan információvesztéshez vezet (a fájlok nem állíthatók vissza eredeti, eredeti formájukban).

Célok:

nevelési:

  • Ismerkedjen meg a bináris fájlkódolási technológiával wav formátumban
  • Ismerje meg, hogyan oldhat meg problémákat a WAV-audiofájl hangerejének meghatározásához

Időbeli diszkretizálás - olyan folyamat, amelyben egy folyamatos audiojel kódolása során egy hanghullámot külön kis időszakaszokra bontanak, és minden ilyen szakaszhoz beállítanak egy bizonyos amplitúdóértéket. Minél nagyobb a jel amplitúdója, annál hangosabb a hang.

Hangmélység (kódolási mélység) -hangkódolásonkénti bitek száma.

Hangerőszintek (jelszintek)- a hang eltérő hangerővel rendelkezhet. A különböző hangerőszintek számát a képlet számítja ki N= 2 én aholén- hang mélysége.

Mintavételi gyakoriság - a bemeneti jelszint méréseinek száma időegységenként (1 másodpercenként). Minél nagyobb a mintavételi sebesség, annál pontosabb a bináris kódolási eljárás. A frekvenciát hertzben (Hz) mérik. 1 mérés 1 másodperc alatt -1 Hz.

1000 mérés 1 másodperc alatt 1 kHz. Jelölje betűvel a mintavételi gyakoriságotD. A kódoláshoz válasszon egyet a három frekvencia közül:44,1 kHz, 22,05 kHz, 11,025 kHz.

Úgy gondolják, hogy az a frekvenciatartomány, amelyből az ember hall 20 Hz és 20 kHz között.

Bináris kódolás minősége -olyan érték, amelyet a kódolási mélység és a mintavételi gyakoriság határoz meg.

Audio adapter (hangkártya) - olyan eszköz, amely a hangfrekvencia elektromos rezgéseit numerikus bináris kóddá alakítja hang bemenetekor és fordítva (numerikus kódtól elektromos rezgésig) hang lejátszásakor.

Audioadapter specifikációi:mintavételi sebesség és regiszter bitmélysége.).

Kapacitás nyilvántartása - a bitek száma az audioadapter regiszterében. Minél nagyobb a bitmélység, annál kisebb az érték minden egyes konverziójának hibája elektromos áram számra és fordítva. Ha a bitmélység az én, majd a bemeneti jel mérésekor 2én = N különböző értékeket.

Digitális monó hangfájl mérete (A) a következő képlettel mérjük:

A= D* T* én/8 , aholD - mintavételi frekvencia (Hz),T- hang vagy hangfelvétel ideje,éna regiszter bitmélysége (felbontás). Ez a képlet a méretet bájtokban méri.

Digitális sztereó hangfájl mérete (A) a következő képlettel mérjük:

A=2* D* T* én/8 , a jel két hangszóróra kerül rögzítésre, mivel a bal és a jobb hangcsatorna külön kódolású.

A tanulók számára hasznos, ha kiadják az 1. táblázatot, amely megmutatja, hogy a kódolt egyperces hanginformáció hány MB-ot vesz igénybe különböző mintavételi frekvenciák mellett:

1. algoritmus (Egy hangfájl információmennyiségének kiszámítása):

1) megtudja, hány érték kerül beolvasásra a memóriába a fájl hangja során;

2) megtudja a kód bitmélységét (hány bitet foglal el az egyes mért értékek a memóriában);

3) megszorozzuk az eredményeket;

4) fordítsa le az eredményt bájtokká;

5) konvertálja az eredményt K bájtra;

6) fordítsa le az eredményt M bájtra;

2. algoritmus (Számítsa ki a fájl lejátszási idejét.)

1) Alakítsa át a fájl információs kötetét K bájtra.

2) Alakítsa át a fájl információs mennyiségét bájtokká.

3) Alakítsa át a fájl információmennyiségét bitekre.

4) Nézze meg, hány értéket mértek összesen (Ossza el az információ mennyiségét bitekben a kód kapacitásával).

5) Számítsa ki a hang másodpercek számát. (Ossza el az előző eredményt a mintavételi gyakorisággal.)

1. Digitális fájlméret

"3" szint

1. Határozza meg annak a digitális audiofájlnak a méretét (bájtban), amelynek lejátszási ideje 10 másodperc 22,05 kHz mintavételezési frekvenciával és 8 bites felbontással. A fájl nincs tömörítve.

Megoldás:

Képlet a méret kiszámításához (bájtokban) digitális hangfájl: A= D* T* én/8.

A bájtokká alakításhoz a kapott értéket el kell osztani 8 bittel.

22,05 kHz = 22,05 * 1000 Hz = 22 050 Hz

A= D* T* én/8 = 22050 x 10 x 8/8 = 220500 bájt.

Válasz: a fájl mérete 220500 bájt.

2. Határozza meg a tárhely méretét egy olyan digitális audiofájl számára, amelynek lejátszási ideje 2 perc 44,1 kHz-es mintavételezési frekvenciával és 16 bites felbontással.

Megoldás:

A= D* T* én/nyolc. - a memória mennyisége a digitális audiofájl tárolására.

44100 (Hz) x 120 (s) x 16 (bit) / 8 (bit) = 10584000 bájt = 10335,9375 KB = 10,094 MB.

Válasz: ≈ 10 Mb

"4" szint

3. A felhasználónak 2,6 MB memóriája van. 1 perces időtartamú digitális hangfájlt kell rögzítenie. Mekkora legyen a mintavételezési sebesség és a bitmélység?

Megoldás:

A mintavételi sebesség és a bitmélység kiszámításának képlete: D * I \u003d A / T

(memória bájtban) : (lejátszási idő másodpercben):

2,6 MB = 2726297,6 bájt

D* I = A / T = 2726297,6 bájt: 60 \u003d 45438,3 bájt

D=45438,3 bájt: I

Az adapter bitmélysége 8 vagy 16 bit lehet. (1 bájt vagy 2 bájt). Ezért a mintavételi frekvencia lehet 45438,3 Hz = 45,4 kHz ≈ 44,1 kHz- szabványos jellemző mintavételi frekvencia, vagy 22719,15 Hz = 22,7 kHz ≈ 22,05 kHz- szabványos jellemző mintavételi frekvencia

Válasz:

Mintavételi gyakoriság

Audio adapter bitmélység

1 lehetőség

22,05 kHz

16 bites

2. lehetőség

44,1 kHz

8 bites

4. Hangerő szabad memória 5,25 MB lemezen, 16 bites hangkártya Mennyi ideig tart egy 22,05 kHz-es mintavételezési frekvencián rögzített digitális hangfájl?

Megoldás:

Képlet a hang időtartamának kiszámításához: T=A/D/I

(memória mérete bájtban) : (mintavételezési frekvencia Hz-ben) : (hangkártya bitmélysége bájtban):

5,25 MB = 5505024 bájt

5505024 bájt: 22050 Hz: 2 bájt = 124,8 mp
Válasz: 124,8 másodperc

5. Egy perc digitális hangfájl rögzítése 1,3 MB-ot foglal el a lemezen, a hangkártya bitmélysége 8. Mekkora a hang mintavételezési sebessége?

Megoldás:

Mintavételi sebesség képlete: D =A/T/I

(memória mérete bájtban) : (rögzítési idő másodpercben) : (hangkártya bitmélysége bájtban)

1,3 MB = 1363148,8 bájt

1363148,8 bájt: 60:1 = 22719,1 Hz

Válasz: 22,05 kHz

6. Két perc digitális hangfelvétel 5,1 MB lemezterületet foglal el. Mintavételi frekvencia - 22050 Hz. Mekkora az audioadapter bitessége?

Megoldás:

A bitmélység kiszámításának képlete: (memória bájtban) : (lejátszási idő másodpercben): (mintavételi frekvencia):

5, 1 MB = 5347737,6 bájt

5347737,6 bájt: 120 mp: 22050 Hz = 2,02 bájt = 16 bit

Válasz: 16 bites

7. A lemezen a szabad memória mennyisége 0,01 GB, a hangkártya bitmélysége 16. Mennyi ideig szól a 44100 Hz-es mintavételezési frekvenciával rögzített digitális hangfájl?

Megoldás:

Képlet a hangzás időtartamának számítására T=A/D/I

(memória mérete bájtban) : (mintavételezési frekvencia Hz-ben) : (hangkártya bitmélysége bájtban)

0,01 GB = 10737418,24 bájt

10737418,24 bájt: 44100: 2 = 121,74 mp = 2,03 perc
Válasz: 20,3 perc

8. Becsülje meg egy 1 perces időtartamú monó audiofájl információs mennyiségét. ha a kódolás "mélysége" és az audiojel mintavételezési gyakorisága megegyezik:
a) 16 bit és 8 kHz;
b) 16 bit és 24 kHz.

Megoldás:

a)

16 bit x 8000 = 128 000 bit = 16 000 bájt = 15,625 KB/s

15,625 KB/s x 60 s = 937,5 KB

b).
1) Egy 1 másodperces hangfájl információs mennyisége egyenlő:
16 bit x 24 000 = 384 000 bit = 48 000 bájt = 46,875 KB/s
2) Egy 1 perces időtartamú hangfájl információs mennyisége egyenlő:
46,875 KB/s x 60 s = 2812,5 KB = 2,8 MB

Válasz: a) 937,5 KB; b) 2,8 MB

"5" szint

Az 1. táblázatot használjuk

9. Mekkora tárhely szükséges egy jó minőségű, 3 perces lejátszási idővel rendelkező digitális audiofájl tárolásához?

Megoldás:

Jó minőség A hang 44,1 kHz-es mintavételezési frekvenciával és 16 bitmélységű audioadapterrel érhető el.
A memória mennyiségének kiszámításának képlete: (rögzítési idő másodpercben) x (a hangkártya bitmélysége bájtban) x (mintavételi frekvencia):
180 s x 2 x 44100 Hz = 15876000 bájt = 15,1 MB
Válasz: 15,1 MB

10. A digitális hangfájl gyenge minőségű hangfelvételt tartalmaz (a hang sötét és tompa). Mennyi ideig szól egy fájl, ha a hangereje 650 KB?

Megoldás:

A komor és tompa hangzásra a következő paraméterek jellemzőek: mintavételezési frekvencia - 11,025 kHz, audio adapter bitmélysége - 8 bit (lásd az 1. táblázatot). Ekkor T=A/D/I. Fordítsuk le a kötetet bájtokra: 650 KB = 665600 bájt

T=665600 bájt/11025 Hz/1 bájt ≈60,4 s

Válasz: a hang időtartama 60,5 s

Megoldás:

Egy 1 másodperces hangfájl információs hangereje egyenlő:
16 bit x 48 000 x 2 = 1 536 000 bit = 187,5 KB (sztereó óta 2-vel szorozva).

Egy 1 perces időtartamú hangfájl információs mennyisége egyenlő:
187,5 KB/s x 60 s ≈ 11 MB

Válasz: 11 MB

Válasz: a) 940 KB; b) 2,8 MB.

12. Számítsa ki egy monó audiofájl lejátszási idejét, ha 16 bites kódolással és 32 kHz-es mintavételezési frekvenciával a hangereje egyenlő:
a) 700 KB;
b) 6300 KB

Megoldás:

a)
1) Egy 1 másodperces hangfájl információs mennyisége egyenlő:


700 KB: 62,5 KB/s = 11,2 s

b).
1) Egy 1 másodperces hangfájl információs mennyisége egyenlő:
16 bit x 32 000 = 512 000 bit = 64 000 bájt = 62,5 KB/s
2) Egy 700 KB-os monó hangfájl lejátszási ideje:
6300 KB: 62,5 KB/s = 100,8 s = 1,68 perc

Válasz: a) 10 másodperc; b) 1,5 perc.

13. Számítsa ki, hogy egy sztereó felvétel egyetlen másodperce hány bájtnyi információt foglal el egy CD-n (44032 Hz frekvencia, 16 bit értékenként). Mennyi ideig tart egy perc? Mekkora a lemez maximális kapacitása (80 perces maximális időtartamot feltételezve)?

Megoldás:

Képlet a memória mennyiségének kiszámításához A= D* T* én:
(rögzítési idő másodpercben) * (hangkártya bitmélysége bájtban) * (mintavételi frekvencia). 16 bit - 2 bájt.
1) 1 s x 2 x 44032 Hz = 88064 bájt (1 másodperc sztereó CD)
2) 60 s x 2 x 44032 Hz = 5283 840 bájt (1 perces sztereó CD)
3) 4800 s x 2 x 44032 Hz = 422707200 bájt = 412800 KB = 403,125 MB (80 perc)

Válasz: 88064 bájt (1 másodperc), 5283840 bájt (1 perc), 403,125 MB (80 perc)

2. A hangminőség meghatározása.

A hangminőség meghatározásához meg kell találni a mintavételi frekvenciát, és használni kell az 1. számú táblázatot

256 (2 8) jelintenzitási szint - rádióadás hangminősége, 65536 (2 16) jelintenzitási szint használatával - audio CD hangminőség. A legjobb minőségű frekvencia a CD-re felvett zenének felel meg. Az analóg jel nagyságát ebben az esetben másodpercenként 44 100-szor mérjük.

"5" szint

13. Ha tudja, hogy egy 10 másodperces hangtartamú monó hangfájl hangereje, határozza meg a hangminőséget (sugárzott minőség, közepes minőség, audio CD minőség). egyenlő:
a) 940 KB;
b) 157 KB.

(, 76. o., 2.83. sz.)

Megoldás:

a)
1) 940 KB = 962560 bájt = 7700480 bit
2) 7700480 bps: 10 mp = 770048 bps
3) 770048 bps: 16 bit = 48128 Hz - mintavételezési frekvencia - közel a legmagasabb 44,1 kHz-hez
Válasz: audio CD minőség

b).
1) 157 KB = 160768 bájt = 1286144 bit
2) 1286144 bit: 10 mp = 128614,4 bps
3) 128614,4 bps: 16 bit = 8038,4 Hz
Válasz: adás minősége

Válasz: a) CD minőség; b) az adás minősége.

14. Határozza meg a hangfájl hosszát, amely elfér egy 3,5”-os hajlékonylemezen. Kérjük, vegye figyelembe, hogy egy ilyen hajlékonylemezen 2847, 512 bájtos szektor van lefoglalva adattárolásra.
a) alacsony hangminőséggel: monó, 8 bit, 8 kHz;
b) kiváló hangminőséggel: sztereó, 16 bit, 48 kHz.

(, 77. o., 2.85. sz.)

Megoldás:

a)



8 bit x 8 000 = 64 000 bit = 8 000 bájt = 7,8 KB/s
3) Egy 1423,5 KB-os monó hangfájl lejátszási ideje:
1423,5 KB: 7,8 KB/s = 182,5 s ≈ 3 perc

b).
1) A hajlékonylemez információs térfogata egyenlő:
2847 szektor x 512 bájt = 1457664 bájt = 1423,5 KB
2) Egy 1 másodperces hangfájl információs mennyisége egyenlő:
16 bit x 48 000 x 2 = 1 536 000 bit = 192 000 bájt = 187,5 KB/s
3) Egy 1423,5 KB-os sztereó audiofájl lejátszási ideje:
1423,5 KB: 187,5 KB/s = 7,6 s

Válasz: a) 3 perc; b) 7,6 másodperc.

3. Bináris hangkódolás.

A feladatok megoldása során a következő elméleti anyagokat használja:

A hang kódolásához analóg jelábrán látható,

síkot függőleges és vízszintes vonalak. A függőleges felosztás az analóg jel mintavételezése (jelmérési frekvencia), a vízszintes felosztás az kvantálás szint szerint. Azok. Minél finomabb a rács, annál jobban közelítik az analóg hangot a számok segítségével. A nyolcbites kvantálást a hétköznapi beszéd digitalizálására használják ( telefonbeszélgetés) és rövidhullámú rádióadásokat. Tizenhat bites - zene és VHF (ultra-rövidhullámú) rádióadások digitalizálására.

"3" szint

15. Az analóg hangjel mintavételezése először 256 jelerősségi szinttel (műsorszórási hangminőség), majd 65536 jelerősségi szinttel (audio CD hangminősége) történt. Hányszor tér el a digitalizált hang információmennyisége? (, 77. o., 2.86. sz.)

Megoldás:

Egy 256 jelerősségi szintet használó analóg jel kódhossza 8 bit, 65536 jelerősségi szint esetén 16 bit. Mivel egy jel kódjának hossza megkétszereződött, a digitalizált hang információmennyisége 2-szer tér el.

Válasz: 2 alkalommal.

szint "négy"

16. A Nyquist-Kotelnikov tétel szerint ahhoz, hogy egy analóg jelet a diszkrét reprezentációjából (mintáiból) pontosan rekonstruálhassunk, a mintavételezési frekvenciának legalább kétszerese ennek a jelnek a maximális hangfrekvenciájának.

  • Mekkora legyen az emberi hang mintavételezési frekvenciája?
  • Melyik legyen magasabb: a beszéd mintavételezési gyakorisága vagy egy szimfonikus zenekar hangjának mintavételezési gyakorisága?

Cél: megismertetni a hallgatókkal a hanggal való munkavégzéshez szükséges hardver és szoftver jellemzőit. Tevékenységek: ismeretszerzés fizika tanfolyamról (vagy segédkönyvekkel való munka). (, o. ??, 2. feladat)

Megoldás:

Úgy gondolják, hogy az ember által hallható frekvenciatartomány 20 Hz és 20 kHz között van. Így a Nyquist-Kotelnikov tétel szerint annak érdekében, hogy egy analóg jelet pontosan vissza lehessen állítani a diszkrét reprezentációjából (a mintáiból), a mintavételezési frekvenciának legalább kétszerese kell legyen a jel maximális hangfrekvenciájának. A maximális hangfrekvencia, amit egy személy hall, -20 kHz, ami azt jelenti, hogy az eszköz ra és szoftver legalább 40 kHz-es, pontosabban 44,1 kHz-es mintavételezési frekvenciát kell biztosítania. A szimfonikus zenekar hangjának számítógépes feldolgozása többet foglal magában magas frekvencia mintavételezés, mint beszédfeldolgozás, mivel a frekvenciatartomány egy szimfonikus zenekar esetében sokkal nagyobb.

Válasz: nem kevesebb, mint 40 kHz, a szimfonikus zenekar mintavételi frekvenciája magasabb.

"5" szint

17. Az ábra a felvevő által rögzített 1 másodperces beszéd hangját mutatja. Kódolja bináris digitális kódba, amelynek frekvenciája 10 Hz és kódhossza 3 bit. (, o. ??, 1. feladat)

Megoldás:

A 10 Hz-es kódolás azt jelenti, hogy másodpercenként 10-szer kell megmérnünk a hangmagasságot. Válasszunk egyenlő távolságra lévő időpillanatokat:

A 3 bites kód 2 3 = 8 kvantálási szintet jelent. Azaz a hangmagasság számkódjaként minden kiválasztott időpillanatban a következő kombinációk egyikét állíthatjuk be: 000, 001, 010, 011, 100, 101, 110, 111. Ebből csak 8 van, ezért , a hangmagasság 8 "szinttel" mérhető:

A hangmagasság értékeket a legközelebbi alacsonyabb szintre „kerekítjük”:

Használata ez a módszer kódolással a következő eredményt kapjuk (szóközök vannak beállítva az olvashatóság érdekében): 100 100 000 011 111 010 011 100 010 110.

Jegyzet. Célszerű felhívni a tanulók figyelmét arra, hogy a kód mennyire pontatlanul közvetíti az amplitúdó változását. Vagyis a 10 Hz-es mintavételezési frekvencia és a 2 3 (3 bites) kvantálási szint túl kicsi. Általában hanghoz (hanghoz) 8 kHz-es mintavételezési frekvenciát, azaz 8000-szer másodpercenként, és 2 8 kvantálási szintet (8 bites kód) választanak.

Válasz: 100 100 000 011 111 010 011 100 010 110.

18. Magyarázza meg, miért a kvantálás szintje a mintavételezési frekvenciával együtt a hang számítógépes reprezentációjának egyik fő jellemzője! Célok: megszilárdítani a tanulók megértését az „adatábrázolás pontossága”, „mérési hiba”, „ábrázolási hiba” fogalmakkal kapcsolatban; tekintse át a bináris kódolást és a kód hosszát a tanulókkal. A tevékenység típusa: munka fogalmak meghatározásával. (, o. ??, 3. feladat)

Megoldás:

A geometriában, a fizikában és a technológiában létezik a „mérési pontosság” fogalma, amely szorosan kapcsolódik a „mérési hiba” fogalmához. De ott van a koncepció is "ábrázolási pontosság". Például egy személy magasságáról azt mondhatjuk, hogy: a) kb. 2 m, b) valamivel több, mint 1,7 m, c) egyenlő 1 m 72 cm-rel, d) egyenlő 1 m 71 cm 8 mm-rel. Azaz 1, 2, 3 vagy 4 számjegy használható a mért növekedés jelzésére.
Ugyanez igaz a bináris kódolásra is. Ha csak 2 bitet használnak a hangmagasság rögzítésére egy adott időpontban, akkor még ha a mérések pontosak is voltak, csak 4 szintet lehet továbbítani: alacsony (00), átlag alatti (01), átlag feletti (10), magas (11). Ha 1 bájtot használ, 256 szintet vihet át. Hogyan magasabb kvantálási szint, vagy, ami megegyezik a Minél több bit van allokálva a mért érték rögzítésére, annál pontosabb az érték továbbítása.

Jegyzet. Figyelembe kell venni, hogy a mérőeszköznek is támogatnia kell a kiválasztott kvantálási szintet (nincs értelme a vonalzóval mért hosszt deciméteres osztásokkal milliméteres pontossággal ábrázolni).

Cél. A hanginformáció konvertálásának folyamatának megértése, a hanginformáció mennyiségének kiszámításához szükséges fogalmak elsajátítása. Tanulj meg problémákat megoldani a témában.

A cél a motiváció. Felkészülés a vizsgára.

Tanterv

1. Nézzen meg egy prezentációt egy témában tanári megjegyzésekkel. 1. melléklet

Prezentációs anyag: Hangos információ kódolása.

A 90-es évek eleje óta személyi számítógépek lehetőséget kapott a megbízható információkkal való munkavégzésre. Minden számítógép, amely rendelkezik hangkártyával, mikrofonnal és hangszórókkal, képes hanginformációkat rögzíteni, tárolni és lejátszani.

A hanghullámok bináris kóddá alakításának folyamata a számítógép memóriájában:

A számítógép memóriájában tárolt hanginformációk reprodukálásának folyamata:

Hang egy folyamatosan változó amplitúdójú és frekvenciájú hanghullám. Minél nagyobb az amplitúdó, annál hangosabb egy személy számára, minél nagyobb a jel frekvenciája, annál magasabb a hang. A számítógépes szoftver jelenleg lehetővé teszi, hogy egy folyamatos hangjelet elektromos impulzusok sorozatává alakítsanak, amelyekben ábrázolható bináris forma. A folyamatos hangjel kódolásának folyamatában az idődiszkretizálás . A folyamatos hanghullám külön kis időszakaszokra van felosztva, és minden ilyen szakaszhoz be van állítva egy bizonyos amplitúdóérték.

Így a jel amplitúdójának folyamatos időfüggősége Nál nél) helyébe a hangerőszintek diszkrét sorozata lép. A grafikonon ez úgy néz ki, mintha egy sima görbét „lépések” sorozatára cserélnénk. Minden „lépéshez” hozzá van rendelve egy érték a hangerő szintjéhez, kódjához (1, 2, 3 stb.

További). A hangerőszintek a lehetséges állapotok halmazának tekinthetők, illetve minél több hangerőszint kerül kiosztásra a kódolási folyamat során, annál több információt hordoz az egyes szintek értéke, és annál jobb lesz a hang.

Audio adapter ( hangkártya) - egy számítógéphez csatlakoztatott speciális eszköz, amelyet arra terveztek, hogy a hangfrekvencia elektromos rezgését numerikus bináris kóddá alakítsa hang bemenetekor, és fordított átalakításra (numerikus kódról elektromos rezgésekre) hang lejátszásakor.

A hangrögzítés során az audioadapter egy bizonyos periódussal méri az elektromos áram amplitúdóját, és beírja a kapott érték bináris kódját a regiszterbe. Ezután a regiszterből kapott kód átíródik a számítógép RAM-jába. A számítógépes hang minőségét az audioadapter jellemzői határozzák meg:

  • Mintavételi gyakoriság
  • Bitmélység (a hang mélysége).

Időbeli mintavételi sebesség

Ez a bemeneti jel méréseinek száma 1 másodperc alatt. A frekvenciát hertzben (Hz) mérik. Egy másodpercenkénti mérés 1 Hz-es frekvenciának felel meg. 1000 mérés 1 másodperc alatt - 1 kilohertz (kHz). Az audioadapterek tipikus mintavételezési gyakorisága:

11 kHz, 22 kHz, 44,1 kHz stb.

A regiszter bitmélysége (hangmélység) az audioadapter regiszterében lévő bitek száma, amely beállítja a lehetséges hangszintek számát.

A bitmélység határozza meg a bemeneti jel mérésének pontosságát. Minél nagyobb a bitmélység, annál kisebb a hiba az elektromos jel magnitúdójának minden egyes számmá történő átalakításakor, és fordítva. Ha a bitmélység 8 (16), akkor a bemeneti jel mérésekor 2 8 = 256 (2 16 = 65536) különböző értékeket kaphatunk. Nyilvánvaló, hogy egy 16 bites audioadapter pontosabban kódolja és reprodukálja a hangot, mint egy 8 bites. A modern hangkártyák 16 bites hangkódolási mélységet biztosítanak. A különböző jelszintek (egy adott kódolás állapota) száma a következő képlettel számítható ki:

N = 2 I = 2 16 = 65536, ahol I a hang mélysége.

Így a modern hangkártyák 65536 jelszintet képesek kódolni. Az audiojel amplitúdójának minden értékéhez 16 bites kód tartozik. Nál nél bináris kódolás folyamatos hangjelet, azt diszkrét jelszintek sorozata váltja fel. A kódolás minősége az időegységenkénti jelszint mérések számától függ, pl. mintavételi ráta. Minél több mérést végeznek 1 másodperc alatt (minél nagyobb a mintavételi sebesség, annál pontosabb a bináris kódolási eljárás.

Hangfájl - egy fájl, amely a hanginformációkat bináris numerikus formában tárolja.

2. Ismételjük az információ mértékegységeit

1 bájt = 8 bit

1 KB = 2 10 bájt = 1024 bájt

1 MB = 2 10 KB = 1024 KB

1 GB = 2 10 MB = 1024 MB

1 TB = 2 10 GB = 1024 GB

1 PB = 2 10 TB = 1024 TB

3. Rögzítse a tanult anyagot az előadás, a tankönyv megtekintésével

4. Problémamegoldás

A megoldást bemutató bemutató az előadáson.

1. feladat. Határozza meg az 1 másodperces hangtartamú sztereó audiofájl információs hangerejét, kiváló hangminőség mellett (16 bit, 48 kHz).

Feladat (önálló). A megoldást bemutató bemutató az előadáson.
Határozza meg egy 10 másodperces, 22,05 kHz-es mintavételi frekvenciával és 8 bites felbontású digitális audiofájl információmennyiségét.

5. Rögzítés. Problémák megoldása otthon, önállóan a következő leckében

Határozza meg a tárhely méretét egy olyan digitális audiofájl számára, amelynek lejátszási ideje 2 perc 44,1 kHz-es mintavételezési frekvenciával és 16 bites felbontással.

A felhasználó memóriája 2,6 MB. 1 perces időtartamú digitális hangfájlt kell rögzítenie. Mekkora legyen a mintavételezési sebesség és a bitmélység?

A lemezen a szabad memória mennyisége 5,25 MB, a hangkártya bitmélysége 16. Mennyi ideig szól a 22,05 kHz-es mintavételezési frekvenciával rögzített digitális hangfájl?

Egy digitális hangfájl rögzítésének egy perce 1,3 MB-ot foglal el a lemezen, a hangkártya bitmélysége 8. Milyen mintavételezési frekvenciával rögzítették a hangot?

Mennyi tárhelyre van szükség egy kiváló minőségű, 3 perces lejátszási idővel rendelkező digitális audiofájl tárolásához?

A digitális hangfájl gyenge minőségű hangfelvételt tartalmaz (a hang sötét és tompa). Mennyi ideig szól egy fájl, ha a hangereje 650 KB?

Két percnyi digitális hangfelvétel 5,05 MB lemezterületet foglal el. Mintavételi frekvencia - 22 050 Hz. Mekkora az audioadapter bitessége?

A lemezen a szabad memória mennyisége 0,1 GB, a hangkártya bitmélysége 16. Mennyi ideig szól a 44 100 Hz-es mintavételezési frekvenciával rögzített digitális hangfájl?

Válaszok

No. 92. 124,8 másodperc.

No. 93. 22,05 kHz.

No. 94. A kiváló hangminőség 44,1 kHz-es mintavételezési frekvenciával és 16-os audioadapter bitmélységgel érhető el. A szükséges memóriaméret 15,1 MB.

No. 95. A komor és tompa hangra a következő paraméterek jellemzőek: mintavételi frekvencia - 11 kHz, audio adapter bitmélysége - 8. A hang időtartama 60,5 s.

No. 96. 16 bit.

No. 97. 20,3 perc.

Irodalom

1. Tankönyv: Informatika, gyakorlati munkafüzet, 1. kötet, szerkesztette I.G. Semakin, E.K. Henner)

2. Pedagógiai ötletek fesztiválja "Nyílt lecke" Hang. Hanginformáció bináris kódolása. Supryagina Elena Aleksandrovna, számítástechnikai tanár.

3. N. Ugrinovich. Informatika és információs technológiák. 10-11 évfolyam. Moszkva. Binomiális. Tudáslabor 2003.