Digitaalne heli: erinevus redaktsioonide vahel

Eemaldatud sisu Lisatud sisu
MPihlap (arutelu | kaastöö)
+ ülevaade
MPihlap (arutelu | kaastöö)
Lisatud sisu
23. rida:
 
Digitaalset helisignaali on võimalik kodeerida, parandamaks vigu, mis võivad tekkida signaali salvestamisel või edastamisel, kuid see ei ole otseselt digitaalse heli tekitamise protsessi osa. Seda tehnikat nimetatakse "kanalikodeerimiseks" ning see on hädavajalik bittide täpsuse säilitamiseks digitaalse heli salvestamisel. 
 
=== Ajalugu ===
Impulss-koodmodulatsioon leiutati umbes 80 aastat tagasi, kui Alec Reeves, töötades ITT (International Telephone and Telegraph) heaks tegi ettepaneku, et selle asemel, et esitada heli sujuvalt muutuva elektrisignaalina (originaalheli "analoogina"), oleks võimalik võtta pingest perioodilisi hetkväärtusi ja salvestada neid kui binaarnumbrite jada. Reeves mõistis, et neid hetkväärtusi oleks võimalik ainult teatud täpsusega mõõta, kuid ta arvas, et mõõtevigade amplituudid oleksid vähem märgatavad kui analoogsignaali puhul elektrimüra ja tolleaegsete seadmete kvaliteedi poolt tekitatavad vead.
 
Mida Reeves ei kaalunud (ja mille jaoks puudusid katsetamismeetodid) oli see, et kas need väiksemad vead oleks rohkem või vähem häirivad, kui suhteliselt healoomuline sahin, mis käis kaasas analoogsignaaliga. Sellest hoolimata oli tema ideede ulatus muljetavaldav ja kui ta need 1937. aastal patenteeris, siis ta väitis, et kui diskreetide peal ei rakendata ühtegi matemaatilist tehet, siis sõltub digitiseeritud heli kvaliteet vaid kasutatavatest A-D ja D-A muunduritest. See oli sel ajal väga julge väide, kuid on osutunud õigeks.
 
Reevesi ideed põhinesid, oli ta sellest teadlik või mitte, tublisti suhteliselt uuel matemaatika harul, milleks oli diskreetajastusega signaali töötlus, mille kõige olulisemaks väljundiks on diskreetimisteoreem. Diskreetimisteoreem püstitati esmaselt juba 1915. aastal ning väidab, et kui signaal ei sisalda kõrgemaid sagedusi kui "B" (ribalaius), siis on võimalik seda signaali täielikult kindlaks teha regulaarsete vahedega diskreetide abil, juhul, kui diskreetimissagedus on kõrgem kui 2 x B. See tähendab, et kui on tarvis diskreetida helisignaali, mille kõrgeim sagedus on 20 kHz, siis on mis tahes sagedus üle 40 kHz selle jaoks piisav.
 
Siis, kui Reeves oma ideed patenteeris, ei olnud võimalik diskreete piisavalt kiiresti salvestada, et katta ära kogu inimeste kuuldavate sageduste vahemikku, milleks peetakse üldiselt 20 Hz - 20 kHz. See muutus aastal 1947, kui leiutati transistor. Kuigi esimesed transistorid olid liiga aeglased, siis veerand sajandit tehnoloogilist arengut viisid transistorid kiirusteni, millega olid võimalikud digitaalsed heliseadmed.
 
Esimene kaubanduslik digitaalne diktofon, Soundstream, ilmus 1975. aastal ja kasutas kahte seadet, et lindistada: PCM konverterit, mis diskreetis sisendsignaali ja seejärel muundas numbrid video tüüpi signaaliks ning videosalvesti piisava ribalaiusega (üle 1 MHz), mis oli vajalik nende andmete salvestamiseks.
 
=== Digitaalseks diskreetimine ===
Kõik helid, mida me kuuleme, on õhus liikuvad rõhulained. Alates Thomas Edisoni tutvustatud esimesest fonograafist 1877. aastal, on võimalik neid rõhulaineid jäädvustada füüsilisel kandjal ning seejärel neid taasluua, neid samu rõhulaineid hiljem uuesti genereerides. Heli rõhulained, või lainekujud, näevad välja sellised:
 
WaveformAbstract.png
 
Analoogsalvestusseadmed nagu fonograaf kujutavad lainekuju otse, kasutades soone sügavust plaadil või magneetumuse ulatust lindi puhul. Analoogsalvestised suudavad taastekitada märkimisväärseid erinevaid helisid, kuid ta kannatab ka müraprobleemide all. Iga kord, kui analoogsalvestist kopeeritakse, tekib sinna rohkem müra, mis vähendab salvestuse kvaliteeti. Seda müra saab vähendada, kuid mitte täielikult kõrvaldada.
 
Digitaalsalvestus toimib erinevalt: lainekujust võetakse perioodiliselt hetkväärtused, millele seatakse vastavusse täpsed arvud. Digitaalsete salvestuste kvaliteet, olgu nad siis salvestatud kas kompaktkettale (CD), digitaalhelikassettile (DAT) või siis arvutisse, ei lange aja jooksul ning neid salvestusi on võimalik täiuslikult kopeerida, ilma kopeerimise käigus uut müra tekitamata. Järgnev pilt illustreerib diskreeritud heli lainekuju:
 
Waveform digital.png
 
Lisaks on võimalik digitaalse heli korral kasutada mitmeid digitaalseid efekte, näiteks simuleerida kaja, tuua esile teatud sagedusi või muuta helikõrgust.
 
=== Digitaalse heli kvaliteet ===
Digitaalse helisalvestuse kvaliteet sõltub suuresti kahest tegurist: diskreetimissagedusest ja bitisügavusest. Diskreetimissageduse suurendamine parandab salvestuse kvaliteeti, kuid suurendab ühtlasi kasutatavat andmemahtu.
 
==== Diskreetimissagedused ====
Diskreetimissagedusi mõõdetakse hertsides (Hz), või tsüklites sekundis. See väärtus tähistab lainekuju esitamisel sekundis talletatud hetkväärtuste arvu. Kõrgemad diskreetimissagedused võimaldavad esitada kõrgemaid helisagedusi. Tingimusel, et diskreetimissagedus on enam kui kaks korda suurem kõrgeimast helisagedusest, on võimalik lainekuju digitaalsete diskreetide põhjal täpselt taastada.
 
Sagedusi, mis on alla poole diskreetimissageduse ei ole võimalik digitaalselt diskreetidena täpselt esitada. Sellised sagedused tuleb olemasolu korral enne heli digitaalseks teisendamist eemaldada. "Pool diskreetimissagedust" kujutab endast seega ülempiiri, mida nimetatakse Nyquisti sageduseks ja analoog lainekuju sagedus peab olema täielikult allpool seda piiri, et seda oleks võimalik korrektselt digitaalselt esitada. Analoogsignaalid, mille sagedused on selle piiriga võrdsed või kõrgemad, ei ole diskreetides esitatavad ning tekitavad moonutust, mida nimetatakse sakilisuseks.
 
Inimkõrv on tundlik helidele vahemikus umbes 20 Hz kuni 20 000 Hz. Helid väljaspool neid piire ei ole kuuldavad. Seetõttu on diskreetimissagedus 40 000 Hz absoluutne miinimum, esitamaks kõiki inimesele kuuldavaid helisid. Kõrgemaid sagedusi kasutatakse tavaliselt Nyquisti sageduse ümber tekkiva sakilisuse filtreerimiseks. Seda nimetatakse ülediskreetimiseks.
 
Heli kandvad CD plaadid kasutavad diskreetimissagedust 44100 Hz. Inimkõne on arusaadav isegi siis, kui kõik sagedused üle 4000 Hz eemaldada. Telefonid edastavad ainult sagedusi vahemikus 200 Hz ja 4000 Hz. Seetõttu on levinud diskreetimissageduseks 8000 Hz, mida nimetatakse vahepeal kõnekvaliteediks. Tasub märkimist, et Nyquisti sagedusel on tarvis väga järsku filtreerimist, et signaale sellest piirist kõrgemal ei teisendataks tagasi kuuldavale sagedusele ja ei tekiks sakilisusest tulenevaid moonutusi.
 
Kõige tavalisemateks diskreetimissagedusteks  hertsides on 8000, 16000, 22050, 44100, 48000, 96000 ja 192000. Diskreetimissagedustest räägitakse ka kilohertsides. Niisiis ühikutes kHz on levinumad sagedused 8 kHz, 16 kHz, 22.05 kHz, 44.1 kHz, 48 kHz, 96 kHz ja 192 kHz.
 
Kõige levinum diskreetimissagedus on 44100 Hz.
 
Allpool oleval joonisel on vasakul madal diskreetimissagedus ja paremal kõrge diskreetimissagedus (st. suure eraldusvõimega):
 
Waveform sample rates.png
 
==== Bitisügavus ====
Teine helikvaliteedi mõõdis on bitisügavus, mida mõõdetakse tavaliselt ühe diskreedi kujutamiseks kasutatavate arvutibittide arvuna. Mida rohkem bitte diskreedi kohta, seda täpsem on iga diskreedi esitus. Bittide arvu suurendamine suurendab ühtlasi lindistuse dünaamilist diapasooni, ehk teisisõnu, kõige valjema ja vaiksema helitugevuse suhet.
 
Dünaamilist diapasooni mõõdetakse detsibellides. Inimkõrv tajub helisid, mille dünaamiline diapasoon on vähemalt 90 dB, kuid kui vähegi võimalik, siis on hea mõte salvestada digitaalset heli dünaamilise diapasooniga, mis on palju suurem kui 90 dB, et oleks võimalik liiga vaikseid helisid võimendada. Tasub märkimist, et kuigi üldiselt on võimalik madalatel helitugevustel salvestatud signaale kogu olemasoleva dünaamilise diapasooni ära kasutamiseks võimendada, ei kasutata madalate signaalide salvestamisel ära kogu saadavat bitisügavust. Seda resolutsiooni kaotust ei ole võimalik lihtsalt digitaalse lainekuju normaliseerimisega tasa teha.
 
Levinud bitisügavused ja nende vastavad dünaamilised diapasoonid:
 
8-bitine täisarv: 48 dB
 
16-bitine täisarv: 96 dB
 
24-bitine täisarv: 145 dB
 
32-bitine ujukomaarv: praktiliselt lõpmatu dB
 
Tasub märkimist, et riistvara ja sisend-väljund muundurite suutlikkuse tõttu on dünaamilisel diapasoonil praktilised piirangud. Nende tõttu on 16-bitise sügavuse korral praktiline piir pigem 90 dB kandis.
 
Mõned formaadid, nagu näiteks ADPCM, kasutavad kokkusurutud 4-bitiseid diskreete, imiteerimaks 16-bitist heli. Audio-CD plaadid ja enamik heliformaate kasutavad 16-bitiseid täisarve. Alloleval pildil vasakul pool on madala bitisügavusega formaat ja paremal on formaat rohkemate bittidega. Kui mõelda diskreetimissagedusest kui vahest vertikaalsete joonte vahel, siis bitisügavus on vahe horisontaalsete joonte vahel.
 
Waveform sample formats.png
 
=== Helifailide maht ===
Helifailid on väga suured. Pakkimata helifaili suuruse määramiseks tuleb korrutada diskreetimissagedus (nt 44100 Hz) bitisügavusega (nt 16 bitti), audiokanalite arvuga (stereo puhul 2) ja sekundite arvuga. Täielikult täis kirjutatud 74 minutiline stereo audio CD kasutab üle 6 miljardi biti. Jagades selle arvu kaheksaga jõuame baitide arvuni. Audio CD plaat mahutab natuke alla 800 megabaidi (MB).
 
=== Maksimumide kärpimine ===
Üheks digitaalse heli piiranguks on, et see ei suuda käsitleda helilaineid, mis ületavad ülempiirid, millega töötamiseks on antud heliformaat mõeldud. Kui lindistatakse signaal, mis ületab maksimumväärtust, siis diskreedid väljaspool ülem- või alampiire kärbitakse vastava piirväärtuseni, nagu on näidatud järgneva pildi peal:
 
WaveformClippingAbstract.png
 
Nõnda kärbitud heli kõlab moonutatult ja rohmakalt. Kuigi on olemas mõned meetodid, mis suudavad kõrvaldada osa kärpimisest tekkinud müra, on alati eelistatav kärpimist lindistamise ajal vältida.
 
=== Tihendatud heli ===
Kuna digitaalsed helifailid on nii suured, kasutati tüüpiliselt kus vähegi võimalik vähendatud diskreetimissagedusega helifaile. See muutus aastal 1991, kui tuli välja MP3 (MPEG I, layer 3) standard. MP3 on kadudega pakkimismeetod, mis võib oluliselt vähendada helifaili mahtu üllatavalt väikese mõjuga heli kvaliteedile. Üks sekund CD-kvaliteediga heli võtab enda alla 1.4 megabitti, samas kui levinud bitisagedus MP3 failide jaoks on 128 kbps, mis on üle 10x väiksem! MP3 "viskab ära" lainekuju puudutavaid detaile, millele inimesed ei ole eriti tundlikud. Kõik MP3 failid ei ole samasugused; erinevad psühhoakustilised mudelid inimestest viivad erinevate tajutavate moondusteni.
 
Heade kõlaritega suudab enamik inimesi teha vahet 128 kbps MP3 formaadil ja tihendamata CD kvaliteediga helifailil. 256 kbps ja 320 kbps MP3 failid on populaarsemad audiofiilide seas, kes soovivad kõrgemat helikvaliteeti.
 
Tihendatud kadudega heliformaate on teisigi. Näiteks Ogg Vorbis formaat, mis on sarnane MP3 formaadile, kuid on täiesti patendivaba standard. Aegamisi on Ogg Vorbis formaadi kvaliteet MP3 kvaliteedi ületanud ja formaat ise on paindlikum, mis tähendab, et seda on võimalik veelgi parendada. OGG Vorbis on suurepärane valik oma heli jaoks, aga reaalsus on see, et paljud seadmed nagu iPodid ja muud kaasaskantavad helimängijad toetavad MP3 formaati, kuid mitte Ogg Vorbist.
 
Teiste tuntud pakkimismeetodite hulka kuuluvad Sony MiniDisc salvestite kasutatav ATRAC, Windows Media Audio (WMA) ja AAC.
 
==== Kadudeta tihendus ====
Kadudeta tihendus vähendab faili suurust ilma kvaliteeti kaotamata. Seda näiliselt maagilist meetodit failisuuruse vähendamiseks on võimalik rakendada ka helifailidele. Kui MP3 kasutab kadudega pakkimist, siis on uuemad pakkimisalgoritmid nagu näiteks FLAC ja Apple Lossless compression suutelised looma kadudeta tihendatud helifaile.
 
Selline pakkimine põhimõtteliselt kirjutab algse faili andmed efektiivsemalt ümber. Kuid kuna kvaliteet ei lange on nende meetoditega pakitud helifailid tüüpiliselt palju suuremad kui helifailid, mida on pakitud kadudega pakkimisega. Näiteks kadudega tihendatud helifail võib olla originaalist 10x väiksem, samas kui kadudeta tihendamisel on ebatõenäoline saavutada originaalfailist enam kui poole väiksem fail.
 
Kadudeta heliformaate kasutatakse enamasti kas tootmiseks või arhiveerimiseks, samas kui väiksemaid kadudega helifaile kasutatakse tavaliselt kaasaskantavates mängijates, kus on salvestusruum piiratud või on ebavajalik heli täpselt esitada.