Alkulause I sisällysluettelo II tiivistelmä III abstract IV lyhenteet V



Yüklə 254,85 Kb.
səhifə7/10
tarix21.08.2018
ölçüsü254,85 Kb.
#73985
1   2   3   4   5   6   7   8   9   10

4.2 Äänen pakkaaminen

Jotta ääntä voidaan pakata, täytyy se ensin muuttaa digitaaliseen muotoon sa-malla tavoin kuin analogista videosignaalia pakattaessa. Ääntä digitoitaessa sisään tulevasta analogisesta audiosignaalista otetaan sovitulla näytteenottotaa-juudella näyteitä. Saadut näytearvot sitten kvantisoidaan eli muutetaan halutulla resoluutiolla binääriluvuiksi. Mitä suurempaa näytteenottotaajuutta ja useampaa kvantisointitasoa käytetään, sitä tarkemmin digitoitu signaali vastaa alkuperäistä. Nyquistin teoreeman mukaan analogisesta signaalista pitää ottaa näytteitä vä-hintään kaksinkertaisella nopeudella verrattuna signaalin suurimpaan taajuu-teen, jotta sen digitoitu signaali vastaisi alkuperäistä. Ihmiskorva pystyy havait-semaan ääniä 20 Hz ja 20 kHz välillä ja vastaasti ihminen tuottaa tyypillisesti ää-niä 40 Hz ja 4 kHz välillä. Musiikin digitoimisessa ja pakkaamisessa käytetään huomattavasti suurempaa näytteenottotaajuutta ja useampia kvantisointitasoja kuin tavallisen puheen koodaamisessa. Esimerkiksi CD-standardissa käytetään 44 kHz:n näytteenottotaajuutta ja tavallisessa puhelimessa, ja useimmiten myös erilaisissa videoneuvottelujärjestelmissä 8 kHz:n näytteenottotaajuutta, joka var-sin hyvin riittää, koska suurimmat tyypilliset ihmisäänen tuottamat taajuudet ovat luokkaa 4 kHz. [Ke96]


Äänen pakkaamiseen on olemassa useita eri kompressiomenetelmiä. Yleisimpiä ovat ITU-T:n G.7xx sarjassa määrittelemät puheen pakkausmenetelmät, joita käytetään tavallisessa puhelinverkossa ja videoneuvottelusovelluksissa. Muun äänen kuin puheen koodaamiseen soveltuvat paremmin koko kuuloalueella toi-mivat koodausmenetelmät. Näistä yleisimpiä ovat ISO:n määrittelemät MPEG/audio, Philipsin ja Sonyn [StNa95] kehittämä CD-DA (Compact Disk-Digital Audio) ja BBC:n [Ke96] televisioon kehittämä NICAM.


4.2.1 G.7xx

Eräs yleisimmistä äänen pakkaamisessa käytetyistä menetelmistä on PCM (Pulse Code Modulation), jonka puhelinverkossa käytettävä versio on määritelty ITU-T:n standardissa G.711. Siinä käytetään 8 kHz näytteenottotaajuutta, loga-ritmista kvantisointitaulukkoa (A- tai -lain mukaista) ja 8 bitin resoluutiota, jolloin siirettävän puhevirran nopeudeksi tulee 64 kbit/s. Koska ihmiskorva ei ole yhtä herkkä kaikille äänille käytetään logaritmista kvantisointia äänen laadun paran-tamiseksi. Käytettäessä logaritmista kvantisointia päästään 8 bitillä saamaan laatutasoon kuin noin 14 bitillä ja lineaarisella kvantisoinnilla päästäisiin. [Ke96]


PCM:stä on edelleen kehitetty tehokkaampia pakkausmetelmiä, kuten ADPCM (Adaptive Differential Pulse Code Modulation) ja SB-ADPCM (Sub-Band ADPCM), jotka on määritelty muun muassa ITU-T:n standardissa G.722. Käy-tettävä näytteenottotaajuus on nostettu 7 kHz:iin, jolloin päästään parempaan äänenlaatuun. Itse koodaus perustuu samanlaiseen ideaan kuin liikekompen-soinnissa. Todennäköisyys sille, että peräkkäiset näytteet ovat melko samanlai-sia, on suuri, ja seuraava näyte voidaan ennustaa käyttäen hyväksi nykyistä ja edellistä näytettä. Koodausalgoritmi laskee laskee näytteen ja siitä tehdyn en-nusteen ja koodaa vain näiden erotuksen. Tämän koodaamiseen tarvitaan yleensä vähemmän bittejä kuin koko näytteen koodaamiseksi. G.722:ssa käy-tettävät puhevirran nopeudet ovat 64 kbit/s:n lisäksi joko 56 kbit/s tai 48 kbit/s [Sc96]. Alle 64 kbit/s nopeuksilla loppu siirtokapasiteetti käytetään datan siirtä-miseen. [Ke96]
Vielä tehokkaampaa pakkausta käytetään ITU-T:n standardeissa G.728 ja G.729. G.728:ssa käytettävällä CELP:hen (Code Excited Linear Prediction) pe-rustuvalla LD-CELP (Low Delay-CELP) menetelmällä voidaan hyvälaatuista pu-hetta siirtää jo 16 kbit/s nopeudella. G.729:ssa käytettävällä CS-ACELP (Conjugate Structure Algebraic Codebook Excitation Linear Prediction) mene-telmällä päästään jopa 8 kbit/s:n nopeuteen. Molemmat menetelmät perustuvat ennustamiseen ja vaativat monimutkaisten koodausalgoritmien vuoksi melkoista laskentatehoa käytettävältä prosessorilta. [Sc96]

4.2.2 Muita äänen digitointi- ja pakkausmenetelmiä

CD-levyillä käytetyssä CD-DA:ssa on 44.1 kHz näytteenottotaajuus ja 16 bitin resoluutio, jolloin audiovirran siirtonopeudeksi tulee noin 1.5 Mbit/s käytettäessä molempia kanavia. CD-DA ei ole varsinaisesti mikään pakkausmenetelmä. Se ainoastaan muuttaa analogisen signaalin digitaaliseksi lineaarisella kvantisoin-nilla. Tämän ansiosta levyllä oleva ääni on saatu pysymään erittäin hyvälaatui-sena.


MPEG/audio kuuluu yhtenä osana yhdessä koko MPEG-standardiin, jonka muut osat ovat video ja ääni/video. MPEG/audion yleisimmät versiot ovat MPEG-1/audio ja MPEG-2/audio. Molemmat on tarkoitettu erilaisille audiolähteille ja ne koodaavat myös kaikki korkeammat ihmiskorvalla kuultavat äänet. MPEG-1/au-dio mahdollistaa äänen koodamisen yhdellä tai kahdella kanavalla, usealla eri bittinopeudella sekä kolmella eri kompressiotasolla. Näiden lisäksi voidaan käyttää virheenkorjausta ja lisä-datakanavaa. Käytettävät näyteenottotaajuudet ovat 32 kHz, 44.1 kHz ja 48 kHz. MPEG-2/audio sisältää näiden taajuuksien lisäksi niiden puolinopeudet. MPEG-2/audio mahdollistaa myös monikanava-ää-nituen (kanava 5.1, jossa on kaksi etukanavaa, kaksi takakanavaa, keskikava ja erillinen matalien taajuuksien kanava), monikielisen äänituen (7 ylimääräistä ää-nikanavaa), sekä hitaampia kompressoituja bittinopeuksia. [Ke96]
NICAM:ssa sisääntulevasta signaalista otetaan 32 kHz:n taajuudella näytteitä, jotka sitten muutetaan14-bittisiksi binääriluvuiksi. Sen jälkeen companding-me-netelmällä muutetaan 14-bittinen signaali 10-bittiseksi. NICAM-järjestelmää käytetään nykyisin useimmissa televisioissa ja videoissa stereolähetysten vas-taanottoon. Se mahdollistaa stereofonisten lähetysten lisäksi kaksikieliset lähe-tykset, jolloin toinen äänikanava on koodattu vasempaa kanavaan ja toinen oike-aan. [Ke96]

4.3 Videoneuvottelulaitteistot

Videoneuvottelulaitteistot luokitellaan tavallisesti kolmeen luokkaan niiden fyy-sisten kokoonpanojen mukaan: desktop-laitteistoihin, Roll-about-laitteistohin ja kiinteästi johonkin tilaan asennettuihin laitteistoihin [Sc96]. Varsinaisen video-neuvottelun mahdollistavan laitteiston lisäksi vaadittavat laitteet, kuten videoka-merat, televisiot, mikrofonit, kaiuttimet ja muut lisälaitteet ovat pitkälle samoja kaikissa ympäristöissä. Niille asettaa vaatimuksia lähinnä neuvotteluun tai ope-tukseen osallistuvan joukon määrä. Merkitystä on myös sillä kuinka moni ottaa interaktiivisesti osaa varsinaiseen videoneuvotteluun ja kuinka moni vain seuraa etäpaikalta tulevaa videokuvaa ja puhetta.


Laitteistojen hinnoissa on kuitenkin merkittäviä eroja. Kun desktop-laitteiston voi tällä hetkellä ostaa jo olemassa olevaan tietokoneeseen reilulla kymmenellä tu-hannella markalla [Hä96], on Roll-about laitteistojen ja kiinteiden laitteistojen hinnat ovat huomattavasti korkeampia. Toisaalta käyttövarmuus on parempi kun hankitaan Roll-about- tai kiinteä laitteisto, koska ne on suunniteltu ainoastaan videoneuvottelukäyttöön. Tavallisella PC-koneella on yleensä muutakin käyttöä kuin pelkkä videoneuvottelu ja siinä saattaa lisäksi olla asennettuna paljon muita kortteja ja ohjelmistoja, mitkä aiheuttavat erilaisia ongelmia videoneuvottelussa.

4.3.1 Desktop-laitteet

Desktop-laitteistojen pohjana on tavallinen PC-tietokone, johon asennetaan vi-deoneuvottelussa vaadittavat lisäkortit. Lähetettävää ja vastaanotettavaa video-kuvaa ja ääntä varten on tietokoneeseen asennettava video/audiokoodekkikortti. Video- ja audio-osat on tavallisesti integroitu samalle kortille tai käytetään tytär/emokortti ratkaisua [Bi95], jossa audio-kortti liitetään yhdyskaapelilla video-korttiin. Koodekkikortin lisäksi tarvitaan verkkokortti, joka vastaa varsinaisesta datan siirrosta koneen ja tietoverkon välillä. Uusimpiin koodekkeihin on usein kiinteästi integroitu ISDN-kortti, jolloin muuta verkkokorttia ei välttämättä tarvita lainkaan. Osaa laitteistoista voidaan käyttää myös esimerkiksi TCP/IP:tä tukevis-sa lähiverkoissa, kuten Ethernetissa tai LANE:ssa [Hä96]. Jos videoneuvottelua halutaan käyttää myös näissä verkoissa, on tietysti hankittava kyseisen median vaatima verkkokortti. Koodekin ja verkkokortin lisäksi tarvitaan puhelinluuri, tai mikrofoni ja kaiutin, sekä jonkinlainen videokamera.


Desktop-laitteistot on suunniteltu käytettäväksi yksin tai hyvin pienellä osallis-tujajoukolla [Sc96]. Jo yksin tavallisen tietokoneissa käytettävän monitorin fyy-sinen koko asettaa selkeät rajoitukset neuvottelussa mukana olevalle joukolle. Jos desktop-laitteistoa halutaan käyttää suuremmalla osallistujamäärällä on monitorin lisäksi hankittava jokin muu esityslaite, kuten videotykki tai siirtohei-tin/piirtoheitin yhdistelmä. Usein desktop-laitteistojen peruskokoonpanossa mik-rofonin ja kaiuttimen virkaa hoitaa tavallinen puhelimen luuri tai sankaluuri, jolloin useamman henkilön osallistuminen neuvotteluun samasta pisteestä on melko mahdotonta [Hä96]. Useimpiin laitteistoihin saadaan kuitenkin liitettyä eri-laisia ulkoisia mikrofoneja ja kaiuttimia, mikä mahdollistaa suuremman joukon osallistumisen neuvotteluun. Kameraksi videoneuvottelukäyttöön sopii periaat-teessa millainen videokamera tahansa, kunhan vain siitä saadaan ulos sellainen signaali, jonka käytettävä videokoodekki ymmärtää. Joihinkin koodekkikortteihin on myös mahdollista liittää useita videokameroita, jolloin lähetettävää kuvaa voi-daan vaihdella esimerkiksi varsinaisen puhujan ja yleisön välillä tai toisella ka-meralla kuvataan jotain dokumenttia vastapuolen nähtäväksi.




Kuva 4-2. Sonyn TriniCom 500 desktop-videoneuvottelulaitteisto.

4.3.2 Roll-about-laitteet

Roll-about-laitteisto on kokonaisuus, joka on suunniteltu ainoastaan videoneu-vottelua silmälläpitäen. Videoneuvottelulaitteistojen keskiluokkaan sijoittuvien Roll-about-laitteiden erityisiä vahvuuksia ovat parempi käyttövarmuus kuin Desktop-laitteilla, sekä pienemmät kustannukset ja siirtelymahdollisuus verattu-na kiinteisiin laitteistoihin [Mi96]. Tyypillisesti laitteisto koostuu pyörillä liikkuvasta alustasta, jolle on koottu kaikki tarvittavat videoneuvottelussa tarvittavat kom-ponentit. Hallitsevana osana laitteistossa on suuri televisio tai televisiot, jotka toimivat näyttölaitteena. Joskus mukana saattaa olla myös pienempi televisio-ruutu, josta voidaan seurata lähetettävää kuvaa. Video/audiokoodekki ja verkko-sovitin on kasattu erilliseen koteloon, jossa on liittimet käytettäville videokame-roille, mikrofoneille ja kaiuttimille. Useimmiten kauttimien virkaa hoitavat televisi-on omat kaiuttimet. Nykyisin on saatavana myös laitteita, jotka sisältävät kaiken muun paitsi näyttönä käytettävän television. Laitteeseen on integroitu koodekki, verkkosovitin, kamera ja mikrofoni, ja se voidaan liittää suoraan tavalliseen tele-visioon. Tämän lisäksi tarvitaan tietysti ISDN-liittymä.







Kuva 4-3. Kuvassa vasemalla Sonyn valmistama Roll-about-laitteisto

(Trinicom 5100) ja oikealla laitteisto, joka voidaan pystyttää

tavallisen television ympärille (PictureTel SwiftSite).
Laitteistot on suunniteltu muutamalle henkilölle. Käytettävät linjanopeudet vaih-televat 128 kbit/s:ssa (yksi ISDN-linja) 384 kbit/s:iin (kolme ISDN-linjaa). Laitteis-ton ohjaaminen tapahtuu tavalllisesti kauko-ohjaimen avulla televisioruudun toi-miessa näyttönä.

4.3.3 Kiinteästi asennetut laitteistot

Videoneuvottelulaitteet voidaan asentaa myös kiinteästi johonkin niille varattuun tilaan. Laitteiston ydin on usein vastaavanlainen kuin Roll-about-laitteistoissa si-sältäen koodekin ja verkkosovittimen. Laitteiston ohjaus voidaan hoitaa saman-laisella television kautta toimivalla käyttöliittymällä tai esimerkiksi PC:n kautta, sillä laitteistoa ei tarvitse siirrellä, ja PC voidaan kytkeä suoraan videoneuvottelu-laitteistoon kiinteästi. Käytetyt linjanopeudet voivat vaihdella 128 kbit/s ja 1920 kbit/s välillä [Sc96].


Videoneuvottelutilat on tavallisesti varustettu useilla suurilla TV-monitoreilla, kiin-teästi sijoitetuilla videokameroilla ja mikrofoneilla, mikä mahdollistaa suurenkin joukon yhtäaikaisen osallistumisen videoneuvotteluun tai opetukseen samasta tilasta. Lähettävän mikrofonin ja kameran valinta voidaan hoitaa joko automaat-tisesti äänestä ohjautuvalla järjestelmällä tai manuaalisesti ohjauspaneelista. Automaattisesti ohjautuva järjestelmä perustuu äänestä aktivoituviin mikrofonei-hin. Kun henkilö alkaa puhua, häntä lähinnä oleva mikrofoni aktivoituu ja valitsee samalla sen videokameran, joka on yhdistetty toimimaan yhdessä kyseisen mikrofonin kanssa. Usein henkilökameroiden lisäksi tilaan asennetaan vähintään yksi dokumenttikamera. Kamera voidaan asentaa esimerkiksi kattoon lähelle esiintyjän paikkaa, jolloin hän halutessaan voi lähettää oman kuvansa sijaan ku-vaa jostakin dokumentista. Molemmat kuvat voidaan myös lähettää yhtä aikaa yhdistämällä ne mikserillä. Puhuja voi esitystä tehdessä huomioida tämän mah-dollisuuden ja jättää vaikka esitysmateriaaliinsa vasempaan yläkulmaan sen verran tilaa, että sinne voidaan lisätä pieni kuva puhujasta ilman että se peittää mitään. Samaa ratkaisua voidaan toki käyttää myös muiden laitteistojen yhtey-dessä niin haluttaessa, mikäli käytössä on erillinen dokumenttikamera ja mikseri.


Yüklə 254,85 Kb.

Dostları ilə paylaş:
1   2   3   4   5   6   7   8   9   10




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©muhaz.org 2024
rəhbərliyinə müraciət

gir | qeydiyyatdan keç
    Ana səhifə


yükləyin