Mavzu: mpeg-1 standartining video va ovoz tashkil etuvchisi



Yüklə 40,21 Kb.
tarix13.12.2023
ölçüsü40,21 Kb.
#139841
MPEG-1 standartining video va ovoz tashkil etuvchisi


Mavzu: MPEG-1 standartining video va ovoz tashkil etuvchisi
0. Audio va videoni siqish bilan shug'ullanadigan bir guruh odamlar mavjud. Ular o'zlarini Moving Picture Expert guruhi (video va audio siqish bo'yicha mutaxassislar guruhi) deb atashadi. Ular deyarli barcha ishlab chiqaruvchilar rioya qiladigan standartlar to'plamini ishlab chiqdilar. Ushbu standartlar MPEG deb ataladi - inglizcha qisqartmalardan keyin.
1. Hammasi MPEG standartidan boshlanadi. Bu audio va video oqimlari, shuningdek, ularning o'zaro sinxronizatsiya oqimlari va "yordamchi" oqimlar (yordamchi) deb ataladigan siqishni standartidir. Oqim bit faylga ishora qiladi.
2. Hozirgi vaqtda MPEG standartlarining besh turi (raqami) mavjud:
MPEG1 - umumiy tezligi 150 Kb/sek gacha (audio 38.44.1, 48 kilogerts) audio va videolarni siqish;
MPEG2 - umumiy tezligi 300 Kb/sek (audio 38.44.1, 48 kilogerts) gacha bo'lgan audio va videolarni siqish, audioni siqish MPEG1 bilan bir xil;
MPEG2.5 - pasaytirilgan ruxsat bilan audio siqish (audio 16.22.05.24 kilogerts);
MPEG3 - ko'p kanalli MPEG1+MPEG2, bu standart amalda o'lik;
MPEG4 chet elda yangi standart hisoblanadi. Uning xususiyati: u 8 tagacha audio kanalni sig‘dira oladi (ya’ni, AC-3 Surround tizimining raqamli kengaytmasi hisoblanadi. Xuddi mono stereoga almashtirilgani kabi, stereoni ham to‘rtlik bilan almashtirishga harakat qilganidek, xuddi stereo kabi. surround bilan almashtirilgan, shuning uchun surround AC-3 bilan almashtirilmoqchi. Menimcha, AC-3 audio tizimlar uchun standart bo'ladi, garchi bitta BUT bo'lsa ham. Men naushniklar, pleyerlar va hokazolarni nazarda tutyapman. Baribir, yo'lda siz AC-3 dan stereo adapterga qanoat qilish kerak bo'ladi, shuning uchun AC-3 faqat uy audio markazlari va uy kinoteatri uchun foydali bo'lishi mumkin. Afsuski, ovoz sifatini faqat naushniklar yordamida baholash mumkin. Shuning uchun AC-3 sifatini tekshirish Masalan, men avtobuslarda “quloqsiz” sayohat qilmayman.
Shunisi e'tiborga loyiqki, MPEG2.5 standarti (MPEG2 LSF - LOW SAMPLE FREQUENCY nomi bilan ham tanilgan) IIS Fraunhofer (Germaniyadan Fraunhofer axborot texnologiyalari instituti) tomonidan taqdim etilgan, bu haqda keyinroq gaplashamiz.Ushbu standart standartning kengaytmasi hisoblanadi. "sof "MPEG2 audio (ya'ni, MPEG1!) audio skanerlash tezligi odatdagi tezligining yarmiga teng.
Xulosa:

  • har qanday audio (yoki video) oqimini MPEG3 ifodasi deb atash qonuniy emas, chunki bu standart mavjud emas;

  • Ovoz formatlarini MPEG1 va MPEG2 standartlariga muvofiq ajratish qonunga ziddir, chunki ular bir xil! Bu "sof" MPEG2 standartiga ishora qiladi;

  • Odatda MPEG2.5 oddiygina MPEG2 deb nomlanadi, bu esa chalkashlikni kuchaytiradi. MPEG2.5 to'g'riroq MPEG2 LSF deb nomlanishi kerak;

  • CD sifatiga faqat MPEG1 (va "sof" MPEG2) yordamida erishish mumkin;

  • MPEG2.5 uchun (afsuski, deyarli barcha MP3 kodlash dasturlari uni MPEG2 deb atashadi!) siz faqat 22,05 KHz sifatiga erishishingiz mumkin (CD dan ikki baravar yomonroq!);

  • MPEG2 ifodasi haqida gapirganda, nima haqida gapirayotganingizni tushunishingiz kerak. Kichik bir misol: DVD-dagi film. MPEG2 standartidan foydalanilgani aniq (hech bo'lmaganda video uchun). Ovozga kelsak, bu erda siz audio signalning spektrini olishingiz kerak. Agar chastotalar 22 KHz da keskin kesilsa, audio MPEG1 standartida amalga oshiriladi. Ovozni kesish 11 kHz chastotada sodir bo'lsa, bizda MPEG2.5 (aka MPEG2 LSF);

"To'g'ri" standartlar jadvali: 

Standart

Video

Audio

Sinxronizatsiya

MPEG1

MPEG1

MPEG1

MPEG1 (150 Kbit/s) 352 X 240 38.44.1.48

MPEG2

MPEG2

MPEG1

MPEG2 (300 Kbit/s) 720 X 520 38.44.1.48

MPEG2.5

Yo'q

MPEG2.5

hech MPEG2 LSF 16,22.05,24

MPEG3

Yo'q

Yo'q

Yo'q

MPEG4

MPEG4

??????

MPEG4 (1200 Kbit/s???)

 3. Har bir standart bir nechta qismlarni o'z ichiga oladi. Asosan, bu qismlar:

  • siqilgan video oqim formati;

  • siqilgan audio oqim formati;

  • sinxronizatsiya oqimi formati;

  • yordamchi oqim formati;

  • * oldingi barcha oqimlar uchun kodlash va dekodlash algoritmlarining optimal bo'lmagan dasturiy ta'minoti (odatda ANSI C da).

Yulduzcha siz va men uchun mavjudligi (yoki ahamiyati) deyarli nolga teng bo'lgan elementni belgilaydi. Misol uchun, men ba'zi manbalarni qazib olishga muvaffaq bo'ldim, lekin ular bilan taqqoslaganda, barcha eng sekin WAV->MP3 kodlovchilari ancha tezroq.
4. Biz MPEG ning audio qismiga qiziqamiz. Aslida, bu erda bir nechta sifatli qatlamlar aniqlanadi (Layer). Ular shuningdek raqamlangan:

  • 1-qavat

  • Qatlam 2

  • Qatlam 3

  • 4-qavat (hali emas).

Standartda qatlam raqami uchun 2 bit ajratilgan, shuning uchun faqat 4 ta qatlam bo'lishi mumkin.Men qatlamlarni tartibda tasvirlab beraman:
4.1. 1-qavat
Eng birinchi rivojlanish. Ovozni 3...12 marta siqish imkonini beradi. CD sifati 4 martadan ko'p bo'lmagan siqish nisbatida saqlanadi. Aynan mana shu qatlam keyingilarning ajdodi bo'ldi va SONY mini-disklarni siqish tizimining asosiga aynan shu qatlam yotadi. Umuman olganda, bu ahmoq. Bunday qatlam yordamida siqilgan har qanday fayl nazariy jihatdan MP1 kengaytmasiga ega bo'lishi kerak. Siqish algoritmining mohiyati:

  • chap va o'ng kanallarning bir nechta namunalari olinadi;

  • diskret kosinus konvertatsiyasi amalga oshiriladi;

  • akustik model (quloq modeli) ko'rib chiqiladi;

  • quloq modeli va siqilish darajasiga ko'ra, kosinus konvertatsiya koeffitsientlari kesiladi;

  • bu kesilgan koeffitsientlar, ularni qayta qurish haqidagi ma'lumotlar bilan birga, chiqish oqimiga yoziladi.

Dekodlash algoritmining mohiyati:

  • sarlavha olinadi va koeffitsient blokining o'lchami aniqlanadi;

  • kesilgan koeffitsientlar o'qiladi;

  • koeffitsientlar tiklanadi;

  • teskari kosinus transformatsiyasi (sintezi) amalga oshiriladi;

  • qabul qilingan signal (tiklangan audio) chiqish oqimiga yoziladi.

Siqish algoritmi sekin (asosan akustik modelni hisoblash va koeffitsientlarning iterativ qisqarishi tufayli). Dekodlash algoritmi tez (real vaqtda amalga oshirilishi mumkin).
4.2. Qatlam 2
Birinchi qatlamning past sifati tufayli matematiklar uni optimallashtirishga kirishdilar. Ko'pgina maxsus jadvallarni aniqlagandan so'ng, birinchi qatlam modeliga uch qavatli taroqli filtrni kiritgandan so'ng, Layer 2 paydo bo'ldi.Birinchidan, u uchta tsiklda audio ma'lumotlarning taroq zanjirini quradi, buning natijasida audioda tez sakrash uchun umumiy sifat sub'ektiv ravishda oshadi. signal. Bu sizga kosinus konvertatsiyasi uchun koeffitsientlarni uchta o'xshash kichik guruhga guruhlash imkonini beradi, ya'ni eng yaxshi holatda siqilish nisbati 1-qavatga nisbatan uch baravar ortadi. Lekin, aslida, bu biroz yomonroq bo'ldi. 1-qavat uchun qulog'imizning eski akustik modeli endi 2-qavat uchun unchalik yaxshi ishlamadi, shuning uchun biz ushbu modelni murakkablashtirishimiz va takomillashtirishimiz va unga Furyening tez o'zgartirish protseduralarini kiritishimiz kerak edi, bu kodlash paytida psixoakustik modelni hisoblashni sezilarli darajada sekinlashtiradi. Barcha siqish protseduralari ham 3 barobar murakkablashadi, ya'ni siqish vaqti ortadi. 1-qavatga nisbatan 2-qavatni siqish jarayoni 12 marta sekinroq. Qizig'i shundaki, oqimni tiklash algoritmi deyarli murakkablashmagan, garchi teskari kosinus konvertatsiya koeffitsientlarining 3 ta kichik guruhi uchun uch martalik tsikllarni kiritish kerak bo'lsa. Ko'pgina matematiklar DCT (diskret kosinus o'zgarishi) algoritmini tezlashtirish haqida o'ylashni boshlaydilar. Ammo muammo shu: ish faqat teskari DISKRET KOSINA TRANSFORMASINI tezlashtirish uchun olib borilmoqda (bu audio ma'lumotni tiklashda qo'llaniladi, ya'ni real vaqtda siqilgan audioni o'ynash kerak; bu video ma'lumotni tiklashda ishlatiladi. siqilgan VideoCD oqimida). Xing Technology bu sohada alohida ajralib turdi; u o'zining Video CD oqim dekompressorlari dasturiy ta'minotining unumdorligini past darajadagi Pentium modellarida normal ijro qilish nuqtasiga qadar oshirishga muvaffaq bo'ldi (afsuski, 352 X 240 video tasvirni o'lchash uchun 2D video tezlatgich talab qilinadi. to'liq ekranga). Keling, Xing kompaniyasini va uning mahsuloti Xing MPEGni eslaylik (garchi, rostini aytsam, ushbu kompaniyaning ODCT algoritmi hali ham eng qo'pol va yomon). Lekin TO'G'RIDAN DISKRET KOSINA TRANSFORMATION hech qanday tarzda optimallashtirilmagan! Ya'ni, ovozni siqishda ko'p vaqt sarflanadi. Bundan tashqari, Intel MMX texnologiyasini chiqaradi (bu haqda keyinroq muhokama qilinadi) va hisoblashni tezlashtirishga misollar keltiradi ... REVERSE DCT. To'g'ridan-to'g'ri PrEP haqida yana sukunat. Shunday qilib, MMX texnologiyasiga ega protsessor egalari ovozni siqish haqida gap ketganda, hech narsaga ega bo'lmaydilar!
Siqish va dekodlash algoritmlari 1-qavat algoritmlariga o'xshash bo'lib, koeffitsientlarni olishning uch martali sikli va murakkab psixoakustik algoritm uchun sozlangan. Subyektiv jihatdan Layer 2 algoritmi 4..6 marta siqish nisbatida CD dan farqlanmaydigan sifatni beradi. Ushbu qatlam bilan to'ldirilgan fayllar MP2 kengaytmasiga ega.
4.3. Qatlam 3
1992 yilda (va, ehtimol, 1998 yilgacha) IIS Fraunhofer kompaniyasi (Fraungofer instituti) hech kimga noma'lum bo'lib, ilmiy yutuqni amalga oshirdi: agar biz to'g'ridan-to'g'ri diskret kosinus o'zgarishi koeffitsientlarini olgan bo'lsak, unda nega xuddi shu protsedurani qayta ishlatmaslik kerak? bir xil koeffitsientlar? Ular buni birinchi bo'lib sinab ko'rishdi - ular ikkinchi marta koeffitsientlar bo'yicha o'zgarishlarni amalga oshirdilar. Natija nolga teng. Keyin ba'zi bir nemis dahosi muammoni yolg'on holatida ko'rishga qaror qildi: u koeffitsientlarni uchta to'plamga ajratdi (ya'ni birinchi to'plam 1, 4, 7 va hokazo koeffitsient; ikkinchi to'plam 2, 5-chi to'plamdir. , 8-chi, va hokazo koeffitsient; uchinchi bog'lovchi 3-, 6-, 9-koeffitsient va boshqalar), ushbu bog'lovchilarda alohida boshqa diskret kosinus transformatsiyasini amalga oshirdi, dekodlash algoritmini o'zgartirdi - va kashfiyot sodir bo'ldi: bir xil siqish nisbati bilan sifat oshdi. 4 marta! Tajribalar boshlandi, uning davomida quyidagilar aniqlandi:

  • hamma narsani 2-qavatdagi kabi uchta kichik guruhga ajratmaslik va keyin ularni yana uchta to'plamga bo'lish yaxshiroqdir; va zudlik bilan Layer 2 algoritmini o'zgartiring va 3 ta kichik guruh o'rniga 32 ta kichik guruhni oling va shundan keyingina 36 ta (3 emas!) havolada ko'ndalang o'zgartirishni amalga oshiring. Ya'ni: 1-qavat 1*1152; 2-qavat 3*384; 3-qavat 32*36 (bular DCT uchun koeffitsient matritsasining o'lchamlari).

  • olingan koeffitsientlarni 4 bitgacha qisqartirish mumkin! (2-qavatda va 1-qavatda faqat 16 tagacha).

Umuman olganda, Layer 3 yuqori sifatli va sekin bo'lib chiqdi. Bundan tashqari, psixoakustik modellarni qayta tiklash va murakkablashtirish va qat'iy Huffman jadvali yordamida ba'zi arxivlash elementlarini qo'shish kerak edi (bu ARJ arxivatorida qo'llaniladigan algoritm, faqat ARJda bu jadval dinamik va doimiy ravishda o'zgarib turadi, buning uchun ikkita talab qilinadi. ma'lumotlar orqali o'tadi; Ruxsat etilgan jadval bilan siqilish bir o'tishda sodir bo'ladi).
Yuqoridagi barcha o'zgarishlar quyidagilarga olib keldi:

  • yangi MP3 kengaytmasi;

  • CD sifati bilan siqishni nisbati 6..8 marta (baqirmang yoki qasam ichmang, 10 va 12 marta siqish nisbati muxlislari, oxirigacha o'qing!);

  • siqish tezligi 2-qavatga nisbatan 24 marta kamaydi;

  • qadoqdan chiqarish tezligi 8 marta kamaydi.

Nima, qo'rqinchli?
IIS Fraunhofer real vaqt rejimida 3-qatlam kodlovchi va dekoderni HARDWARE amalga oshiradi. Ushbu uskuna Germaniyada va Albertvildagi Olimpiya o'yinlarida portlash bilan qo'llaniladi.Germaniya televideniesi va radioeshittirishlari sun'iy yo'ldosh kanallari orqali 12 marta siqilgan audio oqimini uzatishda katta mablag'ni tejaydi.
Hamma narsa shu erda to'xtaganga o'xshaydi, lekin Intel boshqacha fikrda. Pentium-133 va undan yuqori versiyalar 3-qavat oqimini cheklangan tezlikda (CD-ROMning yagona tezligi sekundiga 5KB tezlikdan 30 baravar sekin) siqishi MUMKIN. Fraunhofer klaviaturaga o'tadi va packer va unpacker kodini optimallashtirishni boshlaydi. Ko'pchiligingizga ma'lum bo'lgan L3ENC va L3DEC tug'ilgan (GNU C++ asosida yaratilgan), ular apparat tatbiqiga nisbatan ancha past narxga sotiladi. Bozor topildi. Asta-sekin, Yaponiya va IIS Fraunhofer institutida 36 ball uchun tezkor DCT va ODCT algoritmlari tug'iladi (ular Layer 3 algoritmida aynan nima kerak). Windows 3.1 uchun birinchi real vaqtda o'yinchi paydo bo'ladi - Winplay 3 (hali ham ijro etish sifati uchun standart). Ammo pul hisoblashni yaxshi ko'radi:

  • Winplay 3 ro'yxatdan o'tmasdan atigi 30 soniya o'ynaydi;

  • Ro'yxatdan o'tmasdan L3ENC faqat 12 marta siqish imkonini beradi.

  • MP3ENC (Fraunhofer'dan Mpeg Encoder 3.0 demosi) faqat kredit karta orqali sotiladigan 30 soniyalik audioni siqib chiqaradi.

Amerikada talaba Jeff Tsay hozirda Win95 ostida *.MP1 va *.MP2 fayllari (MAPLAY) uchun real vaqt rejimida pleyer ustida ishlamoqda va o'z ixtirosini bepul tarqatmoqda. Kelajakda u kodda *.MP3 (real vaqtda ijro etish) ni qo'llab-quvvatlashni o'z ichiga oladi.
Fraunhofera instituti uskunani Germaniyadagi Dialog 4-ga o'tkazadi. Biz ADPCM siqish (Ima Dvi, Microsoft) haqida 4 marta aqldan ozganmiz, garchi bu algoritmlarning sifati (ular hozir Windows 95 da audio siqishning bir qismidir) baxtsiz Layer 1dan yuzlab marta yomonroq. Biz Sony mini haqida aqldan ozganmiz. -disklar, garchi MP3 bilan solishtirganda, bu o'tmishdagi narsadir ...
"Guruhning barcha qo'shiqlari ..." ning interaktiv albomlari chet elda paydo bo'ladi: 16 bitli 22 kHz yoki 8 bitli 16 kHz sifati yoki hatto "MONO"! Bu opuslar quloqlar uchun o'limdir! Ammo biz buni hali bilmaymiz va biz bu kolleksiyalarni sotib olamiz ...
MMX poygaga kiradi. Intel MMX protsessorini chiqaradi (bu matematik protsessor registrlariga qo'shimcha bo'lib, go'yoki hisob-kitoblarni 8 marta tezlashtiradi. LEKIN! MMX butun son muhiti bo'lib, uni 8 marta tezlashtiradi, BYTE algoritmlari kerak. (MMX registri 64 bit! Bir bayt 8 bit, ya'ni sakkizta butun son bo'ladi, demak, 8 marta tezlashadi) bular 0 dan 256 gacha bo'lgan raqamlar. Kuladi va bu hammasi. Butun o'zgaruvchilarni 32 bitga keltirsak ham. (ikkita butun son - qayta ishlash tezligi 2 baravar yuqori), ikkilik kosinus transformatsiyasini printsipial ravishda amalga oshirib bo'lmaydi !Hazil sifatida Intel AUDIO va VIDEO siqish tizimlarini ishlab chiquvchilari uchun MMX ga teskari kosinus konvertatsiyasining butun sonini taklif qiladi. " Bu bulochka Xing tomonidan olinadi, shundan so'ng, MMX dan foydalanish katagiga belgi qo'yilgan holda, o'z dasturida filmlarni tomosha qilganda, ular oq fonda hech qanday joydan qora kvadrat tortlar paydo bo'ladi (Xing MPEG pleer 3.20 ma'nosini bildiradi) Xing ishlab chiquvchilari! Ikkilik kosinus o'zgarishi raqamlarning sifati va aniqligi uchun juda muhim! Butun sonlar emas, balki faqat haqiqiy raqamlar sizga DCT va ODCT ni ko'proq yoki kamroq aniq ishlab chiqarishga imkon beradi! Bu darhol tushunildi va Xing MPEG pleer 3.31 da amalga oshirildi. MMX vazifalari faqat CD dan video oqimlarni o'qish va yozishni tezlashtirishga qisqartiriladi!
Yana ko'proq. Xudo u bilan, MMH bilan. Yana bir hazil va yana bir Intel hazili bor: birinchi buyruq berilganda, MMX haqiqiy sonlarni (yaʼni matematik protsessorni) qayta ishlashni OʻCHIRADI, chunki tejamkorlik maqsadida u MATEMATIK KOPROTSESSOR REGISTRIDAN AYNAN foydalanadi! Axir, ikkita odam bitta skameykada o'tira olmaydi, shuning uchun EMMS buyrug'i berilmaguncha, matematik protsessor o'chiriladi. Bundan tashqari, Float protsessoridan MMX ga va orqaga o'tish - 6 takt siklida, shuningdek, haqiqiy registrlarning holati zaxira xotirada saqlanadi, bunda ma'lum sharoitlarda (tizim uzilishlari va istisnolar) soprotsessor bayrog'i registrining holati buziladi. ! Xulosa qilib aytganda, MMX buyruqlarini ishga tushirishdan oldin barcha protsessor registrlarini o'zingiz biror joyda saqlashingiz kerak va EMMS buyrug'idan keyin ularni ham tiklashingiz kerak!
Sizga eslatib o'tamanki, teskari DCT algoritmi enkoder uchun mo'ynaga o'xshaydi, shuning uchun biz MMX dan foydalanishni taxmin qilsak ham, siqish tezligi oshmaydi va sifati juda yomonlashadi.
Uchinchi tomonlar IIS Fraunhofer tomonidan nashr etilgan ba'zi "eski" algoritmlardan pul ishlashadi. WinAMP tug'ildi. Men bu WinAMP-ni ko'rdim. Tekshirish oddiy:

  • MP3 yaratish;

  • WinAMP yoki MAPLAY-ga yuklash;

  • ochilmagan oqimni WAV fayliga saqlang;

  • IIS Fraunhoferning o'zidan qadoqlash/ochish paketidan olingan L3DEC faoliyati bilan olingan natijalarni solishtiring.

Natija:

  • MAPLAY: 64 kbaytda farq 1-2 bayt (ortiqcha/minus 1);

  • WINAMP: 512 baytda farq ko'p bayt (ortiqcha/minus 3);

  • XING: Taqqoslamagan ma’qul... Bu zulmat.

WINAMP-ga kelsak, ular HQ rejimini, 32-bit va 64-bit (qanday qilib?) rejimlarini yaratdilar, lekin ularni L3DEC bilan solishtirishga vaqt yo'q edi. Shuning uchun, agar u erda hamma narsa tartibda bo'lsa, men shlyapani WinAMP-ga olib boraman. Ayni paytda, bu MP3-ni WAV-ga to'g'ri ochishning yagona variantidir:
l3dec in.mp3 out.wav -wav
Ayni paytda, WINAMP o'zining barcha terilari va plaginlari bilan shaxsan men uchun nolga teng. Jeff Tsay's MAPLAY manba kodi bilan birga keladi, shuning uchun men uni ovoz balandligi va umumiy dizayn, bir nechta fayllarni ochish, real vaqtda ustuvorlik va qulaylik uchun o'zgartirdim. MAPLAY xususiyatlari:

  • o'ynaladigan hamma narsa o'ynaydi (WAV, MID, MOV, DAT, MP1, MP2, MP3 va boshqalar);

  • mutlaqo bepul;

  • yuqori sifatli MP3 pleer;

  • Borland C++ 5.01 va boshqa bir qator tizimlar (masalan, MAC, OS, UNIX va boshqalar) uchun manbalarga ega.

Endi gap qadoqlovchilar haqida. Fraunhofer Win95 uchun L3 prodyuser pro-ni chiqarmoqda va bu allaqachon 32-bitli modul bo'lib, u ACM filtrini o'z ichiga oladi (ya'ni, endi MPEG Layer 3 barcha standart qadoqlovchilar/ochishchilar va Win95 pleyerlari tomonidan ko'riladi), bu modulga qaraganda 3 baravar sekin ishlaydi. bitta tezlikli CD-ROM.
Men yana bir narsani ko'rdim (olov uchun uzr, men qarshilik qila olmadim!):
RJPAENC - bolalar, bu nima? MMX, ishlashning 30% ga oshishi va boshqalar? Ko'ramiz... Keling, bajariladigan faylni olib, tuzatuvchiga joylashtiramiz. MMX qayerda? Nimadir etishmayapti... Nima uchun bu yerda boshqa bajariladigan dastur chaqirilmoqda? Aziz onam! Shunday qilib, u TOMPG.EXE faylini WIN\SYSTEM ichiga tashladi va uni parametrlar bilan ishga tushirdi ... Mana siz uchun paketlovchi! Bu TOMPG.EXE dasturi uchun eng qobiliyatsiz interfeysdir (hech bo'lmaganda bir nechta fayllarni tanlash qobiliyatining yo'qligi va birinchi marta bosishdan keyin barcha variantlarni saqlamaslik haqida gapirishimiz mumkin). OK, keling, TOMPG.EXE ga o'tamiz. Voy, mo''jizalar mualliflik huquqi Xing Tech ichida. Yana Xing? To'g'ri - u. Ish tezligi portlovchi hisoblanadi. Fraunhofer paketidagi L3ENC dan o'n baravar tezroq. Sifat haqida nima deyish mumkin? Keling, tekshiramiz. Biz L3ENC va TOMPG-da juda ko'p yuqori chastotali sevimli musiqangizning bir xil oqimlarini yaratamiz. Ha, aytmoqchi, biz L3ENC da -hq kalitini unutdikmi? Yo'q, bu kalitni so'ramang - o'zingizni hurmat qilmang! Keling, taqqoslaylik:

  • L3ENC - hamma narsa kerak bo'lganda, ovoz 5.

  • - TOMPG - maaaaaa! film tiqilib qoldi! Chirillagan ovoz, har 2 soniyalik tanaffusdan keyin blokirovkalar, voy-nuqsonlar va tsk-nuqsonlar, chaynash baland va suzuvchi pastlar... Farqni his eting...

(Aytgancha, men buni karnay orqali emas, balki Philips naushniklarida tinglayman).
Men sizga nima deyman. L3 kodlashdan foydalangan holda turli xil hunarmandchilik / soxta narsalarni takroriy sinovdan o'tkazgandan so'ng, bitta xulosaga kelish mumkin:
eng yaxshi tanlov l3enc my.wav my.mp3 -hq -crc -br 160000 (bu l3enc ning maxsus “maxsus” versiyasida!)
Hatto L3producer ham yomonroq.
4.4. 4-qavat
Hozircha faqat noaniq kelajakda. Garchi, ehtimol, nemislar allaqachon MP4 fayllari bilan tanishishni boshlashgan. Men hali ham MP4ni hech qayerda topib bo'lmasligini bilaman. Fraungoferalik o'rtoqlar o'zlari yozadilar BIZ MP4 NIMA TUSHUNMAYBIZ (ular o'zini ahmoq qilib ko'rsatishadi), do'stim MPEG1,2,3,4 haqida o'qing va MPEG4 4-qatlam emasligini tushunishadi, deyishadi. nima demoqchiman? Sizchi? (Sizga eslatib o'taman, qatlam raqami uchun 2 bit ajratilgan - demak u Layer 1, Layer2, Layer 3 va Layer 4 bo'lishi mumkin (tinglang, ehtimol bu Layer 4 emas, balki Layer 0? - kimdir so'raydi... Balki bu nol qatlamdir, balki 20-asrdan oldin MP0 fayllar bo'lgandir, bu ma'lumot men uchun mavjud emas...) Qisqasi, hali hech qanday Layer4 dan asar ham yo'q...
5. Xulosa qilish uchun: Har bir MPEG standartida audio oqimlar mavjud, har bir audio oqim 3 qatlamga bo'lingan (hozircha). Shunday qilib, quyidagi iboralar mos keladi:

  • MPEG1 Layer 3 (uchinchi MPEG1 qatlami *.MP3 fayl);

  • MPEG2.5 Layer 3 (MPEG2.5 skanerlash chastotasi kamaytirilgan uchinchi qatlam - *.mp3 fayl);

  • MPEG2 LSF Layer 2 (16,22.05,24 chastotalar uchun ikkinchi qatlam - *.mp2 fayl);

  • MPEG4 Layer 2 (ikkinchi MPEG4 qatlami *.MP2 fayli).

Aslida, hozirgi kunga qadar quyidagi kombinatsiyalar ishlab chiqilgan:

  • MPEG1 qatlami 1,2,3 (*.MP1,*.MP2,*.MP3)

  • MPEG2.5 Layer 2.3 (*.MP2,*.MP3) (yoki MPEG2 LSF Layer 2.3)

  • MPEG3 qatlamsiz

  • MPEG4 1-qavat (*.MP1)

Fayl kengaytmalari bir xil bo'lsa, qaysi MPEG ekanligini qanday aniqlash mumkin? Ushbu ma'lumot har doim har qanday qadoqlangan audio faylning blok sarlavhasida mavjud (ikki bitda kodlangan). Masalan, MAPLAY dasturi (men bu haqda bir necha marta gapirganman) har doim Audio Properties menyusidagi aniq standart raqamni ko'rsatadi. Ba'zida standartlar nostandart tarzda raqamlanadi (so'zni kechiring):

  • MPEG I (MPEG1);

  • MPEG II (MPEG2);

  • MPEG III (MPEG3);

  • va hokazo.

6. Endi ENG YOMON haqida. Sifat yana uchta parametrga bog'liq.
A). Men allaqachon psixoakustik modelni eslatib o'tdim. Hozirgi vaqtda ikkita bunday model ma'lum:

  • Musicam (to'liq axlat, odatda Xing tomonidan qo'llaniladi);

  • At&t (hozirgacha eng yuqori sifatli model, u L3ENC tomonidan qo'llaniladi).

B). Siqish rejimi:

  • mono (mono);

  • stereo (stereo);

  • yarim stereo (qo'shma stereo);

  • er-xotin mono (ikkita mono yoki ikki kanalli).

Biz mono rejimini bekor qilamiz. Stereo rejimi eng zerikarli hisoblanadi. Aynan shu rejimda balandliklarning "chaynashi" kuzatiladi va pastda "VAY" eshitiladi (bu faqat naushniklar bilan yaxshi eshitilishi mumkin!). Qo'shma stereo - o'rta chastotalarning koeffitsientlari o'rtacha hisoblanadi (o'rta chastotalarda MONO olinadi) va faqat qaysi quloqda ustun signal qayd etiladi (chapda yoki o'ngda). Shu sababli, yuqori chastotalar uchun ko'proq joy bor, shuning uchun ob'ektiv ravishda bu rejim STEREOga qaraganda yaxshiroq tinglanadi (istisnolar mavjud bo'lsa ham). Ushbu rejimda "VAY" va tepadagi silliqlash shovqini odatda yo'qoladi. Ammo balandliklarning haddan tashqari aniqligi yoki ularning ehtiyotkorlik bilan tekislanishi paydo bo'ladi, shuning uchun aks-sado effektlari va zaif eshitiladigan tovushlar yo'qoladi. Nihoyat, DUAL CHANNEL rejimi barcha algoritmlarning eng yuqori sifati hisoblanadi. U avvalgilariga qaraganda ikki baravar sekin ishlaydi va ajoyib sifat beradi: voy yoki tsz effektlari yo'q, baland yoki pastlar xiralashmaydi, zaif eshitiladigan tovushlar yo'qolmaydi va hokazo. U erda DUAL CHANNEL rejimidan foydalanganda quloqlarimga (naushniklarda) 8 marta siqish nisbatida asl signaldan farq YO'Q. Shuning uchun men Layer 3 uchun siqish chegarasi 8 marta ekanligini da'vo qilaman. Eshitish vositalarida 10 va 12 marta siqilgan holda, zaif tovushlarning yo'qolishi va yuqori chastotalarning pardalanishi, hatto DUAL CHANNEL rejimida ham aniq seziladi (boshqa rejimlar odatda qorong'i). Siz rejim turini xuddi shu MAPLAY dasturida bilib olishingiz mumkin (Audio Properties elementi).
Juda kam uchraydigan paketlar sizga DUAL CHANNEL oqimini yaratishga imkon beradi. Misol uchun, siz mashhur TOMPG.EXE dan foydalanishingiz mumkin (undagi -M tugmachasini ko'ring). Har qanday rejimda sifat jirkanch bo'lsa-da, barcha to'rt rejimni (-M0, -M1, -M2 va -M3 mono, stereo, qo'shma stereo va qo'sh kanalga to'g'ri keladi) taqqoslash orqali siz dual kanal va boshqa rejimlar o'rtasidagi farqni tushunasiz.
Fraunhofer-ning barcha dasturlari DUAL CHANNEL-ni qo'llab-quvvatlamaydi, shuning uchun siz ushbu rejim bilan oddiy pakerni izlashingiz kerak bo'ladi (birinchi akustik modeli bilan TOMPG emas!) Siz Xingdan ikkinchi psixoakustik modelni yaratishni va musiqaning sharmandali ovqatlanishini olib tashlashni so'rashingiz mumkin. .
B. Uchinchi, muhim parametr - eng yuqori sifat (hq rejimi). L3ENC -hq dastur kaliti bilan aniqlanadi. Ushbu kalitni topshirishda algoritmdagi o'zgarishlarning mohiyati menga tushunarli emas; DCT koeffitsientlari qisqartirilganda iteratsiyalar soni ko'payadi deb o'ylayman, bu muqarrar ravishda yaxshi natija berishi kerak. Hq ning mavjudligini aniqlash mumkin emas. Siz faqat quyidagi binolardan harakat qilishingiz mumkin:

  • L3enc dasturida -hq kalitidan foydalanganda ish deyarli 3 baravar sekinlashadi;

  • -hq bo'lgan va bo'lmagan paketli oqimlar osmon va yer kabi farqlanadi, garchi ulardagi ma'lumotlar sarlavhalari bir xil bo'lsa ham (ya'ni hamma narsa bir xil - turi, rejimi, qatlami, MPEG algoritm raqami va siqilish darajasi);

  • -hq bo'lgan va bo'lmagan oqimlarni tinglashda ovozning dinamik xususiyatlarining ulkan yaxshilanishi sezilarli bo'ladi - chuqurroq va boyroq ovoz va hq rejimida baland tovushlarni yaxshi uzatish.

Mana bunday. Shuning uchun, ENCODER dan foydalanganda, uning -hq algoritmiga muvofiq ishlashiga ishonch hosil qilishingiz kerak. Shunday qilib, o'sha Fraunhofer institutidan L3 prodyuseri -hq ISHLATILMAYDI. Shuning uchun u tezroq ishlaydi (va ovoz yomonroq).
7. Qanday qilib siqish kerak? Men quyidagi sxemadan foydalanaman:

  • MPEG1 algoritmi (odatda 44,1 kHz oqim uchun avtomatik ravishda tanlanadi);

  • qatlam 3 (qatlam 3);

  • psixoakustik model 2 (AT&T);

  • DUAL KANAL rejimi;

  • sifatni oshirish (switch -hq);

  • siqish darajasi 8 (160kbit/s yoki 160000 bit/s).

Bunday holda, Pentium 250 MMX mashinasida oqim 13,1 marta sekinlashuv bilan siqiladi (o'n uch marta, kim tushunmadi!). Ya'ni, bir soatlik ixcham 13 soat davomida mahkamlanadi. Lekin MP3larim sifati men eshitgan har qanday Layer 3 hunarmandchiligidan yuzlab marta yuqori. Provokatsiyalarga berilmang! Qadoqlovchi eng yuqori sifatli 3-qatlamni yaratishda hali 13 baravar sekinroq ishlay olmaydi. Agar birortasi bilan uchrashsam, albatta xabar beraman. Hozirgi paytda:

  • siqilish darajasi 8 dan ortiq (160000 kbps dan kam) - yomon, yuqori darajalarni yo'qotish;

  • qatlam 3 dan kam - yomon, sifatni yo'qotish;

  • stereo, qo'shma stereo - yomon, muhim ma'lumotlarning yo'qolishi va audio oqimidagi buzilish;

  • rejim emas hq (yuqori sifat - eng yuqori sifat) - yomon, kichik dinamik diapazon;

  • psixoakustik model 2 emas (AT&T) - dahshatli buzilish va xiralashgan ovoz;

  • MMX, qo'pol algoritmlar va evristik buzilish algoritmlaridan foydalanish va tovush xarakterini o'zgartirish.

Qanday yaxshilanishlar mumkin? Mana shular:

  • dastlab menda Pentium-100 bor edi - 24 marta sekinroq;

  • keyin Pentium-133 - 21 marta sekinroq;

  • Pentium-166 MMX - 17 marta sekinroq;

  • Pentium-250 MMX - 13 marta sekinroq...

Fikrlash chizig'i aniqmi?
Mashinani tezlashtirish kerak, foiz. - Pentium II 333 atigi 5 baravar sekinlashadi (yoki undan ham kamroq!), va Intel allaqachon Mercedes 900 ni e'lon qilmoqda. Xulosa shuki: yuqori tezlikdagi paketchilarni quvmang - naushniklarni qo'ying va ular nima qilayotganini tinglang. u erda ovoz bilan ishlayapman. -hq va DUAL CHANNEL bilan oddiy va sekin packerni qidiring va shubhali MP3 qaychi bilan musiqangizni buzmang.
Men bu masalani bahslashmoqchi emasman, boshi bor odamga yordam beradigan ma'lumot beraman. Men allaqachon REAL CD sifati bilan 8 soatlik (aniqrog'i 74 * 8,61 = taxminan 10 soat 37 daqiqa) musiqali kompakt diskni olishim mumkin, ammo qiziqarli nomlar bilan CD bozorida ommaviy sotiladigan disklarni emas, balki "barchasi" falon guruhining qo'shiqlari - to'liq MPEG3". Ha, bolalar, sizning disklaringiz haqiqatan ham to'liq MPEG3 formatida bo'lib, hech qachon ishlab chiqilmagan. Qachon hamma uchun Layer 3 audio borligi va MPEG3 audiosi yo'qligi qachon paydo bo'ladi?
8. Siqish nisbatlari ham ba'zi tushuntirishlarni talab qiladi. Men 44,1 KHz 16 bitli 3-qatlam oqimi uchun jadval beraman:
Siqilgan oqim tezligi (sekundiga bit) - siqish nisbati (marta)
32000 - 43.066
40000 - 34.453
48000 - 28.711
56000 - 24.609
64000 - 21.533
80000 - 17.227
96000 - 14.355
112000 - 12.305
128000 - 10.767
160000 - 8.613
192000 - 7,178
224000 - 6.152
256000 - 5.383
320000 - 4.307
Ba'zi dasturlar siqish nisbatini SONIDA KILOBITS (kbps/sek yoki oddiygina kbps) da o'lchaydi. Misol sifatida L3ENC dasturidan foydalanishni tushuntirib beraman, bu erda -br (BIT RATE) tugmasi siqishni uchun o'rnatiladi:

  • br 160000 (8,6 marta siqish)

  • br 320000 (4,3 marta siqish)

  • br 96000 (14,4 marta siqish).

Kbps li dasturlarda u shunday bo'ladi (masalan, l3producer pro):

  • 160 kbps/s (8,6 marta siqilgan)

  • 112 kbps/s (12,3 marta siqilgan)

  • va hokazo.

Ko'pgina dasturlar barcha belgilangan siqish nisbatlarini qo'llab-quvvatlamaydi. Bu dasturchi muammosi. MPEG1, MPEG2 standartiga ko'ra, barcha belgilangan siqish darajalari to'g'ri (va sanab o'tilganlardan tashqari boshqasi yo'q). MPEG2.5 da bir qator qo'shimcha siqish stavkalari mavjud, ammo ularning barchasi belgilangan jadvaldan olingan (ya'ni raqam 2, 4, 8 va boshqalarga bo'linadi).
9. Yordamchi ma'lumotlarni (yordamchi ma'lumotlarni) oqimga kiritishingiz mumkin, ular qo'shiq matni yoki mualliflik huquqi bo'lishi mumkin. Ushbu ma'lumotlar birinchi navbatda mualliflik huquqini himoya qilish uchun kiritilgan: kimdir boshqa birovning MP3-ni o'ynaydi, bu uning ishi ekanligini aytadi, muallif kelib, to'g'ridan-to'g'ri MP3-dan o'z nomi yuz marta takrorlangan faylni chiqaradi (bu ma'lumotlar bir tekisda "bulg'angan"). butun faylni boshidan oxirigacha) va "o'g'ri" qo'llarini orqasida zulmatga olib boradi - mualliflik huquqini buzgani uchun. Garchi printsipial jihatdan, nima uchun MP3->WAV-ni va keyin WAV->MP3-ni qaytarmaslik kerak? Darvoqe, WinAmp orqali MP3->WAV qilishingdan Xudo saqlasin! Faqat L3DEC va faqat oxirgi versiya (hozirda 2.74). Xuddi shu narsa WAV->MP3 uchun ham amal qiladi. Yaxshi va sifatli (naushniklarda eshitishingiz uchun) enkoderni toping va faqat u bilan ishlang.
10. Ayni paytda Fraunhoferning yana bir kodlovchisi paydo bo'ldi. Bu Mpeg Encoder 3.0 demosi (bu g'alati - lekin bu jinni uni o'z sahifasida joylashtirdi - va u oddiy kodlovchining "maxsus" versiyasini xohlamaydi! badbaxt! he-ha) (EXE fayl nomi MP3ENC.EXE). Afsuski, u vaqt bilan cheklangan (cheklov men tomonidan olib tashlangan), yordam ma'lumotlarini ko'rsatmaydi (men tomonidan ham tuzatilgan) va -dual kalitni qo'llab-quvvatlamaydi (bu hujjatda tasvirlangan). Ushbu dasturda nima yangiliklar:

  • -hq kaliti -qual [0..9] kaliti bilan almashtirildi.

Mana jadval:

  • qual 0..3 - bir xil va eng past sifatni beradi (qo'pol to'g'ridan-to'g'ri DCT algoritmi);

  • kval 4..6 - bir xil va o'rtacha sifatni beradi (aniq PDKP algoritmi);

  • kval 7..8 - dinamik Huffman jadvali, DCT koeffitsientlarini kesishning takrorlash sonining ko'payishi va akustik modelning aniqligini oshirish (hujjatlardan olingan) tufayli bir xil va yuqori sifatni ta'minlaydi.

Endi unpacker yaratilmagan - 2.74 versiyasidan l3dec dan foydalanish tavsiya etiladi.
Nima deyish kerak? Tezlik nuqtai nazaridan, -qual 9 eski versiyalarda -hq kabi sekin. Sifati aniq yomonroq (ikkita kanal qayerda?). Oddiy taqqoslash uchun avvalo ishlaydigan -dual kaliti bilan tijorat versiyasini olishingiz kerak.
11. SoloH dan MPEG encoder v0.07 dasturining yangi versiyasi paydo bo'ldi (http://www.isafeelin.org/soloh/mpegEnc.html). Bu erda men allaqachon gaplashgan narsalarning aksariyati (uni www.freeware.ru saytiga sudrab olishingiz mumkin ) :

  • ikkita akustik model;

  • mono, stereo, qo'shma-stereo va dual mono rejimlari.

Kamchiliklari:

  • sekin;

  • stereo va dual-mono rejimlari bir necha blokdan so'ng bir-biriga to'g'ri kela boshlaydi, bu muallifning ayyorligi yoki aniq niyatidan yoki uning foydalanuvchilarini aldash istagidan dalolat beradi. Misol: bir xil wav dan ikkita bir xil mp3 fayl yarating, birinchisi stereo rejimda, ikkinchisi dual-mono. MP3 fayllarni solishtiring. Birinchi bloklar osmon va yer kabi bir-biridan farq qiladi (bunday bo'lishi kerak!), lekin 10-blokdan biron bir joyda (yoki undan oldinroq - hisoblash uchun juda dangasa!) fayllar egizaklar kabi bir-biriga to'g'ri kela boshlaydi (farq faqat bitta baytda bo'ladi). blok sarlavhasi - bu erda rejim dual-mono yoki stereo). Bu YAXSHI EMAS va HALQSIZ, SOLOHdan ishlab chiquvchi! Siz potentsial foydalanuvchilarni aldayapsiz va ulardan otkritkalarni so'raysiz (ushbu paketdagi readme.txt fayliga qarang);

  • -hq kaliti qayerda?

Yüklə 40,21 Kb.

Dostları ilə paylaş:




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©muhaz.org 2024
rəhbərliyinə müraciət

gir | qeydiyyatdan keç
    Ana səhifə


yükləyin