|
يكشنبه ، 22 آذر 1388 ، 12:02 |
|
مباني فرايند فشردهسازي تصاوير ويدئويي همزمان با ارائه سيستمهاي كدگزاري و كدگشايي (كدك) جديد به بازار، فرايند فشردهسازي تصاوير ويدئويي نيز به صورت مداوم در حال تغيير ميباشد. طرحهاي مربوط به فرايند فشردهسازي استاندارد تصاوير ويدئويي مانند H.26x و MPEG-x بر مبناي اصول كدگذاري مشتركي هستند. در اين قسمت ما به بررسي اين اصول خواهيم پرداخت.
تصاوير ويدئويي ديجيتالي اندازه تصاوير در فرمت ويدئويي كنوني در شكل زیر نشان داده شده است. توجه داشته باشيد كه فرمت ITU-R/CCIR 601 (مانند فرمت متداول تصاوير تلوزیون) CIF و QCIF داراي عرض و طول يكساني هستند. اما فرمت HDTV عرض بيشتري دارد. هر تصوير از اجزايي كه به آنها پيكسل گفته ميشود تشكيل شده است. اندازه طول و عرض فرمتهاي مختلف در جدول زیر نشان داده شده است. فرمتهاي متداول براي ويدئوهاي بيسيم، QCIF و CIF ميباشد. QCIF = 176x144 Pixel CIF = 325x288 Pixel یك پيكسل را ميتوان در دو فضاي رنگي متفاوت نشان داد : RGB و YUV. در فضاي رنگي RGB، پيكسل از سه رنگ قرمز، سبز و آبي تشكيل شده است. در فضاي رنگي YUV پيكسل با U رنگتاب، Y درخشان و V ميزان خلوص رنگ نشان داده ميشود. به V و U، مقادير رنگتاب گفته ميشود. از RGB معمولاً براي نمايش رايانه و از YUV براي تلويزيون استفاده ميشود. تلويزيون در هنگام نمايش تصوير، YUV را به RGB تبديل ميكند. YUV براي ارسال سيگنال تلويزيون رنگي ضروري است. در حالي كه اطلاعات درخشندگي در باندهايي با فركانسهاي متفاوت واقع شدهاند تنظيمكننده (Tuner) ميتواند يك سيگنال Y را به تنهايي تنظيم كند. فرايند تبديل بين اين دو فضاي رنگي با ماتريس تبديل ثابت تعريف شده است. اكثر طرحهاي فشردهسازي تصاوير ويدئويي از فضاي رنگي YUV به عنوان ورودي استفاده ميكنند. در تصاوير ويدئويي ديجيتالي، مقادير Y، U و V (يا R، G و B) با 8 بيت نشان داده ميشوند به عنوان مثال 3 بايت نشاندهنده يك پيكسل هستند. چشم انسان به تغييرات ايجاد شده در ميزان درخشندگي نسبت به تغييرات ايجاد شده در رنگتابي بيشتر حساس ميباشد. بنابراين با نمونهبرداري از رنگتاب ميتوان تعداد اطلاعات ذخيره شده در هر تصوير را كاهش داد. در فرمت YUV نمونهبرداري شده كه به آن فرمت 4:4:4 YUV نيز گفته ميشود هر پيكسل با 3 بايت نشان داده ميشود. با انجام نمونهبرداري، نسبت بايتهاي رنگتاب به بايتهاي درخشان كاهش پيدا ميكند. فرايند نمونهبرداري نشاندهنده يك گروه چهار پيكسلي با چهار بايت درخشان آنها و دو بايت رنگتاب ميباشد. هر يك از اين دو بايت رنگتاب با محاسبه ميانگين بايتهاي رنگتاب موجود در گروه مشخص ميشوند. در جايي كه چهار پيكسل به صورت يك بلوك از پيكسلهاي 2 در 27 دستهبندي شدهاند فرمت، YUV 4:2:0 ميباشد. در صورتي كه پيكسلهاي دستهبندي شده خط 4x1 را بوجود بياورند آنگاه فرمت، YUV 4:1:1 ميباشد. اين دو فرمت متداول YUV در شكل های زیر نشان داده شدهاند. بنابراين اندازه يك فريم YUV با نمونهبرداري رنگتاب در فرمت QCIF (که 176 ستون پيكسل با 144 رديف پيكسل براي بايتهاي درخشان) به صورت زير است. | HDTV | TV | CIF | QCIF | Satandard | | ITU-R 709-3 | ITU-R /CCIR-601 | ITU-T H.261 | ITU-T H.261 | | NTSC [30 Hz] | PAL [25 Hz] | NTSC [30 Hz] | PAL [25 Hz] | NTSC [30 Hz] | PAL [25 Hz] | NTSC [30 Hz] | PAL [25 Hz] | Format | | 4:2:2 | 4:2:2 | 4:2:0 | 4:2:0 | Sub-Sampling | | 1920 | 720 | 352 | 176 | Columns (Y) | | 1080 | 480 | 576 | 288 | 144 | Rows (Y) | | 960 | 360 | 360 | 176 | 88 | Columns (U,V) | | 1080 | 480 | 576 | 144 | 72 | Rows (U,V) | | 4147200 | 1036800 | 1244160 | 152064 | 38016 | Frame Size (Byte) | | 995.3 | 829.4 | 298.6 | 248.8 | 36.5 | 30.4 | 9.1 | 7.6 | Data Rate (Mbps) | اگرچه فرايند نمونهبرداري از بايتهاي رنگتاب موجب كاهش سرعت انتقال بيت ميشود اما به تصوير ويدئويي نمونهبرداري شده تصوير ويدئويي فشرده نشده (خام) گفته ميشود. اين تصوير ورودي فرايند فشردهسازي است. در رابطه با تلويزيون از YUV 4:2:2 استفاده ميشود. براي انجام فرايند نمونهبرداري و ذخيرهسازي، چندين فرمت متفاوت وجود دارند. سرعت متفاوت 25 فريم در هر ثانيه در تصوير ويدئويي PAL و 30 فريم در هر ثانيه در تصوير ويدئويي NTSC ناشي از وجود فركانسهاي متفاوت ميباشد. با توجه به سرعت انتقال دادههاي خام و پهناي باند محدودي كه وجود دارد به فرايند فشردهسازي نياز ميباشد. به طور كلي تصاوير ديجيتالي در يك سلسله مراتب مانند آنچه كه در شكل زبر نشان داده شده پردازش، ذخيره، فشرده و منتقل ميشوند و فشرده سازي بر مبناي پيكسل انجام نميشود. 
در راس اين سلسله مراتب، توالي تصاويري وجود دارد كه به گروههايي از تصاوير (GOP) تقسيم ميشود. هر GOP از چند فريم تصوير تشكيل شده است. يك فريم به چند بخش تقسيم ميشود. هر بخش از چند ماكروبلوك (MB) تشكيل شده كه هر يك از آنها از بلوكهاي 4x4 تشكيل شدهاند. هر بلوك نيز از پيكسلهاي 4x4 تشكيل شده است. به دليل حجم بالا، تصاوير ديجيتالي قبل از ارسال از طريق شبكه، كدگذاري (فشرده) ميشوند. پهناي باند محدود موجب اهميت فرايند فشردهسازي ميشود. در اين فرايند از سه نوع Redundancy استفاده ميشود. از آنجا كه پيكسلهاي مجاور به يكديگر مرتبط بوده و داراي Redundancy مكاني هستند، فرايند كدگذاري داخل فريم براي كاهش ميزان Redundancy مكاني در يك فريم بكار برده ميشود. به علاوه فريمهاي متوالي داراي شباهتهايي هستند در نتيجه Redundancy زماني وجود دارد. اين نوع Redundancy با استفاده از تكنيك كدگذاري بين فريمها كاهش پيدا ميكند. نتيجه كاهش اين دو نوع Redundancy، جرياني از نمادها بوده كه داراي Redundancy هستند. Redundancy موجود ميان اين نمادها با استفاده از فرايند كدگذاري با اندازههاي متغير انجام ميشود. در قسمت بعد به چگونگي استفاده از اين Redundancyها براي فشرده سازي پرداخته خواهد شد.
|
|
آخرین بروز رسانی در سه شنبه ، 24 آذر 1388 ، 14:53 |