CODEC قسمت سوم مشاهده در قالب پی دی اف چاپ فرستادن به ایمیل
يكشنبه ، 22 آذر 1388 ، 12:02

مباني فرايند فشرده‌سازي تصاوير ويدئويي

همزمان با ارائه سيستمهاي كدگزاري و كدگشايي (كدك) جديد به بازار، فرايند فشرده‌سازي تصاوير ويدئويي نيز به صورت مداوم در حال تغيير مي‌باشد. طرحهاي مربوط به فرايند فشرده‌سازي استاندارد تصاوير ويدئويي مانند H.26x و MPEG-x بر مبناي اصول كدگذاري مشتركي هستند. در اين قسمت ما به بررسي اين اصول خواهيم پرداخت.

تصاوير ويدئويي ديجيتالي
اندازه تصاوير در فرمت ويدئويي كنوني در شكل زیر نشان داده شده است. توجه داشته باشيد كه فرمت ITU-R/CCIR 601 (مانند فرمت متداول تصاوير تلوزیون)   CIF و QCIF داراي عرض و طول يكساني هستند. اما فرمت HDTV عرض بيشتري دارد. هر تصوير از اجزايي كه به آنها پيكسل گفته مي‌شود تشكيل شده است. اندازه طول و عرض فرمتهاي مختلف در جدول زیر نشان داده شده است. فرمتهاي متداول براي ويدئوهاي بي‌سيم، QCIF  و CIF مي‌باشد.
QCIF = 176x144 Pixel
CIF = 325x288 Pixel

 


یك پيكسل را مي‌توان در دو فضاي رنگي متفاوت نشان داد : RGB و YUV. در فضاي رنگي RGB، پيكسل از سه رنگ قرمز، سبز و آبي تشكيل شده است. در فضاي رنگي YUV پيكسل با U رنگ‌تاب، Y درخشان و V ميزان خلوص رنگ نشان داده مي‌شود. به V و U، مقادير رنگ‌تاب گفته مي‌شود. از RGB معمولاً براي نمايش رايانه و از YUV براي تلويزيون استفاده مي‌شود. تلويزيون در هنگام نمايش تصوير، YUV را به RGB تبديل مي‌كند. YUV براي ارسال سيگنال تلويزيون رنگي ضروري است. در حالي كه اطلاعات درخشندگي در باندهايي با فركانسهاي متفاوت واقع شده‌اند تنظيم‌كننده (Tuner) مي‌تواند يك سيگنال Y را به تنهايي تنظيم كند. فرايند تبديل بين اين دو فضاي رنگي با ماتريس تبديل ثابت تعريف شده است. اكثر طرحهاي فشرده‌سازي تصاوير ويدئويي از فضاي رنگي YUV به عنوان ورودي استفاده مي‌كنند.
در تصاوير ويدئويي ديجيتالي، مقادير Y، U و V (يا R، G و B) با 8 بيت نشان داده مي‌شوند به عنوان مثال 3 بايت نشان‌دهنده يك پيكسل هستند. چشم انسان به تغييرات ايجاد شده در ميزان درخشندگي نسبت به تغييرات ايجاد شده در رنگ‌تابي بيشتر حساس مي‌باشد. بنابراين با نمونه‌برداري از رنگ‌تاب مي‌توان تعداد اطلاعات ذخيره شده در هر تصوير را كاهش داد. در فرمت YUV نمونه‌برداري شده كه به آن فرمت 4:4:4 YUV نيز گفته مي‌شود هر پيكسل با 3 بايت نشان داده مي‌شود. با انجام نمونه‌برداري، نسبت بايتهاي رنگ‌تاب به بايتهاي درخشان كاهش پيدا مي‌كند. فرايند نمونه‌برداري نشان‌دهنده يك گروه چهار پيكسلي با چهار بايت درخشان آنها و دو بايت رنگ‌تاب مي‌باشد. هر يك از اين دو بايت رنگ‌تاب با محاسبه ميانگين بايتهاي رنگ‌تاب موجود در گروه مشخص مي‌شوند. در جايي كه چهار پيكسل به صورت يك بلوك از پيكسلهاي 2 در 27 دسته‌بندي شده‌اند فرمت، YUV 4:2:0 مي‌باشد. در صورتي كه پيكسلهاي دسته‌بندي شده خط 4x1 را بوجود بياورند آنگاه فرمت، YUV 4:1:1 مي‌باشد. اين دو فرمت متداول YUV در شكل های زیر نشان داده شده‌اند. بنابراين اندازه يك فريم YUV با نمونه‌برداري رنگ‌تاب در فرمت QCIF (که 176 ستون پيكسل با 144 رديف پيكسل براي بايتهاي درخشان) به صورت زير است.

 

 

 

HDTV

TV

CIF

QCIF

Satandard

ITU-R 709-3

ITU-R /CCIR-601

ITU-T H.261

ITU-T H.261

NTSC

[30 Hz]

PAL

[25 Hz]

NTSC

[30 Hz]

PAL

[25 Hz]

NTSC

[30 Hz]

PAL

[25 Hz]

NTSC

[30 Hz]

PAL

[25 Hz]

Format

4:2:2

4:2:2

4:2:0

4:2:0

Sub-Sampling

1920

720

352

176

Columns (Y)

1080

480

576

288

144

Rows (Y)

960

360

360

176

88

Columns (U,V)

1080

480

576

144

72

Rows (U,V)

4147200

1036800

1244160

152064

38016

Frame Size (Byte)

995.3

829.4

298.6

248.8

36.5

30.4

9.1

7.6

Data Rate (Mbps)

 

 

 اگرچه فرايند نمونه‌برداري از بايتهاي رنگ‌تاب موجب كاهش سرعت انتقال بيت مي‌شود اما به تصوير ويدئويي نمونه‌برداري شده تصوير ويدئويي فشرده نشده (خام) گفته مي‌شود. اين تصوير ورودي فرايند فشرده‌سازي است. در رابطه با تلويزيون از YUV 4:2:2 استفاده مي‌شود. براي انجام فرايند نمونه‌برداري و ذخيره‌سازي، چندين فرمت متفاوت وجود دارند.
سرعت متفاوت 25 فريم در هر ثانيه در تصوير ويدئويي PAL و 30 فريم در هر ثانيه در تصوير ويدئويي NTSC ناشي از وجود فركانسهاي متفاوت مي‌باشد. با توجه به سرعت انتقال داده‌هاي خام و پهناي باند محدودي كه وجود دارد به فرايند فشرده‌سازي نياز مي‌باشد.
به طور كلي تصاوير ديجيتالي در يك سلسله مراتب مانند آنچه كه در شكل زبر نشان داده شده پردازش، ذخيره‌، فشرده و منتقل مي‌شوند و فشرده سازي بر مبناي پيكسل انجام نميشود.

 

 


 

 در راس اين سلسله مراتب، توالي تصاويري وجود دارد كه به گروه‌هايي از تصاوير  (GOP) تقسيم مي‌شود. هر GOP از چند فريم تصوير تشكيل شده است. يك فريم به چند بخش تقسيم مي‌شود. هر بخش از چند ماكروبلوك (MB) تشكيل شده كه هر يك از آنها از بلوكهاي 4x4 تشكيل شده‌اند. هر بلوك نيز از پيكسلهاي 4x4 تشكيل شده است.
به دليل حجم بالا، تصاوير ديجيتالي قبل از ارسال از طريق شبكه، كدگذاري (فشرده) مي‌شوند. پهناي باند محدود موجب اهميت فرايند فشرده‌سازي مي‌شود. در اين فرايند از سه نوع Redundancy استفاده مي‌شود. از آنجا كه پيكسلهاي مجاور به يكديگر مرتبط بوده و داراي Redundancy مكاني هستند، فرايند كدگذاري داخل فريم براي كاهش ميزان Redundancy مكاني در يك فريم بكار برده مي‌شود. به علاوه فريمهاي متوالي داراي شباهتهايي هستند در نتيجه Redundancy زماني وجود دارد. اين نوع Redundancy با استفاده از تكنيك كدگذاري بين فريمها كاهش پيدا مي‌كند. نتيجه كاهش اين دو نوع Redundancy، جرياني از نمادها بوده كه داراي Redundancy هستند. Redundancy موجود ميان اين نمادها با استفاده از فرايند كدگذاري با اندازه‌هاي متغير انجام مي‌شود. در قسمت بعد به چگونگي استفاده از اين Redundancyها براي فشرده سازي پرداخته خواهد شد.

نظر
افزودن جدید
+/-
نظرات خوانندگان
نام:
پست الکترونیک:
 
آدرس سایت:
عنوان:
 
کد آنتی اسپم نمایش داده شده در عکس را وارد کنید.

3.26 Copyright (C) 2008 Compojoom.com / Copyright (C) 2007 Alain Georgette / Copyright (C) 2006 Frantisek Hliva. All rights reserved."

آخرین بروز رسانی در سه شنبه ، 24 آذر 1388 ، 14:53
 
 
Imam Mahdi 8.jpg

وضعیت سایت

اعضا : 8
مطالب و محتوا : 56
لینك وب ها : 7
مشاهده بازدیدهای مطالب و محتوا : 22566
Error in my_thread_global_end(): 1 threads didn't exit