데이터 압축정보통신 기술의 발전에 따라 전자우편과 같은 많은 응용분야에서 취급되는 데이터의 양이 급격히 증가하고 있는 추세에 있다. 이와 더불어 컴퓨터 이용에 있어서 저장공간의 절약과, 정보통신에 있어서 통신채널의 효율적 이용을 목적으로 한 데이터 압축기술에 관한 중요성도 크게 부각되는 상황이다. 최근 국내에서도 개인용 컴퓨터의 대량보급과 국가기간전산망의 구축확대, PC통신 등의 활발한 보급으로 이용요금을 보다 절약하기 위한 목적 하에 데이터 압축의 필요성이 크게 증대하고있다. 데이터 압축이란, 대상으로 하고 있는 데이터에 포함되어 있는 유효한 정보와 용장성(불필요한 공간) 가운데, 용장성을 제거 함으로써 원래의 데이터 길이보다 짧은 출력데이타를 생성하는 것이다. 일반적으로 이러한 과정을 정보원 부호화, 또는 데이터 압축이라 한다. 또 이와 구분되는 것으로서 데이터가 포함하는 정보 가운데 부적절한 정보라 판단되는 부분을 제거하는 정보원 부호화 과정인 데이터 축약(data compaction)도 크게는 데이터 압축의 하나로서 간주된다. 한편, 데이터 압축에 의해 출력된 데이터를 다시 원래의 데이터로 복원하는 과정을 정보원 복호화(decoding)라 한다. 따라서 데이터 압축기법은 압축을 수행하는 정보원 부호화와 복원과정을 수행하는 정보원 복호화의 쌍으로 구성된다.1. MPEG MPEG은 (동화상과 음향으로 이루어지는) 영화를 압축하기 위한 표준이다. MPEG 표준에는 세 가지가 있는데, MPEG-1과 MPEG-2, 그리고 MPEG-4가 그것이다. 각각에 대해 비디오(동화상 압축), 오디오(음향 압축), 시스템(동화상과 음향 등이 잘 섞여있는 스트림)에 대한 명세가 존재한다. MPEG의 가장 큰 단점은 압축을 많이 하기 위해서는 압축시간이 지나치게 많이 걸린다는 점이다. 압축시간이 복원시간보다 훨씬 커지므로(이를 비대칭적이라 한다), 동시성이 요구되는 분산 멀티미디어 응용에는 무리가 따른다.MPEG -1 (1배속 CD 롬 드라이버의 데이터 전송속도인 1.5 Mbps에 맞도록 설계됨 (비디오 압축 알고리즘 - VCR 화질의 동영상 데이터를 압축했을 때 최대비트율이 1.15 Mbps (오디오 압축 알고리즘 - 스테레오 CD 음질의 음향 데이터를 압축했을 때 최대비트율이 128 Kbps(채널당 64 Kbps) 단순히 음향과 동화상의 동기화를 목적으로 잘 섞어놓은(interleave) 것MPEG -2 (압축 효율이 향상되고 용도가 넓어짐 (보다 고화질/고음질의 영화 대상, 방송망이나 고속망 환경에 적합 (비디오 압축 알고리즘 - 방송 TV (스튜디오 TV, HDTV) 화질의 동영상 데이터를 압축시 최대 비트율이 4 ( 6, 40)Mbp (오디오 압축 알고리즘 - 여러 채널의 CD 음질 음향 데이터를 압축했을 때 최대 비트율이 채널당 64 Kbps 이하 (여러 영화를 한데 묶어 전송 가능, 이 때 전송시 있을 수 있는 에러 복구도 가능MPEG 4 (매우 높은 압축 효율을 얻음으로써 매우 낮은 비트율로 전송하기 위한 것 (이동 멀티미디어 응용의 구현 가능성 (아직 만들어지지 않았으며, 매우 높은 압축 효율을 위해 내용기반(model-based) 압축 기법이 연구되고 있음엠펙 동화상 압축 알고리즘 (제이펙(JPEG) 정화상 압축 알고리즘의 발전 (인접 프레임 사이에 유사점이 많다는 점을 이용 - 예측과 보간을 이용하여 동작보상을 함(자신이 가지고 있는 정보만으로도 복원될 수 있는 프레임의 규칙적인 삽입이 필요 - VCR식 제어(임의 접근)가 가능해야 한다는 등의 여러 필요성 때문 -압축된 정화상 프레임 (JPEG과 아주 유사) 삽입MPEG에서 사용되는 주요 압축원리 모든 압축의 기본 원리는 중복성 제거이다. 여기에 더해 시각 및 청각 매체들에 대해서는 가시가청성의 원리를 사용할 수 있는데, 가시가청성의 원리란 사람이 자세한 것은 보지 못한다는 점 등을 이용해서 사람이 잘 느끼지 못할 데이터들은 살짝 빼버림으로써 데이터의 양을 줄일 수 있다는 원리이다. 압축은 불필요한 정보를 삭제하고 반복되는 정보를 간략히 기술함으로써 데이터의 크기를 줄이는 것이다. 이를 중복성(redundancy) 제거의 원리라 한다. 이를테면 0이 100 개 나열되는 데이터는 100 개의 숫자를 지닐 것이나 간략히 0, 100 함으로써 두 개의 숫자만으로 표현이 가능하게 된다. 또한 영어로 씌여진 문서를 압축할 때 우리는 알파벳 중 e가 많이 나오고 x가 적게 나온다는 것을 알고 있으므로 모든 알파벳 문자에 같은 길이의 부호를 할당하는 것이 아니라 자주 나오 는 문자는 짧게 흔히 나오지 않는 문자에는 길게 부호를 할당함으로써 전체 문서의 길이를 줄일 수 있다. 전화 음성의 경우 말을 하는 때와 말을 안 하는 때가 분리 되는 점을 이용해서 말을 안 하는 부분은 정보를 보내지 않음으로써 주고받아야 하는 정보의 양을 줄일 수 있다. 동영상의 경우 직전 그림과 현재 그림이 별차이가 없다는 점을 이용한다. 즉, 동영상에서는 1 초에 비슷한 그림을 60 장 정도 빠르게 바꾸어 줌으로써 움직이는 그림을 구현하기 때문이다. 압축에서는 또 사람이 감지할 정보만을 추려서 남기고 감지할 수 없는 정보는 삭제함으로써 데이터의 양을 줄일 수 있다. 이를 가시성, 가청성의 원리라 한다. 사람은 큰 소리를 들은 후에는 그 다음 소리는 잘 듣지 못 하게 된다. 이와 유사한 현상을 음향 압축에서 사용하고 있다. 안 들릴 정보는 빼 버리는 것이다. 사람은 그림을 볼 때 명도의 변화에 민감한 반면 색상의 변화에는 상당히 둔감한 특성이 있다. 이를 이용하여 명도 정보는 자세히 하되 색상에 대해서는 덜 자세히 묘사함으로써 정보의 양을 줄일 수 있게 된다.MPEG의 기본적인 압축원리 처음에 MPEG-1은 352 * 240에 30을 기준으로 하는 낮은 해상도로 출발하였다. 그러나 음향 부분에서 만은 CD수준인 16BIT 44.1Khz STEREO 수준으로 표준안이 제정되었다. MPEG에서 사용하는 동영상 압축원리는 두가지 기본 기술을 바탕으로 하고 있다.①공간적 압축기술 - 표본화 주파수 - DCT(Discrete Cosine Transform) - 스캐닝 방법 - 허프만 코딩(Huffmann Coding) - 가변장 부호화②시간적 압축기술 ③움직임 추정과 동영상을 고효율로 압축할 수 있는 기술이 세가지 영상은 MPEG 화상정보를 구성하고 있는 세가지 요소이다. 각 요소의 역할은 다음과 같다. - I-FRAME (Intra-Frame) : 정지 영상을 압축하는 것과 동일한 방법을 사용하는 것으 로 연속되는 화면의 기준을 이루는 화면이다. - P-FRAME (Predict-Frame) : 이전에 재생된 영상을 기준으로 삼아 기준 영상 (I-PRAME)과의 차이점만을 보충하여 재생하는 화면이 며 그 다음에 재생될 P-영상의 기준이 되기도 한다. - B-FRAME (Bidirectional-Frame) : I영상과 P영상 또는 P영상과 다음 P영상 사이에 들 어가는 재생된 영상인데 두 개의 기준영상을 양방향에서 예측해서 붙여내는 영상이라서 이러한 이름을 갖는다.