データ圧縮とは
データ圧縮とは、データを元の内容に影響させず、または許容範囲で情報を間引き、より小さく表現する技術です。主な目的は保存容量と通信量の削減です。送信や保存の前に圧縮し、利用時に伸長(解凍)して元に戻します。
身近な例は、添付ファイルのZIP、Web配信のgzip、写真のJPEG、音楽のMP3、動画のH.264などです。可逆圧縮は完全に元に戻せる方式で、文書やプログラム、ログに向きます。非可逆圧縮は一部を捨てて高い圧縮率を得る方式で、画像・音声・動画でよく使われます。
仕組みは、繰り返しや規則性といった冗長性を見つけ、短い記号に置き換えることです。代表的にはハフマン符号、LZ系や辞書方式、ランレングス、変換と量子化の組み合わせがあります。復元できるように必要な符号化情報も一緒に保存します。
利点は転送時間の短縮、ストレージや回線コストの節約、Web表示の高速化などです。注意点は圧縮・伸長にCPU時間がかかること、非可逆では画質や音質が劣化すること、暗号化後は圧縮が効きにくいことです。
まとめると、圧縮はデータの価値を保ちながらサイズを抑え、ネットワークと保存を効率化する基盤技術です。用途と品質要件に合わせ、方式や圧縮率、処理負荷のバランスを選ぶことが重要です。

