Wavelet
1. Wavelet là gì ?
Wavelet giúp nhìn được tổng thể, vừa soi được chi tiết nhỏ trong tín hiệu hay hình ảnh. Khác với Fourier chỉ biết có tần số gì mà không biết nó xuất hiện ở đâu, Wavelet cho phép phân tích từng phần cụ thể, biết rõ chi tiết nào nằm ở vị trí nào và mang tần số gì. Nhờ đó, nó rất phù hợp cho dữ liệu phức tạp như khuôn mặt, giúp chỉnh sửa biểu cảm mà không làm vỡ chi tiết ảnh. Ngoài ra, Wavelet còn ứng dụng mạnh trong nén ảnh, xử lý âm thanh hay dữ liệu y sinh.
2. Time and frequency domains
2.1. Time Domain
- Tín hiệu được biểu diễn theo thời gian.
- Mỗi điểm là giá trị của tín hiệu tại một thời điểm cụ thể.
2.2. Frequency Domain
- Tín hiệu được biểu diễn dưới dạng các thành phần tần số.
- Cho biết tín hiệu chứa bao nhiêu sóng với các tần số khác nhau.
2.3. Mối liên hệ giữa Time và Frequency Domain
- Time domain: Thấy tín hiệu "khi nào" diễn ra gì, nhưng khó thấy rõ cấu trúc tần số.
- Frequency domain: Biết rõ tín hiệu gồm những tần số nào, nhưng không biết chúng xuất hiện "ở đâu" hoặc "khi nào".
Chuyển đổi qua lại:
- Dùng Fourier Transform hoặc Wavelet Transform để:
- Phân tích tín hiệu sang frequency domain.
- Phục hồi tín hiệu về time domain.
Thực tế trong hình ảnh:
- Tần số thấp → Vùng màu mượt, ít chi tiết (nền trời, da mặt mịn).
- Tần số cao → Cạnh sắc nét, chi tiết nhỏ (viền mắt, tóc).
3. Fourier Transform
3.1. Khái niệm
- Fourier Transform giúp phân tích tín hiệu thành tập hợp các sóng sin và cos với tần số khác nhau.
- Bất kỳ tín hiệu nào — âm thanh, hình ảnh, sóng điện… đều có thể phân tích thành nhiều sóng sin/cos cộng lại.
3.2. Công thức cơ bản (Continuous FT)
Cho tín hiệu 1 chiều :
Trong đó:
- : Tín hiệu theo thời gian.
- : Thành phần tần số (frequency domain).
- : Tần số góc (rad/s).
- : Sóng sin/cos phức đại diện cho dao động.
Hiểu đơn giản:
- Fourier xem tín hiệu là tập hợp sóng sin/cos có tần số, biên độ và pha khác nhau.
- cho biết có bao nhiêu năng lượng ở mỗi tần số.
3.3. Phân biệt Time domain và Frequency domain
- Time domain: Xem tín hiệu dưới dạng biến thiên theo thời gian (hoặc không gian với ảnh).
- Frequency domain: Xem tín hiệu dưới dạng tần số, biết có bao nhiêu thành phần trầm bổng, chi tiết.
Fourier Transform là cầu nối giữa 2 miền:
- Phân tích từ time → frequency.
- Dùng Inverse Fourier Transform (IFT) để phục hồi từ frequency → time.
3.4. Hạn chế lớn nhất của Fourier
- Không biết được:
- Khi nào các tần số xuất hiện.
- Tần số có thay đổi theo thời gian không.
Vì sao?
- Fourier phân tích toàn bộ tín hiệu cùng lúc → không có tính cục bộ.
- Đối với tín hiệu không ổn định (thay đổi theo thời gian), Fourier không hiệu quả.
Giải pháp:
- Short-Time Fourier Transform (STFT): Dùng khung cửa sổ (window) để có chút thông tin về thời gian.
- Wavelet Transform: Cao cấp hơn STFT, giúp phân tích đa cấp độ, biết rõ hơn vị trí + tần số.
4. Wavelets - localized functions
4.1. Localized Function
- Hàm cục bộ chỉ tồn tại hoặc có giá trị lớn tại một vùng nhất định.
- Ngoài vùng đó, giá trị gần như bằng 0.
- Ví dụ:
- Hàm sóng sin cos của Fourier kéo dài vô tận → toàn cục.
- Hàm sóng của Wavelet chỉ dao động 1 khoảng ngắn → cục bộ
- Localized Functions vô cùng quan trọng vì nó giúp phân tích từng vùng cụ thể trong ảnh
- Fourier không cục bộ, nên khi thay đổi một thành phần, toàn bộ tín hiệu có thể bị ảnh hưởng → không phù hợp với chỉnh sửa tinh tế trên ảnh.
4.2. Công thức tổng quát của Wavelet
4.2.1. Điều kiện Giới hạn Năng lượng (Finite Energy)
- Hàm Wavelet phải có năng lượng hữu hạn:
Ý nghĩa dễ hiểu:
- Hàm phải tập trung trong một khoảng giới hạn (cục bộ).
- Không được kéo dài vô tận với biên độ lớn như sóng sin/cos của Fourier.
4.2.2. Điều kiện Trung bình bằng 0 (Zero Mean)
Hiểu nôm na:
- Tổng diện tích phần trên và phần dưới trục thời gian cân bằng nhau.
- Tín hiệu Wavelet dao động quanh giá trị trung bình là 0.
Tại sao cần?
- Đảm bảo Wavelet phù hợp để phát hiện sự thay đổi, cạnh, biên, hoặc chi tiết khác biệt trong tín hiệu hoặc ảnh.
4.2.3. Tính chất Cục bộ về Thời gian và Tần số (Time-Frequency Localization)
- Wavelet phải "tập trung" được cả về:
Không gian/thời gian — biết vị trí chi tiết xuất hiện.
Tần số — biết tín hiệu chứa những dao động gì.
Khác với Fourier:
- Fourier chỉ tập trung tần số, không biết vị trí.
- Wavelet kết hợp được cả 2 — phân tích đa cấp độ và cục bộ.
4.2.4. Tính chất Tạo khung phân tích đầy đủ (Admissibility Condition)
Một Wavelet phải đảm bảo công thức:
Trong đó:
- là biến đổi Fourier của hàm Wavelet .
- $C_\psi$ là hằng số cần có giá trị hữu hạn.
Ý nghĩa thực tế:
- Đảm bảo khi phân tích tín hiệu bằng Wavelet, có thể tái tạo lại đầy đủ tín hiệu gốc từ miền Wavelet.
4.2.5. Phân cấp bằng phép co giãn và tịnh tiến (Scale & Translation Property)
Hàm Wavelet tạo thành các hàm con nhờ phép co giãn và dịch chuyển:
Trong đó:
- là tham số tỉ lệ (scale):
- Nhỏ → Nhìn chi tiết, zoom sâu.
- Lớn → Nhìn tổng thể, bao quát.
- là tham số dịch (shift):
- Dò tìm vị trí khác nhau trong tín hiệu hoặc ảnh.
Đảm bảo:
- Phân tích tín hiệu hoặc ảnh từ tổng quát đến chi tiết.
- Phù hợp xử lý ảnh đa độ phân giải hoặc đa cấp biểu cảm khuôn mặt.
4.3. Real Morlet wavelet
4.3.1. Morlet Wavelet là gì?
- Là loại Wavelet được tạo thành từ:
- Một sóng sin hoặc cos (dao động đều đặn).
- Kết hợp với hàm Gaussian (hình chuông) để "cắt ngắn", tập trung vào một vùng nhỏ.
Hiểu đơn giản:
- Sóng Morlet giống như sóng sin bình thường, nhưng chỉ tồn tại trong khoảng ngắn, không kéo dài vô tận.
4.3.2. Công thức của Real Morlet Wavelet
Dạng thực (Real) được viết:
Trong đó:
- : Trục thời gian hoặc không gian.
- $f_0$ : Tần số trung tâm của sóng.
- : Hàm Gaussian, làm sóng tập trung cục bộ, giảm nhanh về 0 ngoài vùng quan tâm.
Tóm lại: Là sự pha trộn giữa sóng dao động (cosine) và tính cục bộ (Gaussian).
4.3.3. Đặc điểm nổi bật của Real Morlet Wavelet
- Có tính cục bộ về không gian/thời gian.
- Phân tích rõ thành phần tần số.
- Rất phù hợp để phát hiện tín hiệu dao động ngắn hạn.
- Được dùng nhiều trong:
- Xử lý tín hiệu (EEG, âm thanh).
- Xử lý ảnh, đặc biệt là phân tích cạnh và kết cấu.
4.3.4. So sánh với các Wavelet khác
Loại Wavelet | Ưu điểm chính | Nhược điểm |
---|---|---|
Haar | Rất đơn giản, tính toán nhanh | Phân giải tần số kém |
Daubechies | Phân giải tốt, nhiều biến thể | Phức tạp hơn Haar |
Morlet (Real) | Phân tích tần số rất rõ, cục bộ mạnh | Đòi hỏi tính toán nhiều hơn |
4.4. Wavelet Transform
4.4.1. Wavelet Transform là gì?
- Là phương pháp phân tích tín hiệu hoặc ảnh thành các thành phần:
- Theo từng vùng cụ thể (cục bộ).
- Ở nhiều cấp độ tỉ lệ khác nhau (đa phân giải).
- Nắm được cả thông tin về vị trí và tần số.
Tóm lại: Wavelet Transform giúp "phóng to" từng phần nhỏ của tín hiệu hoặc ảnh, nhìn rõ cấu trúc từ tổng thể đến chi tiết, thay vì chỉ nhìn toàn cục như Fourier.
4.4.2. Nguyên lý hoạt động của Wavelet Transform
Dựa trên việc:
- Dùng một hàm Wavelet cơ sở (ví dụ: Morlet, Haar…)
- Thực hiện:
- Co giãn (scale) → Nhìn tổng quát hoặc chi tiết.
- Tịnh tiến (shift) → Quét toàn bộ tín hiệu/ảnh.
Công thức tổng quát:
Trong đó:
- : Tín hiệu hoặc ảnh gốc.
- : Wavelet đã co giãn, dịch chuyển:
- : Hệ số scale (nhìn to/nhỏ).
- : Hệ số dịch (quét từng vị trí).
- : Hệ số biến đổi — chứa thông tin về tần số và vị trí.
4.4.3. Các loại Wavelet Transform phổ biến
Loại Wavelet Transform | Ứng dụng chính |
---|---|
Continuous Wavelet Transform (CWT) | Phân tích chính xác toàn miền tần số/thời gian |
Discrete Wavelet Transform (DWT) | Phân tích nhanh, dùng nhiều trong ảnh/video |
Multi-Level 2D DWT | Phân tích ảnh theo cấp độ, tạo pyramid ảnh |
4.4.4. Lợi ích nổi bật của Wavelet Transform
- Phân tích cục bộ — biết rõ vị trí tín hiệu/chi tiết xuất hiện.
- Phân giải đa cấp độ — nhìn tổng thể và chi tiết cùng lúc.
- Phát hiện cạnh, biên, chi tiết nhỏ trong ảnh cực tốt.
- Nén ảnh/video thông minh, giữ lại vùng quan trọng.
4.4.5. Minh họa Wavelet Transform trên Ảnh
Ảnh được phân tích thành:
- LL (Low-Low): Thành phần tổng thể (mờ).
- LH, HL, HH: Thành phần chi tiết theo chiều ngang/dọc/chéo.
Với mỗi cấp độ, ta lại tiếp tục phân tích ảnh LL → tạo phân giải đa cấp.
Ứng dụng:
- Thay đổi cảm xúc khuôn mặt chỉ cần chỉnh thành phần chi tiết (HH, HL, LH).
- Giữ nguyên cấu trúc tổng thể ảnh (LL) → Ảnh không bị méo, mô hình nhẹ.
4.5. Mother Wavelet
4.5.1. Mother Wavelet là gì?
- Là hàm cơ sở (hàm mẹ) dùng để tạo ra toàn bộ hệ thống các Wavelet con nhờ phép:
- Co giãn (scale).
- Tịnh tiến (shift).
Ví dụ, các hàm mẹ phổ biến:
- Haar Wavelet — Đơn giản, dạng bậc thang.
- Daubechies — Phân giải tốt, mềm mại hơn.
- Morlet — Sóng sin kết hợp Gaussian, mạnh về phân tích tần số.
4.5.1. Tại sao cần chỉnh sửa Mother Wavelet?
Mỗi bài toán có yêu cầu khác nhau:
- Phân tích ảnh y tế cần Wavelet mượt, chi tiết.
- Phát hiện cạnh, biên cần Wavelet sắc nét, nhạy biên.
- Thay đổi cảm xúc khuôn mặt cần Wavelet tập trung vùng mắt, miệng.
Do đó, ta cần:
- Thiết kế hoặc tinh chỉnh Mother Wavelet cho phù hợp mục tiêu.
- Có thể giúp:
- Nâng cao độ chính xác.
- Làm nhẹ mô hình.
4.5.1. Các cách chỉnh sửa Mother Wavelet
Thay đổi tham số
Ví dụ với Morlet Wavelet:
- : Tần số trung tâm → kiểm soát độ nhạy tần số.
- : Độ rộng Gaussian → kiểm soát tính cục bộ.
Điều chỉnh:
- Tăng → Phân giải tần số cao hơn, nhạy hơn.
- Giảm → Sóng tập trung ngắn hơn, chi tiết hơn.
Thiết kế hàm mẹ mới
Có thể tự xây dựng hàm mẹ:
- Đảm bảo:
- Trung bình bằng 0 (Zero Mean).
- Năng lượng hữu hạn (Finite Energy).
- Điều chỉnh theo đặc thù ảnh khuôn mặt hoặc cảm xúc.
Ví dụ:
- Tạo Wavelet có biên độ mạnh ở tần số vùng mắt, miệng — tập trung thay đổi biểu cảm khuôn mặt.
- Giữ nguyên vùng trán hoặc má nếu không cần chỉnh sửa.
5. Wavelet trên Ảnh
5.1. Lấy ví dụ ảnh khuôn mặt
- Ảnh chứa:
- Thành phần tổng thể: hình dáng khuôn mặt, bố cục chung.
- Thành phần chi tiết: đường viền mắt, miệng, nếp nhăn, kết cấu da.
- Nếu chỉnh sửa toàn bộ ảnh:
- Dễ làm méo khuôn mặt.
5.2. Khi dùng 2D Wavelet Transform (DWT)
- Phân tích ảnh thành 4 phần:
Thành phần | Ý nghĩa | Ví dụ trên khuôn mặt |
---|---|---|
LL | Thông tin thấp tần (tổng thể) | Hình dáng chung của mặt, vị trí mắt, miệng |
LH | Biên đứng (chi tiết ngang) | Đường viền dọc của mũi, khóe miệng |
HL | Biên ngang (chi tiết dọc) | Đường viền ngang của mắt, lông mày |
HH | Chi tiết chéo, kết cấu nhỏ | Nếp nhăn, kết cấu da, vùng râu, tóc |
5.3. Ảnh hưởng từng phần khi can thiệp
Thành phần | Nếu chỉnh sửa nó | Ảnh hưởng cụ thể |
---|---|---|
LL | Chỉnh nhẹ (hoặc giữ nguyên) | Khuôn mặt không bị biến dạng tổng thể |
LH, HL | Chỉnh sửa mạnh hơn | Thay đổi rõ rệt viền mắt, miệng, lông mày |
HH | Tăng/giảm hoặc làm mờ | Làm da mịn hơn, hoặc nhấn mạnh kết cấu |
Nếu chỉ muốn thay đổi cảm xúc:
- Tác động chủ yếu vào LH, HL, HH.
- Giữ nguyên LL để không làm méo bố cục mặt.
5.4. Minh họa Quy trình Cụ thể
Giả sử muốn chỉnh miệng cười:
- Dùng DWT tách ảnh khuôn mặt:
- LL: Giữ nguyên — khuôn mặt không méo.
- LH/HL/HH: Tác động vùng miệng, chỉnh đường viền cong hơn.
Tái tạo lại ảnh sau khi chỉnh:
- Tổng thể không khác biệt nhiều.
- Kết quả:
- Miệng cười rõ hơn.
- Biểu cảm thay đổi tự nhiên.
- Không cần xử lý toàn bộ ảnh → mô hình nhẹ hơn.
All rights reserved