감마톤 필터(Gammatone filter)는 인간의 청각 시스템, 특히 달팽이관 내부의 기저막의 주파수 응답을 모델링하는 데 사용되는 선형 필터의 일종입니다. 감마톤 필터는 다양한 주파수에 대한 인간의 청각 시스템 반응과 매우 유사하기 때문에 음성 및 오디오 신호를 분석하고 처리하는 데 특히 유용합니다. 이 필터는 감마 분포 함수 모양의 대역 통과 주파수 응답이 특징이며, 따라서 "감마톤"이라는 이름이 붙여졌습니다.
감마톤 필터의 임펄스 응답은 다음 공식으로 표현됩니다:
$$ g(t) = a(t) \times cos(2 \pi f_{c} t + \phi)$$
g(t)는 임펄스 응답입니다.
a(t)는 진폭 포락선 함수이며, 일반적으로 감마 함수의 형태를 취하며 다음과 같이 주어집니다:
$$a(t) = t^{n-1} \times e^{-2 \pi bt}$$
감마톤 필터는 중심 주파수, 대역폭, 순서, 위상의 네 가지 파라미터로 정의됩니다. 이러한 파라미터는 수신 오디오 신호에 대한 필터의 응답을 결정합니다.
- 중심 주파수(Center frequency: $Hz$)[$f_{c}$]: 필터가 최대 응답을 보이는 주파수입니다. 필터가 모델링하는 기저막의 특정 영역에 해당합니다.
- 대역폭(Bandwidth: $Hz$)[$b$]: 필터가 유의미한 응답을 갖는 주파수 범위의 폭을 나타냅니다. 대역폭은 인간 청각 시스템의 등가 직사각형 대역폭(ERB)에 의해 결정되며 일반적으로 중심 주파수의 함수입니다.
- 차수(Order)[$n$]: 필터의 차수는 필터의 주파수 응답의 선명도를 결정합니다. 차수가 높을수록 통과 대역 주파수와 정지 대역 주파수 사이의 롤오프가 가파르게 진행되어 주파수 선택성이 향상됩니다. 일반적으로 차수는 4로 설정되는데, 이는 인간의 청각 시스템 반응에 대한 좋은 근사치를 제공하는 것으로 밝혀졌기 때문입니다.
- 위상(Phase: Radian)[$\phi$]: 이 파라미터는 필터의 임펄스 응답의 시간 내 위치를 제어합니다. 주파수 응답에는 영향을 미치지 않지만 기저막의 타이밍 속성을 모델링하는 데 중요할 수 있습니다.
※ 시간(Time: $sec$)[$t$]
감마톤 필터는 음성 인식, 음성 합성, 보청기, 인공 와우 및 다양한 오디오 처리 작업과 같은 애플리케이션에서 널리 사용되었습니다. 감마톤 필터는 인간의 청각 시스템에서 청각 처리의 초기 단계를 이해하고 모델링하는 데 필수적인 도구입니다.