| Home | E-Submission | Sitemap | Editorial Office |  
top_img
Korean Journal of Otorhinolaryngology-Head and Neck Surgery > Volume 52(4); 2009 > Article
Korean Journal of Otorhinolaryngology-Head and Neck Surgery 2009;52(4): 307-311.
doi: https://doi.org/10.3342/kjorl-hns.2009.52.4.307
Effects of Various Background Noises on Speech Intelligibility of Normal Hearing Subjects.
Seong Hee Lee, Hyun Joon Shim, Sang Won Yoon, Kyoung Won Lee
1Department of Otolaryngology, School of Medicine, Eulji University, Seou, Korea. eardoc11@naver.com
2Hallym Institute of Advanced International Studies, Seoul, Korea.
배경소음의 유형이 정상인의 어음인지력에 미치는 영향
이성희1 · 심현준1 · 윤상원1 · 이경원2
을지대학교 의과대학 이비인후과학교실1;한림국제대학원대학교 청각학과2;
주제어: 소음어음인지력인지신호.
ABSTRACT
BACKGROUND AND OBJECTIVES:
In auditory tests, several kinds of background noises have been used ; multitalker babble noise, speech noise and white noise, etc. The aim of the present study was to evaluate the effects of different types of background noises on speech intelligibility.
SUBJECTS AND METHOD:
Sixty volunteers having pure-tone thresholds less than 25 dB HL participated in this study. Their ages ranged from teens to sixties with ten subjects in each age group (mean age=40+/-15.4 years, m=25, f= 35) We used three types of background noises used in this study ; multitalker babble noise using the voices of Korean speakers, speech noise using English sentences and white noise. Fifty percent recognition of signal to noise ratios (SNRs) and word recognition scores (WRSs) at -10, -5, 0 dB SNR conditions were measured at 70 dB HL of noise intensity.
RESULTS:
Fifty percent recognition of SNRs on multitalker babble, speech and white noise were -12.4+/-1.4 dB, -13.7+/-1.0 dB and -15.8 +/-1.0 dB, respectively and they were significantly different each other (p< 0.05). Multitalker babble noise generated the lowest WRSs followed by speech noise and then white noise (p< 0.05).
CONCLUSION:
These results support that multitalker babble noise using the voices of Korean speakers influence on normal listener's speech intelligibility more than speech noise from English sentences or white noise
Keywords: NoiseSpeech intelligibilityRecognitionSignal

교신저자:심현준, 139-872 서울 노원구 하계 1동 280-1  을지대학교 의과대학 이비인후과학교실
교신저자:전화:(02) 970-8276 · 전송:(02) 970-8275 · E-mail:eardoc11@naver.com

 

서     론


  
청각검사에 자주 사용되는 배경잡음에는 여러 사람의 말소리를 녹음하여 만든 다화자잡음(multitalker babble noise)과 1인 화자가 읽는 문장의 long term average spectrum을 산출하여 광역대잡음의 형태로 만든 speech noise, 그리고 20 Hz
~20 kHz 범위의 주파수에 대해 일정한 에너지 스펙트럼의 밀도를 가진 무작위적 음향신호인 백색잡음 등이 있다.1,2) 백색잡음은 모든 주파수 대역에서 균일한 에너지를 가지고 있어 저주파 대역에서 큰 에너지를 가지다가 주파수가 높아질수록 점차 줄어드는 어음과는 에너지 스펙트럼의 차이가 많아 어음청각검사에서는 거의 사용되지 않고 주로 순음청력검사의 차폐음으로 사용된다.1) 다화자잡음과 speech noise는 두 가지 모두 본질적으로 어음을 기초로 만들어진 소음이기 때문에 주파수에 따른 스펙트럼의 모양은 큰 차이가 나지 않지만 시간 상수에 대한 waveform을 보면 다화자잡음이 speech noise나 백색잡음에 비하여 큰 시간적 변화(temporal variation)를 보이는 특성을 가지고 있다.1,3,4) 또 다화자잡음은 여러 사람들의 웅성거리는 소리를 녹음한 것으로 실제 문장의 의미가 포함되어 들리는 반면 speech noise는 목표 어음과 주파수별 에너지 스펙트럼을 일치시켜 인위적으로 만들어낸 것으로 의미 없는 광역대잡음으로 들리게 된다.1,5,6) 두 잡음은 모두 언어를 바탕으로 하므로 각국의 언어에 따라 같은 유형의 잡음이라도 그 스펙트럼에 차이가 날 수 있다.
   외국에서는 여러 종류의 소음 환경하에서 시행되는 어음 청각검사들이 개발되어 사용되고 있는데, speech perception in noise test, connected speech test, speech in noise test 등에서는 영어 다화자잡음이 이용되고 있으며 HINT (hearing in noise test)에서는 영어 문장을 long term average spectrum으로 분석하여 만든 speech noise를 사용하고 있다.
   본 연구에서 저자들은 한국어로 만들어진 다화자잡음과 영어 문장의 스펙트럼에서 산출된 speech noise, 그리고 백색잡음이 정상인의 어음인지력에 미치는 영향을 비교해 보고자 하였다. 아울러 각 배경잡음이 연령에 따라 어음의 차폐 효과에 차이를 나타내는지 알아보고자 하였다.

대상 및 방법

대  상
  
10대부터 60대까지 연령별로 각각 10명씩 총 60명의 정상 청력을 가진 지원자들을 대상으로 하였고, 대상자들의 평균연령은 40±15.4세이고, 남자는 25명, 여자는 35명이었다. 이들은 정상고막 소견과 tympanometry 결과 A type을 보였고, 양측 모두 순음청력검사상 250
~8,000 Hz 전 주파수 대역에서 25 dB HL 이하의 정상 청력을 나타내었으며 이과학적 과거력이나 가족력은 없었다.

검사기기
  
임피던스 청력검사는 Zodiac 901(Madsen electronics, Copenhagen, Denmark)을 사용하여 측정하였고, 청력검사는 Orbiter 922(GN otometrics, Copenhagen, Denmark)를 이용하여 방음실 내에서 TDH-50P 헤드폰을 사용하여 시행하였다. 음장(sound field)검사는 청력검사기에 증폭기를 이용해 스피커와 연결하여 시행하였고, 신호와 잡음이 제시되는 스피커는 피검자와 1 m 거리에서 정면(0
°)을 유지하게 하였다. 

소음의 유형
  
다화자잡음의 경우 정상 청력을 가진 20대의 남녀 20명(남 10명, 여 10명, 평균:21.7세)을 대상으로 드라마 대본, TV 뉴스, 신문 등을 2분 동안 읽게 하여 각각 녹음하였다. 녹음시 송화기는 Shure microphone을 사용하였고, 화자의 입과 송화기의 거리는 10 cm를 유지하게 하였으며, 녹음시 표본화 주파수(sampling frequency)는 45,000 Hz이었다. 녹음한 데이터는 computerized speech lab 4,500 (KayPENTAX, New Jersey, USA)을 이용하여 각각의 데이터를 표준화한 후 합성하였다. 합성한 다화자잡음의 long term average spectrum은 125 Hz에서 59.3 dB로 가장 큰 에너지 강도를 보이다가 고주파수로 갈수록 점차 감소하는 특성을 보이고 125 Hz 이상에는 특별한 peak나 dip은 나타나지 않았다(Fig. 1). Speech noise는 영어 문장의 long term average spectrum에서 필터링하여 만든 잡음으로 600 Hz에서 53.8 dB로 가장 큰 peak를 보이고 고주파로 갈수록 서서히 에너지가 감소하지만 다화자잡음과 비교하여 고주파수에서는 상대적으로 큰 에너지를 가지는 특성을 보이고 여러 개의 peak와 dip을 보이고 있다(Fig. 1). 백색잡음은 회화음역 전 주파수 대역에서 동일한 에너지 강도를 가지는 주파수 특성을 보이고 있다(Fig. 1). 시간에 따른 진폭의 변화는 백색잡음이 가장 작았고, 다화자잡음이 상대적으로 크게 나타났다(Fig. 2). 

소음유형에 따른 신호대잡음비의 측정 
  
피검자의 정면 1 m 앞에 설치된 스피커에서 신호와 세 가지 소음이 무작위적으로 나오게 만든 음장에서 소음의 강도는 70 dB HL로 고정시키고 Ham 등에 의해 개발된 양양격 이음절어를 피검자에게 숙지시킨 후 live voice로 제시하였다.7) 이 때 제시되는 신호음의 강도는 20 dB SPL로 맞춘 0 dB HL을 volume unit meter에서 유지하였다. 80 dB HL에서 5 dB 간격으로 최초 오 반응을 보일 때까지 신호음의 자극강도를 줄였다. 최초 오 반응을 보인 자극 강도에서 1 dB 상승시켜 정반응을 보이면 3 dB 하강, 오 반응을 보이면 1 dB 상승시키는 수정상승법으로 50% 이상 정반응을 보이는 역치를 구하였다. 동일한 방법으로 네 가지 소음환경에서 반복 검사하였고, 신호대잡음비는 50% 이상 정반응을 보이는 역치에서 고정된 잡음의 강도인 70 dB HL을 뺀 값으로 계산하였다. 

소음유형에 따른 word recognition score(WRS)의 측정
  
세 가지 소음을 70 dB HL의 강도로 고정하고 신호대잡음비가 -10, -5, 0 dB인 조건에서 피검자마다 Ham 등에 의해 개발된 일음절어 목록 중 25개씩 live voice로 제시하여 정반응한 개수를 %로 나타내었다.

통계분석
  
통계프로그램은 SPSS 프로그램(Ver 13.0, SPSS Inc., Chicago, IL, USA)을 사용하였다. 소음의 종류에 따른 신호대잡음비와 어음인지도는 One-way ANOVA를 이용하여 비교하였고, 연령에 따른 저연령군과 고연령군 두 그룹 간의 신호대잡음비와 어음인지도의 상관관계는 Mann-Whitney test를 이용하여 비교하였다. 이 때 p<0.05인 경우에 통계적으로 유의한 차이가 있는 것으로 판정하였다.

결     과

   신호대잡음비가 더 큰 음수를 나타낼수록 소음환경에서 어음인지력이 더 높음을 의미하게 된다. 세 가지 소음환경에서 신호대잡음비를 측정한 결과 다화자잡음에서 -12.4±1.1 dB, speech noise에서 -13.7±1.0 dB, 백색잡음에서 -15.8±1.0 dB로 나타나 다화자잡음, speech noise, 백색잡음 순서대로 저조한 신호대잡음비를 보였고, 이것은 다화자잡음이 가장 낮은 어음인지력을 보임을 의미한다(p<0.05)(Fig. 3). 
   세 가지 소음환경에서 측정한 WRS는 다화자잡음에서 신호대잡음비가 0 dB일 때 90.3±3.4%, -5 dB일 때 75.9±6.2%, -10 dB일 때 58.9±6.5%였다. Speech noise에서는 각 신호대잡음비에서 92.5±3.3%, 85.5±3.8%, 64.2±5.3%이었으며, 백색잡음에서는 95.8±2.7%, 88.9±3.8%, 75.6±6.7%로 나타났다, 세 가지 신호대잡음비 조건 모두 다화자잡음 환경에서 가장 낮은 점수를 보였고, 그 다음으로 speech noise, 백색잡음 순이었고 이는 통계적으로 유의하였다(p<0.05)(Fig. 4). 
   연령에 따른 결과를 살펴보면, 10
~20대의 저연령군과 50~60대의 고연령군 두 집단 간의 신호대잡음비는 다화자잡음 환경하에서만 저연령군이 고연령군에 비해 낮은 신호대잡음비를 보였다(p<0.05)(Fig. 5). WRS의 측정 결과 다화자잡음 환경에서는 세 가지 신호대잡음비 조건 모두 저연령군이 고연령군에 비해 높은 수행력을 보였고, speech noise 환경에서는 신호대잡음비가 -5, -10 dB인 조건에서 두 군 간에 차이를 보였으며(p<0.05), 백색잡음 환경에서는 두 집단 간의 수행력에는 차이가 없는 것으로 나타났다(p>0.05)(Fig. 6).

고     찰

   각 연령대별로 정상인을 대상으로 세 가지 소음환경에서 신호대잡음비와 WRS를 비교한 결과 다화자잡음 환경하에서 가장 낮은 수행력을 보였고, 다음으로 speech noise, 백색잡음 순이었고, 이것은 그 순서대로 어음의 차폐 효과가 크다는 것을 의미한다.
   정상 청력을 가진 31명의 성인을 대상으로 Bamfold-Kowal-Bench 문장검사를 이용한 연구를 보면 4인 화자의 다화자잡음이 speech noise와 비교하여 문장 이해도를 더 악화시키는 것으로 나타나 본 연구의 일치하는 결과를 보였다.8) 검사 신호를 문장이 아닌 Northwestern University Auditory test No. 6의 50단어로 시행한 연구에서도 6인 화자의 다화자잡음 환경에서 speech noise보다 낮은 수행력을 보이는 것을 확인할 수 있다.9) 이러한 결과는 speech noise는 에너지만 가지고 있는 차폐음인 반면 다화자잡음은 에너지뿐 아니라 의미 있는 어음정보가 포함되어 듣고자 하는 어음 신호에 대한 간섭효과가 더 크게 작용하기 때문이라고 설명될 수 있다.
   그러나 word in noise test를 이용한 또 다른 연구에서는 다화자잡음보다 speech noise가 더 큰 차폐 효과를 나타내는 것으로 보고한 연구도 있었는데, 이러한 결과는 다화자잡음이 시간흐름에 따른 진폭의 변화가 크기 때문에 소음의 강도가 순간적으로 약해지는 noise valley들에서 어음 정보를 습득할 기회가 더 많기 때문이라고 설명하였다.4,10,11) 그러나 저자들의 연구에서는 다화자잡음의 시간적 변화가 다른 연구들에 비하여 큰 편이 아니라 이러한 요소보다는 의미 있는 정보에 의한 간섭효과가 더 크게 작용했던 것으로 추정된다. 거기에 저자들이 이용한 speech noise는 영어 문장과 동일한 스펙트럼으로 만들어진 것으로 한국어 다화자잡음에 비하여 여러 개의 peak와 dip을 보이는 특징을 가졌는데 이러한 점도 결과에 영향을 미쳤을 것으로 생각된다. 언어의 차이에 따라 에너지 스펙트럼은 차이를 보이는데 현재 국내에서 일반적으로 어음청각검사에서 사용하는 차폐음은 영어 문장을 기초로 만든 speech noise로 한국어음을 차폐하는 효과가 다소 떨어질 것으로 예상된다.
   백색잡음은 저음역대의 에너지가 적어 어음 스펙트럼과 큰 차이를 보이기 때문에 적절한 차폐가 이루어지지 않은 것으로 생각된다. 다른 연구들에서도 같은 결과를 보이는데 미군 부대에서 사용하는 암호를 신호로 이용하여 다화자잡음, 백색잡음, pink noise의 차폐 능력을 비교한 연구에서는 pink noise가 가장 큰 차폐 효과를 보였고 다화자잡음, 백색잡음이 그 다음 순서로 나타났다고 하였다.12) 소음이 어음인지에 미치는 영향을 뇌파의 변화 형태로 볼 수 있는 mismatch negativity를 이용한 연구에 의하면 청각중추에서도 다화자잡음이 백색잡음에 비해 더 큰 영향을 미치는 것을 확인할 수 있다.13)
   본 연구에서 연령에 따라 두 군으로 나누어 비교하였을 때 신호대잡음비는 다화자잡음 환경하에서 차이를 보이고, WRS는 다화자잡음 환경과 speech noise 환경에서 차이를 보여, 어음을 인지하기 비교적 쉬운 소음환경에서는 연령에 따른 차이를 보이지 않지만 어려운 소음상황에서는 고연령군에서 더욱 언어 인지의 어려움을 겪게 되는 것으로 나타났다. 일반적으로 고연령군에서는 청각중추의 인지기능이 떨어지면서 같은 청력역치를 가진 경우에도 소음에 의한 방해를 크게 받는 것으로 알려져 있는데,8,14,15) 본 연구에서는 어음인지력에 가장 큰 영향을 미치는 다화자잡음에서 저연령군과 고연령군의 차이가 가장 뚜렷이 나타났다.

결     론

   한국어 다화자잡음과 영어 문장과 동일한 스펙트럼을 가지는 speech noise, 그리고 백색잡음이 정상인의 어음인지력에 미치는 영향을 비교한 결과 다화자잡음, speech noise, 백색잡음 순으로 나타났다. 특히 다화자잡음의 경우 저연령군에 비하여 고연령군에서 더 큰 차폐 효과를 나타내는 것으로 확인되었다.


REFERENCES

  1. Katz J, Lezynski J. Clinical masking. In: Katz J, editor. Handbook of clinical audiology. 5th ed. U.S.A: Lippincott Williams& Wilkins;2002. p.124-41.

  2. Fastle H, Zwicker E. Information processing in the auditory system. In: Fastle H, Zwicker E, editors. Psychoacoustics. 3rd ed. Europe: Springer;2007. p.61-110.

  3. Hallgren M, Larsby B, Lyxell B, Arlinger S. Speech understanding in quiet and noise, with and without hearing aids. Int J Audiol 2005;44(10):574-83.

  4. Wilson RH, Carnell CS, Cleghorn AL. The words-in-noise (WIN) test with multitalker babble and speech-spectrum noise maskers. J Am Acad Audiol 2007;18(6):522-9.

  5. Noordhoek IM, Houtgast T, Festen JM. Measuring the threshold for speech reception by adaptive variation of the signal bandwidth. I. Normal-hearing listeners. J Acoust Soc Am 1999;105(5):2895-902.

  6. Summers V, Molis MR. Speech recognition in fluctuating and continuous maskers: Effects of hearing loss and presentation level. J Speech Lang Hear Res 2004;47(2):245-56.

  7. Kim LS. Hearing test. In: Kim JS, Jang SO, Im HH, Lee JK, Lee CH, Wang SG, et al. editors. Otorhinolaryngology-Head and Neck Surgery. 3rd ed. Korea: Ilchokak;2006. p.451-79.

  8. Cainer KE, James C, Rajan R. Learning speech-in-noise discrimination in adult humans. Hear Res 2008;238(1-2):155-64.

  9. Sperry JL, Wiley TL, Chial MR. Word recognition performance in various background competitors. J Am Acad Audiol 1997;8(2):71-80.

  10. Peters RW, Moore BC, Baer T. Speech reception thresholds in noise with and without spectral and temporal dips for hearing impaired and normally hearing people. J Acoust Soc Am 1998;103(1):577-87.

  11. Gnansia D, Jourdes V, Lorenzi C. Effect of masker modulation depth on speech masking release. Hear Res 2008;239(1-2):60-8.

  12. Rao MD, Letowski T. Callsign acquisition test (CAT): Speech intelligibility in noise. Ear Hear 2006;27(2):120-8.

  13. Kozou H, Kujala T, Shtyrov Y, Toppila E, Starck J, Alku P, et al. The effect of different noise types on the speech and non-speech elicited mismatch negativity. Hear Res 2005;199(1-2):31-9.

  14. Snell KB, Mapes FM, Hickman ED, Frisina DR. Word recognition in competing babble and the effects of age, temporal processing, and absolute sensitivity. J Acoust Soc Am 2002;112(2):720-7.

  15. Pichora-Fuller MK, Schneider BA, Daneman M. How young and old adults listen to and remember speech in noise. J Acoust Soc Am 1995;97(1):593-608.


Editorial Office
Korean Society of Otorhinolaryngology-Head and Neck Surgery
103-307 67 Seobinggo-ro, Yongsan-gu, Seoul 04385, Korea
TEL: +82-2-3487-6602    FAX: +82-2-3487-6603   E-mail: kjorl@korl.or.kr
About |  Browse Articles |  Current Issue |  For Authors and Reviewers
Copyright © Korean Society of Otorhinolaryngology-Head and Neck Surgery.                 Developed in M2PI
Close layer
prev next