| Home | E-Submission | Sitemap | Editorial Office |  
top_img
Korean Journal of Otorhinolaryngology-Head and Neck Surgery > Volume 46(9); 2003 > Article
Korean Journal of Otorhinolaryngology-Head and Neck Surgery 2003;46(9): 737-741.
Frequencies of Korean Syllables and the Distribution of Syllables of PB Word List.
Sung Wan Byun
Department of Otolaryngology, College of Medicine, Ewha Womans University, Seoul, Korea. byunsw@ewha.ac.kr
한국어의 음절빈도와 단음절 어음표의 음절분포
변성완
이화여자대학교 의과대학 이비인후과학교실
주제어: 어음청력검사어음명료도검사.
ABSTRACT
BACKGROUND AND OBJECTIVES:
There can be 3, 192 syllables in Korean language but the frequencies of each syllables are variable. This study was aimed to investigate the frequencies of each Korean syllable in the everyday dialogue and to compare the result with the existing Korean phonetically balanced (PB) word list, which can provide the basic data for the standardization of Korean PB word list.
MATERIALS AND METHOD:
Using 33 materials (total 537, 245 syllables) collected from TV drama (MBC Best Theater), the author calculated the frequencies of each Korean syllables composed of initial consonant and vowel and compared with existing PB word list by computer program.
RESULTS:
Each syllable appeared in the different frequency pattern. The 138 of 399 syllables represented the 95% of everyday dialogue.
CONCLUSION:
This study showed that established PB word list was made relatively well but needs somewhat modification to reflect the actual frequencies of syllable in colloquialism.
Keywords: Speech discrimination testSpeech audiometry

교신저자:변성완, 158-710 서울 양천구 목동 911-1  이화여자대학교 의과대학 이비인후과학교실
              전화:(02) 2650-5650 · 전송:(02) 2648-5604 · E-mail:byunsw@ewha.ac.kr

서     론


  
어음청력검사의 어음명료도를 구할 때 사용하는 PB(phonetically balanced) word list는 균등한 난이도의 표준말 단음절어의 모음으로 일상 회화에서 사용하는 어음의 빈도와 같은 빈도를 가지는 친숙한 어음으로 구성되어야 한다.1)2)3) 한국어의 초성은 19음(ㄱ
~ㅎ, ㄲ~ㅉ), 중성은 21음, 종성은 7음(없는 경우까지 8음)으로 총3192(19×21×8)개의 음절이 가능하며 각 음절의 빈도는 매우 다양하다. PB word list에 사용할 음절도 드문 빈도의 음절보다는 흔히 쓰이는 친숙한 음절을 선정하는 것이 타당할 것이다. 1962년에 제작되어 현재 임상에서 쓰이고 있는 PB word list2)4)는 회화 어음에 대한 대규모의 정확한 통계가 불가능하던 때의 조사에 바탕을 둔 것으로, 회화 어음의 빈도에 대해서는 타당성에 대한 검증이나 보완 작업이 이루어지지 못했다.
   저자는 PB word list의 타당성 검증과 수정 보완에 가장 중요한 기초 자료가 될 수 있는 회화 어음에 대한 빈도를 17만 여 음절에 대해 조사하여 그 음소의 빈도를 보고한 바 있다.5) 그러나, 음소의 빈도만으로는 한국어 어음의 특징을 충분히 기술하였다고 보기는 힘든 면이 있다. 예를 들어 /스저요해/와 /쇼즈허애/는 음소의 빈도가 동일하지만, 전자는 흔히 출현하는 음절로, 후자는 드물게 출현하는 음절로 구성되어 있다. 마찬가지로, PB word list의 보완이나 인공와우이식술 후 평가를 위한 어음재료 등을 제작할 때 어음을 선정하는 기준으로 음절 단위의 대표성도 고려할 수 있을 것이다. 즉, 음소의 빈도가 같다면, 가능하면 음절의 분포에 대해서도 대표성 있는 분포를 따르는 재료가 더 좋은 어음 재료가 될 것이다.
   본 연구에서는 음소의 빈도에서 진일보하여 한국어 회화 어음의 음절의 빈도를 초성, 중성을 중심으로 파악하고, 현재 쓰이고 있는 PB word list가 음절의 빈도 면에서도 타당한지에 대해서도 평가해보고자 하였다.

재료 및 방법

한국어 문서자료의 선정
  
한국어 어음의 빈도를 대표할 어음자료는 현재 쓰이는 표준어이며 일상 회화체이어야 한다는 전제를 만족시켜야 한다. 이러한 많은 음절을 구할 수 있는 어음 자료로 현대물을 다룬 영화 대본이나 TV드라마 등의 극 대본 등이 적합할 것이라는 점에 착안하였다. MBC방송사의 인터넷 홈페이지(http://www.imbc.com)에서 대표적 현대극이라 할 수 있는 'MBC 베스트 극장'의 33회분(422회
~454회)의 극 대본(합 537,245음절)을 구하여 본 연구의 어음 자료로 선정하였다. 자료의 내용 중 그림, 표, 각종 web page의 link성분 등 본 연구의 목적에 부적합한 부분은 삭제, 교정 등 수정하여 사용하였다.

컴퓨터 프로그램의 제작
   PB word list의 기본조건에 보다 충실하기 위해 표기음절이 아닌 발음음절을 측정함을 원칙으로 하였다. 어음의 분석에 있어 영어 단어 ace가 영어 어음표에서 표기 음소 /a/, /c/, /e/로 취급되지 않고, 발음 음소 /ei/, /s/로 취급되는 것과 같은 원리이다. 따라서 어음 재료 문서의 발음 표기로의 변환과 음소의 빈도 측정의 2단계 작업을 하도록 작성하였던 이전 연구의5) 컴퓨터 프로그램을 발음 표기로의 변환과 음절의 빈도 측정 작업을 하도록 수정 제작하였다. 프로그램 내부에서는 상용조합형 한글코드(KS C5601-1992)를 사용하였다.

기존 한국어 PB word list2)4)의 발음 음절과 비교
   상기의 어음 자료와 프로그램을 이용하여 음절의 빈도를 측정할 때 총 3,192개의 음절에 대한 조사 결과는 빈도의 분포를 도식화하기에 무리가 있고, 기존 PB word list와의 비교에도 어려움이 있어, 종성을 고려하지 않은 399음절(초성 19음절×중성 21음절)의 빈도로 다시 조사하였다. 이를 초성×중성의 조합으로 된 음절표에 빈도를 표시하였고, PB word list의 초성×중성의 음절 빈도 분포와 비교하였다.

결     과

   전반적인 음절 빈도의 분포를 보았을 때, 초성과 중성으로 구성된 399개의 음절의 빈도가 고르지 않고 서로 다른 빈도로 출현하였으며 빈도가 낮은 음절과 빈도가 높은 음절의 뚜렷한 차이를 보였다(Table 1, Figs. 1A and 2A).
   음절의 누적 빈도 분포를 보았을 때 전체 53만 여 음절의 25%를 399개중 10개의 음절이, 50%를 26개의 음절이, 75%를 58개의 음절이, 그리고 95%를 138개의 음절이 담당하고 있었다(Table 2, Fig. 1B). 이 중 가장 자주 쓰이는 음절은 /느/로 2.97%의 빈도로 출현하였으며 그 이후로 /이/, /다/, /가/, /지/, /나/, /아/, /마/, /그/, /고/, /자/, /하/, /서/, /시/, /리/, /나/, /니/, /저/, /어/, /허/, /수/, /사/, /며/, /르/, /드/, /여/ 등의 순이었다(Table 2). 또한 66개의 음절은 단 한 번도 출현하지 않았다.
   음소 빈도 분포와 음절 빈도 분포를 비교하였을 때, 비교적 빈도가 높은 음소의 결합 음절 부위에 빈도가 높은 음절이 분포하고 있었으나, 음소 빈도 분포와 음절 빈도 분포가 반드시 일치하지는 않았다(Fig. 2A). 기존의 PB word list는 비교적 빈도가 높은 음절로 구성되어 있었으나 누적빈도 95%에 들지 않는 즉, 드물게 쓰이는 음절이 50개의 음절 중 평균 6개(12%) 사용되고 있었다(Table 3). 구체적으로는 200음절중 /힘폭통뽕귀향/풀쉰흉뼈뇌/뒤흠귤뚝죄뺨/흙품총뿔깨쥐쇠/의 24음절이었다.

고     찰

   현재 한국어에 있어 임상에서 가장 많이 사용되고 있는 PB word list는 1960년대에 함4)등에 의하여 제작된 것이다. 당시의 시대적인 여건상 이러한 검사 어음 자료를 작성하는데 가장 기본적인 바탕이 되는 회화 어음의 빈도 조사에 관한 연구를 수작업에 의존했기 때문에 연구 대상이 클 수 없었고, 방대한 시간과 노력의 소요, 신뢰성의 부족 등의 한계가 있었다. 그 동안 이러한 PB word list 개량을 위한 몇 가지 시도4)6)7)8)9)10)11) 및 한국어의 음소 빈도 조사로 PB word list 표준화에 도움이 되고자 하는 노력의 연구가5)9)11)12) 있었다.
   같은 음소를 가지고도 조합하는 방법에 따라 빈도가 낮은 음절 혹은 빈도가 높은 음절이 만들어질 수 있으므로, 음소의 빈도 만으로 대표 어음을 선정하는 것보다는, 음소의 빈도와 함께 음절의 빈도를 고려 사항으로 넣어 대표 어음 음절 선정을 용이하게 해보려는 이 연구의 주요 목적이라 하겠다.
   연구 대상을 선정함에 있어 현재 쓰이는 회화체라는 조건을 위해 사극이나 뉴스 등을 제외한 현대극을 택하였고, 이 중 'MBC 베스트 극장'은 등장 인물과 작가가 매회분 마다 다르므로, 특정 등장 인물의 이름이 많이 출현하거나, 특정 작가의 어투가 어음 빈도에 영향을 줄 수 있는 왜곡을 배제하는데 도움이 될 것으로 생각하여 어음 자료로 선정하였다. 이 연구의 537,245음절은 충분히 큰 자료로 한국어 표준어 일상 회화체의 빈도로 간주하는데 큰 무리가 없을 것으로 판단하였다.
   이 연구는 방법론에서 종성을 고려하지 않은 음절 즉 초성과 중성으로만 구성된 399음절을 대상으로 하였는데, 이는 초기 시험 연구 과정에서 종성을 포함한 3,192음절을 대상으로 한 경우와 거의 같은 결과를 얻었지만, 다음과 같은 이유로 이루어진 결과 보고 방법의 선택이었다. 이는 첫째, 한국어에 있어 종성이 있는 음절의 빈도가 35% 정도로 낮고,5) 둘째, 종성을 포함할 경우 보고의 대상이 되는 표의 성분이 총 3,192개로 결과 도시의 복잡성이 문제가 될 수 있고, 셋째, 3,192개로 너무 세분하다 보면 음절의 빈도차가 서로 뚜렷하지 않아 분포의 특징을 파악하기 어려울 수 있다는 점을 감안한 것이었다.
   연구의 결과 6.5% 밖에 안 되는 26개의 음절이 일상회화의 50%를, 138개의 음절(35%)이 일상회화의 95%를 담당하고 있으며 또한 66개의 음절은 한 번도 출현하지 않아 자주 출현하는 음절과 그렇지 않은 음절의 구분이 확실함을 알 수 있었다. 이 연구의 음절 분포로 기존의 PB word list를 재평가해 본 결과, 대부분 일상생활에서 자주 쓰이는 음절로 구성되어 있어 비교적 잘 제작된 표로 평가할 수 있었다. 단, 실제 사용하고 있는 음절의 빈도가 PB word list에 잘 반영되었다면 50음절의 95%인 평균 47.5개가 빈도가 높은 음절이고 평균 2.5개의 음절이 빈도가 낮은 음절이어야 하지만, 6개로 다소 높았다. 따라서 이러한 음절에 대하여는 실제 사용하는 음절의 빈도를 고려하여 약간의 수정이 필요할 것으로 보이며, 이러한 PB word list를 포함한 어음검사 재료 제작에 빈도가 높은 어음을 95%정도 사용하는 것과 전체를 빈도가 높은 어음으로 사용하는 것 중 어느것이 더 타당한가에 대한 논의가 필요할 수 있다. 또한 본 연구의 결과로 알게 된 한국어 회화체의 음절 빈도 분포는 인공와우이식술 후 평가 자료 등 여타 어음 자료 제작에도 도움이 되는 기초 자료라 할 수 있다. 
   본 연구에서 평가한 방법은 음절의 빈도면에서의 평가에 주안점을 둔 것이므로, 서론에서도 밝힌 PB word list의 다른 조건들에 의한 평가와 최대공약수를 찾아 개선하는 것이 합리적이며 타당한 선택일 것이다.

결     론

   현재 사용하는 PB word list는 비교적 잘 제작된 표라 할 수 있으나 실제 사용하는 음절의 빈도와 맞게 약간의 수정이 필요할 것으로 보인다.


REFERENCES

  1. Pendrod JP. Speech threshold and word recognition/discrimination testing. In: Katz J.Handbook of clinical Audiology. 4thed. Baltimore: Williams & Wilkins;1994. p.147-64.

  2. 백만기. 최신이비인후과학. 서울: 일조각;1987. p.38.

  3. Newby HA. Audiology. 4th ed. Englewood Cliffs: Prentice-Hall, Inc; 1979. p.163-88.

  4. 함태영. 한국어음청력검사표와 명료도검사 성적에 관한 연구. 가톨릭의대 논문집 1962;5:31-8.

  5. Byun SW. Frequencies of Korean phonemes and reliability of Korean phonetically balanced word lists. Korean J Otolaryngol 2001;44:485-9.

  6. 신규식. 한국 정상인에 대한 Speech Audiometry에 관하여. 한이인지 1960;3:1-3.

  7. Soh JM, Park SJ, Eun JH. Statistical review of spondee and PB words. Korean J Otolaryngol 1970;13:113-6.

  8. Park CI. Audiologic studies of Korean speech sounds part I: Analysis of frequencies and structures of Korean speech sounds. Korean J Otolaryngol 1971;14:1-8.

  9. Park CI. Audiologic studies of Korean speech sounds part II: Articulation scores and confusion patterns of Korean speech sounds. Korean J Otolaryngol 1971;14:9-22.

  10. Kim YM, Choi SE, Kang DH, Shim YJ, Kim GR. The study on method of speech audiometry and the Korean word lists part 1: Normal hearing group. Korean J Otolaryngol 1978;21:831-6.

  11. Han TH, Park CI. A study on standardization of Korean PB word list for speech audiometry. Korean J Otolaryngol 1981;24:265-78.

  12. Park CI, Han TH. A study on standardization of Korean PB word list for speech audiometry. Korean J Otolaryngol 1985;28:269-78.

TOOLS
PDF Links  PDF Links
Full text via DOI  Full text via DOI
Download Citation  Download Citation
Share:      
METRICS
2,343
View
47
Download
Related article
Frequencies of Korean Phonemes and Reliability of Korean Phonetically Balanced Word Lists.  2001 May;44(5)
Editorial Office
Korean Society of Otorhinolaryngology-Head and Neck Surgery
103-307 67 Seobinggo-ro, Yongsan-gu, Seoul 04385, Korea
TEL: +82-2-3487-6602    FAX: +82-2-3487-6603   E-mail: kjorl@korl.or.kr
About |  Browse Articles |  Current Issue |  For Authors and Reviewers
Copyright © Korean Society of Otorhinolaryngology-Head and Neck Surgery.                 Developed in M2PI
Close layer
prev next