서 론
갑상선 암은 한국에서 가장 흔한 암이다. 2012년 발표된 대한 암 학회의 자료에 따르면 갑상선 암은 국내에서 발생한 암 중 약 19.6%를 차지한다[1]. 또한 10만 명당 62.5명의 갑상선 암 유병률은 세계적으로 높은 수치에 속한다. 하지만 갑상선 암은 그 유병률이 높아짐에도 불구하고 이로 인한 사망률은 이전과 큰 변화가 없고[2], 이에 대한 진단과 치료는 보존적인 방향으로 변하고 있다[3].
한편 세침흡인검사(fine needle aspiration)는 갑상선 결절을 평가하는 데 점점 더 중요한 검사가 되고 있다[4,5]. 그러나 갑상선 결절을 세침흡인검사로 진단할 때 결절의 크기에 따라 악성 진단율과 진단의 위음성율의 차이를 보이기도 한다[6,7]. 반대로, 다른 연구들에서는 갑상선 결절의 크기가 세침흡인검사의 결과에 영향을 주지 않는다고 결론 짓기도 한다[8-10]. 갑상선 결절의 크기에 따른 악성 진단율이 변한다는 연구들의 결론에 근거하여, 몇몇 의료진들은 갑상선 결절의 크기를 통해 진단적 갑상선 수술을 계획하기도 한다[6,7].
한국에서는 국민건강보험공단의 암 검진(National Cancer Screening Program in Korea) 대상에 갑상선 암이 포함되어 있지 않으나, 많은 병원들에서 갑상선 암 검진을 위한 초음파를 다른 국가에 비해 낮은 가격에 제공하고 있다[11]. 이로 인해 1962~2009년 사이 한국에서는 1 cm 이하의 작은 갑상선 암이 진단되는 비율이 6.1~43.1%까지 증가하였다[12]. 낮은 수가의 검진을 통하여 갑상선 암이 많이 진단되는 이러한 한국의 의료 환경 속에서 수술 전 갑상선 결절의 크기와 세침흡인검사를 통해 최종 악성 진단을 예측할 수 있다면 불필요한 수술을 줄이고 환자의 불편을 덜어 줄 수 있을 것이다.
이 연구에서는 최근 갑상선 수술을 받은 환자들의 의무기록을 후향적으로 분석하여 갑상선 결절의 크기가 수술 전 세침흡인검사 및 최종 악성 진단에 미치는 영향을 알아보았다.
대상 및 방법
대 상
이 연구는 본원 임상시험심의위원회의 승인(IRB No. KUGH16304-002)을 받아 진행된 연구이며, 2010년 4월부터 2012년 5월까지 이비인후-두경부외과에서 갑상선 엽절제술 혹은 전절제술을 시행 받은 환자를 대상으로 의무기록을 후향적으로 분석하였다. 이 기간 동안 총 196명의 환자가 갑상선 수술을 진행하였고, 이 환자들의 갑상선 결절 204개에 대해 수술 전 세침흡인검사를 시행하였다. 환자들 중 완결 갑상선 절제술(completion thyroidectomy)의 목적으로 수술 받았던 환자 3명을 제외하여 총 193명의 환자들이 대상이 되었다. 갑상선 수술의 결과 총 255개의 결절의 조직검사 결과가 보고되었으나, 수술 전 세침흡인검사를 시행했던 204개의 갑상선 결절만 연구에 포함되었고, 수술 결과 추가로 얻어진 51개의 조직검사 결과는 분석대상에서 제외되었다.
방 법
환자들의 의무기록에서 세침흡인검사의 세포학적 검사 결과, 갑상선 결절의 개수, 결절의 크기, 조직학적인 최종 진단에 대한 데이터를 수집하였다. 갑상선 결절의 크기는 수술 전 시행한 초음파 검사를 통해 측정되었고, 가장 큰 지름을 기준으로 평가하였다. 갑상선 결절 중 실제로 수술 전 세침흡인검사를 시행한 것을 연구 대상으로 하였고, 수술 후 조직학적검사상 발견되는 추가적인 결절은 모두 제외하였다. 하나의 결절에 대하여 두 가지의 다른 세침흡인검사 결과가 발생하였을 때는 좀 더 가능성이 높은 것을 채택하였다.
갑상선 세침흡인검사의 약 90.2%(204개 중 184개)는 숙련된 본원 내분비내과 전문의 또는 영상의학과 두경부 분과 전문의가 진행하였으며, 모두 초음파를 이용하여 원하는 결절에 27-gauge 바늘 끝이 위치한 것을 확인한 후 진행하였다. 이렇게 얻어진 검체에 대한 세포학적인 분석은 5년 이상의 숙련된 경력을 가진 본원의 병리학 전문의가 시행하였다. 20개의 검체는 타 병원에서 시행한 세침흡인검사로 얻어졌으며, 이 중 18개는 마찬가지로 숙련된 병리학 전문의가 재분석하였다. 나머지 2개의 검체는 검사를 시행했던 타원의 검체 판독결과지를 참조하였다.
검체의 세포학적인 분석은 2009년 미국 국립암센터에서 발표한 The Bethesda System for Reporting Thyroid Cytopathology에 따라 6가지 범주로 나타냈다. Class 1은 nondiagnostic, class 2는 benign, class 3은 atypia of undetermined significance 또는 follicular lesion of undetermined significance, class 4는 suspicious for follicular neoplasm 또는 follicular neoplasm, class 5는 suspicious for malignant disease, class 6은 malignant 결과를 나타낸다.
Benign 결과를 나타내는 class 2를 음성 결과로 판단하였고, class 3부터 class 6까지를 악성의 가능성이 있는 양성 결과로 두고 세침흡인검사의 민감도, 특이도, 음성예측도, 양성예측도를 구하였으며, 위음성율은 세침흡인검사상 양성 결과를 보인 결절이 수술로 얻어진 최종 조직검사 결과가 갑상선 암으로 진단된 경우로 정의하였다. 이분형 로지스틱 회귀분석을 통하여 갑상선 결절의 크기와 세침흡인검사 결과가 악성 진단에 어떤 영향을 주는지에 대한 통계학적 분석을 시행하였다. 통계학적 유의수준은 p-value 0.05 이하로 하였으며 통계적 검증을 위해 IBM SPSS statistic version 22.0(IBM Corp., Armonk, NY, USA)을 이용하였다.
결 과
갑상선 수술 전 세침흡인검사를 시행하였던 총 193명의 환자를 대상으로 분석한 결과 여성은 153명(79.3%), 남성은 40명(20.7%), 성비는 3.8:1이었다. 평균 연령(표준편차)은 49.4세(12.4세), 중간값은 49세(14.0~83.0)로 나타났다. 평균적인 갑상선 결절의 크기(표준편차)는 1.5 cm(1.2)로 측정되었으며 총 204개의 갑상선 결절 중, Bethesda class 1은 5개(2.5%), class 2는 21개(10.3%), class 3은 21개(10.3%), class 4는 12개(5.9%), class 5는 30개(14.7%), class 6은 115개(56.4%)로 나타났다. 최종 조직검사 결과 악성 결절은 162개, 양성 결절은 42개였다. 162개의 악성 결절 중 155개의 결절(95.7%)이 papillary carcinoma였고, 7개(4.3%)는 follicular carcinoma였다. 42개의 양성 결절 중 가장 많은 것은 nodular hyperplasia(n=31, 73.8%)로 나타났다(Table 1).
Table 2에서 각 결절을 크기별로 분석하였는데, 1.0 cm 이하의 결절은 99개(48.5%), 1.0 cm 초과 2.0 cm 이하의 결절은 64개(31.4%), 2.0 cm 초과 3.0 cm 이하의 결절은 19개(9.3%), 3.0 cm 초과 4.0 cm 이하의 결절은 11개(5.4%), 4.0 cm 초과하는 결절은 11개(5.4%)였다. 세침흡인검사 결과별 결절의 크기를 비교해 보았을 때, class 2에서만 평균 2.99 cm로 다른 class에 비해 크게 나타났다(one-way ANOVA, p<0.05). 최종 조직 진단에서도 양성으로 진단된 경우(2.41 cm)와 악성으로 진단된 경우(1.23 cm)의 크기 차이가 나는 것을 확인할 수 있다(nonparametric test, Mann-Whitney 검정, p<0.05). 또한 크기에 따라 나눈 그룹 간의 수술 전 세침흡인검사 결과의 분포도 서로 다르게 나타났다. 1.0 cm 이하의 결절과 1.0 cm 초과 2.0 cm 이하의 결절, 2.0 cm 초과 3.0 cm 이하의 결절에서는 Bethesda class 6의 결과(각각 63.6, 57.8, 52.6%)가 가장 많았다. 3.0 cm 초과 4.0 cm 이하의 결절에서는 class 2와 class 6의 비율이 27.3%로 같게 나타났으며, 4.0 cm를 초과하는 그룹에서는 Bethesda class 2의 결과(63.6%)가 가장 많이 나타났다.
Table 3에서는 결절의 크기에 따른 수술 전 세침흡인검사 결과와 최종 악성 진단의 odds ratio를 나타내었다. 결절의 크기가 3.0 cm 초과 4.0 cm 이하인 결절과 4.0 cm 초과하는 결절은, 1 cm 이하의 결절보다 수술 전 세침흡인검사 결과 Bethesda class 6을 나타낼 odds값이 각각 0.238(p=0.047), 0.123(p=0.010)으로 나타났다. 즉, 갑상선 결절의 크기가 클수록 수술 전 세침흡인검사상 악성 결과가 나올 가능성이 떨어진다. 또한 갑상선 결절의 크기가 최종 악성 진단에 미치는 영향을 알아보기 위해 시행한 로지스틱 회귀 분석의 결과에서는 1.0 cm 이하의 갑상선 결절을 reference variable로 하였을 때 2.0 cm를 초과한 결절의 odds ratio는 1.0 cm 이하의 결절보다 모두 유의하게 작은 것을 볼 수 있다.
Table 4는 2.0 cm를 기준으로 하여 로지스틱 회귀 분석을 재시행하여 얻은 결과로써, 2.0 cm 이하의 결절은 2.0 cm 초과하는 결절보다 7.812(3.546~17.208)의 odds값을 나타냈다. 즉, 2.0 cm 이하의 결절에서 악성 진단이 의미 있게 상승되어 있었다. 또한, 수술 전 세침흡인검사의 세포학적 검사 결과에 따른 Bethesda class로 갑상선 결절을 그룹화한 후 각 그룹 별로 크기에 따른 악성도가 2 cm를 기준으로 어떻게 달라지는지를 살펴보았다. 각 class별로 로지스틱 회귀분석을 시행한 결과 2 cm 기준으로 악성도가 더 높아지는 class는 보이지 않았다. Bethesda class 5인 suspicious for malignant disease에서는 27.000(0.887~821.790)의 odds값을 보였으나, 통계적으로 의미를 갖지는 않았다(p=0.059).
갑상선 수술 후 최종 조직검사 결과 악성으로 진단된 검체는 162개(79.4%)였으며, 세침흡인검사를 시행했던 결절이 갑상선 수술 후 조직학적 검사에 따라 실제 악성으로 진단되는 비율은 Bethesda class 1부터 6까지 차례대로 40.0, 14.2, 52.4, 33.3, 93.3, 99.1%로 나타났다. Class 1을 제외한 199개의 갑상선 결절을 대상으로 분석한 수술 전 세침흡인검사의 민감도는 98.1%, 특이도는 46.2%였으며, 양성예측도는 88.2%, 음성예측도는 85.7%였다. 이 연구에서 위음성 결과는 총 3건이 있었다.
고 찰
본 연구를 통하여 갑상선 결절의 크기와 세침흡인검사 및 최종 조직검사의 악성도의 상관관계를 알아보았다. 이 연구결과 갑상선 수술을 받은 환자의 최종 조직검사 결과는 결절의 크기가 2.0 cm를 기준으로 악성도의 차이를 보이고 있었다. 최근 갑상선 결절의 크기와 악성 진단과의 상관관계에 대한 다양한 연구들이 있으며, 저자 등에 의해 시행된 본 연구결과는 Magister 등[13]의 연구와 유사한 결과를 내고 있다. 본 연구의 결과 2.0 cm 이하의 갑상선 결절에서 Bethesda class 6의 결과가 가장 많았으며, 4.0 cm 이상의 갑상선 결절에서 시행한 세침흡인검사의 결과에서는 Bethesda class 2의 양성 결과가 63.6%로 의미 있게 상승되어 있었다. 이는 4 cm를 기준으로 세침흡인검사의 악성도가 증가한다는 다른 연구들의 결론과는 상반되는 결론을 나타내고 있다[7,14-16]. 오히려 결절의 크기와 악성 진단과의 상관관계가 뚜렷하지 않다는 연구들[8,17]이나 0.5~0.9 cm의 갑상선 결절의 악성도가 4.0 cm 이상의 크기를 갖는 갑상선 결절보다 높은 악성도를 보인다는 Shrestha 등[18]의 연구 결과와 유사하다고 할 수 있다.
4.0 cm 초과의 크기를 갖는 결절에서 Bethesda class 2의 세포학적 검사 결과가 가장 높게 나온 것은 Hammad 등[16]이 연구한 메타분석의 결과와 비슷하다. 이 연구에서 저자들은 3.0 이상 5.9 cm 이하의 결절에서는 악성도가 증가하지만, 6.0 cm 이상의 큰 갑상선 결절에서 악성도가 낮아진다는 결론을 내었다. 한편, 본 연구에서 Bethesda class별로 군을 나눈 후 2.0 cm를 기준으로 악성도를 분석하였을 때 2.0 cm 이하의 그룹과 2.0 cm 이상의 그룹의 악성도 차이를 보이는 class는 없었다. Bethesda class 5에서 2.0 cm 이하의 그룹이 27.0의 odds를 보였으나 유의확률 0.059로 통계학적인 의미를 갖지는 못하였다. 이는 낮은 위음성율과도 관계가 있을 것으로 생각된다. 수술을 고려하고 시행하였던 환자들을 대상으로 하였기 때문에 수술 전 세침흡인검사 소견이 어느 정도 비정상적이었을 것이며, 이렇게 비정상의 세포검사 소견을 보인 환자 중 실제로 양성으로 진단된 환자의 수는 적을 것으로 보인다.
본 연구에서는 숙련된 세침흡인검사의 시행과 정확한 세포학적 분석을 통해 3건의 적은 위음성 결과를 나타내었다. 연구에 포함된 양성 결절의 수가 낮은 것을 고려한다면, 양성 결절의 검체 수를 더 증가시킬 경우 위음성율은 더 낮아질 것으로 생각된다. 낮은 위음성율은 세침흡인검사의 악성 진단에 대한 효용성을 뒷받침하는 결과이며, 세침흡인검사 결과를 통해 최종진단을 미루어 짐작할 수 있다는 가정을 가능하게 한다. 본 연구에서도 세침흡인검사 결과는 악성 진단에 큰 영향을 주는 단일 인자임이 분명해 보인다.
이 연구의 한계점으로 단일 삼차병원에서 시행한 연구인 점과 이로 인해 대규모의 연구가 이루어지지 못한 점을 생각할 수 있다. 이는 최근 이루어지고 있는 다기관의 대규모 환자를 대상으로 하는 연구들이 이러한 점을 보완해 줄 수 있을 것이다. 또한 환자의 의무기록을 후향적으로 분석한 연구라는 것에서 선택 오류 등이 발생할 수 있는데, 특히 수술을 진행한 환자의 갑상선 결절만을 분석하였기 때문에 갑상선 결절들의 악성(class 6)이나 악성이 의심되는(class 5) 세침흡인검사 결과의 비율이 높다. 더불어 수술을 진행하지 않은 갑상선 결절에 대한 정보를 알 수 없다는 한계점이 있다. 갑상선 암 검진이 빈번하게 이루어지는 한국에서 시행한 연구이므로 갑상선 결절의 크기가 비교적 다른 연구에 비해 작게 발견 되었을 가능성도 있는데, 실제로 본 연구의 갑상선 결절의 평균 크기는 1.5 cm로 Magister 등[13]의 연구 또는 Shrestha 등[18]의 연구의 갑상선 결절의 평균 크기보다 더 작았다. 마지막으로, 수술 전 세침흡인검사를 통한 검체의 세포학적인 분석의 결과로 Bethesda class를 이용하는데, 이는 병리학 전문의 사이에서 이견이 발생할 수 있는 여지가 있다.
이러한 한계점에도 본 연구는 합의점이 아직 이루어지지 않은 갑상선 결절의 크기와 악성도에 대한 주제에서 의미 있는 결과를 도출한 또 하나의 연구로서 의미가 있는 것으로 생각한다. 특히 빈번한 갑상선 암 검진이 이루어져 갑상선의 조기 발견 또는 과잉 진단의 문제가 대두되는 한국의 의료 환경을 반영한 연구로써 의미가 있는 것으로 보인다.