침술 임상시험이 항상 성공하는 이유: 방법론의 문제
발행: 2025-12-25 · 최종 업데이트: 2025-12-25
침술 임상시험에서 국가별로 극단적으로 다른 결과가 나오는 이유를 임상시험 방법론, 무작위배정, 플라시보, 메타분석의 관점에서 분석합니다.
베일러에 의해서 당시까지의 항암치료가 큰 효과가 없다는 것이 밝혀지면서 대체의학이 국가의 지원을 받고 연구되기 시작했습니다. 특히 NCCAM 이라는 조직은 대체의학을 연구했는데, 대체의학의 이론 자체는 현대과학적으로 검증이 불가능하기 때문에 이들은 주로 임상시험을 진행했습니다. 당시 그들이 대체의학의 앞선 실험을 평가할 때, 매우 우수한 결과를 기대하고 임상을 진행하지만, 실제 엄격한 임상으로 증거를 확보하고자 하면 그 효과가 사라지는 일이 다반사였습니다.
침술 임상시험을 둘러싼 논쟁은 단순히 치료 효과의 유무를 넘어, 임상시험의 질과 연구 설계가 결과에 어떤 영향을 미치는가라는 문제를 잘 보여주는 사례입니다.
특히 국가별로 보고되는 침술 임상시험 결과를 비교하면, 통계적으로 매우 이례적인 양상이 관찰됩니다. 미국이나 영국을 포함한 서구권 국가에서는 침술 임상시험의 상당수가 무효 또는 제한적 효과를 보고하는 반면, 한국·중국·일본 등 동아시아 지역에서 수행된 연구에서는 거의 예외 없이 긍정적인 결과가 보고됩니다.
이는 단순한 우연이나 문화적 차이로 설명하기 어렵습니다.
국가별 침술 임상시험 결과의 차이
다음 표는 연구자의 국적에 따라 보고된 침술 임상시험의 긍정적 결과 비율을 정리한 것입니다.
| 연구자의 국적 | 임상시험 건수 | Positive 비율 |
|---|---|---|
| Non-US/Non-UK 영어권 (캐나다, 호주, 뉴질랜드) | 20 | 30% |
| 미국 | 47 | 53% |
| 스칸디나비아 | 47 | 55% |
| 영국 | 20 | 60% |
| 기타 유럽 국가 | 62 | 78% |
| 아시아 (중국, 홍콩, 대만, 스리랑카, 일본, 베트남) | 52 | 98% |
| 기타 국가 | 3 | 100% |
과학적으로 볼 때, 특정 지역에서만 거의 100%에 가까운 성공률이 반복적으로 보고된다는 것은 치료 효과의 강력함을 의미하기보다, 연구 설계와 수행 과정에서 체계적인 편향이 개입되었을 가능성을 강하게 시사합니다.
침술 임상시험이 어려운 이유
침술은 임상시험 설계가 매우 까다로운 치료법에 속합니다.
특히 다음과 같은 문제가 반복적으로 지적됩니다.
-
적절한 대조군 설정의 어려움
-
플라시보 침(placebo acupuncture)의 한계
-
시술자와 환자 모두에 대한 눈가림(blinding)의 어려움
이러한 조건에서도 불구하고, 미국과 유럽의 연구자들은 가능한 한 엄격한 방법론을 적용해 임상시험을 수행해 왔습니다. 그 결과, 침술의 효과는 대부분 플라시보 효과와 크게 구별되지 않거나, 제한적인 상황에서만 관찰되는 수준으로 평가됩니다.
반면, 동아시아 지역의 다수 연구에서는 무작위 배정이 불충분하거나, 눈가림이 제대로 이루어지지 않거나, 탈락자 처리가 부적절한 경우가 반복적으로 발견됩니다. 이러한 조건에서는 치료 효과가 실제보다 과대평가되는 것이 통계적으로 거의 필연적입니다.
“많은 나쁜 연구”는 “하나의 좋은 연구”를 대체할 수 없습니다
임상연구에서 자주 등장하는 오해 중 하나는, “표본 수가 많아지면 결국 진실에 가까워지지 않겠는가”라는 생각입니다.
그러나 이는 잘못된 전제입니다.
질 낮은 임상시험 수백 건은, 엄격하게 설계된 무작위 배정 비교임상시험(Randomized Controlled Trial, RCT) 한 건을 대체할 수 없습니다.
오히려 경험적으로 볼 때,
-
연구 설계가 허술할수록 효과가 있는 것으로 나오고
-
연구 설계가 엄격해질수록 효과가 사라지는 경우
는 매우 흔하게 관찰됩니다.
우수한 임상시험의 필수 조건
과학적으로 신뢰할 수 있는 임상시험에는 몇 가지 필수 조건이 있습니다.
첫째, 무작위 배정(randomization)입니다.
환자는 사전에 정해진 기준에 따라 등록되며, 어느 군에 배정될지는 연구자와 환자 모두 알 수 없어야 합니다. 그렇지 않으면 무의식적인 기대와 판단이 배정 과정에 개입하게 됩니다.
둘째, 충분한 표본 수입니다.
소규모 연구는 우연에 의한 결과 왜곡 가능성이 큽니다.
셋째, 플라시보 대조와 눈가림(blinding)입니다.
약물 연구에서는 비교적 구현이 쉽지만, 침술과 같은 시술 연구에서는 가장 큰 난관입니다.
넷째, 탈락자 관리입니다.
탈락자가 많고, 그 분포가 군별로 다를 경우 결과는 심각하게 왜곡됩니다.
마지막으로, 동료 평가(peer review)와 독립적인 반복 연구가 필수적입니다.
하나의 연구 결과는 검증의 출발점일 뿐, 결론이 아닙니다.
임상시험 방법론의 전환점: Archie Cochrane
이러한 문제의식은 오래전부터 제기되어 왔습니다.
그 중심에 있는 인물이 바로 영국의 의사이자 역학자인 아키 코크레인입니다.
그는 1972년 『Effectiveness and efficacy: random reflections on health services』를 통해,
의료 행위는 반드시 체계적 비평과 무작위 임상시험에 근거해야 한다고 주장했습니다.
이러한 사상은 이후 메타분석과 근거중심의학(evidence-based medicine)의 토대가 되었고,
그의 이름을 딴 Cochrane Collaboration이 설립되었습니다.
코크레인 공동연구는 임상시험을 다음과 같은 영역에서 평가합니다.
-
무작위 순서 생성
-
배정 은닉
-
눈가림
-
불완전한 결과 자료
-
선택적 결과 보고
-
기타 잠재적 편향
이 기준을 통과한 연구만을 모아 메타분석을 수행합니다.
메타분석의 의미와 오해
메타분석은 서로 다른 임상시험 결과를 통합해 하나의 결론을 도출하는 방법입니다.
종종 “서로 다른 연구를 섞는 위험한 방법”으로 오해받지만,
실제로는 질 평가를 통과한 연구만을 선별적으로 통합합니다.
이는 사과와 오렌지를 무작위로 섞는 것이 아니라,
품질 기준을 충족한 사과들만을 비교해 평균적인 특성을 평가하는 과정에 가깝습니다.
비평은 구호가 아니라 적용의 문제입니다
흥미로운 점은, 한의학계에서도 코크레인의 이름과 체계적 비평의 중요성을 언급한다는 사실입니다.
그러나 실제로는 이러한 기준이 자기 분야의 연구에 엄격하게 적용되지 않는 경우가 많습니다.
비평적 사고는 선언으로 끝나서는 안 됩니다.
자신에게 가장 불리한 경우에도 동일한 기준을 적용할 때에만,
그것은 과학적 태도라고 부를 수 있습니다.
참고자료
-
Cochrane A. Effectiveness and Efficiency: Random Reflections on Health Services_.
Nuffield Provincial Hospitals Trust, 1972.
→ 무작위배정 비교임상시험(RCT)과 체계적 비평의 중요성을 처음으로 정리한 고전. -
Vickers AJ et al. Acupuncture for chronic pain: individual patient data meta-analysis.
Archives of Internal Medicine, 2012.
→ 침술 임상에서 연구 설계의 질이 높아질수록 효과가 감소하는 경향을 보여준 메타분석. -
Bausell RB. Snake Oil Science: The Truth About Complementary and Alternative Medicine.
Oxford University Press, 2007. → 이 글의 주요 논지는 이 책에서 얻은 것임. -
조재훈, 메타분석의 이론과 실제. J Rhinol 2020;27(2):83–89.
→ Forest plot 해석과 메타분석의 기본 구조를 설명한 국내 리뷰.