* 이 글은 제가 오래전에 '카즈머'란 필명으로  베트남 커뮤니티인 '연꽃마을'에 기고했던 글을 약간의 손질을 해서 다시 올리는 글입니다. 오래전(2007년)에 썼던 글이지만, 글의 내용상 시의성과는 무관한 글이고, 또 동남아시아의 주요 언어들인 태국어, 베트남어, 버마어(미얀마어) 등이 모두 성조 언어이기 때문에, 이들 언어의 주요 특성인 성조를 이해하는데 다소 도움이 될 것이란 판단에서 이곳에 다시 올려봅니다.

 

 

 

베트남어와 성조

 

 

1. 호치민시에 가면 배낭여행자들이 묵는 숙소들이 밀집한 여행자 거리에 ‘데땀’과 ‘팜 응우 라오’란 거리가 있습니다. 이 중에서 우리에겐 ‘데땀’이 길이도 짧고 발음하기도 편해서 기억하기가 더 쉽죠. 그런데 제 경험상, 택시를 타고 우리말 발음대로 ‘데땀’이라고 말하면 십중팔구 택시기사들은 제대로 알아듣지를 못하고 어디 가냐고 되묻습니다. 반면에 우리에겐 다소 발음하기 힘든 ‘팜 응우 라오’를 대충 엉성하게 발음하면 택시기사들이 의외로 쉽게 알아듣습니다. 전혀 뜻밖이죠? 왜 그럴까 그 이유를 곰곰이 생각해보니, 그 비밀은 베트남어의 특성인 ‘성조’(聲調, tone)에 있었습니다.

 

2. 성조((聲調, tone)란 한 언어에서 뜻을 구별하는데 관여하는 ‘소리의 높낮이’를 가리키며, 성조를 갖고 있는 언어를 성조언어(tone language)라고 합니다. 대표적인 성조언어가 바로 중국어와 베트남어인데, 중국어는 4개의 성조를 갖고 있는데 반해서 베트남어는 6개의 성조가 있다고 합니다. 태국어도 성조언어로서 5개의 성조를 갖고 있다고 합니다. 현대한국어 표준말은 소리의 높낮이가 전혀 뜻을 구별하는데 관여하지 않기 때문에 성조언어가 아닙니다만. 중세한국어는 ‘평성, 상성, 거성’ 등의 성조로써 의미를 구별하는 성조언어였으며, 현대한국어 중에서도 경상도말은 소리의 높낮이로써 뜻을 구별하는 성조언어입니다. 제 학창 시절의 경험입니다만, ‘경남고’ 출신과 ‘경북고’ 출신들은 둘 다 줄여서 자신의 모교를 ‘경고’라고 하는데, 글로 써놓고 보면 구별이 안 되지만 실제 말로써는 그 둘이 정확히 구별되는 것이었습니다. 왜 그럴까요? 그 답 역시 성조에 있었습니다. ‘경남고’는 ‘경고’를 처음이 낮고 끝이 올라가는 ‘상승조’로 발음하는데 반해, ‘경북고’는 처음이 높고 끝이 내려가는 ‘하강조’로 발음하기 때문에 성조만 이해하면 그 둘은 쉽게 구별할 수 있는 것이었습니다.

 


3. 그러면 한 언어에 성조가 4개, 5개 또는 6개 있다고 할 때 그 정확한 의미는 무엇일까요? 그것은 그 언어에서 각각 4가지, 5가지 또는 6가지 유형의 ‘소리의 높낮이’가 뜻을 구별하는데 이용되고 있다는 것을 의미합니다. 다시 말해서 중국어에 4개의 성조가 있다는 것은 중국어에는 4가지 유형의 소리의 높낮이가 의미 구별에 관여한다는 뜻입니다. 예를 들어 ‘ma'는 우리에게는 하나의 ’자음+모음‘의 결합체(이것을 전문 용어로는 분절음(segment)의 결합체라고 합니다)에 불과하지만, 중국어에서는 여기에 4가지 종류의 다른 소리의 높낮이가 얹혀서 이론적으로는 최대 4가지의 다른 뜻을 갖는 단어가 될 수 있는 것입니다. 베트남어는 6개의 성조가 있다고 하니, ’ma'라는 말에 6가지 종류의 높낮이가 얹혀서 이론적으로는 최대 6개의 다른 단어가 될 수 있다는 뜻입니다. 물론 그 이론적 가능성이 반드시 별개의 단어로 구별되는 것은 아니어서 실제로는 그 중의 일부만이 그 언어의 단어로 실존하게 될 것입니다.

 


4. 한편 한 언어에서 어떤 소리가 하나의 독립적인 소리(음운, phoneme)로서의 자격을 인정받기 위해서는 그 소리가 그 언어에서 뜻을 구별하는데 기여해야만 합니다. 이를 보다 전문적인 용어로 표현한다면, 어느 한 소리의 차이로 의미가 구별되는 한 쌍의 단어를 최소변별쌍(minimum pair)이라고 하는데, 이때 최소변별쌍의 형성에 관여하는 소리들은 그 언어에서 독립적인 소리(음운,phoneme)의 자격을 인정받게 되나, 최소변별쌍을 형성하지 못하는 소리들은 단순히 같은 소리의 변이음(allophone)으로 취급됩니다. 예컨대 한국어에서 ‘불’과 ‘뿔’과 ’풀‘은 최소변별쌍을 형성하며, 이 때 최소변별쌍의 형성에 관여하는 ’ㅂ‘과 ’ㅃ‘과 ’ㅍ‘은 한국어에서는 각각 별개의 소리로서의 자격을 인정받게 되는 것입니다. 반면 최소변별쌍을 형성하지 못하면 그 소리는 그 언어에서는 독립적인 소리로서의 자격을 인정받지 못하게 되는데, 예컨대 speak를 [스삐크]라고 발음하든 [스피크]라고 발음하든 영어에서는 최소변별쌍을 형성하지 못하므로 영어에서는 ’ㅃ‘와 ’ㅍ‘는 다른 소리로 인정받지 못하며 단순히 같은 소리의 변이음에 불과한 것으로 간주됩니다.

 '소리의 높낮이'의 경우도 마찬가지여서, 의미를 구별하는데 관여하는 '소리의 높낮이'만이 하나의 성조로서 인정받을 수 있습니다. 예를 들어 어떤 언어에서 ‘상승조의 ma'와 ‘하강조의 ma'가 최소변별쌍을 이룬다면 그 언어에서 ’상승조‘와 ’하강조‘는 각각 별개의 성조로서 인정받을 수 있는 것입니다. 제가 중국어와 태국어, 베트남어를 몰라서 구체적인 예를 들 수는 없으나, 중국어와 태국어, 베트남어에 각각 4개, 5개, 6개의 성조가 있다는 말은 이처럼 의미를 구별하는데 관여하는 소리의 높낮이가 중국어에는 4가지, 태국어에는 5가지, 베트남어에는 6가지가 있다는 뜻이 됩니다.

 


5. 이제 베트남의 택시기사들이 왜 ‘데땀’이라고 하면 못 알아듣고 대충 엉성하게 ‘팜 응우 라오’라고 발음하면 알아듣는지 생각해봅시다. ‘de tham'은 [d-e-th-a-m] 이렇게 5개의 분절음(segment)의 결합체이고 여기에 6개의 성조가 얹혀져서 가능한 이론적 단어 6개 중 몇 개가 다른 단어나 지명으로 실존할 가능성이 꽤 높습니다. 우리가 성조 없이 그냥 ’데땀‘이라고 했을 때 베트남 택사기사들이 잘 못 알아듣는 이유가 여기에 있을 것으로 생각됩니다. 반면에 ’pham ngu lao'는 [ph-a-m-ng-u-l-a-o]라는 8개의 분절음의 결합체로 길이가 길기 때문에 이 8개의 소리가 정확히 일치하면서 6개의 성조로 구별되는 단어나 인명, 또는 지명의 존재 확률이 이론적으로 현저하게 줄어듭니다. 실제로 베트남어에 이 8개의 분절음을 모두 갖고 있으면서 동시에 성조의 차이를 보이는 의미변별쌍은 없는 듯하며, 이것이 바로 베트남의 택시기사들이 우리가 엉성하게 발음해도 의외로 '팜 응우 라오'를 보다 쉽게 알아듣는 이유가 아닌가 생각됩니다. 물론 우리가 성조 없이 우리식으로 평범하게 발음했을 때, 그것은 그들에게 매우 이상하게 들리겠지만, 적어도 의사 전달에 있어서는 '데땀'보다 유리한 것은 확실합니다.  베트남의 여행자 거리를 방문할 기회가 있을 지도 모르는 초보 여행자 여러분! 택시를 타시면, ‘데땀’보다 ‘팜 응우 라오’라고 말해보세요. 택시기사들이 보다 쉽게 이해합니다. 아울러 이 글이 베트남어나 태국어, 중국어 등의 성조언어를 배우고자 하는 분들에게 이들 성조언어의 한 특성인 성조에 대해서 이해하는 데 작은 도움이라도 되기를 바랍니다.