[논문 초록]


본고는 외국인 유학생의 작문이 한국인 대학생의 작문에 비해 어휘적 차원에서 어휘 다양성이 어떻게 다르게 나타나는가를 살펴보았다. 이를 위해 총 120편의 작문에 나타난 어휘 유형(type)과 구현(token)을 각각 산출하여 분석하여 비교하였고, 이를 바탕으로 어휘 다양성(TTR)이 어떻게 나타났는가를 살펴보았다. 주요 연구 결과는 다음과 같다. 외국인 유학생과 한국인 대학생의 작문에서 나타난 어휘 규모 차원에서 살펴볼 때 어휘 구현의 산출 결과보다 어휘 유형에서 더 많은 차이가 난 것으로 드러났다. 언어권별로는 중국인 유학생 집단이 일본인 유학생보다는 어휘 유형이 더 적은 것으로 나타났다. 또한 일본인 유학생 집단의 경우 상대적으로 거의 일정한 수치로 나타났는데 이에 반해 중국인 유학생 집단은 어휘 유형의 수치가 높은 경우와 그렇지 않은 경우가 다양하게 존재하였다. 그 다음으로 한국인 대학생 작문과 외국인 유학생 작문에 나타난 어휘 다양성의 산출 결과를 살펴볼 때, 그 결과는 거의 차이가 없었다. 다만, 가장 두드러진 차이점은 외국인 유학생 텍스트가 한국인 대학생 텍스트에 비하여 변화 폭이 매우 심하다는 점이다. 즉 다양한 어휘를 생산해 내는 학습자와 그렇지 못하는 학습자의 격차가 존재함을 보여주었다. 마지막으로 통계적으로 집단 간 차이를 분석한 결과, 전체 어휘 유형에서만 통계적으로 유의한 차이를 보였다. 본고는 학습자 코퍼스를 기반으로 이들의 작문을 계량언어학적으로 접근하여 외국인 유학생과 한국인 대학생 집단의 어휘의 다양성을 객관적으로 분석함으로써 유사점과 차이점을 제시하였다는 점에서 의의가 있다.

This paper investigated the difference in lexical diversity between foreign university students’ writing and Korean students’ writing. For this, tokens and types of vocabulary were extracted respectively from a total of 120 pieces of writing, and were analyzed and compared. In addition, based on the result, it looked at how type-token-ratios (TTR) were shown. The main findings are these: In terms of the quantity of vocabulary shown in each group’s writing, it was shown that the difference in the result of lexical diversity was bigger than that of extraction of tokens. Notably, as for language group, Chinese students used fewer vocabulary types than Japanese students. Also, as for the group of Japanese students, the figures were nearly consistent, while as for the group of Chinese students, the figures varied - either high figures or not. Next, when comparing the difference in the extraction of TTR between Korean students’ texts and foreign students’ texts, the results were nearly the same. However, the most remarkable difference was that foreign students’ texts varied greatly compared to Korean students’ texts. That is, there was a gap between a groups of learners who produce a variety of vocabulary and another groups of learners who cannot. Lastly, according to the result of an analysis of the statistical difference between the groups, there was a statistically significant difference in total lexical types alone. This paper is significant in that based on learners’ corpus both groups’ TTRs were analyzed objectively through computational lingustics - each group’s pieces of writing were used for this research - and the similarities and differences were presented.