2023년 12월 13일 중국 언론사 인민망(人民网)에 따르면, 최근 난징농업대학(南京农业大学)에서 왕둥보(王東波) 정보관리대학(信息管理学院) 교수팀과 중국 도서국 구롄(古聯)회사가 공동으로 개발한 고서적 대언어와 관련된 인공지능 모델이 출시되었다.
왕둥보는 인공지능 모델에 ‘금릉(金陵)*’을 주제로 한 시를 만들어 달라며 모델의 창작 기능을 시연했고, 명령을 입력한 지 얼마 지나지 않아 시를 지어내 많은 사람들의 놀라움을 자아냈다. 지능형 시 작문 및 단편 번역 외에도 인공지능 모델은 문법 분석, 실체 인식, 관계 추출, 내용 요약 및 기타 기능을 선보였다. 일반 독자들은 고서적 문헌을 읽기가 쉽지 않다. 번체자**, 모든 것이 세로로 작성되어 있다는 점, 구절 표시가 없는 점 등의 어려움을 극복해야 하기 때문이다. 이에 왕 교수와 그의 연구팀은 2013년부터 사고전서(四库全书)*** 등을 추가하고, 20억 자 이상의 정제된 말들로 데이터를 축적해 인공지능 모델에 데이터 기반을 제공할 수 있는 기능을 개발했다.
고서적 대언어와 관련된 인공지능 모델은 현재 중국 내 사회과학 기금의 주요 프로젝트인 ‘중국 고대 언어 지식 데이터베이스의 구축 및 적용 연구’의 중요한 성과이다. 다음 단계에서 난징농업대학과 중국 도서국 구롄 회사는 인공지능 모델의 응용 시나리오를 고서적 정리, 디지털 문화 오락 및 기타 분야로 홍보할 계획이다. 왕 교수는 “인공지능 모델이 고서적 지능화 연구와 학제 간 인재 양성의 유기적 결합을 더욱 촉진하고, 대중이 첨단 인공지능 기술에 대한 접근성을 확대하고, 전통문화 지식을 축적하는 계기가 되기를 기대한다”고 밝혔다.
최근 챗GPT(ChatGPT(Generative Pre-trained Transformer))로 고대 메소포타미아(Mesopotamian) 문명의 아카드어(Akkad語)를 번역해 본 사례가 눈길을 끌고 있다. 18일 정보통신매체 기가진에 따르면, 일본의 한 블로거 잰(Jan)은 바빌론(Babylon) 전시회의 석판 내용을 해석하기 위해 챗GPT를 사용했다. 우선 잰은 챗GPT에 바빌로니아(Babylonia)와 같은 고대 석판의 카탈로그를 열람할 수 있는지 물었다. 그러자 “할 수 없다”는 답변이 돌아왔다. 이에 잰은 석판 전체의 번역을 요청했다. 챗GPT는 문장별 번역문을 제공했으나, 유다(Judah) 왕국의 마나세(Manasseh)왕을 애쉬르(Ashre) 왕국의 마나세왕으로 표기하는 등 오류가 있었다. 잰은 고대 문자의 석판을 자동으로 번역하는 추가 기능의 구축을 희망한다고 밝혔다. (출처: 디지털투데이)
고대 언어는 과거의 문명과 역사를 담고 있는 소중한 유산이다. 그러나 많은 고대 언어는 현대 사회에서 사용되지 않아 점차 잊혀가고 있다. 고대 언어의 보존과 활성화는 역사와 문화의 연결고리를 유지하고, 우리의 과거를 이해하는 데에 중요한 역할을 한다. 그렇기에 인공지능이 발달하고 있는 최근 들어 점점 고대 언어를 해석하려는 다양한 노력이 대두되고 있다. 따라서 중국을 포함한 많은 국가에서 역사를 보존하기 위해 현재 발달한 기술들을 활용하여 고대 언어를 분석 및 적용하는 등의 노력을 기울여야 할 것이다.
관련 기사의 자세한 내용은 다음의 기사 확인 링크를 통해 확인할 수 있다. 기사 확인
*금릉(金陵): 기원전 8세기부터 기원전 3세기 춘추 전국 시대(春秋战国时代)에 있었던 초(楚)나라의 읍이다. 현재의 난징에 해당한다. (출처: 네이버 사전)
**번체자: 중국은 문맹률 문제에 대응하기 위해 1964년 한자 점획을 간단하게 변형시킨 간체자(简体字)를 공포했다. 이에 본래의 복잡한 한자를 번체자(繁体字)라고 한다. 간체자는 중국과 싱가포르(Singapore)에서 주로 쓰이며, 그 외 한자 문화권 국가에서는 번체자를 사용하고 있다. (출처: 네이버 지식백과)
***사고전서(四库全书): 청(淸)나라 건륭(乾隆)제 때(1735-1795) 만들어진 중국 최대의 총서(叢書)다. (출처: 네이버 중국어사전)