본문 바로가기

IT테크 여행

다빈치와 미켈란젤로의 고향, 피렌체에서 열린 ACL 2019

반응형



다빈치, 미켈란젤로, 단테... 이들을 떠올릴때 무엇이 생각나시나요? 

대부분의 많은 사람들은 르네상스의 근원지인 '이탈리아 피렌체'가 떠오르실 겁니다. 제가 이렇게 서두의 운을 띄운 것은 단순하게 르네상스 이야기를 언급하고자 하는 것이 아니라, 지난 8월에 있었던 ACL 2019(Annual meeting of Association for Computational Linguistics) 컨퍼런스(57차 총회)에 다녀왔던 이야기를 하고자 함입니다. 


인문학의 고장인 피렌체에서 인공지능 자연어 처리 관련 컨퍼런스를 한다는 것 자체가 약간 어색할 수 있지만, 엄연히 전세계의 석학들이 모여 관련 기술에 대한 최신 동향을 공유하는 세계 최대 규모의 학회임에는 틀림없습니다. 


이번 ACL 컨퍼런스에서는 ML(머신러닝) / DL(딥러닝) 기반 NLP(자연어 처리) 최신 연구 동향을 확인하고 새로운 인사이트를 얻을 수 있는 자리였습니다. ACL은 전산 언어학 분야에서 EMNLP와 더불어 가장 인지도가 높은 학회 중 하나입니다. 

자연어 처리에 대한 관심을 대변하듯 이번 컨퍼런스에 제출된 논문수는 무려 2600여건에 달할 정도 였습니다. 참석자도 지난해 대비 2배이상 증가했다고 합니다. 


ACL은 크게 튜토리얼, 컨퍼런스, 워크숍으로 구성되어 있습니다. 메인 컨퍼런스는 주제별로 논문을 공유하는 자리이며, 워크숍은 스피치, 논문발표, 패널토의 등이 진행됩니다. 튜토리얼은 특정 주제에 대해 전문가 3명정도가 돌아가며 이론과 연구 동향을 설명하는 자리 입니다. 저는 튜토리얼 세션 중에 1개의 세션에 참석했는데요. 


참가한 튜토리얼에서는 자연어 처리 중 많은 연구가 필요한 분야인 자연어 생성(NLG) 영역에 관한 방법론에서 최신 기술 동향까지 알아갈 수 있었습니다. 이번 컨퍼런스 참석을 통해 다양한 NLP 분야를 연구하는 관계자들과 한자리에 모여 넓은 인사이트를 얻어갈 수 있었던 좋은기회가 마련되어, 좋았습니다. 


특히 중국 텐센트(Tencent)와 화웨이 연구소는 신경계 번역 훈련과 추론 사이의 격차를 해소하는 연구를 진행하고 있었습니다. 이 논문에서는 훈련하고 있는 모델이 작성한 예측 순서와 실제 문맥상 단어를 샘플링하여 문제를 다루고 있는데요. 연구원들은 중국어와 영어에 대한 접근 방식과 독일어 번역 작업에 대해 WMT 접근 방식을 테스트했으며, 다양한 데이터에서 상당한 성과를 이루고 있었습니다. 


이번 학회를 통해 참가자들에게 좋은 자극을 받았고, 최근 상당한 성장세를 이룩하고 있는 자연어 처리 분야에 대해 좀 더 고민하고 공부하는 시간이 되어 의미있었습니다. NLP 뿐 아니라 NLG 분야에도 해결해야 할 과제들이 정말 많다는 생각도 들었습니다. 배움의 장이 된 ACL 학회, 다음에도 또 한번 가보고 싶습니다. 

반응형