PINGPONG AI RESEARCH

"Make AI Social"

대화체에 유연한 띄어쓰기 모델 만들기

자연어 형태의 텍스트를 컴퓨터가 이해하기 하기 위해서는 토크나이징 (tokenizing) 과정이 필수적으로 진행되어야 합니다. 그러나 핑퐁팀에서 다루고 있는 채팅 데이터는 띄어쓰기가 제대로 안 된 데이터가 많고 이로 인해 토크나이징 단계에서 오류가...

서수인, 김준성 | 2019년 08월 05일

꼼꼼하고 이해하기 쉬운 XLNet 논문 리뷰

XLNet은 최근에 대부분의 NLP 테스크들에서 state-of-the-art 성능을 달성하고 있던 BERT를 큰 차이로 outperform 하면서 파장을 일으켰습니다. 논문 저자들은 기존의 Language Model들과 BERT의 문제를 지적하면서 새로운 학습 방식과 이 학습 방식을...

이주홍, 백영민, 김준성 | 2019년 07월 01일