PINGPONG AI RESEARCH

"Make AI Social"

대화체에 유연한 띄어쓰기 모델 만들기

자연어 형태의 텍스트를 컴퓨터가 이해하기 하기 위해서는 토크나이징 (tokenizing) 과정이 필수적으로 진행되어야 합니다. 그러나 핑퐁팀에서 다루고 있는 채팅 데이터는 띄어쓰기가 제대로 안 된 데이터가 많고 이로 인해 토크나이징 단계에서 오류가...

서수인, 김준성 | 2019년 08월 05일

꼼꼼하고 이해하기 쉬운 XLNet 논문 리뷰

XLNet은 최근에 대부분의 NLP 테스크들에서 state-of-the-art 성능을 달성하고 있던 BERT를 큰 차이로 outperform 하면서 파장을 일으켰습니다. 논문 저자들은 기존의 Language Model들과 BERT의 문제를 지적하면서 새로운 학습 방식과 이 학습 방식을...

이주홍, 백영민, 김준성 | 2019년 07월 01일

핑퐁팀 ML 세미나, 그 시작

ML 리서치 사이언티스트들의 첫 번째 세미나 발표자료 묶음을 갈무리하여 올립니다. 본 세미나는 2019년 5월 8일부터 2019년 6월 12일까지 진행되었습니다. 첫 세미나의 주제는 아무래도 기본을 닦는 것이 좋다고 판단해 대화 시스템...

이주홍, 구상준, 정다운, 김선웅, 백영민, 김준성 | 2019년 06월 15일

이전 1 2 3 다음