안녕하세요 딥논읽 입니다 오늘 소개드릴 논문은 'LayoutLM'입니다 !
여러 회사에서 스캔 된 문서의 텍스트를 추출하여 이해하는 기술에 대한 수요가 증가하고 있습니다. 하지만 뒷받침할 모델들이 많이 학습이 되지 않고 있는 상황입니다
문제는 이제 Label된 Dataset이 극도로 부족한데 이런 문제를 해결하기 위해서
Unlabel Dataset을 활용을 해야 하지만 연구가 충분히 이루어지지 못하고 있습니다
기존의 모델들은 OCR같은 사전에 학습된 CV모델만을 활용하거나 반대로 NLP 모델만 활용을 하고 있고 이 두 개 모델을 같이 활용된 pre-training 모델이 존재하지 않습니다
그래서 이 논문에서는 컴퓨터 비전과 NLP 를 동시에 사용하는 pre-training 모델을 사용하는 LayoutLM에 대해 제안합니다!
오늘 논문 리뷰는 딥논읽 자연어 처리팀 박희수 님이 자세한 리뷰 도와주셨습니다.
오늘도 많은 관심 미리 감사드립니다!