딥러닝을 활용해 이미지나 문서에 포함된 텍스트나 특수기호, 수학 수식 등을 인식합니다. 한국어, 일본어, 중국어, 영어, 러시아어, 프랑스어, 스페인어 등 다양한 언어 데이터를 수집하고 라벨링하여 Document Comprehension을 자동화하기 위한 데이터셋을 만듭니다. 자동화를 위해 반복되거나 일관된 양식에 Key Value 속성을 부여하거나 특정 영역이나 의미를 Clustering 하는 작업 방식을 활용합니다.