작성자 : 한양대학원 융합로봇시스템학과 유승환 석사과정 (CAI LAB) 이번에는 OCR 모델 학습을 위한 한글 & 영문 이미지 데이터를 제작하는 일을 진행해보겠습니다. OCR 데이터 제작은 파이썬 패키지로 제공하는 trdg(Text Recognition Data Generator)를 사용합니다. 글자 이미지에 필터를 넣거나 배경을 입힐 수도 있는데, 저는 그런 데이터는 필요가 없어서 따로 언급하지는 않겠습니다. (AI 허브에도 한글 OCR 데이터를 제공해주는데, 라벨링 방식이 제가 사용하는 방법과 달라서... 직접 OCR 데이터를 생성하는 방법을 선택했습니다.) [작업 환경 정보] OS : Window 10 python_version : 3.8.5 trdg_version : 1.6.0 anaconda3..
작성자 : 한양대학원 융합로봇시스템학과 유승환 석사과정 (CAI LAB) 네이버 Clova AI팀에서 연구한 OCR 딥러닝 모델을 custom data로 학습하는 과정을 정리해보겠습니다~! * 2021년 3월 8일자 기준으로 내용 보완 중 입니다. (현재 6. 코드 분석 보완 중) [필자 PC 환경] OS : Ubuntu 18.04.03 LTS (네이버 클로바 공식 깃헙에서는 16.04로 진행함) & Window 10 그래픽 카드 : GTX 1080 Ti (Ubuntu) & RTX 2070 (Window) CUDA : 10.1 (Ubuntu) & 10.2 (Ubuntu) cuDNN : 7.5.0 (Ubuntu) & 7.6.5 (window) python : 3.6.9 (Ubuntu 18.04의 defau..
작성자 : 한양대학원 융합로봇시스템학과 유승환 석사과정 (CAI LAB) 우분투 환경에서 CUDA, CuDNN, NVIDIA-Driver(그래픽 드라이버) 그리고 Pytorch를 설치하여 딥러닝 환경을 셋팅해보겠습니다. 많은 분들이 삽질을 덜 하길 바라면서 글을 작성합니다ㅎㅎ [설치 환경] PC : 데스크탑 그래픽카드 : NVIDIA-GTX 1080Ti (& GTX 1660) OS : Ubuntu 18.04.03 LTS Python : 3.6.9 (Ubuntu 18.04의 default 값) CUDA version : 10.1 cuDNN version : 7.5.0 NVIDIA-Drvier version : 440.59 Pytorch_version : 1.3.1 torchvision_version : 0..