배경: ‘쓰레기 대란’, ‘매립지 부족’과 같은 쓰레기로 인한 사회적 문제 해결 필요
주제: 재활용 품목 분류를 위한 Semantic Segmentation 모델 개발
기대 효과
Input: 쓰레기 객체가 담긴 이미지
Output
지난 object detection 대회에서 좋은 성능을 보여주었던 Swin Transformer - L 모델과 Convnext - XL 모델을 UperNet의 backbone으로 사용
Model | mIoU (val) | mIoU (LB) | Training Time |
---|---|---|---|
swin - l | 0.7673 | 0.7325 | 8h 29m 32s |
convnext - xl | 0.7123 | 0.6792 | 2h 22m 56s |
convnext 모델이 swin 모델과 비슷한 성능을 보여주지만 훈련 시간이 매우 적기 때문에 convnext 모델도 함께 baseline으로 차용
기본적으로 mmsegmentation에 적용되어 있던 Resize, Random Flip, PhotoMetricDistortion, Normalize Augmentation을 사용하였으며 마지막에 Ablumentation Augmentation(Random Rotate90, One of (Blur, GaussianBlur, MotionBlur))을 추가하여 함께 사용