본문 바로가기

Python/Project

Python Project 01. 주제 선정 및 데이터 수집

- 아이티윌 교육센터에서 진행한 팀 프로젝트 정리.

 

0. 프로젝트 주제 선정

 

- 주제 후보

이 중 '식물 정상 / 비정상 이미지 분류 모델 생성'을 주제로 선정.

(필자는 미세먼지 예측, 게임 리뷰 분석, 서울시 노인 시설 안건 제시.)

 

1. 프로젝트 주제 선정 배경

 

○ 현재 스마트 농업에 대한 관심도가 늘어나는 중.

- 관련 기사

 

○ 식물병은 상품의 가치 하락을 유발, 생산량을 감소시킴 ⇒ 경제적 손실을 야기 ⇒ ∴ 식물병 관리가 중요

 

○ 그 중 국내 가장 재배 규모가 큰 과일 중 하나인 사과 / 발병률이 높고 피해가 심각한 병 중 하나인 사과 탄저병을 구별하는 모델을 생성하기로 결정.

 

2. 데이터 수집

 

○ AI-Hub에 있는 이미지 자료를 데이터로 이용. (https://www.aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&aihubDataSe=realm&dataSetSn=146)

 

○ 훈련에 사용되지 않은 일부 사진은 Google 크롤링으로 수집.

 

 

⇒ 총 21,452장의 '사과 탄저병' 이미지 중 중복 및 잘못된 사진들을 제거하고 정상 사진 500장 / 비정상(탄저병) 사진 500장을 선정.

 

 

⇒ Google에서 검색한 '사과 탄저병' 및 일반 사과 사진들과 위의 데이터 셋에서 Validation으로 구분된 이미지를 포함하여 186장을 검증 셋으로 사용.

(※ 검증 셋 : 훈련에 사용하지 않고 위 이미지를 이용해 분류가 잘 수행되는지 확인을 위해 따로 분리한 데이터 셋)

 

정상 (좌) / 탄저병 (우)