서 론
벼는 세계 3대 주요 곡물로 인구 절반 이상이 주식으로 이용하고 있는 작물이다. 벼의 생육단계 진단은 벼의 생육 관리를 위해 필요한 요소이다. 특히 출수기는 유전적 요인뿐만 아니라 온도 등 환경적 요인의 영향을 많이 받는다. 또한 최근 기후변화로 인하여 벼 출수기 변동 우려가 커지고 있다. 온도 조건은 벼 재배 적기를 판단하는 데 가장 중요한 요인이며 변동될 벼 출수기를 알기 위해서는 기온 예측이 필요하다고 판단된다. 벼 출수기를 잘못 판단하여 적정수확시기가 아닌 시기에 수확하게 되면 종실 등숙율과 천립중이 낮아져 수량에 큰 영향을 미친다(Bak et al., 2023). 따라서 벼 생육에 있어 기온은 매우 중요한 부분이다.
본 연구는 벼 출수기 변화 분석을 위해 기온을 예측하고자 한다. 기온을 예측하기 위한 방법은 딥러닝을 이용하고자 한다. 딥러닝은 층을 깊게 쌓을 수 있어 다양한 변수를 고려할 수 있고, 주요 데이터 특징을 자동으로 추출할 수 있다는 장점이 있다(Choi et al., 2019). 그중 딥러닝 라이브러리인 TensorFlow는 구글사에서 공개된 딥러닝 소프트웨어로서 음성인식이나 영상인식 등 광범위한 영역에서 사용되고 있고 구글은 실제로 구글 포토, Gmail, 구글번역기, 구글맵, 유튜브 등에서 실제 활용이 되는 시스템이다(Chung et al., 2024). 이전 선행연구들은 딥러닝이 아닌 기후 데이터만을 이용하여 예측하거나 농업 모델을 사용하였지만, 본 연구는 딥러닝을 직접 설계하여 사용 범위를 확장 시킬 수 있다는 이점이 있다. 따라서 벼 생육 과정에서 중요한 벼 출수기의 변화를 딥러닝을 이용하여 분석하려고 한다. 먼저 기온 CSV 데이터를 수집하고 딥러닝 라이브러리인 TensorFlow를 이용하여 기후환경 예측 모델을 개발 후 예측된 기후환경을 바탕으로 출수기의 변화를 분석하는 것을 목표로 한다.
Park et al. (2008)은 한국 60개 지역에서 기후 데이터를 활용하여 벼의 출수기를 예측하였다. 연구팀은 누적 온도를 기준으로 벼 출수 후 40일간의 평균 누적 온도를 분석하여, 각 지역의 최적 출수기를 도출했다. 결과적으로 대부분의 지역에서 최적 출수기는 8월 중후반에 해당하며, 경남, 전남 등 일부 지역은 9월 초로 예측되었다. 기상적 수확량과 기후적 수확량의 차이를 분석한 결과, 충남에서 가장 높은 수확량을 기록했으며, 강원도는 가장 낮은 수확량을 보였다. 이 연구는 기후 데이터를 기반으로 한 출수기 예측 방법을 제시하며, 지역별 출수기 분석에 중요한 기초 자료를 제공하였다.
Hyun & Kim (2017)은 ORYZA (v3)모델을 사용하여 벼의 출수기 예측 정확성을 평가하였다. 2015년과 2016년 동안 신동진벼를 대상으로 기상, 토양, 재배 관리 자료를 바탕으로 실험을 진행했다. 예측된 출수기는 기상 관측소의 데이터를 이용해 대부분 정확하게 예측되었으며, 전주, 대구, 영남 지역에서는 예측 오차가 1일 이내로 매우 적었다. 그러나 해안가 인근 지역에서는 국지적 기상 조건을 반영하지 못해 예측 오차가 크게 발생하였다. 연구는 기상 자료를 쉽게 확보할 수 있지만, 토양 자료에 대한 추가적인 처리가 필요함을 지적하며, 토양 자료 처리 도구 개발의 필요성을 강조하였다. 이 연구는 ORYZA (v3)의 적용 가능성을 확인하고, 벼 출수기 예측을 위한 기초 데이터를 제공하였다.
Bak et al. (2023)은 CNN 모델을 활용하여 드론, 타워형 관측장치, RGB 카메라로 촬영한 직하방 및 경사각 영상 데이터를 통해 벼의 출수기를 예측하는 방법을 제시한다. 사용된 CNN 아키텍처는 ResNet50, InceptionV3, VGG19로, 모두 0.98% 이상의 정확도가 나타났다. Grad- CAM 분석을 통해 모델이 벼 출수기를 이삭 형태에 높은 가중치를 두어 판별하는 방식도 확인하였으며, 실제 논 포장 모니터링 이미지에서 출수기를 하루 정도 오차 범위 내에서 정확히 추정할 수 있음을 입증하였다. 이 연구는 다양한 논 포장에서 자동적이고 정량적인 벼 출수기 예측이 가능함을 보여준다.
Park et al. (2008)는 연구팀이 직접 평균 온도를 분석하여 출수기를 예측하였고, Hyun & Kim (2017)에서는 주로 농업에서 사용되는 ORYZA (v3) 모델을 사용하였고, Bak et al. (2023)은 벼 출수기를 영상 데이터를 이용하여 출수기 예측을 하였다. 반면, 본 연구는 딥러닝 기법을 활용하여 벼 출수기를 예측하며, 특히 순환신경망(RNN)의 변형 모델인 GRU (Gated Recurrent Unit)를 적용하였다. GRU 모델은 기존의 시계열 분석 모델보다 연산 효율이 높다. 따라서 본 연구에서는 시계열 기후 데이터를 입력으로 하여 기온 변화를 학습하고, 이를 기반으로 벼 출수기를 보다 정밀하게 예측하는 모델을 구축하였다. 또한, 기존 연구에서 사용된 영상 기반 예측 방법과 달리, 본 연구는 수치 기후 데이터를 중심으로 분석을 수행하므로 기상 관측 데이터를 직접 활용한 출수기 예측 방법을 제시한다는 점에서 차별성이 있다.
재료 및 방법
데이터 수집
본 연구에서 사용된 학습 데이터는 기상자료개방포털(기상청, KMA)을 통해 수집하였다. 연구 지역으로는 우리나라 주요 쌀 생산지 중 하나인 정읍시를 선정하였다. 수집한 데이터는 2010년 1월 1일부터 2024년 7월 31일까지의 기온 데이터를 포함하며, 기온 데이터는 기상청에서 제공하는 관측소 기반의 기후 데이터를 바탕으로 하였다. 본 연구에서는 기온 변수만을 선택하여 사용하였다. 데이터는 일일 평균기온을 기준으로 한다. 또한, 수집된 기온 데이터는 월, 계절, 요일 등의 시간적 특성을 고려하여 전처리 되었고, 주말 여부와 같은 추가적인 특성을 반영하여 모델에 활용하였다.
모델 설계
본 연구에서는 GRU(Gated Recurrent Unit) 모델을 사용하여 시계열 데이터를 기반으로 기온을 예측하는 문제를 다루었다. GRU는 LSTM과 유사한 순환 신경망 구조로, 시퀸스 데이터의 패턴을 학습하는 데 적합하며(Son & Kang, 2023), LSTM보다 간단한 구조를 통해 계산 효율성을 높일 수 있다(Lee & Kwahk, 2022).
데이터는 기온 예측을 위한 입력 변수로 활용하기 위해 다양한 전처리 과정을 거쳤다. 날짜 정보로부터 월, 계절, 요일과 같은 시간 관련 특성을 추출하였으며, 이를 통해 시계열 데이터의 패턴을 학습할 수 있도록 입력 변수를 구성하였다. 데이터는 Min-Max Scaling을 통해 정규화하여 각 변수의 스케일 차이를 줄였고, 이후 학습 데이터와 테스트 데이터를 80:20의 비율로 분리하여 모델의 훈련과 검증에 활용하였다.
모델 구조는 두 개의 GRU 레이어와 Dropout, BatchNormalization, Dense 레이어로 설계되었다. 첫 번째 GRU 레이어는 시계열 데이터의 특징을 추출하고, return_sequences= True 옵션을 사용해 시계열 데이터를 다음 레이어에서도 처리할 수 있도록 하였다. 두 번째 GRU 레이어는 추가적으로 시계열 패턴을 학습하도록 구성되었다. Dropout 레이어는 과적합 방지를 위해 각 GRU 레이어 뒤에 적용되었으며, BatchNormalization 레이어는 학습 과정에서 데이터 분포를 안정화하여 학습의 효율성을 높였다. 출력층에는 Dense 레이어를 사용하여 단일 값인 기온을 예측하도록 하였다.
모델 학습은 Mean Squared Error(MSE)를 손실 함수로 사용하여 회귀 문제에 적합하도록 설정되었다. 최적화는 Adam 옵티마이저를 사용하였으며, 학습률은 0.0003으로 설정하여 안정적으로 학습이 진행되도록 하였다. 학습은 최대 200 epoch 동안 수행되었으며, EarlyStopping 콜백을 사용하여 검증 손실이 50 epoch 동안 개선되지 않을 경우 학습을 조기에 종료하였다.
또한, ReduceLROnPlateau 콜백을 활용하여 검증 손실이 개선되지 않을 때 학습률을 점진적으로 감소시켜 모델의 학습 효율을 높였다.
Fig. 1은 위 코드의 흐름을 정리한 다이어그램이다.
모델 평가
모델의 성능을 평가하기 위해, 본 연구에서는 두 가지 주요 평가 지표인 평균 제곱 오차(MSE)와, R2을 사용하였다. 지표는 모델의 예측 정확도와 기후 데이터를 얼마나 잘 설명할 수 있는지에 대한 중요한 정보를 제공한다. MSE는 0에 가까울수록 정확한 예측을 의미하고 R2은 1에 가까울수록 정확한 예측을 의미한다. 각 지표를 구하는 공식은 다음과 같다.
본 모델에서 도출된 MSE와 R2의 값은 각각 0.00267, 0.954이다. 두 함수 모두 정확한 예측을 의미하고 있다.
또한 모델의 정확성을 시각화하기 위해 학습손실그래프와 예측기온과 실제기온을 비교하는 그래프를 생성하였다. 학습손실그래프는 학습 과정에서의 손실 함수 값 변화를 시각화한 것으로, 학습 손실(Train Loss)과 검증 손실(Validation Loss)의 변화를 나타내고 있다. 데이터 셋을 80:20으로 분할할 때 80%를 이용한 손실 값은 Train Loss, 20%를 이용한 학습손실값은 Validation Loss를 의미한다.
X축은 모델이 전체 학습 데이터를 한 번 학습하는 과정을 의미하는 반복 횟수(Epoch)를 나타낸다. Y축은 예측값과 실제값 간의 차이를 나타내는 지표로, MSE를 의미하는 손실값(Loss)을 나타낸다. 따라서 Fig. 2에서와 같이 손실값이 감소할수록 모델의 정확도가 높은 것을 의미한다.
Fig. 2는 3, 7, 15년의 데이터를 이용해 딥러닝을 하였을 때의 학습 손실 그래프이다. 7년, 15년에 해당하는 학습 손실 그래프의 훈련 손실과 검증 손실 모두 0.05 이하로 나타나고 있고 두 손실값 모두 epochs에 따른 안정적인 손실값을 유지하고 있다. 따라서 본 연구에서 사용한 모델은 3년의 데이터를 이용한 딥러닝에서도 높은 정확도를 보여주고 있다고 판단된다. 또한 15년에 해당하는 학습 손실 그래프는 학습 손실과 검증 손실 모두 0.02 이하의 매우 낮은 손실값을 나타내고 있고, 3년, 7년에 해당하는 학습 손실 그래프보다 높은 정확도를 보이는 것이 확인된다.
예측기온과 실제기온 비교 그래프는 전체 데이터에 대해 실제 기온(Actual Temperature)과 예측 기온(Predicted Temperature)을 비교하여 시각적으로 나타낸 것이다. 실제 기온은 녹색 실선으로, 예측 기온은 파란색 점선으로 표시되며, 모델의 정확성을 효과적으로 시각화할 수 있다. 실제 기온과 예측 기온이 중복됐을 때 높을 정확도를 의미한다.
Fig. 3(a), (b), (c)는 각각 3, 7, 15년의 데이터를 이용해 딥러닝을 하였을 때의 예측기온과 실제기온 비교 그래프이다. 각 그래프에서는 MAE (Mean Absolute Error)를 이용해서 실제 값과 예측값의 평균적인 차이를 나타내었다.
MAE는 평균 절대 오차로 예측값과 실제값 간의 차이를 절댓값으로 변환한 이후 평균을 구한 것이다(Kang, 2024). 기온 예측 평가에서 사용되는 MAE는 2.00℃이하로 도출되면 정확한 모델로 판단한다. 3, 7, 15년의 MAE 값의 경우, 각각 1.72℃, 1.63℃, 1.60℃로 도출됨에 따라 본 모델의 전체적인 정확도가 우수하다고 판단된다.
결과 및 고찰
본 연구에서는 정읍시의 기온 데이터를 활용하여 해당 지역에서 가장 많이 재배되는 벼 품종인 일품 벼의 출수기를 분석하였다. 일품 벼의 출수기는 현재 8월 14일이다(RDA, 2020). 이를 기준으로 본 연구에서는 8월 14일을 기준으로 8월 11일부터 8월 17일까지의 평균 기온을 1990년부터 2024년까지 정리하였다(Fig. 4).
1990년부터 2024년 사이 8월 11일부터 8월 17일까지 최저 평균기온은 22.5℃(2002년)이고 최고 평균기온은 29.4℃ (2018년)이다. 또한 Fig. 5에서 추세선을 그려보았을 때, 평균기온은 연간 0.05℃씩 증가하는 것으로 나타났다. 따라서 향후 평균기온은 점차 증가할 것으로 보인다.
이를 바탕으로, 2025년부터 2034년까지의 8월 11일부터 8월 17일까지의 평균기온 예측을 실시하고, 벼 출수기를 제안하였다. 결과는 Fig. 5과 같이, 예측된 추세선의 기울기와 기온을 기존의 그래프와 비교하여 나타내었다.
예측된 2025년부터 2034년까지의 기온 범위는 27.46℃에서 30.59℃로, 이전 기온 범위 내에 포함하거나 근접한다. 이를 통해, 기온이 단기간 상대적으로 안정적인 수준을 유지할 것으로 예상된다. 이에 따라, 벼 출수기인 8월 14일은 예측 기간 동안 큰 변화가 없을 것으로 판단된다.
추세선의 기울기를 비교해 보았을 때, 기존 평균기온 값의 추세선 기울기는 y=0.0533x-80.399, 예측 평균기온 값의 추세선 기울기는 y=0.083x-139.81로 도출된다. 이는 각각 연간 평균기온이 0.05℃, 0.08℃가 지속적으로 증가하는 것을 의미한다.
본 연구에서 예측한 10년 동안의 평균기온은 안정적인 기온이라고 판단하지만, 현재 추세선의 기울기와 향후 추세선의 기울기를 살펴보았을 때, 평균기온은 점차 증가할 것으로 예상된다. 이처럼 장기적인 기온 상승이 예상됨에도 불구하고 연구결과에 따르면, 2025년부터 2034년까지 예측된 기온 범위 내에서는 벼 출수기 날짜가 크게 변동하지 않으리라고 해석할 수 있다. 특히, 예측된 기온이 벼 품종의 생육에 미칠 영향은 현재 평균기온이 벼 품종 생육에 미치고 있는 영향의 수준과 유사하게 유지될 것으로 보이며, 벼 품종의 환경적 특성에 따른 출수기 변화는 큰 영향을 받지 않을 것으로 예상된다.
고찰 및 제언
본 연구에서는 정읍시의 기온 데이터를 활용하여, 해당 지역에서 가장 많이 재배되는 벼 품종인 일품 벼의 출수기를 분석하였다. 연구에 적용한 모델은 GRU (Gated Recurrent Unit)로서 시계열 데이터를 기반으로 기온을 예측하였다. 데이터는 시간 관련 특성을 추출하고 Min.-Max. Scaling을 통해 정규화한 후, 학습과 검증 데이터를 80:20으로 분리하였다. 이후, 해당 연구모델을 두 개의 GRU 레이어와 Dropout, BatchNormalization, Dense 레이어로 구성하였으며, MSE 손실 함수와 Adam 옵티마이저를 사용하여 평균기온 예측을 실시하였다.
일품 벼의 출수기는 현재 8월 14일이다. 8월 14일을 기준으로 8월 11일부터 8월 17일까지의 평균기온을 1990년부터 2024년까지 분석한 결과, 최저 평균기온은 22.5℃(2002년)이고, 최고 평균기온은 29.4℃(2018년)로 나타났으며, 추세선 기울기는 y=0.0533x-80.399로 정리되었다.
다음으로 2025년부터 2034년 사이, 8월 11일부터 8월 17일까지의 평균기온에 대한 추세선 기울기를 도출하고, 도출된 평균기온을 기존의 그래프와 비교함으로써 벼 출수기를 제안하였다.
2025년부터 2034년 사이의 예측된 기온 범위는 27.46℃에서 30.59℃로, 이전 기온 범위 내에 포함되거나 근접하고 있어, 기온이 상대적으로 안정적인 수준을 유지할 것으로 예상된다. 추세선의 기울기를 계산하였을 때, 추세선은 y=0.083x-139.81로 나타났다. 이는 연간 평균기온이 0.08℃씩 증가하는 것으로 해석할 수 있다. 이는 장기적으로 기온 상승이 초래된다고 하더라도, 2025년부터 2034년까지의 예측된 기온 범위 내에서는 벼 출수기 날짜가 크게 변동하지 않을 것으로 예상해 볼 수 있다. 또한, 본 연구에 적용한 기후환경 예측코드는 기온 데이터의 시계열 분석과 미래 예측을 통해 벼뿐만 아니라 다양한 작물 생육에 필요한 정보를 도출하는 데 도움을 줄 수 있어 딥러닝과 농업 분야에서 중요하게 활용될 수 있을 것으로 기대된다.
적 요
벼는 세계 3대 주요 곡물로 인구 절반 이상이 주식으로 이용하고 있는 작물이다. 벼의 생육단계 진단은 벼의 생육 관리를 위해 필수적인 요소이다. 특히 출수기는 유전적 요인뿐만 아니라 온도 등 환경적 요인의 영향을 많이 받는다. 본 연구는 딥러닝 기법을 활용하여 정읍시에서 주로 생산되는 일품 벼의 출수기를 분석하고 예측하였다. 본 연구에서 사용한 딥러닝 모델은 GRU모델로 데이터는 시계열 특성을 반영하기 위해 시간 관련 변수를 추출하고 정규화 과정을 거쳤으며, GRU 레이어와 Dropout, BatchNormalization을 통해 모델의 일반화 성능과 학습 효율성을 높였다. 최적화 과정에서 EarlyStopping과 학습률 조정 기법을 적용하여 안정적이고 효율적인 학습을 진행하였다.
예측된 2025년부터 2034년까지의 기온 범위는 27.46℃에서 30.59℃로, 이전 기온 범위 내에 포함하거나 근접하여 기온이 상대적으로 안정적인 수준을 유지할 것으로 예상된다. 추세선의 기울기를 계산하였을 때, 추세선은 y=0.083x- 139.81로 나타났다. 이는 연간 0.08도씩 증가한다고 해석된다. 장기적으로 기온 상승을 초래할 수 있지만, 2025년부터 2034년까지의 예측된 기온 범위 내에서는 벼 출수기 날짜가 크게 변동하지 않을 것으로 예상된다. 본 연구에 적용한 기후환경 예측 코드는 기온 데이터의 시계열 분석과 미래 예측을 통해 벼뿐만 아니라 다양한 작물 생육에 필요한 정보를 도출하는 데 도움을 줄 수 있어 딥러닝과 농업 분야에서 중요하게 활용될 수 있을 것으로 기대된다.







