Swasono, Dwiretno Istiyadi (2022) Klasifikasi Hama Penyakit Dan Kualitas Daun Tembakau Berbasis Convolutional Neural Networks. Other thesis, Institut Teknologi Sepuluh Nopember Surabaya.
Text
05111460010004-Dissertation.pdf - Accepted Version Restricted to Repository staff only until 1 November 2024. Download (7MB) | Request a copy |
Abstract
Kualitas daun tembakau dipengaruhi oleh beberapa faktor, antara lain adalah adanya serangan hama dan penyakit. Beberapa serangan hama daun tembakau baru terlihat setelah proses fermentasi awal. Daun tembakau yang terkena serangan hama membuat kualitasnya menurun. Daun yang terserang hama dan penyakit perlu dipisahkan dari daun yang sehat untuk menjaga kualitasnya. Penyortiran biasanya dilakukan secara manual yang memungkinkan kesalahan karena faktor manusia. Dalam penelitian ini mengusulkan metode klasifikasi daun tembakau untuk beberapa jenis serangan hama penyakit secara otomatis. Convolutional Neural Network (CNN) adalah salah satu metode klasifikasi terbaru yang diusulkan dalam penelitian ini dengan menggunakan arsitektur VGG16. Pelatihan VGG16 dapat berlangsung lama jika dilatih dengan inisialisasi bobot secara acak. Untuk itu inisialisasi bobot awal menggunakan transfer learning untuk meningkatkan akurasi dan mempercepat waktu pelatihan. Berdasarkan hasil pelatihan dengan 3 kelas penyakit menggunakan VGG16 dan transfer learning, mendapatkan akurasi yang sangat tinggi. Beberapa skenario diuji berdasarkan kombinasi jumlah parameter yang dapat dilatih (trainable) dan jenis optimizer untuk mendapatkan hasil terbaik. Hasilnya arsitektur yang diusulkan terbukti mampu mengklasifikasikan semua data latih dan validasi dengan benar. Dataset yang digunakan adalah 1500 total citra dengan cross validation acak 20%. CNN biasanya menggunakan dataset citra berukuran besar dengan jumlah parameter yang banyak. Kumpulan data yang kecil membutuhkan sejumlah kecil parameter. Model standar (pretrained) yang populer seperti Alexnet, VGG, Inception, dan Resnet telah diuji dengan akurasi tinggi tetapi memiliki sejumlah besar parameter. Untuk kumpulan data kecil, jumlah parameter yang terlalu besar menjadi kurang efisien dan dapat meningkatkan cost komputasi. Cost komputasi yang tinggi membuat model tidak cocok untuk komputer dengan sumber daya terbatas seperti perangkat embedded dan hand phone. Penelitian ini mengusulkan pemangkasan pada kedalaman arsitektur resnet50 dan menambahkan lapisan pereduksi dimensi setelah titik pemangkasan. Pendekatan ini tidak memerlukan algoritma kriteria pemangkasan yang rumit, sehingga mudah diimplementasikan. Resnet50 dipilih karena kinerjanya yang baik dengan lapisan batch normalization dan skip connection. Transfer learning digunakan untuk inisialisasi bobot Resnet50. Pemangkasan dilakukan pada kedalaman jaringan dengan memotong pada lapisan fungsi aktivasi. Beberapa titik pruning dipilih untuk menghasilkan
beberapa model dengan jumlah parameter tertentu. Semakin banyak lapisan jaringan yang di-pruning, semakin kecil jumlah parameter yang dihasilkan. Titik pruning seringkali masih memiliki dimensi output yang besar. Untuk itu ditambahkan lapisan untuk mengurangi jumlah kanal setelah jaringan yang di-pruning. Hal ini untuk mengurangi jumlah feature map sebelum memasuki lapisan fully connected (FC) sebagai classifier. Model jaringan yang baru kemudian di-training lagi menggunakan 2000 dataset hama daun tembakau yang dibagi menjadi 1600 data training dan 400 data validasi dengan 4 kelas. Hasil penelitian menunjukkan bahwa akurasi dapat dipertahankan sama dengan jaringan yang tidak di-pruning hingga akurasi 100% dan tingkat pengurangan jumlah parameter 74,38% dari total parameter tanpa pruning. Tingkat reduksi jumlah parameter yang lebih tinggi hingga 90,62% masih memberikan akurasi data validasi yang tinggi sekitar 99,3%. Ini membuktikan bahwa metode yang diusulkan sangat efektif dalam mempertahankan akurasi dan mengurangi jumlah parameter. Penelitian ini juga menganalisis kualitas daun tembakau berdasarkan citra daun tembakau Na-Oogst dan Kasturi (Voor-Oogst). Metode utama yang digunakan adalah menggunakan deep learning dengan CNN. Sebelum itu juga melakukan identifikasi citra menggunakan metode-metode pengolahan citra untuk mengenali beberapa sifat/karakteristik daun tembakau. Beberapa metode klasifikasi konvensional juga diuji coba sebelumnya namun hasilnya kurang memuaskan dibandingkan dengan menggunakan CNN. Beberapa arsitektur CNN diuji coba mulai dari arsitektur kecil/sederhana hingga arsitektur besar yang populer seperti VGG, Resnet50, hingga Efficient-Net untuk mendapatkan hasil yang optimal. Penelitian ini juga melakukan object detection menggunakan Yolov5x untuk jenis penyakit green spot dan thrip. Dipilih green spot dan thrip karena penampakan visual dan boundary yang cukup jelas. Jenis penyakit yang lainnya memiliki penampakan dan boundary yang samar. Kinerja Yolov5 sangat baik untuk penyakit green spot dengan mencapai mAP (mean Average Precision) sekitar 0,619 yang lebih baik daripada mAP kelas penyakit thrip sekitar 0,106 dan mAP rata-rata adalah sekitar 0,362. Selain itu penelitian ini juga melakukan semantic segmentation menggunakan U-Net pada jenis penyakit green spot karena relatif mudah memisahkan area green spot dengan area daun di sekitarnya. Penyakit thrip umumnya berupa titik-titik putih dan penyakit kulit katak titik-titik hitam sehingga cukup sulit melakukan segmentasi. Penyakit glassy memiliki area luas pada daun dan boundary cukup samar sehingga segmentasi menjadi sulit dilakukan. Kinerja U-Net pada jenis penyakit green spot diukur menggunakan Intersection over Union (IOU) dan berhasil mencapai 41,2%
======================================================================================================================================
Tobacco leaf quality is influenced by several factors, including the presence of pests and diseases. Some of the tobacco leaf pest attacks were only seen after the initial fermentation process. Tobacco leaves affected by pest attacks make the quality decline. Leaves affected by pests and diseases need to be separated from healthy leaves to maintain quality. Sorting is usually done manually allowing errors due to human-errors. In this study, we tried to classify the leaves affected by several types of pest attacks automatically. Convolutional Neural Network (CNN) is one of the latest classification methods proposed in this study using the famous VGG16 architecture. VGG16 training can last a long time if trained with random initialization of weights. For this reason, we selected initial weights by transfer learning to improve accuracy and speed up training time. Based on the results of training with 3-classes of the diseases using VGG16 and transfer learning, we obtained a very high accuracy. Some scenarios are tested based on a combination of the number of learnable parameters and types of the optimizer to get the best results. The result was that the proposed architecture was proven to be able to classify all training and validation data correctly. The dataset used was 1500 total images with 20% random cross-validation. Convolutional Neural Network (CNN) usually uses a large image dataset with a large number of parameters. Small datasets require a small number of parameters. Existing standard (pre-trained) models such as Alexnet, VGG, Inception, and Resnet have been tested with high accuracy but have a large number of parameters. For small datasets, a too large number of parameters becomes less efficient and increases computation costs. The high computational costs make the model unsuitable for computers with limited resources such as embedded devices and mobile phones. This research proposes pruning on the depth of resnet50 architecture and adds a dimensionality reduction layer after the pruning point. This approach does not require a complex pruning criteria algorithm, so it is easy to implement. Resnet50 was chosen because it's a good performance with batch normalization and skip connections. We use transfer learning for Resnet50 weight. Pruning is carried out at the depth of the network by cutting at the layer of the activation function. Several pruning points were selected to produce several models with a certain number of parameters. The more network layer pruned, the smaller the number of parameters produced. We add a layer for channel reduction after pruned network to reduce the number of feature maps before entering the fully connected (FC) layer as a classifier. We retrained a new network using a 2000 tobacco leaf pest dataset split into 1600 training and 400 validation images with 4-classes. The result shows that the accuracy could be maintained equal to the unpruned network up to 100% accuracy and 74.38% reduction rate for the number of parameters. A higher reduction rate of the number of parameters up to 90.62% still provides high accuracy of validation data around 99.3%. These prove that our proposed method was effective in maintaining accuracy and reduce the number of parameters. This research also analyzed the quality of tobacco leaves based on Na-Oogst and Kasturi (Voor-Oogst) tobacco leaf images. The main method used is using deep learning with CNN. Previously, we also identified images using image processing methods to identify some of the characteristics of tobacco leaves. Several conventional classification methods were also tested previously, but the results were less satisfactory than using CNN. Several CNN architectures were tested, started from small/simple architectures to popular large architectures such as VGG, Resnet50, upto Efficient-Net to reach optimal results. This study also performs object detection using Yolov5x for green spot and thrip diseases. Green spots and thrips were chosen because the visual appearance and boundaries are much clear. Other types of disease have a vague appearances and boundary. Yolov5x's performance is very good for green spot disease by achieving an mAP (mean Average Precision) of about 0,619, which is better than the thrip disease class mAP of around 0,106 and the average mAP of about 0,362. In addition, this study also conducted semantic segmentation using U-Net on the type of green spot disease because it is relatively easy to segment the green spot area from the leaf area around it. Thrip disease is generally in the form of white dots, and frog skin disease is black dots, so it is difficult to segment. The glassy disease has a large area on the leaves, and the boundary is quite vague, so segmentation becomes difficult. U-Net performance on the type of green spot disease was measured using the Intersection over Union (IOU) and reached 41,2%
Item Type: | Thesis (Other) |
---|---|
Additional Information: | RDIf 006.32 Swa k-1 2022 |
Uncontrolled Keywords: | kualitas daun tembakau, hama penyakit daun tembakau, Convolutional Neural Networks, object detection, semantic segmentation; Quality of tobacco leaves, tobacco leaf pests and disease, convolutional neural networks, object detection, semantic segmentation |
Subjects: | Q Science > QA Mathematics > QA76.87 Neural networks (Computer Science) |
Divisions: | Faculty of Intelligent Electrical and Informatics Technology (ELECTICS) > Informatics Engineering > 55001-(S3) PhD Thesis (Comp Science) |
Depositing User: | EKO BUDI RAHARJO |
Date Deposited: | 27 Mar 2023 04:23 |
Last Modified: | 27 Mar 2023 04:23 |
URI: | http://repository.its.ac.id/id/eprint/97801 |
Actions (login required)
View Item |