Fajar, Aziz (2024) Pengembangan Metode Rekonstruksi dan Segmentasi Citra 3D DICOM Magnetic Resonance Imaging Otak. Doctoral thesis, Institut Teknologi Sepuluh Nopember.
Text
05111960010015-Dissertation.pdf - Accepted Version Restricted to Repository staff only until 1 July 2026. Download (3MB) | Request a copy |
Abstract
Saat ini operasi otak sangat bergantung pada kemampuan dokter yang melakukan operasi. Dalam melakukan operasi, dokter menggunakan citra Magnetic Resonance Imaging (MRI) berupa citra Digital Imaging and Communications in Medicine (DICOM) untuk membantu menentukan lokasi yang akan dioperasi. Hasil dari scan MRI ini adalah beberapa citra yang apabila digabungkan dapat membentuk citra 3D yang merepresentasikan otak. Untuk melakukan pendidikan pada dokter pemula, dokter senior masih menggunakan citra 2D DICOM yang dapat membuat dokter pemula harus membayangkan bagaimana bentuk 3D dari bagian otak yang sedang dibahas. Kasus lain dimana citra 3D dibutuhkan adalah ketika melakukan segmentasi citra DICOM. Citra DICOM memiliki spacing between slices dalam metadatanya. Apabila citra DICOM memiliki space diantara slice maka ada bagian dari keseluruhan citra yang hilang. Dengan rekonstruksi 3D, bagian ini juga direkonstruksi. Namun, membentuk 3D dari citra-citra DICOM bukan hal yang sederhana, karena apabila hanya digabungkan tanpa ada konfigurasi, maka citra yang dihasilkan tidak mirip dengan bentuk otak yang mirip dengan aslinya. Sehingga, penelitian ini mengusulkan metode untuk merekonstruksi citra 3D berdasarkan slices citra 2D DICOM. Metode rekonstruksi ini terdiri dari beberapa langkah. Metode ini terdiri dari image enhancement menggunakan histogram equalization, rekonstruksi 3D citra DICOM, interpolasi menggunakan trilinear interpolation dan resize citra 3D. Selanjutnya, dilakukan segmentasi pada citra 3D DICOM yang didapat dari dokter di Surabaya maupun BraTS 2021 sebagai dataset publik dengan menggunakan Deep Learning. Segmentasi dilakukan pada citra 3D otak karena apabila menggunakan data 2D maka struktur keseluruhan otak tidak terlihat dengan sempurna, sedangkan anatomi manusia memang sama, namun morfologi atau bentuk dari anatominya dapat berbeda-beda. Pada penelitian sebelumnya, Spatially Localized Atlas Network Tiles (SLANT) memiliki performa yang bagus, namun dalam proses training dibutuhkan sumber daya yang sangat besar dan waktu yang lama. Sedangkan, arsitektur yang digunakan adalah arsitektur Deep Learning U-Net memiliki performa yang sedikit lebih rendah namun memiliki waktu pelatihan yang jauh lebih cepat. Sehingga U-Net, Res U-Net, dan Dense U-Net termasuk arsitektur yang sering digunakan untuk segmentasi data medis Yang terakhir, penelitian ini mengusulkan metode untuk learning rate tuning menggunakan exponential moving average dan cyclical learning rate (CLR) untuk meningkatkan hasil segmentasi. Metode ini dikembangkan berdasarkan penelitian sebelumnya. Penelitian sebelumnya melakukan learning rate test menggunakan datapoint yang didapat dari tiap akhir epoch. Sedangkan, penelitian ini menggunakan datapoint yang didapat dari tiap akhir batch pada saat proses training model. Performa dari CLR yang diusulkan ini dibandingkan dengan metode CLR pada penelitian sebelumnya. Kinerja dari metode segmentasi dievaluasi dengan cara membandingkan hasil segmentasi dengan ground truth yang didapatkan dari dokter bedah syaraf untuk segmentasi anatomi otak. Sedangkan, metode tuning learning rate yang diusulkan dalam penelitian ini digunakan untuk segmentasi tumor pada dataset BraTS 2021 dan melakukan validasi secara online. Hal ini dilakukan untuk mengetahui performa dari metode yang diusulkan untuk tuning learning rate pada dataset publik. Untuk mengukur kemampuan dari model segmentasi, penelitian ini menggunakan Dice Similarity Coefficient (DSC). Hasilnya, metode tuning learning rate yang disusulkan memiliki hasil yang lebih baik daripada hasil dari penelitian sebelumnya. Hasil training model pada training set menunjukkan bahwa arsitektur U-Net yang memiliki nilai DSC sebesar 81,725 % dalam 140 epochs meningkat menjadi 82% dalam 121 epochs. Arsitektur Res U-Net juga mengalami peningkatan nilai DSC dari 82,875% menjadi 83,575% namun membutuhkan jumlah epoch yang lebih banyak untuk mencapai convergence, dari 142 menjadi 152 epoch. Nilai DSC dari Dense U-Net juga meningkat dari 81,875% dalam 224 epochs menjadi 81,95% dalam 170 epochs
===================================================================================================================================
Currently brain surgery is very dependent on the ability of the doctor performing the operation. When carrying out surgery, doctors use Magnetic Resonance Imaging (MRI) images in the form of Digital Imaging and Communications in Medicine (DICOM) images to help determine the location to be operated on. The result of this MRI scan is several images which, when combined, can form a 3D image that represents the brain. To educate novice doctors, senior doctors still use 2D DICOM images which can make novice doctors have to imagine what the 3D shape of the part of the brain being discussed is like. Another case where 3D images are needed is when segmenting DICOM images. DICOM images have spacing between slices in their metadata. If a DICOM image has space between slices then part of the entire image is lost. With 3D reconstruction, this part is also reconstructed. However, forming 3D from DICOM images is not a simple thing, because if they are only combined without any configuration, the resulting image will not resemble the original brain shape. Thus, this research proposes a method for reconstructing 3D images based on 2D DICOM image slices. This reconstruction method consists of several steps. This method consists of image enhancement using histogram equalization, 3D reconstruction of DICOM images, interpolation using trilinear interpolation and 3D image resizing. Next, segmentation was carried out on 3D DICOM images obtained from doctors in Surabaya and BraTS 2021 as a public dataset using Deep Learning. Segmentation is carried out on 3D images of the brain because when using 2D data the overall structure of the brain cannot be seen perfectly, while human anatomy is the same, but the morphology or shape of the anatomy can vary. In previous research, Spatially Localized Atlas Network Tiles (SLANT) had good performance, but the training process required very large resources and a long time. Meanwhile, the architecture used is the U-Net Deep Learning architecture which has slightly lower performance but has a much faster training time. So U-Net, Res U-Net, and Dense U-Net are architectures that are often used for medical data segmentation. Lastly, this research proposes a method for learning rate tuning using exponential moving average and cyclical learning rate (CLR) to improve segmentation results . This method was developed based on previous research. Previous research conducted a learning rate test using data points obtained at the end of each epoch. Meanwhile, this research uses data points obtained from the end of each batch during the model training process. The performance of the proposed CLR is compared with the CLR method in previous research. The performance of the segmentation method was evaluated by comparing the segmentation results with ground truth obtained from a neurosurgeon for brain anatomical segmentation. Meanwhile, the learning rate tuning method proposed in this research is used for tumor segmentation in the BraTS 2021 dataset and carries out online validation. This was done to determine the performance of the proposed method for tuning learning rate on public datasets. To measure the ability of the segmentation model, this research uses the Dice Similarity Coefficient (DSC). As a result, the proposed learning rate tuning method has better results than the results from previous research. The results of model training on the training set show that the U-Net architecture which has a DSC value of 81.725% in 140 epochs increases to 82% in 121 epochs. The Res U-Net architecture also experienced an increase in the DSC value from 82.875% to 83.575% but required a greater number of epochs to achieve convergence, from 142 to 152 epochs. The DSC value of Dense U-Net also increased from 81.875% in 224 epochs to 81.95% in 170 epochs
Actions (login required)
View Item |