Bayesian Mixture Model Averaging Untuk Mengidentifikasi Perbedaan Ekspresi Gen Percobaan Microarray

Astuti, Ani Budi (2017) Bayesian Mixture Model Averaging Untuk Mengidentifikasi Perbedaan Ekspresi Gen Percobaan Microarray. Doctoral thesis, Institut Teknologi Sepuluh Nopember.

[thumbnail of 1311301002-Disertation.pdf]
Preview
Text
1311301002-Disertation.pdf - Published Version

Download (7MB) | Preview

Abstract

Data ekspresi gen merupakan data hasil percobaan microarray. Tantangan utama
analisis statistika untuk data microarray adalah jumlah sampel yang tersedia
sedikit tetapi karakteristik variabel yang terukur sangat banyak. Hal ini
disebabkan oleh keterbatasan dana, tenaga dan waktu serta ketersediaan sampel.
Selain itu, sifat dasar dari sebaran data ekspresi gen yang diperoleh akan sangat
komplek (multimodal). Penelitian yang terkait dengan identifikasi perbedaan
ekspresi gen telah banyak dilakukan dengan menggunakan pendekatan Bayesian.
Analisis Bayesian yang digunakan adalah Bayesian Mixture Model (BMM) karena
indikasi data memiliki distribusi mixture. Selain itu, secara terpisah, Bayesian
Model Averaging (BMA) digunakan untuk mengidentifikasi perbedaan ekspresi
gen dengan prinsip memprediksi model terbaik melalui rata-rata terboboti dari
semua kemungkinan model baik dari data. Tujuan dari penelitian ini adalah
menggabungkan metode BMM dan metode BMA sehingga terbentuk model
Bayesian Mixture Model Averaging (BMMA) untuk data Chickpea di Indonesia.
Hasil penelitian menunjukkan bahwa model BMMA-normal mampu dengan baik
dalam mengidentifikasi kelompok ID gen data Chickpea dalam kelompok Upregulated,
Regulated, dan Down-regulated dengan tetap mempertahankan konsep
data driven. Model BMMA-normal telah berhasil mengidentifikasi lima ID gen
yang masuk dalam kelompok Up-regulated dan 14 ID gen masuk dalam
kelompok Regulated. Dalam penelitian ini tidak ditemukan ID gen yang masuk
dalam kelompok Down-regulated. Model BMMA-normal untuk kasus data
Chickpea adalah model terbaik dibandingkan model pendekatan non- mixture
normal. Nilai goodness of fit Kolmogorov-Smirnov yang diperoleh cukup kecil
dan masih dalam jaminan lebih kecil dari nilai Kolmogorov-Smirnov tabel.
==================================================================================================
Gene expression data is the data from the results of microarray experiment. The
main challenge of the statistical analysis for microarray data is the small number
of samples available but the characteristics of the variables measured are
numerous. This is due to the limited funds, personnel, time and availability of
samples. Moreover, the nature of the distribution of gene expression data obtained
will be very complex (multimodal). Research related to the identification of gene
expression differences have been carried out by using a Bayesian approach.
Bayesian analysis is used Bayesian Mixture Model (BMM) because an indication
of the data has a distribution mixture. In addition, separately, Bayesian Model
Averaging (BMA) is used to identify gene expression differences with the
principle of predicting the best model through the weighted average of all possible
good models of data. The results showed that the BMMA-normal model able to
properly identify groups of gene ID of the Chickpea data in the of Up-regulated,
Regulated, and Down-regulated groups while maintaining the concept of data
driven. BMMA-normal model have successfully identified five genes ID in the
Up-regulated group and 14 genes ID in the Regulated group. In these studies
could not find the genes ID in the Down-regulated group. The BMMA-normal
model for Chickpea data cases is the best model compared to the normal nonmixture
approach model. The value of goodness of fit Kolmogorov-Smirnov
obtained is quite small and still under warranty smaller than the value of
Kolmogorov-Smirnov table.

Item Type: Thesis (Doctoral)
Uncontrolled Keywords: Bayesian, Model Mixture, Model Averaging, Model Mixture Averaging, Microarray-Indonesia
Subjects: Q Science > QA Mathematics
Divisions: Faculty of Mathematics and Science > Statistics > 49001-(S3) PhD Thesis
Depositing User: Astuti Ani Budi
Date Deposited: 03 Jan 2018 04:21
Last Modified: 05 Mar 2019 08:05
URI: http://repository.its.ac.id/id/eprint/47751

Actions (login required)

View Item View Item