Comparison of Linear, Quadratic and Flexible Discriminant Analysis by Using Generated and Real Data
1Department of Medical Education, Erciyes University Medical Faculty, Kayseri, Turkey
2Department of Biostatistics Eskişehir Osmangazi University, Medical Faculty, Eskişehir, Turkey
J Clin Pract Res 2008; 30(4): 266-277
Full Text PDF (Turkish)

Abstract

Purpose: Parametric Linear Discriminant Analysis (LDA), Quadratic Discriminant Analysis (QDA) and nonparametric Flexible Discriminant Analysis (FDA) were compared by using generated and real data sets.
Materials and Methods: The research used generated and six medical data sets. A thousand repeated data were produced by Monte Carlo simulation method under multivariate normal and nonnormal distributed conditions, different mean vectors and variance-covariance matrices of containing four independent variables as in groups g=2, 3 and 4.
Results: It was determined that all the methods demonstrated good performances in the data homogeneous within groups and heterogeneous between groups. When the mean vectors of groups were similar and variances were small, it was determined that all methods showed high accurate classification rates. When overlapping in the data, QDA gave more efficient performance than LDA. Methods of FDA gave more performance than LDA, but gave less performance than QDA. That FDA and LDA performance of two data compared in six medical data performance gave high performance according to QDA, while 4 data gave similar results methods.
Conclusion: We concluded that the use of FDA methods in the nonnormal and heterogeneous sets and in the normal and homogeneous sets LDA should be used, but heterogeneous sets QDA may be used.


Doğrusal, Karesel ve Esnek Ayırma Analizlerinin Türetilmiş ve Gerçek Veriler Üzerinde Karşılaştırılması
1Department of Medical Education, Erciyes University Medical Faculty, Kayseri, Turkey
2Department of Biostatistics Eskişehir Osmangazi University, Medical Faculty, Eskişehir, Turkey
Journal of Clinical Practice and Research 2008; 4(30): 266-277

Amaç: Bu çalışmada parametrik ayırma analizi yöntemleri olan Doğrusal Ayırma Analizi (DAA) ve Karesel Ayırma Analizi (KAA) ile parametrik olmayan Esnek Ayırma Analizi'nin (EAA) türetilmiş ve gerçek veri setlerinde performansları karşılaştırıldı.
Gereç ve Yöntemler: Araştırmada tıp alanında gerçek ve türetilmiş veri setleri kullanıldı. Türetilmiş veri setleri, grup sayısı g=2, 3 ve 4 olacak şekilde, 4 bağımsız değişken içeren farklı ortalama vektörleri ve varyans-kovaryans matrislerine sahip çok değişkenli normal dağılım gösteren ve göstermeyen koşullarda Monte Carlo simülasyon yöntemi kullanılarak 1000 tekrar yapılarak oluşturuldu.
Bulgular: Türetilmiş veri setlerindeki gruplar kendi içinde homojen yapıda ve aralarında heterojen yapıda ise tüm yöntemler daha iyi performans gösterdi. Grup merkezleri birbirine yakın olduğunda; eğer varyanslar küçük ise, yöntemlerin Doğru Sınıflandırma Oranları'nın (DSO) daha yüksek olduğu saptandı. Bununla beraber birimlerin özellikleri birbirlerine karıştığında KAA, DAA'ya göre daha etkin DSO değerleri verdi. EAA yöntemlerinin ise genellikle farklı koşullarda DAA'ya göre yüksek, ancak KAA'dan daha düşük performansı olduğu belirlendi. Tıp alanında 6 sette, EAA ve DAA performansı KAA yöntemine göre daha yüksek iken 4 sette yöntemler benzer sonuçlar verdi.
Sonuç: Normal dağılmayan ve heterojen veri yapılarında EAA yönteminin, normal dağılan v homojen veri yapılarında DAA'nın tercih edilmesi gerektiği, normal dağılan fakat büyük değerli varyanslara sahip heterojen dağılımlarda ise KAA'nın ayırma işlemlerinde kullanılmasının uygun olacağı belirlendi.