DNA dizilimlerinin sınıflandırılmasında karar ağacı algoritmalarının karşılaştırılması
Özet
DNA dört tip nükleotidden oluşan bir zincir moleküldür. Son yıllarda DNA üzerinde yapılan çalışmalarda, DNA ‘daki nükleotid dizilişlerinin birbiri ardı sıra tekrar ettiği görülmüştür. STR olarak adlandırılan ve çeşitli alanlarda kullanılan bu tekrarlar genetik hastalıklarda, adli amaçlı kimlik tespitinde, babalık araştırmaları ve tümör biyokimyasal araştırılmaları gibi birçok farklı amaçlar için kullanılmaktadır.
Bu makale çalışmasında, 4 bakteri türünün farklı uzunluklardaki DNA dizilimleri alınarak, bu dizilimlerde tekrar eden nükleotid çiftlerin frekansı bulunmuş ve elde edilen bu frekans değerlerine Karar Ağacı algoritmalarından J48, LMT ve RandomForest uygulanarak bir sınıflandırılma yapılmıştır. Sınıflandırma sonucunda RandomForest algoritmasının, J48 ve LMT algoritmalarından sınıflandırma başarımının çok daha yüksek olduğu görülmüştür.
Koleksiyonlar
DSpace@BİNGÖL by Bingöl University Institutional Repository is licensed under a Creative Commons Attribution-NonCommercial-NoDerivs 4.0 Unported License..