Kümeleme analizi yöntemlerinin hayvancılık verilerinde karşılaştırmalı olarak incelenmesi
Abstract
Bu çalışmada; Türkiye’de 81 ilin hayvancılık potansiyeli yedi farklı kümeleme analizi yöntemi ve beş farklı uzaklık ölçüsü ile karşılaştırmalı olarak incelenmiştir. Türkiye İstatistik Kurumu internet sitesinde hayvancılık istatistikleri bölümünden dinamik sorgulama ile elde edilen 2012 yılına ait büyükbaş hayvan, küçükbaş hayvan, kümes hayvancılığı ve arıcılık faaliyetlerine ait veriler kullanılmıştır.
Veri olarak, büyükbaş hayvancılık ile ilgili yerli yetişkin sığır sayısı, genç-yavru yerli sığır sayısı, sağılan yerli sığır sayısı, yerli sığırdan elde edilen süt miktarı, yetişkin kültür sığır sayısı, genç-yavru kültür sığır sayısı, sağılan kültür sığır sayısı, kültür sığırdan elde edilen süt miktarı, yetişkin melez sığır sayısı, genç-yavru melez sığır sayısı, sağılan melez sığır sayısı, melez sığırdan elde edilen süt miktarı, yetişkin manda sayısı, genç-yavru manda sayısı, sağılan manda sayısı, mandadan elde edilen süt miktarı verileri kullanılmıştır. Küçükbaş hayvancılık ile ilgili yerli koyun sayısı, genç-yavru yerli koyun sayısı, sağılan yerli koyun sayısı, yerli koyundan elde edilen süt ve yapağı miktarı, merinos koyun sayısı, genç-yavru merinos koyun sayısı, sağılan merinos koyun sayısı, merinos koyundan elde edilen süt ve yapağı miktarı, kıl keçisi sayısı, genç-yavru kıl keçisi sayısı, sağılan kıl keçisi sayısı, kıl keçisinden elde edilen süt ve tiftik miktarı, tiftik keçisi sayısı, genç-yavru tiftik keçisi sayısı, sağılan tiftik keçisi sayısı, tiftik keçisinden elde edilen süt ve tiftik miktarı verileri kullanılmıştır. Kümes hayvancılığı ile ilgili yumurta tavuğu, et tavuğu, hindi, ördek ve kaz sayısı verileri kullanılmıştır. Arıcılık ile ilgili kovan sayısı, bal ve balmumu üretim miktarı verileri kullanılmıştır.
Verilerden elde edilen 44 adet değişken, hiyerarşik kümeleme analizi yöntemlerinden ortalama (average), merkezi (centroid), tam (complete), mcquitty, ortanca (median), tek (single) ve ward bağlantı kümeleme yöntemleri ile analiz edilmiştir. Uzaklık ölçüsü olarak öklid (euclidean), karesel öklid (squared euclidean), pearson, karesel pearson ve manhattan uzaklık ölçüleri kullanılmıştır. 5,6,7,8,9 ve 10’lu kümeler bütün kümeleme yöntemleri ve uzaklık ölçüleri için ayrı ayrı oluşturulmuştur. Kümeleme yöntemlerinden ward bağlantı kümeleme yöntemi dışındaki yöntemlerin benzer kümeler oluşturduğu gözlenmiştir. Uzaklık ölçülerinden öklid, karesel öklid ve manhattan uzaklıkları benzer kümeler oluştururken pearson ve karesel pearson kendi içinde benzer diğer uzaklık ölçülerinden farklı kümeler oluşturduğu gözlenmiştir. In this study; Turkey animal husbandry potential of the 81 provinces were examined and compared with five different distance measures and seven different clustering analysis methods. Turkey Statistical Institute section on the website livestock statistics for the year 2012 obtained by dynamic querying of cattle, small ruminants, poultry and beekeeping activities data were used.
In cattle raising-related data, numbers of domestic adult cattle, young-pup domestic cattle, milking domestic cattle, young-pup culture, milking culture cattle, adult hybrids cattle, young-pup hybrid cattle, milking hybrid cattle, adult buffalo, young-pup buffalo, milking buffalo and the amount of milk obtained from domestic cattle, adult culture cattle, crossbred cattle, buffalo were used. In Small Ruminant livestock-related data counts of domestic sheep, young-pup domestic sheep, milking domestic sheep, merino sheep, young-pup merino, milking merino, goat, teen-fry goat, milking goats, Angora goat, teen-fry angora goat, milking the angora goat and milk and wool-hair-mohair quantity obtained from domestic sheep, merino sheep, goat and Angora goat were used. In Poultry-related data, numbers of egg-chicken, meat-chicken, turkey, duck and goose were used. About beekeeping hives, honey and wax production quantity data were used.
44 units variable obtained from data, hierarchical cluster analysis of the mean (average), center (centroid), full (complete), mcquitty, median, single and ward link aggregation methods were analyzed. Measure of distance "x" as euclid (euclidean), squared Euclidean, pearson, squared pearson and manhattan quadratic distance measures were used. Of 5, 6, 7, 8, 9 and 10 clusters for all clustering methods and distance measures have been created separately. Except the ward link aggregation method, similar clusters have been observed in the other clustering methods. Of the euclidean distance measure, similar to the squared euclidian distance and manhattan creating clusters pearson, squared pearson and quadratic distance measure in itself different from other similar form clusters were observed.
Collections
- Zootekni [27]
DSpace@BİNGÖL by Bingöl University Institutional Repository is licensed under a Creative Commons Attribution-NonCommercial-NoDerivs 4.0 Unported License..