Nowa wersja platformy, zawierająca wyłącznie zasoby pełnotekstowe, jest już dostępna.
Przejdź na https://bibliotekanauki.pl

PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Czasopismo
2010 | R. 18, nr 6 | 330-337
Tytuł artykułu

Zastosowanie technik data mining oraz regresji logistycznej w ustaleniu czynników odpowiedzialnych za upadki jagniąt

Warianty tytułu
EN
Application of data mining techniques and logistic regression in determining factors responcible for lamb survival
Języki publikacji
PL
Abstrakty
PL
Celem przeprowadzonych badań była statystyczne ocena przeżywalności 1201 jagniąt rasy merynos polski do wieku 56 dni z wykorzystaniem metod statystycznych: drzew klasyfikacyjnych oraz regresji logistycznej. Analizę statystyczną przeżywalności jagniąt (wyrażonej w skali binominalnej: l - przeżycie, O - upadek) przeprowadzono za pomocą techniki drzew klasyfikacyjnych Skonstruowano trzy modele drzew zróżnicowane kryterium tworzenia podziałów (funkcja entropii, wskaźnik Gini i test chi2). W celach porównawczych przeprowadzono dodatkowo analizę statystyczną za pomocą wielorakiej regresji logistycznej. Jakość skonstruowanych modeli drzew klasyfikacyjnych oraz regresji wielorakiej porównywano za pomocą następujących kryteriów: przeciętnej funkcji błędu, błędu średniego kwadratowego, liftu skumulowanego, pola pod krzywą ROC oraz statystyki Kołmogorowa-Smirnova. Analizę statystyczną przeprowadzono przy użyciu oprogramowania Enterprise Miner 6.1, wchodzącego w skład pakietu SAS. Obliczone kryteria jakości czterech skonstruowanych modeli pozwalają wnioskować, że drzewa klasyfikacyjne zbudowane w oparciu o wskaźnik Gini, a w dalszej kolejności o funkcję entropii w najlepszym stopniu opisują zmienność cechy jaką jest przeżywalność jagniąt do wieku 56 dni. W przypadku najlepszego modelu klasyfikacyjnego, tj. drzewa zbudowanego z wykorzystaniem wskaźnika Gini, ranking ważności zmiennych, jaki sporządzono na podstawie miary "Importance" pozwala wnioskować, że rok urodzenia jagnięcia najsilniej różnicuje zbiór danych. W dalszej kolejności wskazano na: typ urodzenia jagnięcia, masę ciała matek jagniąt w wieku 12 miesięcy, typ urodzenia dziadka jagnięcia, wiek ojca jagnięcia przy kryciu oraz kolejny wykot matki jagnięcia.
EN
The aim of the present research was to analyse statistically the survival of 1201 Polish merino lambs up to 56 days of age using classification trees and logistic regression. Classification trees were applied in a statistical analysis of lamb survival rate (in binominal scale 1 - survival, O - mortality). Three different models of the trees were developed depending on division criterion (function of entropy, Gini index and chi-square test). For comparison purposes, an additional statistical analysis was carried out with a multiple logistic regression. The quality of decision tree models and multiple regressions was compared taking into consideration the following criteria: average error function, average squared error, lift cumulative, Kolmogorov-Smirnov statistics and the area under the ROC curve. A statistical analysis was conducted using the Enterprise Miner 6. l software included in the SAS package. The calculated quality criteria of four models that were developed lead to the conclusion that the classification trees established based on the Gini index, and then on the function of entropy, are most accurate in defining the variability of characteristics under the study, i. e. survival of lambs up to 56 days of age. In the case of the best classification model available, i.e. a tree built using the Gini idex, the ranking of variable importance that was developed based on the "Importance" measure leads to the conclusion that the year of a lamb's birth is the most significant differentiating factor. Then, other factors were: type of lamb's birth, body weight of mothers at 12 months of age, type of grandfather's birth, age of lamb's father at mating and successive lambing.
Wydawca

Czasopismo
Rocznik
Strony
330-337
Opis fizyczny
Bibliogr. 15 poz. tab., rys.
Twórcy
  • Uniwersytet Technologiczno-Przyrodniczy im. J.J. Śniadeckich, Katedra Genetyki i Podstaw Hodowli Zwierząt, 85-084 Bydgoszcz, ul. Mazowiecka 28
Bibliografia
  • 1. Abu-Hanna A., De Keizer N., 2003 - Integrating classification trees with local logistic regression in Intensive Care prognosis. Artificial Intelligence in Medicine 29, 5-23.
  • 2. Austin P.C., 2007. A comparison of regression trees, logistic regression, generalized additive models, and multivariate adaptive regression spines for predicting AMI mortality. Statistics in medicine 26, 2937-2957.
  • 3. Casellas J., Caja G., Such X., Piedrafita J., 2007. Survival analysis from birth to slaughter of Ripollesa lambs under semi-intensive management. Journal of Animal Science 85, 512-517.
  • 4. Feldman D., Gross S., 2003. Mortgage default: classification trees analysis. The Pinhass Sapir Center for Development Tel-Aviv University. Discussion Paper. 3, 1-46.
  • 5. Gama L.T., Dickerson G.E., Young L.D., Ley-master K.A., 1991. Effects of breed, heterosis, age of dam, litter size, and birth weight on lamb mortality. Journal of Animal Science 69, 2727-2743.
  • 6. Grzesiak W., 2003. Prognozowanie mleczności krów za pomocą sztucznej sieci neuronowej. Prace i Materiały Zootechniczne 61, 71-89.
  • 7. Nash M.L., Hungerford L.L., Nash T.G., Zinn G.M., 1996. Risk factors for perinatal and postnatal mortality in lambs. Veterinary Record 139(3), 64-67.
  • 8. Niedziółka R., Pieniak-Lendzion K., 2005. Wpływ wieku i typu urodzenia na użytkowość rozpłodową maciorek rasy berrichonne ducher. Roczniki Naukowe Zootechniki, Suplement, 21,45-49.
  • 9. Lasek M., 2007. Metody Data Mining w analizowaniu i prognozowaniu kondycji ekonomicznej przedsiębiorstw. Zastosowanie Enterprise Miner. Wyd. Difin Warszawa, 1-174.
  • 10. Piwczyński D., 2007. Statystyczna analiza śmiertelności jagniąt za pomocą regresji logistycznej. Roczniki Naukowe PTZ 3(1), 19-26.
  • 11. Piwczyński D., 2009. Using classification trees in statistical analysis of discreet sheep reproduction traits. Journal Central European Agriculture 10(3), 303-310.
  • 12. SAS Institute Inc. 2008. SAS/STAT® 9.2 User's Guide. Cary, NC: SAS Institute Inc.
  • 13. Southey B.R., Rodriguez-Zas S.L., Leymaster K.A., 2001. Survival analysis of lamb mortality in a terminal sire composite population. Journal of Animal Science 79(9), 2298-2306.
  • 14. SzymanowskaA., 1998. Straty jagniąt w okresie odchowu w zależności od niektórych czynników genetycznych. Annales UMCS XVI, 22, 161-166.
  • 15. Warren J.T., Mysterud L, 1995. Mortality of domestic sheep in free-ranging flocks in Southeastern Norway. Journal of Animal Science 73, 1012-1018.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.baztech-article-BPG8-0037-0015
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.