نوع مقاله : مقاله پژوهشی
نویسندگان
1 بخش علوم دامی، دانشکده کشاورزی، دانشگاه شیراز، شیراز، ایران.
2 نویسنده مسئول، بخش علوم دامی، دانشکده کشاورزی، دانشگاه شیراز، شیراز، ایران.
3 مرکز پژوهشهای علمی و صنعتی غذا و کشاورزی مشترک المنافع (CSIRO)، آرمیدل، نیوساوت ولز، استرالیا.
4 CSIRO Hamideh.Keshavarzi@csiro.au
5 02 6776 1328 9308 New England Highway, Armidale, NSW, 2350, Australia
چکیده
در این پژوهش، از چهار الگوریتم جنگل تصادفی، درخت تصمیم، بیز ساده و رگرسیون لجستیک برای پیشبینی بیماری ورم پستان بر اساس دادههای دو گله گاو شیری هلشتاین استفاده شد. به دلیل نامتوازن بودن تعداد موارد بیمار و سالم از دو روش بیشنمونهبرداری و کمنمونهبرداری استفاده شد. متغیرهای مرتبط با ورم پستان، شامل نوبت زایش، تولید شیر روزانه، فصل زایش، مرحلهی شیردهی، سابقهی ورم پستان و امتیاز سلولهای بدنی از دو گاوداری در اصفهان جمعآوری شد. ویرایش دادهها با نرمافزارSQL Server (نسخه 2012)، مدلسازی برای پیشبینی ورم پستان با نرمافزارWEKA (نسخه 3/8)، انجام شد. بر اساس نتایج بهدستآمده، بهترین عملکرد مربوط به الگوریتم جنگل تصادفی در حالت کمنمونهبرداری با صحت، حساسیت، تشخیص و ناحیه زیرمنحنی خم به ترتیب 84/30درصد، 94/80 درصد،73/80 درصد و 0/90 بود. بدون نمونهبرداری، قدرت تشخیص موارد بیمار (حساسیت برحسب درصد) در الگوریتمهای جنگل تصادفی، درخت تصمیم، بیز ساده و رگرسیون لجستیک به ترتیب 1/67، صفر، 12/29 و 2/06 بود که نسبت به استفاده از نمونهبرداری بهطور چشمگیری ضعیفتر بود. این بخاطر نامتوازن بودن تعداد موارد دو کلاس سالم و بیمار و نشاندهندهی لزوم استفاده از روشهای نمونهبرداری بود. با توجه به یافتهها، الگوریتم درخت تصمیم نیز در روش کمنمونهبرداری با اختلاف کمی بعد از جنگل تصادفی بهترین عملکرد را با صحت، حساسیت، تشخیص و ناحیه زیرمنحنی خم بهترتیب 84/0 درصد، 94/2 درصد، 73/9 درصد و 0/90 داشت. با توجه به هزینهی محاسباتی بسیار بیشتر جنگل تصادفی نسبت به درخت تصادفی، در مواقعی که حجم دادهها بالاست، بهتر است از درخت تصمیم استفاده شود.
کلیدواژهها
عنوان مقاله [English]
Using machine learning algorithms to predict the occurrence of clinical mastitis in Holstein cows
نویسندگان [English]
- MohammadTaghi Fayazikia 1
- Mohammad Dadpasand 2
- Hamideh Keshavarzi 3 4 5
1 Department of Animal Science, School of Agriculture, Shiraz University, Shiraz, Iran
2 Department of Animal Science, School of Agriculture, Shiraz University, Shiraz, Iran
3 Research plus postdoctoral fellow Agriculture and Food
4 CSIRO, 9308 New England Highway, Armidale, NSW, 2350, Australia
5
چکیده [English]
Introduction Mastitis is one of the most frequent and costly diseases of the dairy cattle industry and causes many economic losses, which negatively affects milk yield and composition, fertility, longevity and welfare of cows. The best solution for reducing the economic and biological consequences is early and accurate prediction of mastitis based on indicator factors. So far, various statistical methods have been used to predict mastitis such as linear and multiple regression, and threshold models. Machine learning is another method that has recently widely been used to predict farm profitability, reproductive traits, longevity and abortion in dairy cow. Machine learning is defined as a set of methods for automatically finding patterns in data and then using those patterns to predict possible future data.
Material and Methods In this research, the performance of four machine learning algorithms including random forest, decision tree, Naïve Bayes and logistic regression and two sampling methods, over-sampling and under-sampling, were compared to predict risk of clinical mastitis based on data collected in two Holstein dairy herds in Isfahan province. Final dataset included 393504 records on cows calved during 2007 to 2017 of which 13653 cases (3.47%) were infected and 379851 cases (96.53%) were healthy. Factors related to mastitis, including parity, daily milk production, calving
کلیدواژهها [English]
- dairy cow
- machine learning
- mastitis
- prediction
- sampling