نوع مقاله : مقاله پژوهشی
نویسندگان
1 گروه علوم دامی، دانشکده کشاورزی، دانشگاه آزاد واحد ابهر، ایران
2 سازمان تحقیقات، آموزش و ترویج کشاورزی وزارت جهاد کشاورزی، موسسه آموزش و ترویج جهاد کشاورزی، استادیار ژنتیک و اصلاح نژاد، گروه علوم دامی
3 گروه علوم دامی، دانشکده کشاورزی، دانشگاه آزاد واحد ورامین، ایران
4 گروه علوم دامی، دانشگاه آزاد اسلامی واحد ابهر، ابهر، ایران
چکیده
هدف: این تحقیق ، به دنبال شناسایی و تجزیه و تحلیل سیستماتیک عوامل کلیدی مؤثر بر ماندگاری گاوهای شیری هلشتاین در گله، با استفاده از الگوریتمهای پیشرفته دادهکاوی است. درک و پیشبینی ماندگاری حیاتی است زیرا مستقیماً بر بهرهوری و سودآوری گاوداریهای شیری تأثیر میگذارد. گاوهای با طول عمر بیشتر، تمایل به تولید گوسالههای بیشتر و تولید شیر بیشتر داشته و در نتیجه بهرهوری اقتصادی کلی دامداری را افزایش میدهند. علاوه بر این، طول عمر بیشتر با کاهش هزینههای جایگزینی مرتبط است.
مواد و روشها: در سالهای اخیر، ادغام تکنیکهای یادگیری ماشین در مدیریت کشاورزی و دامداری شتاب قابل توجهی یافته است. این مطالعه از دادههای فنوتیپی دقیق جمعآوریشده از 37009 حیوان دختر متعلق به 664 پدر در 82 گله مجزا استفاده میکند که نشاندهنده یک مجموعه داده جامع است که یک دهه را در بر میگیرد. دادهها شامل هشت رکورد تولید شیر، در کنار سایر متغیرهای مرتبط مانند سن دام، تعداد پدر، ماندگاری به ماه، تعداد سلولهای سوماتیک، روزهای شیردهی، تولید شیر (کیلوگرم)، میزان پروتئین و چربی، طول چرخه زایش، دفعات شیردوشی، موقعیت جغرافیایی (استان)، تاریخ تولد، تاریخ زایش، فاصله زایش، کد گله و سن در اولین زایش است. مرحله آمادهسازی دادهها شامل پردازش و سازماندهی مجموعه دادهها با استفاده از اکسل ۲۰۱۶ بود که کیفیت و سازگاری دادهها را تامین نمود. تجزیه و تحلیلهای بعدی دادهها با استفاده از نرمافزارR (نسخه ۴.۳.۳) و با استفاده از بستههای تخصصی مربوطه برای یادگیری ماشین و مدلسازی آماری انجام شد.
نتایج: نتایج نشان داد که ماشین بردار پشتیبان بهترین دقت (۰.۹۸۷) را دارد. جنگل تصادفی دومین الگوریتم کارآمد بود. دقت ماشین تقویت گرادیان کمی کمتر از جنگل تصادفی بود، اما همچنان عملکرد خوبی را نشان داد. درخت تصمیم کمترین دقت را در بین این الگوریتمها ارائه داد. درخت تصمیم و ماشین بردار پشتیبان این عملکرد را با متغیرهای ورودی کمتری در مقایسه با ماشین تقویت گرادیان و جنگل تصادفی به دست آوردند.
نتیجهگیری: نتایج نشان داد که هیچ یک از الگوریتمهای مورد استفاده برای طبقهبندی بقا، با وجود دقت قابل قبول، عاری از خطا نیستند، اما از سوی دیگر، نشان داده شد که درخت تصمیم سادهتر و کمهزینهتر است. مهمترین ویژگیهای این روشها، عدم نیاز به فرضیات و الزامات آماری مورد نیاز روشهای رگرسیون خطی و درونیابی، عدم نیاز به فرضیات نرمال بودن، مقاوم بودن در برابر مقادیر و مقادیر گمشده و توانایی تشخیص روابط غیرخطی پیچیده بین متغیرها و اهداف پیشبینی است که آنها را برای کاربردهای مختلف در صنعت دامپروری مناسب میسازد. پروتکلهای دقیق ثبت دادهها و همچنین تنظیمات دقیق الگوریتم برای پیشبینی دقیق ضروری هستند.
کلیدواژهها
عنوان مقاله [English]
Factors Influencing Longevity in Holstein Dairy Cattle: A Data Mining Approach
نویسندگان [English]
- Ali Rezazadeh Vishkaei 1
- Alireza Hasani Bafarani 2
- Kian Pahlevan Afshar 3
- Mehran Aboozari 4
1 Department of Animal Science, Faculty of Agriculture, Abhar Branch, Islamic Azad University
2 PhD of animal genetic & biotechnology Assistant Professor. Department of Animal Sciences. Agricultural Research, Education and Extension Organization (AREEO) Agricultural institute of education and extension (IATE)
3 Department of Animal Science, Faculty of Agriculture, Varamin Branch, Islamic Azad University
4 Department of Animal Science, Faculty of Agriculture, Abhar Branch, Islamic Azad University
چکیده [English]
Objective: This research aims to systematically identify and analyze the key factors that influence the longevity of Holstein dairy cattle within herds by employing advanced data mining algorithms. Understanding and predicting longevity is vital because it directly impacts dairy farm productivity and profitability. Longer-lasting cows tend to produce more calves over their lifetime, contribute to higher milk yields, and thus enhance the overall economic efficiency of dairy operations. Furthermore, extended longevity is associated with reduced replacement costs.
Materials and Methods: In recent years, the integration of machine learning techniques into agricultural and livestock management has gained significant momentum. This study utilizes detailed phenotypic data collected from 37,009 daughter animals belonging to 664 sires across 82 distinct herds, representing a comprehensive dataset that spans a decade. Data includes eight milk production records, alongside other relevant variables such as animal age, sire number, shelf life in months, somatic cell count, lactation days, milk production (kg), protein and fat content, calving cycle length, milking frequency, geographic location (province), birth date, calving date, calving interval, herd code, and age at first calving. The data preparation phase involved processing and organizing the dataset using Excel 2016, ensuring data quality and consistency. Subsequent data analyses were conducted using R software (version 4.3.3), employing relevant packages specialized for machine learning and statistical modeling.
Results: The results showed that, the Support Vector Machine has the best accuracy (0.987). The Random Forest was the second most efficient algorithm. The accuracy of the Gradient Boosting Machine was slightly lower than that of the Random Forest but still showed good performance. The Decision Tree provided the least accuracy among these algorithms. The Decision Tree and Support Vector Machine achieved this performance with fewer input variables compared to the Gradient Boosting Machine and Random Forest.
Conclusion: The results showed that none of the algorithms used for survival classification, despite acceptable accuracy, are error-free, but on the other hand, it was shown that the decision tree is simpler and less expensive. The most important features of these methods are the lack of statistical assumptions and requirements that linear regression and interpolation methods require, the lack of normality assumptions, robustness to missing values and values, and the ability to detect complex nonlinear relationships between variables and prediction objectives, which makes them suitable for various applications in the livestock industry. Accurate data recording protocols as well as precise algorithm settings are essential for accurate prediction.
کلیدواژهها [English]
- longevity
- Dairy Cattle lifespan
- Reproductive Traits
- Machine Learning
- Classification algorithms