محمدتقی فیاضی کیا؛ محمد دادپسند؛ حمیده کشاورزی
دوره 25، شماره 2 ، تیر 1402، ، صفحه 123-132
چکیده
در این پژوهش، از چهار الگوریتم جنگل تصادفی، درخت تصمیم، بیز ساده و رگرسیون لجستیک برای پیشبینی بیماری ورم پستان بر اساس دادههای دو گله گاو شیری هلشتاین استفاده شد. به دلیل نامتوازن بودن تعداد موارد بیمار و سالم از دو روش بیشنمونهبرداری و کمنمونهبرداری استفاده شد. متغیرهای مرتبط با ورم پستان، شامل نوبت زایش، تولید شیر روزانه، ...
بیشتر
در این پژوهش، از چهار الگوریتم جنگل تصادفی، درخت تصمیم، بیز ساده و رگرسیون لجستیک برای پیشبینی بیماری ورم پستان بر اساس دادههای دو گله گاو شیری هلشتاین استفاده شد. به دلیل نامتوازن بودن تعداد موارد بیمار و سالم از دو روش بیشنمونهبرداری و کمنمونهبرداری استفاده شد. متغیرهای مرتبط با ورم پستان، شامل نوبت زایش، تولید شیر روزانه، فصل زایش، مرحلهی شیردهی، سابقهی ورم پستان و امتیاز سلولهای بدنی از دو گاوداری در اصفهان جمعآوری شد. ویرایش دادهها با نرمافزارSQL Server (نسخه 2012)، مدلسازی برای پیشبینی ورم پستان با نرمافزارWEKA (نسخه 3/8)، انجام شد. بر اساس نتایج بهدستآمده، بهترین عملکرد مربوط به الگوریتم جنگل تصادفی در حالت کمنمونهبرداری با صحت، حساسیت، تشخیص و ناحیه زیرمنحنی خم به ترتیب 84/30درصد، 94/80 درصد،73/80 درصد و 0/90 بود. بدون نمونهبرداری، قدرت تشخیص موارد بیمار (حساسیت برحسب درصد) در الگوریتمهای جنگل تصادفی، درخت تصمیم، بیز ساده و رگرسیون لجستیک به ترتیب 1/67، صفر، 12/29 و 2/06 بود که نسبت به استفاده از نمونهبرداری بهطور چشمگیری ضعیفتر بود. این بخاطر نامتوازن بودن تعداد موارد دو کلاس سالم و بیمار و نشاندهندهی لزوم استفاده از روشهای نمونهبرداری بود. با توجه به یافتهها، الگوریتم درخت تصمیم نیز در روش کمنمونهبرداری با اختلاف کمی بعد از جنگل تصادفی بهترین عملکرد را با صحت، حساسیت، تشخیص و ناحیه زیرمنحنی خم بهترتیب 84/0 درصد، 94/2 درصد، 73/9 درصد و 0/90 داشت. با توجه به هزینهی محاسباتی بسیار بیشتر جنگل تصادفی نسبت به درخت تصادفی، در مواقعی که حجم دادهها بالاست، بهتر است از درخت تصمیم استفاده شود.
منوچهر مرادی؛ رستم عبدالهی آرپناهی؛ بهزاد همتی؛ ابوالقاسم لواف
دوره 19، شماره 1 ، اردیبهشت 1396، ، صفحه 1-12
چکیده
هدف از این مطالعه مقایسه سه روش پارامتری (GBLUP، BayesB، RKHS) و دو روش بازنمونهگیری (Bagging GBLUP و Random Forest) در پیش بینی ارزشهای اصلاحی ژنومیک برای صفاتی با ساختار ژنتیکی متفاوت بود. یک ژنوم با سه کروموزوم، هر کروموزوم به طول یک مورگان شبیهسازی شد و روی آن 1500 نشانگر تک نوکلئوتیدی (SNP) در سه سناریو 50، 100 و 200QTL به طور یکنواخت پخش شدند. اثر جایگزینی ...
بیشتر
هدف از این مطالعه مقایسه سه روش پارامتری (GBLUP، BayesB، RKHS) و دو روش بازنمونهگیری (Bagging GBLUP و Random Forest) در پیش بینی ارزشهای اصلاحی ژنومیک برای صفاتی با ساختار ژنتیکی متفاوت بود. یک ژنوم با سه کروموزوم، هر کروموزوم به طول یک مورگان شبیهسازی شد و روی آن 1500 نشانگر تک نوکلئوتیدی (SNP) در سه سناریو 50، 100 و 200QTL به طور یکنواخت پخش شدند. اثر جایگزینی QTLها با استفاده از توزیع نرمال استاندارد، گاما و یکنواخت با وراثتپذیری 30 درصد مدل سازی شدند. توانایی پیشبینی روشهای آماری با استفاده از آمارههای همبستگی بین ارزشهای اصلاحی پیشبینی شده و واقعی و همچنین رگرسیون ارزش اصلاحی واقعی بر پیشبینی شده بررسی شد. نتایج نشان داد در جمعیتهای تایید، روش RF باعث بیش-برآورد رگرسیون ارزشهای اصلاحی واقعی بر پیشبینی شده شد، در حالی که روشهای GBLUP، BayesB و RKHS منجر به کم-برآورد ضریب رگرسیون شدند. به جز روش Bagging GBLUP در دیگر روشها تفاوت معنی داری با تغییر توزیع اثرات QTL مشاهده نشد اما در مجموع عملکرد دو روش GBLUP و BayesB نسبت به دیگر روشها بهتر بود. یکی از دلایل احتمالی برتری GBLUP و BayesB بر دیگر روشها میتواند شبیه سازی صفات با اثرات صرفا ًژنتیکی افزایشی بوده باشد. به طور کلی، روشهای GBLUP و BayesB بر روش های بازنمونهگیری در پیشبینی های ژنومی ارجحیت دارند.