نوع مقاله : مقاله پژوهشی
نویسندگان
1 دانش آموخته کارشناسی ارشد
2 استادیار دانشگاه تهران، پردیس ابوریحان، تخصص: ژنتیک و اصلاح نژاد دام/ ژنتیک کمی/ انتخاب ژنومیک
3 هیات علمی دانشگاه آزاد اسلامی واحد کرج
چکیده
هدف از این مطالعه مقایسه سه روش پارامتری (GBLUP، BayesB، RKHS) و دو روش بازنمونهگیری (Bagging GBLUP و Random Forest) در پیش بینی ارزشهای اصلاحی ژنومیک برای صفاتی با ساختار ژنتیکی متفاوت بود. یک ژنوم با سه کروموزوم، هر کروموزوم به طول یک مورگان شبیهسازی شد و روی آن 1500 نشانگر تک نوکلئوتیدی (SNP) در سه سناریو 50، 100 و 200QTL به طور یکنواخت پخش شدند. اثر جایگزینی QTLها با استفاده از توزیع نرمال استاندارد، گاما و یکنواخت با وراثتپذیری 30 درصد مدل سازی شدند. توانایی پیشبینی روشهای آماری با استفاده از آمارههای همبستگی بین ارزشهای اصلاحی پیشبینی شده و واقعی و همچنین رگرسیون ارزش اصلاحی واقعی بر پیشبینی شده بررسی شد. نتایج نشان داد در جمعیتهای تایید، روش RF باعث بیش-برآورد رگرسیون ارزشهای اصلاحی واقعی بر پیشبینی شده شد، در حالی که روشهای GBLUP، BayesB و RKHS منجر به کم-برآورد ضریب رگرسیون شدند. به جز روش Bagging GBLUP در دیگر روشها تفاوت معنی داری با تغییر توزیع اثرات QTL مشاهده نشد اما در مجموع عملکرد دو روش GBLUP و BayesB نسبت به دیگر روشها بهتر بود. یکی از دلایل احتمالی برتری GBLUP و BayesB بر دیگر روشها میتواند شبیه سازی صفات با اثرات صرفا ًژنتیکی افزایشی بوده باشد. به طور کلی، روشهای GBLUP و BayesB بر روش های بازنمونهگیری در پیشبینی های ژنومی ارجحیت دارند.
کلیدواژهها
عنوان مقاله [English]
Comparison of parametric and resampling methods in genetic evaluation of quantitative traits with different genetic structure
نویسنده [English]
- Rostam AbdolahiArpanahi 2
1
2 Assistant Professor, University of Tehran, Aborayhan Campus
3
چکیده [English]
The objective of this study was to compare three parametric (GBLUP, BayesB and RKHS) and two resampling (Bagging GBLUP and Random Forest) statistical methods in genomic prediction of traits with different genetic architecture. A genome consisting of three chromosomes, 1 Morgan each, was simulated on which 5000 SNPs and 50, 100 and 200 QTLs were distributed. The substitutions effects of QTLs were modeled with normal, gamma and uniform distributions with a level of heritability equal to 0.30. The predictive performance of statistical models was evaluated using the correlation between predicted and true breeding values as well as the regression of predicted values on true breeding values. In the target population, Random Forest resulted in overestimation of estimated regression coefficients while GBLUP, BayesB and RKHS led to an underestimation of regression coefficients of true breeding values on predicted breeding values. In exception of Bagging GBLUP, the performance of all statistical methods was the same in three gene effect distributions. However, the performance of GBLUP and BayesB was better than other statistical methods. A reason for this superiority could be the additive architecture of simulated traits. In conclusion, GBLUP and BayesB were superior over resampling methods in genomic predictions.
کلیدواژهها [English]
- Bagging
- Genetic Architecture
- Genomic Evaluation
- Machine learning
- Random forest
- RKHS