लुबके जीएच, लॉरिन सी, वाल्टर्स आर, एरिकसन एन, हाइसी पी, स्पेक्टर टीडी, मोंटगोमरी जीडब्ल्यू, मार्टिन एनजी, मेडलैंड एसई और बूम्समा डीआई
आम तौर पर, जीनोम-वाइड एसोसिएशन अध्ययनों में एक योगात्मक आनुवंशिक मॉडल का उपयोग करके प्रत्येक SNP पर अलग-अलग फेनोटाइप को पुनः प्राप्त करना शामिल होता है। हालाँकि अप्रभावी, प्रभावी, SNP-SNP, या SNP-पर्यावरण अंतःक्रियाओं के लिए सांख्यिकीय मॉडल मौजूद हैं, लेकिन परीक्षण का बोझ जीनोम-वाइड डेटा के लिए सभी संभावित प्रभावों का मूल्यांकन अव्यावहारिक बनाता है। हम दो-चरणीय दृष्टिकोण की वकालत करते हैं जहाँ पहले चरण में एक फ़िल्टर होता है जो विभिन्न प्रकार के SNP मुख्य और अंतःक्रिया प्रभावों के प्रति संवेदनशील होता है। इसका उद्देश्य SNP की संख्या को काफी हद तक कम करना है ताकि दूसरे चरण में अधिक विशिष्ट मॉडलिंग संभव हो सके। हम "ग्रेडिएंट बूस्टिंग मशीन" (GBM) नामक एक सांख्यिकीय शिक्षण विधि का मूल्यांकन प्रदान करते हैं जिसका उपयोग फ़िल्टर के रूप में किया जा सकता है। GBM को आनुवंशिक मॉडल के पूर्व विनिर्देश की आवश्यकता नहीं होती है, और यह बड़ी संख्या में सहचरों को शामिल करने की अनुमति देता है। इसलिए GBM का उपयोग कई GxE अंतःक्रियाओं का पता लगाने के लिए किया जा सकता है, जो GWAS में उपयोग किए जाने वाले पैरामीट्रिक ढांचे के भीतर संभव नहीं होगा। हम एक सिमुलेशन में दिखाते हैं कि GBM, GWAS में आमतौर पर इस्तेमाल किए जाने वाले मानक योगात्मक प्रतिगमन मॉडल के अनुकूल परिस्थितियों में भी अच्छा प्रदर्शन करता है, और यह अंतःक्रिया प्रभावों का पता लगाने के प्रति संवेदनशील है, भले ही अंतःक्रियात्मक चरों में से किसी एक का मुख्य प्रभाव शून्य हो। GWAS में बाद वाले का पता नहीं लगाया जा सकेगा। हमारे मूल्यांकन के साथ बालों की आकृति विज्ञान से संबंधित अनुभवजन्य डेटा का विश्लेषण किया जाता है। हम उच्चतम रैंक वाले SNPs की बढ़ती संख्या द्वारा समझाए गए फेनोटाइपिक विचरण का अनुमान लगाते हैं, और दिखाते हैं कि दो-चरणीय दृष्टिकोण के पहले चरण में 10K-20K SNPs का चयन करना पर्याप्त है।