मिंगकी वू, मोनिक रिजनकेल्स और फेमिंग लियांग
अपने उच्च रिज़ॉल्यूशन मैपिंग और मजबूत ChIP संवर्धन संकेतों के कारण, ChIP-seq जीनोम-व्यापी प्रोटीन-डीएनए इंटरैक्शन का अध्ययन करने में ChIP-chip तकनीक की जगह लेता है, जबकि विशाल डिजिटल ChIP-seq डेटा सांख्यिकीविदों के लिए नई चुनौतियां पेश करता है। आज तक, ChIP-seq डेटा विश्लेषण के लिए साहित्य में प्रस्तावित अधिकांश विधियां मॉडल आधारित हैं, हालांकि, सभी डेटासेट के लिए एक ही मॉडल को खोजना असंभव है, जैविक प्रणालियों की जटिलता और अनुक्रमण प्रक्रिया में उत्पन्न विविधताओं को देखते हुए। इस पत्र में, हम ChIP-seq डेटा विश्लेषण के लिए एक मॉडल-मुक्त दृष्टिकोण, तथाकथित MICS (ChIP-Seq के लिए मॉडल-मुक्त अनुमान) प्रस्तुत करते हैं। मौजूदा विधियों की तुलना में MICS के कुछ फायदे हैं: चूंकि सिमुलेशन-आधारित विधि ChIP नमूनों से स्वतंत्र रूप से काम करती है, MICS विभिन्न ChIP नमूनों के साथ मजबूती से काम कर सकती है; यह चरम क्षेत्रों की सटीक पहचान कर सकती है, यहां तक कि उन क्षेत्रों के लिए भी जहां संवर्धन कमजोर है। तीसरा, MICS गणना में बहुत कुशल है, जो एक उचित रूप से बड़े डेटासेट के लिए व्यक्तिगत कंप्यूटर पर केवल कुछ सेकंड लेता है। इस पत्र में, हम ChIP-seq डेटा को सिम्युलेट करने के लिए एक सरल अर्ध-अनुभवजन्य विधि भी प्रस्तुत करते हैं, जो ChIP-seq डेटा विश्लेषण के लिए विभिन्न तरीकों के प्रदर्शन का बेहतर आकलन करने की अनुमति देता है। MICS की तुलना वास्तविक और सिम्युलेटेड डेटासेट के आधार पर MACS, CCAT, PICS, BayesPeak और QuEST सहित कई मौजूदा विधियों से की गई है