कर्टिस डेविस, कार्तिक कोटा, वेंकट बलधंदापानी, वेई गोंग, सहर अबुबकर, एरिक बेकर, जॉन मार्टिन, क्रिस्टीन एम. वाइली, राधिका खेतानी, मैथ्यू ई. हडसन, जॉर्ज एम. वेनस्टॉक वेनस्टॉक और माकेडोंका मित्रेवा
अगली पीढ़ी की अनुक्रमण तकनीकों में हाल ही में हुई प्रगति के लिए संरेखण एल्गोरिदम और सॉफ़्टवेयर की आवश्यकता होती है जो डेटा उत्पादन में वृद्धि के साथ तालमेल रख सकें। मानक एल्गोरिदम, विशेष रूप से प्रोटीन समानता खोज, विश्लेषण पाइपलाइनों में महत्वपूर्ण बाधाओं का प्रतिनिधित्व करते हैं। विशेष रूप से मेटाजेनोमिक दृष्टिकोणों के लिए, अब बड़े डेटाबेस के विरुद्ध सैकड़ों मिलियन अनुक्रम रीड्स की खोज करना अक्सर आवश्यक होता है। यहाँ हम mBLAST का वर्णन करते हैं, जो बेसिक लोकल अलाइनमेंट सर्च टूल (BLAST) पर आधारित बड़े डेटासेट में अनुवादित और/या प्रोटीन संरेखण के लिए एक त्वरित खोज एल्गोरिदम है और BLAST की उच्च संवेदनशीलता को बनाए रखता है। mBLAST एल्गोरिदम बड़े डेटासेट के लिए नेशनल सेंटर फॉर बायोटेक्नोलॉजी इन्फॉर्मेशन (NCBI) प्रोग्राम BLASTX, TBLASTX और BLASTP पर पर्याप्त गति प्राप्त करते हैं, जिससे मानक कंप्यूटर आर्किटेक्चर पर उचित समय सीमा के भीतर विश्लेषण की अनुमति मिलती है। इस लेख में, ह्यूमन माइक्रोबायोम प्रोजेक्ट से स्वस्थ मनुष्यों के माइक्रोबायोटा से उत्पन्न अनुक्रमों के साथ mBLAST के प्रभाव को प्रदर्शित किया गया है। mBLAST को BLAST के प्लग-इन प्रतिस्थापन के रूप में डिज़ाइन किया गया है, जो किसी भी अध्ययन के लिए है जिसमें शॉर्ट-रीड अनुक्रम शामिल हैं और इसमें उच्च-थ्रूपुट विश्लेषण शामिल है। mBLAST सॉफ़्टवेयर अकादमिक उपयोगकर्ताओं के लिए www.multicorewareinc.com पर मुफ़्त में उपलब्ध है।