सुदेशना गुहा नियोगी, मारिया क्रेस्टेयनिनोवा, मिशा कपुशेस्की, इब्राहिम इमाम, एल्विस ब्रेज़्मा, उगिस सरकंस
जैविक नमूनों में जैव-आणविक इकाइयों (जैसे प्रतिलेख, प्रोटीन, मेटाबोलाइट्स) के गुणों को उच्च थ्रूपुट तरीके से मापने के लिए विभिन्न "ओमिक्स" प्रौद्योगिकियों की सीमा लगातार बढ़ रही है। ऐसे प्रयोगों के परिणामों के एकीकृत अन्वेषण को सक्षम करने वाली सूचना प्रणालियों की आवश्यकता है। हमने एक प्रणाली, MoDa (आणविक डेटा वेयरहाउस) विकसित की है, जो आणविक जीव विज्ञान की विभिन्न प्रयोगात्मक तकनीकों के परिणामों को खोजने और देखने के लिए एक एकीकृत ढांचा प्रदान करती है। वेयरहाउस आर्किटेक्चर को नमूनों, प्रयोगात्मक परिणामों और जीन और अन्य आणविक इकाइयों के गुणों के विभिन्न प्रकार के फ़िल्टरिंग और क्वेरी एनोटेशन के लिए अनुकूलित किया गया है। कार्यान्वयन बायोमार्ट तकनीक पर आधारित है, जिसमें बहुआयामी डेटा में हेरफेर करने के लिए उन्नत साधन हैं। उपयोगकर्ता इंटरफ़ेस एक वेब-आधारित अनुप्रयोग है। प्रत्येक डेटा वेयरहाउसिंग परियोजना के लिए एक महत्वपूर्ण विचार डेटा अधिग्रहण और सफाई है। यह सुनिश्चित करने के लिए कि वेयरहाउस में अपलोड किया गया डेटा सुसंगत है और आगे के सांख्यिकीय विश्लेषणों के लिए पर्याप्त रूप से अच्छी तरह से एनोटेट किया गया है, हमने नमूना और शोध विषय डेटा, प्रयोगात्मक मेटाडेटा और प्रयोगात्मक परिणामों के लिए एक रिपॉजिटरी लागू की है। बायोएंटिटी ("जीन") आयाम के साथ एकत्रित डेटा के लिए एक समान संदर्भ प्रणाली प्रदान करने के लिए जीन री-एनोटेशन पाइपलाइन का उपयोग किया गया था। हम उम्मीद करते हैं कि विकसित डेटा वेयरहाउसिंग इंफ्रास्ट्रक्चर उच्च थ्रूपुट आणविक जीव विज्ञान प्रौद्योगिकियों को नियोजित करने वाली सहयोगी परियोजनाओं के लिए उपयोगी हो सकता है।