शिव कुमार, विजयकुमार घडागे, इंदुप्रिया सुब्रमण्यम, आरती देसाई, विवेक के सिंह और अभय जेरे
पृष्ठभूमि: जीवन विज्ञान अनुसंधान का प्राथमिक उद्देश्य जटिल कोशिकीय तंत्र और कई कोशिकीय प्रक्रियाओं में विभिन्न जीन/प्रोटीन की परस्पर क्रिया को समझना है। इसके लिए, पबमेड अभी भी बायोमेडिकल जानकारी का प्राथमिक स्रोत है, भले ही यूनीप्रोट, प्रोटीन डेटा बैंक (पीडीबी) और रिएक्टोम जैसे कई अन्य डेटाबेस मौजूद हैं।
उद्देश्य: उच्च-थ्रूपुट प्रौद्योगिकियों और कई डेटाबेस से उपलब्ध बड़ी मात्रा में डेटा के साथ, जीन-प्रक्रिया-फेनोटाइप के लिए प्रासंगिक जानकारी प्राप्त करना अब बेहद चुनौतीपूर्ण और थकाऊ हो गया है। समग्र जानकारी प्राप्त करने के लिए PubMed और कई अन्य डेटाबेस को एक साथ खोजने के लिए वर्तमान में कोई उपकरण उपलब्ध नहीं है। इसके अलावा, एक सामान्य PubMed खोज बड़ी संख्या में लेख लौटाती है, जिन्हें प्रासंगिक साहित्य की पहचान करने के लिए मैन्युअल रूप से जांचना पड़ता है। इसलिए, हमने BioGyan विकसित किया, जो PubMed और अन्य प्रासंगिक डेटाबेस में जीन, सेलटाइप और सेलुलर प्रक्रियाओं के लिए संयोजन खोज को सरल बनाने के लिए एक साहित्य खनन उपकरण है।
विधियाँ: बायोज्ञान उपयोगकर्ता खोज शब्दों से संबंधित लेखों को रैंक करने के लिए एक मजबूत स्कोरिंग विधि का उपयोग करता है। स्कोरिंग विधि एक सार में जीन, प्रक्रिया और अंतःक्रिया शब्दों की सह-घटना के भारित योग पर आधारित है।
परिणाम: बायोज्ञान, पूछे गए जीन और प्रक्रियाओं के बीच संबंध, मार्ग डेटाबेस से प्रासंगिक मार्ग और PDB से 3-आयामी संरचनाओं का समर्थन करने वाले PubMed लेखों को पुनः प्राप्त करता है। आसानी से देखने के लिए, उपयोगकर्ता के लिए सभी जानकारी एकल विंडो में उपलब्ध है। बायोज्ञान ने जीन-प्रक्रिया संबंध के लिए लेखों की प्रासंगिकता की भविष्यवाणी करने में 85.46% की सटीकता दिखाई, और PESCADOR से बेहतर प्रदर्शन किया।
निष्कर्ष: बायोज्ञान में कई प्रमुख विशेषताएं हैं जैसे जीन के साथ-साथ प्रक्रियाओं की बैच क्वेरी, लेखों की ऑफ़लाइन रीडिंग, लेखों की सूची को ग्रंथसूची के रूप में निर्यात करना और उपयोगकर्ता के लिए लेख की प्रासंगिकता को संशोधित करने की लचीलापन, जो इसे साहित्य खोज के लिए एक महत्वपूर्ण उपकरण बनाता है। इस प्रकार, बायोज्ञान एक अनूठा उपकरण है जो पूरी प्रक्रिया को स्वचालित करते हुए कई डेटाबेस में समग्र खोज प्रदान करता है।