मिरोस्लाव जे. गिल्स्की, और रोवशान जी. सदयगोव
ह्यूमन प्रोटिओम ऑर्गनाइजेशन (HUPO) प्रोटिओमिक्स स्टैंडर्ड इनिशिएटिव को प्रोटिओमिक्स प्रयोगों (mzIndentML) से कच्चे डेटा (mzML) और स्पेक्ट्रल प्रोसेसिंग (प्रोटीन पहचान और मात्रा का पता लगाना) के परिणामों को संग्रहीत करने के लिए फ़ाइल स्वरूप विकसित करने का काम सौंपा गया है। जटिल प्रयोगों को पूरी तरह से चिह्नित करने के लिए, विशेष डेटा प्रकार डिज़ाइन किए गए हैं। मानकीकृत फ़ाइल स्वरूप विक्रेता-विशिष्ट बाइनरी डेटा संग्रहण फ़ाइलों से स्वतंत्र डेटा के विज़ुअलाइज़ेशन, सत्यापन और प्रसार को बढ़ावा देंगे। मानकीकृत फ़ाइल स्वरूपों तक मजबूत और कुशल डेटा पहुँच के लिए अभिनव प्रोग्रामेटिक समाधान प्रोटिओमिक्स समुदाय द्वारा इन फ़ाइल स्वरूपों की अधिक तेज़ी से व्यापक पैमाने पर स्वीकृति में योगदान देंगे। इस कार्य में, हम mzML फ़ाइल स्वरूप में स्पेक्ट्रल डेटा तक पहुँचने के लिए एल्गोरिदम की तुलना करते हैं। XML फ़ाइल के रूप में, mzML फ़ाइलें XML-विशिष्ट वर्ग प्रकारों का उपयोग करते समय डेटा संरचनाओं की कुशल पार्सिंग की अनुमति देती हैं। ये वर्ग फ़ाइलों तक केवल अनुक्रमिक पहुँच प्रदान करते हैं। हालाँकि, प्रोटिओमिक्स डेटासेट को संसाधित करने के लिए कई एल्गोरिदमिक अनुप्रयोगों में स्पेक्ट्रल डेटा तक यादृच्छिक पहुँच की आवश्यकता होती है। यहाँ, हम अनुक्रमिक पहुँच को यादृच्छिक पहुँच में बदलने के लिए मेमोरी स्ट्रीम के कार्यान्वयन का प्रदर्शन करते हैं। हमारा एप्लिकेशन शानदार XML पार्सिंग क्षमताओं को संरक्षित करता है। अनुक्रमिक और यादृच्छिक पहुँच मोड में फ़ाइल एक्सेस समय की बेंचमार्किंग से पता चलता है कि जबकि कम संख्या में स्पेक्ट्रा के लिए यादृच्छिक पहुँच अधिक समय कुशल है, जब बड़ी संख्या में स्पेक्ट्रा प्राप्त करना अनुक्रमिक पहुँच अधिक कुशल हो जाती है। हम शिक्षा और उद्योग से अन्य फ़ाइल एक्सेसिंग विधियों की तुलना भी प्रदान करते हैं।