जीन अर्मेनगौड, सेलीन ब्लांड, जोसेफ क्रिस्टी-ओलेज़ा और गुइलेन मियोटेलो
जैविक विविधता की मूलभूत इकाई, प्रजाति को परिभाषित करने के लिए आम सहमति अभी तक प्रोकैरियोट्स के लिए नहीं बन पाई है। हालाँकि अब माइक्रोबियल विविधता का आकलन करने के लिए उच्च-थ्रूपुट आणविक उपकरण उपलब्ध हैं, लेकिन पर्यावरण के नमूनों में मौजूद कम-प्रचुर प्रजातियों की भारी मात्रा के कारण पृथ्वी पर बैक्टीरिया और आर्किया की कुल प्रजातियों की संख्या का अनुमान लगाना अभी भी एक चुनौती है। 1995 में हेमोफिलस इन्फ्लुएंजा से पहले पूरे सेलुलर जीनोम के अनुक्रमण के बाद से, सात हज़ार से अधिक पूर्ण जीनोम की रिपोर्ट की गई है। जीनोम अनुक्रमों के हिमस्खलन के परिणामस्वरूप कई टैक्सा के प्रतिनिधियों का एक असाधारण दस्तावेज़ीकरण हो रहा है। जबकि इन जीनोमों के एनोटेशन ने नए जीन भविष्यवाणी उपकरणों के साथ सटीकता प्राप्त की है, प्रोटिओजेनोमिक्स ने नए जीन की खोज करने, कोडिंग डोमेन अनुक्रमों के सही अनुवादात्मक आरंभ कोडन की पहचान करने और सिग्नल पेप्टाइड प्रसंस्करण जैसे प्रोटीन स्तर पर परिपक्वता घटनाओं को चिह्नित करने में मदद करने के लिए साबित किया है। इस संरचनात्मक एनोटेशन के अलावा, प्रोटिओजेनोमिक्स प्रोटीन के कार्य में महत्वपूर्ण अंतर्दृष्टि को भी जन्म दे सकता है। मूल रूप से, प्रोटिओजेनोमिक्स में बड़े शॉटगन प्रोटिओमिक रणनीतियों और उच्च-थ्रूपुट टेंडेम मास स्पेक्ट्रोमेट्री के उपयोग के माध्यम से बड़े पैमाने पर प्रोटीन अनुक्रम डेटा प्राप्त करना शामिल है। इस तरह के प्रायोगिक डेटा का उपयोग जीनोम एनोटेशन को बेहतर बनाने के लिए किया जाता है। विभिन्न बैक्टीरिया में जीन अनुक्रमों के उलट होने या डेइनोकोकस प्रजातियों में अनुवाद के लिए गैर-विहित प्रारंभ कोडन के उपयोग जैसे अप्रत्याशित परिणाम अब तक दर्ज किए गए कई सुधारों में से कुछ हैं। आज, प्रतिनिधियों के एक दिए गए समूह का प्रोटिओजेनोमिक विश्लेषण जो जीवन के पेड़ को पूरी तरह से कवर करता है, नए उपभेदों के सटीक एनोटेशन के लिए बेहतर आधार प्रदान करेगा। इससे तुलनात्मक जीनोमिक्स अध्ययनों में सुधार होगा और यह आकलन करने में मदद मिल सकती है कि किस तरह से निकट-संबंधित प्रजातियां भिन्न हैं।