शशांक रेड्डी वड्याला
कोलोनोस्कोपी का उपयोग कोलोरेक्टल कैंसर (CRC) स्क्रीनिंग के लिए किया जाता है। इलेक्ट्रॉनिक स्वास्थ्य रिकॉर्ड (EHR) में मुक्त पाठ से कोलोनोस्कोपी निष्कर्षों का विवरण निकालने का उपयोग CRC और कोलोरेक्टल स्क्रीनिंग रणनीतियों के लिए रोगी जोखिम निर्धारित करने के लिए किया जा सकता है। हमने नैदानिक निर्णय समर्थन प्रणाली के लिए प्रासंगिक मुक्त-पाठ रिपोर्टों की व्याख्या करने के लिए जानकारी निकालने के लिए एक गहन शिक्षण मॉडल ढांचे की सटीकता को विकसित और मूल्यांकन किया, जिसमें संकेत, विकृति विज्ञान और निष्कर्ष नोट शामिल हैं। बायो-बाय-एलएसटीएम-सीआरएफ ढांचे को द्विदिशात्मक लंबी अल्पकालिक स्मृति (बाय-एलएसटीएम) और सशर्त यादृच्छिक क्षेत्रों (सीआरएफ) का उपयोग करके विकसित किया गया था ताकि कोलोनोस्कोपी के लिए संकेत, कोलोनोस्कोपी के दौरान निष्कर्ष और काटे गए पदार्थ की विकृति सहित इन मुक्त-पाठ रिपोर्टों से कई नैदानिक विशेषताओं को निकाला जा सके। हमने 3,867 रोगियों से 4,000 मैन्युअल रूप से एनोटेट किए गए नोटों में से 80% पर बायो-बाय-एलएसटीएम-सीआरएफ और मौजूदा बाय-एलएसटीएम-सीआरएफ मॉडल को प्रशिक्षित किया। ये नैदानिक नोट चार वेटरन अफेयर्स मेडिकल सेंटर में नामांकित 40 वर्ष से अधिक आयु के रोगियों के समूह से थे। बचे हुए एनोटेट नोट्स में से कुल 10% हाइपर पैरामीटर को प्रशिक्षित करने के लिए इस्तेमाल किए गए और शेष 10% का इस्तेमाल हमारे मॉडल बायो-बाय-एलएसटीएम-सीआरएफ की सटीकता का मूल्यांकन करने और बीआई-एलएसटीएमसीआरएफ़ से तुलना करने के लिए किया गया। हमारे प्रयोगों से पता चलता है कि बायो-बाय-एलएसटीएम-सीआरएफ से डिक्शनरी फ़ंक्शन वेक्टर को एकीकृत करके द्विदिश एनकोडर प्रतिनिधित्व और रणनीति वर्ण अनुक्रम एम्बेडिंग दृष्टिकोण ईएचआर-निष्कर्षित नैदानिक नोट्स से कोलोनोस्कोपी सुविधाओं की पहचान करने का एक प्रभावी तरीका है। बायो-बाय-एलएसटीएम-सीआरएफ मॉडल कोलन कैंसर के जोखिम वाले रोगियों की पहचान करने और उनके स्वास्थ्य परिणामों का अध्ययन करने के लिए नए अवसर पैदा करता है।