Deep Learning Revolusi Analisis Proteomik, Tingkatkan Identifikasi Protein Lebih dari 10 Persen

Sebuah terobosan signifikan dalam bidang telah dicapai dengan integrasi teknik fragmentasi alternatif ke dalam alur kerja kromatografi cair-spektrometri massa () standar, memanfaatkan model pembelajaran mendalam () tunggal. Inovasi ini secara dramatis meningkatkan cakupan proteom, memungkinkan identifikasi protein yang lebih komprehensif dan akurat.

Penelitian yang dipublikasikan di ini menunjukkan bahwa model deep learning tersebut mampu menyederhanakan proses analisis protein yang sebelumnya kompleks. Proteomik, studi tentang semua protein dalam sistem biologis, sangat bergantung pada LC-MS untuk analisisnya. Namun, metode standar seringkali memiliki keterbatasan dalam cakupan proteom dan rentang dinamis, yang berarti tidak semua protein dalam sampel dapat diidentifikasi secara efisien.

Mengatasi Tantangan Fragmentasi Protein

Teknik fragmentasi alternatif, seperti disosiasi yang diinduksi elektron (EID), disosiasi penangkapan elektron (ECD), dan disosiasi foton ultraviolet (UVPD), telah dikenal dapat menghasilkan spektrum yang lebih kaya dan komprehensif. Teknik-teknik ini meningkatkan cakupan urutan peptida dan memungkinkan modifikasi yang labil terhadap disosiasi yang diinduksi tabrakan (CID) tetap utuh. Meskipun demikian, pengintegrasian teknik-teknik ini ke dalam alur kerja analisis data standar merupakan tantangan besar karena kompleksitasnya.

Para peneliti mengatasi hambatan ini dengan mengembangkan model deep learning tunggal yang disebut Prosit. Model ini dirancang khusus untuk memprediksi intensitas ion fragmen, mencakup berbagai teknik disosiasi termasuk EID, ECD, HCD (High-Energy Collisional Dissociation), dan UVPD. Deep learning, sebagai cabang kecerdasan buatan, sangat efektif dalam mempelajari hubungan dan pola kompleks dari kumpulan data besar tanpa memerlukan rekayasa fitur manual yang ekstensif.

Peningkatan Identifikasi Protein yang Signifikan

Hasil penelitian menunjukkan bahwa model deep learning ini memungkinkan penggunaan pendekatan fragmentasi alternatif dalam pipa analisis data standar. Data yang dihasilkan tidak hanya kompetitif dengan metode CID dalam hal efisiensi, tetapi juga memberikan spektrum yang jauh lebih kaya dan komprehensif, terutama untuk EID dan UVPD.

Penerapan model ini dalam proses penilaian ulang (rescoring) menghasilkan peningkatan rata-rata lebih dari 10 persen dalam identifikasi protein. Peningkatan ini diamati di seluruh teknik disosiasi dan pencernaan enzimatik, baik untuk akuisisi data dependen (DDA) maupun akuisisi data independen (DIA). Peningkatan ini secara langsung berkontribusi pada cakupan proteom yang lebih luas dan mendalam.

Model yang dikembangkan ini telah tersedia untuk umum dan diintegrasikan ke dalam modul MSBooster di FragPipe, sebuah perangkat lunak analisis proteomik.

Deep Learning dan Masa Depan Proteomik

Inovasi ini menyoroti peran yang semakin penting dari deep learning dalam penelitian ilmiah, khususnya di bidang proteomik. Deep learning telah menunjukkan potensi besar dalam berbagai aplikasi proteomik lainnya, termasuk prediksi waktu retensi, prediksi spektrum MS/MS, pengurutan peptida *de novo*, prediksi modifikasi pasca-translasi (PTM), dan prediksi struktur protein 3D, seperti yang ditunjukkan oleh AlphaFold.

Dengan kemampuannya untuk memproses dan menganalisis data ‘omics’ yang kompleks dan bervolume tinggi, deep learning mempercepat penemuan ilmiah dan berpotensi merevolusi pengembangan obat serta pemahaman tentang mekanisme penyakit. Kemajuan ini juga membantu mengatasi tantangan dalam menganalisis sampel kecil, memungkinkan cakupan proteom yang lebih mendalam bahkan dari jumlah materi biologis yang terbatas.

Integrasi deep learning ke dalam alur kerja LC-MS standar ini menandai langkah maju yang signifikan, menjanjikan penyederhanaan studi proteomik dan membuka jalan bagi wawasan biologis baru yang sebelumnya sulit diakses.