sasava

Metaproteomika mikrobike: nga përpunimi i mostrës, mbledhja e të dhënave deri te analiza e të dhënave

Wu Enhui, Qiao Liang*

Departamenti i Kimisë, Universiteti Fudan, Shanghai 200433, Kinë

 

 

 

Mikroorganizmat janë të lidhur ngushtë me sëmundjet dhe shëndetin e njeriut. Si të kuptojmë përbërjen e komuniteteve mikrobike dhe funksionet e tyre është një çështje madhore që duhet studiuar urgjentisht. Vitet e fundit, metaproteomika është bërë një mjet teknik i rëndësishëm për të studiuar përbërjen dhe funksionin e mikroorganizmave. Megjithatë, për shkak të kompleksitetit dhe heterogjenitetit të lartë të mostrave të komunitetit mikrobik, përpunimi i mostrave, përvetësimi i të dhënave të spektrometrisë masive dhe analiza e të dhënave janë bërë tre sfidat kryesore me të cilat përballet aktualisht metaproteomika. Në analizën metaproteomike, shpesh është e nevojshme të optimizohet trajtimi paraprak i llojeve të ndryshme të mostrave dhe të miratohen skema të ndryshme të ndarjes, pasurimit, nxjerrjes dhe lizës mikrobiale. Ngjashëm me proteomën e një specieje të vetme, mënyrat e marrjes së të dhënave të spektrometrisë së masës në metaproteomikë përfshijnë mënyrën e përvetësimit të varur nga të dhënat (DDA) dhe mënyrën e përvetësimit të pavarur nga të dhënat (DIA). Mënyra e marrjes së të dhënave DIA mund të mbledhë plotësisht informacionin e peptidit të kampionit dhe ka një potencial të madh zhvillimi. Megjithatë, për shkak të kompleksitetit të mostrave të metaproteomeve, analiza e saj e të dhënave DIA është bërë një problem madhor që pengon mbulimin e thellë të metaproteomikës. Për sa i përket analizës së të dhënave, hapi më i rëndësishëm është ndërtimi i një baze të dhënash të sekuencës së proteinave. Madhësia dhe plotësia e bazës së të dhënave jo vetëm që kanë një ndikim të madh në numrin e identifikimit, por ndikojnë edhe në analizën në nivele speciesh dhe funksionale. Aktualisht, standardi i artë për ndërtimin e një baze të dhënash metaproteome është një bazë të dhënash e sekuencës së proteinave bazuar në metagjenomën. Në të njëjtën kohë, metoda e filtrimit të bazës së të dhënave publike e bazuar në kërkimin iterativ është vërtetuar gjithashtu se ka vlerë të fortë praktike. Nga këndvështrimi i strategjive specifike të analizës së të dhënave, metodat e analizës së të dhënave DIA me qendër peptide kanë zënë një rrjedhë absolute. Me zhvillimin e mësimit të thellë dhe inteligjencës artificiale, ai do të promovojë shumë saktësinë, mbulimin dhe shpejtësinë e analizës së analizës së të dhënave makroproteomike. Për sa i përket analizës së bioinformatikës në rrjedhën e poshtme, një sërë mjetesh shënimi janë zhvilluar vitet e fundit, të cilat mund të kryejnë shënimin e specieve në nivelin e proteinave, nivelin e peptideve dhe nivelin e gjenit për të marrë përbërjen e komuniteteve mikrobike. Krahasuar me metodat e tjera omike, analiza funksionale e bashkësive mikrobike është një veçori unike e makroproteomikës. Makroproteomika është bërë një pjesë e rëndësishme e analizës multi-omike të komuniteteve mikrobiale dhe ka ende një potencial të madh zhvillimi për sa i përket thellësisë së mbulimit, ndjeshmërisë së zbulimit dhe kompletimit të analizës së të dhënave.

 

01 Paratrajtimi i mostrës

Aktualisht, teknologjia metaproteomike është përdorur gjerësisht në kërkimin e mikrobiomës njerëzore, tokës, ushqimit, oqeanit, llumit aktiv dhe fushave të tjera. Krahasuar me analizën e proteomeve të një specieje të vetme, paratrajtimi i mostrës së metaproteomës së mostrave komplekse përballet me më shumë sfida. Përbërja mikrobike në mostrat aktuale është komplekse, diapazoni dinamik i bollëkut është i madh, struktura e murit qelizor të llojeve të ndryshme të mikroorganizmave është shumë e ndryshme dhe mostrat shpesh përmbajnë një sasi të madhe të proteinave strehuese dhe papastërtive të tjera. Prandaj, në analizën e metaproteomes, shpesh është e nevojshme të optimizohen lloje të ndryshme mostrash dhe të miratohen skema të ndryshme të ndarjes, pasurimit, nxjerrjes dhe lizës mikrobike.

Nxjerrja e metaproteomeve mikrobike nga mostra të ndryshme ka disa ngjashmëri si dhe disa dallime, por aktualisht mungon një proces i unifikuar para-përpunimi për lloje të ndryshme të mostrave metaproteome.

 

02 Përvetësimi i të dhënave të spektrometrisë së masës

Në analizën e proteomës së pushkës së gjahut, përzierja e peptideve pas trajtimit paraprak së pari ndahet në kolonën kromatografike dhe më pas futet në spektrometrin e masës për marrjen e të dhënave pas jonizimit. Ngjashëm me analizën e proteomeve të një specieje, mënyrat e marrjes së të dhënave të spektrometrisë së masës në analizën e makroproteomeve përfshijnë modalitetin DDA dhe modalitetin DIA.

 

Me përsëritjen dhe përditësimin e vazhdueshëm të instrumenteve të spektrometrisë së masës, instrumentet e spektrometrisë së masës me ndjeshmëri dhe rezolucion më të lartë aplikohen në metaproteome, dhe thellësia e mbulimit të analizës metaproteome gjithashtu përmirësohet vazhdimisht. Për një kohë të gjatë, një seri instrumentesh të spektrometrisë së masës me rezolucion të lartë të drejtuar nga Orbitrap janë përdorur gjerësisht në metaproteome.

 

Tabela 1 e tekstit origjinal tregon disa studime përfaqësuese mbi metaproteomikën nga viti 2011 e deri më sot për sa i përket llojit të kampionit, strategjisë së analizës, instrumentit të spektrometrisë së masës, metodës së përvetësimit, softuerit të analizës dhe numrit të identifikimit.

 

03Analiza e të dhënave të spektrometrisë së masës

3.1 Strategjia e analizës së të dhënave të DDA

3.1.1 Kërkimi në bazën e të dhënave

3.1.2de novostrategjia e renditjes

3.2 Strategjia e analizës së të dhënave të ASD-së

 

04 Klasifikimi i specieve dhe shënimi funksional

Përbërja e komuniteteve mikrobike në nivele të ndryshme taksonomike është një nga fushat kryesore kërkimore në kërkimin e mikrobiomës. Vitet e fundit, një seri mjetesh shënimi janë zhvilluar për të shënuar speciet në nivelin e proteinave, nivelin e peptideve dhe nivelin e gjeneve për të marrë përbërjen e komuniteteve mikrobike.

 

Thelbi i shënimit funksional është krahasimi i sekuencës së proteinës së synuar me bazën e të dhënave të sekuencës funksionale të proteinave. Duke përdorur bazat e të dhënave të funksioneve të gjeneve si GO, COG, KEGG, eggNOG, etj., mund të kryhen analiza të ndryshme të shënimeve funksionale në proteinat e identifikuara nga makroproteomet. Mjetet e shënimit përfshijnë Blast2GO, DAVID, KOBAS, etj.

 

05 Përmbledhje dhe Outlook

Mikroorganizmat luajnë një rol të rëndësishëm në shëndetin dhe sëmundjet e njeriut. Vitet e fundit, metaproteomika është bërë një mjet i rëndësishëm teknik për të studiuar funksionin e komuniteteve mikrobike. Procesi analitik i metaproteomikës është i ngjashëm me atë të proteomikës me një specie, por për shkak të kompleksitetit të objektit kërkimor të metaproteomikës, strategjitë kërkimore specifike duhet të miratohen në çdo hap analize, nga paratrajtimi i mostrës, marrja e të dhënave deri te analiza e të dhënave. Aktualisht, falë përmirësimit të metodave të para-trajtimit, inovacionit të vazhdueshëm të teknologjisë së spektrometrisë së masës dhe zhvillimit të shpejtë të bioinformatikës, metaproteomika ka bërë përparim të madh në thellësinë e identifikimit dhe shtrirjen e aplikimit.

 

Në procesin e para-trajtimit të mostrave të makroproteomeve, së pari duhet të merret parasysh natyra e kampionit. Mënyra e ndarjes së mikroorganizmave nga qelizat dhe proteinat mjedisore është një nga sfidat kryesore me të cilat përballen makroproteomet dhe ekuilibri midis efikasitetit të ndarjes dhe humbjes mikrobike është një problem urgjent për t'u zgjidhur. Së dyti, nxjerrja e proteinave të mikroorganizmave duhet të marrë parasysh dallimet e shkaktuara nga heterogjeniteti strukturor i baktereve të ndryshme. Mostrat e makroproteomeve në intervalin e gjurmës kërkojnë gjithashtu metoda specifike para-trajtimi.

 

Për sa i përket instrumenteve të spektrometrisë së masës, instrumentet kryesore të spektrometrisë së masës kanë pësuar një tranzicion nga spektrometritë e masës të bazuar në analizuesit e masës Orbitrap si LTQ-Orbitrap dhe Q Exactive në spektrometrat e masës bazuar në analizuesit e masës të shoqëruar me lëvizjen e joneve të kohës së fluturimit si timsTOF Pro . Seria timsTOF e instrumenteve me informacion për dimensionin e lëvizshmërisë së joneve ka saktësi të lartë zbulimi, kufi të ulët zbulimi dhe përsëritshmëri të mirë. Ato gradualisht janë bërë instrumente të rëndësishme në një sërë fushash kërkimore që kërkojnë zbulimin e spektrometrisë së masës, të tilla si proteoma, metaproteoma dhe metaboloma e një specieje të vetme. Vlen të përmendet se për një kohë të gjatë, diapazoni dinamik i instrumenteve të spektrometrisë së masës ka kufizuar thellësinë e mbulimit të proteinave të kërkimit metaproteome. Në të ardhmen, instrumentet e spektrometrisë së masës me një gamë më të madhe dinamike mund të përmirësojnë ndjeshmërinë dhe saktësinë e identifikimit të proteinave në metaproteome.

 

Për përvetësimin e të dhënave të spektrometrisë masive, megjithëse mënyra e marrjes së të dhënave DIA është miratuar gjerësisht në proteomën e një specieje të vetme, shumica e analizave aktuale të makroproteomeve përdorin ende mënyrën e marrjes së të dhënave DDA. Mënyra e marrjes së të dhënave DIA mund të marrë plotësisht informacionin e joneve të fragmentit të kampionit dhe krahasuar me mënyrën e marrjes së të dhënave DDA, ai ka potencialin të marrë plotësisht informacionin e peptidit të kampionit të makroproteomës. Megjithatë, për shkak të kompleksitetit të lartë të të dhënave të DIA, analiza e të dhënave të makroproteomeve të DIA po përballet ende me vështirësi të mëdha. Zhvillimi i inteligjencës artificiale dhe mësimi i thellë pritet të përmirësojë saktësinë dhe plotësinë e analizës së të dhënave të DIA.

 

Në analizën e të dhënave të metaproteomikës, një nga hapat kyç është ndërtimi i bazës së të dhënave të sekuencës së proteinave. Për fushat e njohura kërkimore si flora e zorrëve, mund të përdoren bazat e të dhënave mikrobiale të zorrëve si IGC dhe HMP, dhe janë arritur rezultate të mira identifikimi. Për shumicën e analizave të tjera metaproteomike, strategjia më efektive e ndërtimit të bazës së të dhënave është ende krijimi i një baze të dhënash të sekuencës proteinike specifike të mostrës bazuar në të dhënat e sekuencës metagjenomike. Për mostrat e komunitetit mikrobial me kompleksitet të lartë dhe gamë të madhe dinamike, është e nevojshme të rritet thellësia e sekuencës për të rritur identifikimin e specieve me bollëk të ulët, duke përmirësuar kështu mbulimin e bazës së të dhënave të sekuencës së proteinave. Kur mungojnë të dhënat e renditjes, mund të përdoret një metodë kërkimi përsëritëse për të optimizuar bazën e të dhënave publike. Megjithatë, kërkimi i përsëritur mund të ndikojë në kontrollin e cilësisë FDR, kështu që rezultatet e kërkimit duhet të kontrollohen me kujdes. Për më tepër, zbatueshmëria e modeleve tradicionale të kontrollit të cilësisë FDR në analizën metaproteomike është ende e vlefshme. Për sa i përket strategjisë së kërkimit, strategjia hibride e bibliotekës spektrale mund të përmirësojë thellësinë e mbulimit të metaproteomikës DIA. Vitet e fundit, biblioteka e parashikuar spektrale e krijuar bazuar në të mësuarit e thellë ka treguar performancë superiore në proteomikën DIA. Megjithatë, bazat e të dhënave metaproteome shpesh përmbajnë miliona hyrje proteinash, gjë që rezulton në një shkallë të madhe bibliotekash spektrale të parashikuara, konsumon shumë burime kompjuterike dhe rezulton në një hapësirë ​​të madhe kërkimi. Për më tepër, ngjashmëria midis sekuencave të proteinave në metaproteome ndryshon shumë, duke e bërë të vështirë sigurimin e saktësisë së modelit të parashikimit të bibliotekës spektrale, kështu që bibliotekat spektrale të parashikuara nuk janë përdorur gjerësisht në metaproteomikë. Për më tepër, duhet të zhvillohen strategji të reja për konkluzionet e proteinave dhe klasifikimin e shënimeve për t'u zbatuar në analizën metaproteomike të proteinave shumë të ngjashme me sekuencën.

 

Si përmbledhje, si një teknologji kërkimore e mikrobiomës në zhvillim, teknologjia metaproteomike ka arritur rezultate të rëndësishme kërkimore dhe gjithashtu ka potencial të madh zhvillimi.


Koha e postimit: 30 gusht 2024