به گزارش زیستنا به نقل از Phys.org، ساختار سهبعدی برای عملکرد بسیاری از مولکولهای زیستی بسیار مهم است. به همین دلیل پژوهشگران نهتنها به توالی واحدهای سازنده زیستمولکولها علاقهمندند، بلکه به ساختار فضایی آنها نیز علاقه دارند. از مدتی پیش متخصصان بیوانفورماتیک میتوانستند با کمک هوش مصنوعی (Artificial Intelligence) یا بهاختصار AI به شکل قابلاعتمادی ساختار سهبعدی پروتئین را از روی توالی آمینواسیدهای آن پیشبینی کنند. بااینحال برای مولکولهای RNA، این فناوری هنوز در مراحل ابتدایی خود است. پژوهشگران دانشگاه روهر بوخوم (Ruhr-Universität Bochum) راهی را برای استفاده از هوش مصنوعی برای پیشبینی مطمئن ساختار مولکولهای RNA ویژهای از توالی نوکلئوتیدی آنها توصیف کردهاند. یافتههای این محققین در ژورنال PLOS Computational Biology منتشر شده است.
برای این کار، گروههایی به رهبری ویویان براندنبرگ (Vivian Brandenburg) و پروفسور فرانتس ناربرهاوس (Franz Narberhaus) استاد زیستشناسی میکروارگانیسمها با پروفسور اکسل موسیگ (Axel Mosig) از Bioinformatics Competence Area از مرکز تشخیصهای پروتئینی بوخوم (Bochum Center for Protein Diagnostics) همکاری کردند.
محیط سلول باید در نظر گرفته شود
اکسل موسیگ میگوید: «در اغلب موارد به RNA تنها بهعنوان پیامرسانی بین DNA ژنومی و پروتئینها نگاه میشود.» وی میافزاید: «اما بسیاری از مولکولهای RNA عملکردهای سلولی را بر عهده دارند.» به همین علت ساختار فضایی آنها اهمیت دارد. در یک توالی نوکلئوتیدی مناطقی همسان میتوانند با یکدیگر مجتمع شده و آرایشهای سهبعدی را تشکیل دهند.
ویویان براندنبرگ توضیح میدهد: «شناسایی این خودهمسانیها (self-similarities) در هر توالی RNA مانند یک معمای ریاضی است.» مدلی بیوفیزیکی برای این معما با الگوریتمهای پیشبینی مربوطه وجود دارد. بااینحال، این مدل نمیتواند محیط سلولی RNA را در نظر بگیرد که این مورد نیز بر فرایند تاخوردگی (folding process) تأثیر میگذارد. براندنبرگ میگوید: «اگر RNA جدا شده بود و در محلولی آبی شناور بود، این مدل میتوانست ساختار را بهدقت پیشبینی کند.» اما سلول زنده حاوی اجزای دیگر بسیاری است.
اینجاست که هوش مصنوعی وارد صحنه میشود. هوش مصنوعی میتواند بر اساس ساختارهای شناختهشده، الگوهای ظریفی را از محیط سلولی بیاموزد. سپس هوش مصنوعی میتواند این یافتهها را در پیشبینیهای ساختاری خود وارد کند. بااینحال، برای فرآیند یادگیری، هوش مصنوعی به دادههای آموزشی کافی نیاز دارد و این در واقع در عمل وجود ندارد.
به دست آوردن دادههای آموزشی با یک ترفند
گروه بوخوم برای حل مشکل نبود دادههای آموزشی از ترفندی استفاده کرد: محققان با موتیفهای ساختاری شناختهشده RNA کار کردند. آنها با استفاده از نوعی دندهعقب میتوانند تقریباً هر تعداد توالی نوکلئوتیدی را از مدلهای انرژی این ساختارها تولید کنند که در این ساختارهای فضایی تاخوردگی مییابند. پژوهشگران با کمک این بهاصطلاح تاخوردگی معکوس (Inverse Folding)، زوجهای توالیها و ساختارهای نوکلئوتیدی مربوطه بسیاری را تولید کردند که با آنها توانستند هوش مصنوعی را آموزش دهند.
ساختارهای جدید را با اطمینان میتوان پیشبینی نمود
در مرحله بعد پژوهشگران هوش مصنوعی را با وظیفه جدیدی مواجه کردند: این هوش مصنوعی باید ساختار مولکولهای RNA باکتریایی خاصی را پیشبینی میکرد. این مولکولها که پایاندهندههای رونویسی (Transcription Terminators) نامیده میشوند، در باکتریها پیامهای توقف مهمی در ترجمه DNA ژنومی هستند. این مولکولهای مانند بسیاری از مولکولهای RNA دیگر که عملکردهای مهم سلولی دارند، اغلب در ژنوم مخفی هستند و تشخیص آنها از مناطق دارای عملکردهای دیگر دشوار است.
هوش مصنوعی توانست بهطور قابلاعتمادی ساختار معمول پایاندهندههای رونویسی را تشخیص داده و پیشبینی کند. این ساختار تداعیکننده ساختار سنجاق سری (Hairpin) است. گروه پژوهشی توانست این موضوع را با استفاده از دادههای تجربی در دسترس عموم اثبات کند.
اکسل موسیگ میگوید: «هرچند در حال حاضر استفاده از رویکردهای هوش مصنوعی در پیشبینی ساختارهای پروتئینی تقریباً اجتنابناپذیر است، توسعه ساختارهای RNA تازه شروع شده است.»
منبع: Phys.org
Journal Reference:
Brandenburg, Vivian B., Franz Narberhaus, and Axel Mosig. “Inverse Folding Based Pre-Training for the Reliable Identification of Intrinsic Transcription Terminators.” Edited by Shi-Jie Chen. PLOS Computational Biology ۱۸, no. 7 (July 7, 2022): e1010240. https://doi.org/10.1371/journal.pcbi.1010240.