به گزارش ساوت چاینا مورنینگ پست، از پدیده پژواکیابی (echolocation) در خفاشها و دلفینها گرفته تا توانایی پرواز در پرندگان و حشرات، تکامل همگرا (convergent evolution) – یعنی ظهور مستقل ویژگیهای مشابه در گونههای نامرتبط – از مدتها پیش یکی از موضوعات جذاب در جامعه علمی بوده است.
ظهور مکرر ویژگیهای عملکردی مشابه، فرصتی فراهم میکند تا رابطه میان ژنها و پروتئینها با این فرایند بررسی شود. با این حال، روشهای سنتی مطالعه، معمولاً تنها شباهتهای جزئی در توالی ژنتیکی را بررسی میکنند و از تحلیل تفاوتهای پیچیدهتر مانند ساختار سهبعدی بازمیمانند.
اکنون، تیمی از آکادمی علوم چین (CAS) با کمک یک مدل زبانی پیشرفته پروتئینی مبتنی بر هوش مصنوعی توانستهاند این ویژگیهای پیچیده و سطحبالای پروتئینها را در گونههایی که بهطور مستقل تکامل یافتهاند اما عملکردی مشابه دارند، بررسی کنند.
این گروه در مقالهای در نشریه علمیProceedings of the National Academy of Sciences (PNAS) نوشتند: «یافتههای ما بر نقش کمتر شناختهشدهی پایههای توالی در همگرایی عملکردی طی تکامل تأکید دارد.»
تکامل همگرا، یا همگرایی (convergence)، به ظهور مستقل و مکرر یک ویژگی مشابه در دو یا چند گونه گفته میشود که معمولاً ناشی از سازگاری با محیطها یا شیوههای زیستی مشابه است.
برای مثال، هم خفاشها و هم نهنگهای دندانهدار توانایی پژواکیابی دارند، در حالی که این قابلیت در نیای مشترک این دو تبار دور از هم وجود نداشته است. این موضوع نشان میدهد که چنین تواناییای احتمالاً نتیجهی تکامل همگرا است.
این پدیده باعث طرح این پرسش در میان دانشمندان شده است که آیا همگرایی در عملکرد میتواند ناشی از همگرایی در سطح مولکولی نیز باشد یا خیر.
ویژگیهای سطحبالای پروتئینی شامل جنبههایی فراتر از ترتیب آمینواسیدها در توالی است، از جمله ساختار سهبعدی، برهمکنش با آب و بار الکتریکی. این ویژگیها نقش مستقیمی در فعالیت زیستی پروتئین و تعامل آن با دیگر مولکولها دارند.
روشهای فعلی مطالعهی تکامل تطبیقی در سطح مولکولی عمدتاً بر موقعیتهای منفرد در توالی پروتئین تمرکز دارند، اما قادر به پوشش ویژگیهای سطحبالا نیستند. تیم چینی برای رفع این محدودیت از مدلهای زبانی پروتئین (Protein Language Models – PLMs) که بهتازگی توسعه یافتهاند، بهره گرفت.
این مدلها دادههای واقعی را به نمایههای عددی (embeddings) تبدیل میکنند؛ نوعی بازنمایی عددی که امکان مقایسه مستقیم ویژگیهای پروتئینی میان گونهها را فراهم میسازد.
پژوهشگران با بهکارگیری این مدل در مورد نمونههای شناختهشده از پروتئینهای عملکرداً همگرا دریافتند که پروتئینهایی با توالیهای متفاوت آمینواسیدی اما عملکرد مشابه تمایل دارند نمایههای عددی مشابهی داشته باشند.
آنها بر اساس این یافته، یک سامانه آماری جدید با نام «همگرایی تطبیقی از طریق تعبیهسازی پروتئینها» (Adaptive Convergence by Embedding of Proteins – ACEP) توسعه دادند که امکان شناسایی همگرایی تطبیقی در سطح ژنوم و در ویژگیهای سطحبالای پروتئینی را فراهم میکند.
این سامانه در دو نمونه موردی آزمایش شد: نخست پژواکیابی در خفاشها و نهنگهای دندانهدار و دوم مسیرهای متابولیسم گیاهی در گونههایی از گیاهان مناطق خشک.
نتایج نهتنها پروتئینهای شناختهشده مرتبط با این پدیده را تأیید کرد، بلکه ژنهای جدیدی را نیز به عنوان نامزدهای احتمالی کشف کرد.
پژوهشگران در پایان نوشتند: نمایهسازی PLM میتواند همگرایی تطبیقی در ویژگیهای سطحبالای پروتئینی را فراتر از سطح توالیها نشان دهد و قدرت ابزارهای یادگیری عمیق را در بررسی ارتباط پیچیده میان توالیهای مولکولی و عملکرد آشکار سازد.
با ظرفیت امیدبخش مدلهای یادگیری عمیق، میتوان راهبردهای نوآورانهای توسعه داد تا پایههای ژنتیکی تکامل فنوتیپی و عملکردی را بهتر درک کنیم.
منبع: scmp


