به گزارش ساوت چاینا مورنینگ پست، این مدل که ActFound نام دارد، در عین دور زدن چالشهای استفاده از یادگیری ماشین در پیشبینی زیست فعالیت، از مدلهای رقیب بهتر عمل میکند.
محققان دانشگاه پکن، دانشگاه واشنگتن و شرکت فناوری هوش مصنوعی INF Technology شانگهای میگویند: «زیستفعالی خواص مختلفی از ترکیبات، مانند تعامل آنها با اهداف، تأثیر بر سیستمهای بیولوژیکی و اثرات درمانی را در بر میگیرد».
چالشهای اصلی استفاده از یادگیری ماشینی شامل برچسبگذاری دادههای محدود و ناسازگاری بین سنجشها، آزمونهایی است که فعالیت یا قدرت داروها را اندازهگیری میکنند.
این مدل نه تنها از مدلهای هوش مصنوعی رقیب بهتر عمل میکند، بلکه عملکردی مانند آشفتگی انرژی آزاد (FEP) – یک روش محاسباتی سنتی دارد.
اگرچه محاسبات FEP از دقت بالایی برخوردار هستند، اما در عین حال نیازمند منابع محاسباتی گستردهای هستند که اغلب برای کاربردهای در مقیاس بزرگ مقرون به صرفه نیستند.
چنین روشهایی اغلب به ساختارهای پروتئینی سه بعدی که به سختی به دست میآیند متکی هستند، که تنها با استفاده از تجهیزات گرانقیمت و روشهای آزمایشگاهی گسترده قابل دستیابی هستند.
روش ActFound میتواند به دقت با نقاط داده کمتر عمل کند و جایگزینی دقیق و کمهزینه برای FEP ارائه دهد.
وانگ شنگ، نویسنده مسئول و استادیار دانشگاه واشنگتن گفت: «نتایج امیدوارکننده ما نشان میدهد که ActFound میتواند یک مدل بنیادی مؤثر زیستفعالیتی برای انواع مختلف فعالیتها باشد».
دولت چین سرمایهگذاری زیادی در تحقیق و توسعه داروهای نوآورانه دارد. برخی از شرکتها برای یافتن اهداف دارویی در تلاش برای کاهش زمان توسعه به هوش مصنوعی روی آوردهاند، زیرا برخی از محصولات در حال حاضر تحت آزمایشهای بالینی قرار دارند.
این تیم در مقاله خود نوشت: “ارزیابی زیست فعالی ترکیبات برای کشف و توسعه دارو نقش اساسی دارد.”
هدف پیشبینی زیستفعالیتی، پیشبینی مقادیر ترکیبات است و به دانشمندان کمک میکند تا ترکیبات مفید را از تعداد زیادی کاندید شناسایی کنند و در عین حال آزمایشهای وقتگیر و پرهزینه را به حداقل برسانند.
اما علیرغم پتانسیل یادگیری ماشین، برخی از چالشهای اصلی پذیرش آن را محدود میکنند.
رویکردهای یادگیری ماشینی موجود، به دلیل تعداد کم ترکیبات در هر سنجش و اندازهگیریهای ناسازگار در بین سنجشها، تعمیمپذیری ضعیفی در پیشبینی زیستفعالیت دارند. مدلهای بنیادی، که از قبل بر روی مجموعههای داده بزرگ آموزش داده شدهاند تا پیشبینی مجموعههای داده بدون برچسب را تعمیم دهند، یکی از راههای دور زدن این مسائل است.
مدل ActFound با استفاده از ۳۵۶۴۴ سنجش از یک پایگاه داده شیمیایی محبوب و همچنین ۱٫۶ میلیون زیست فعالیت اندازهگیری شده به صورت تجربی آموزش دید.
همچنین از دو روش یادگیری ماشینی استفاده میکند: فرا یادگیری و یادگیری زوجی.
فرا یادگیری چارچوبی است که به مدل اجازه میدهد تا با استفاده از دادههای برچسبگذاری شده محدود برای پیشبینی خواص ترکیبات اندازهگیری نشده بهینه شود. یک مدل آموزشدیده با تعداد زیادی سنجش میتواند برای کار در سنجش با دادههای محدود استفاده شود.
فرایادگیری برای پیشبینی زیستفعالیت مناسب است، زیرا به دلیل هزینههای بالای آزمایشهای آزمایشگاهی، کمبود شدید دادههای زیستفعالیتی اندازهگیری نشده در بسیاری از پروژههای کشف دارو وجود دارد.
در همین حال، یادگیری زوجی به تعمیم مدل کمک میکند. به جای پیشبینی مقادیر مطلق ناسازگار بالقوه، تفاوتهای نسبی بین جفتهای مرکب را محاسبه میکند.
این تیم نوشت: “شهود ما این بود، اگرچه ترکیبات حاصل از سنجشهای مختلف ممکن است واحدها، محدودههای ارزشی یا معیارهای اندازهگیری متفاوتی داشته باشند، اما ترکیبات موجود در یک سنجش قابلمقایسه هستند.” تا آنجا که میدانیم، ما اولین کسی بودیم که فرایادگیری و یادگیری زوجی را در پیشبینی زیست فعالی ترکیب کردیم.
مدل ActFound بر روی ۶ مجموعه دادههای زیستفعالیتی در دنیای واقعی آزمایش شد، و مشخص گشت که از ۹ مدل رقیب برای پیشبینی درون دامنهای بهتر عمل میکند.
این تیم همچنین یک مطالعه موردی برای بررسی اینکه آیا مدل آنها میتواند برای پیشبینی زیست فعالی داروهای سرطان مورد استفاده قرار گیرد یا خیر، انجام دادند و دریافتند که عملکرد بهتری نسبت به سایر مدل ها دارد.
این تیم گفت: «نتایج امیدوارکننده ما نشان میدهد که ActFound میتواند یک مدل پایه زیستفعالیتی مؤثر برای پیشبینی زیستفعالیت ترکیبی باشد و راه را برای توسعه و کشف دارو مبتنی بر یادگیری ماشینی هموار کند».
منبع: scmp