براساس گزارش گيزمگ، يادگيري عميق، يكي از زيرشاخههاي يادگيري ماشيني،اكنون قرار است در طب ژنتيكي نيز كاربرد پيدا كند. گروهي از دانشمندان دانشگاه تورنتو قصد دارند با كمك گرفتن از اين فن به شناسايي تنوع و جهشهاي ژنتيكي و ارتباط آنها با انواع بيماريها بپردازند. شركت نوپاي Deep Genomics باور دارد از مسير اين مطالعات ميتواند به آغاز دورهاي جديد از طب شخصيسازي شده كمك كند.
پژوهشهاي ژنتيكي بسيار دشوارند و دانشمندان پس از سالها مطالعه و تحقيق هنوز اطلاعات كمي درباره عملكرد ژنها و نحوه تعامل آنها با يكديگر دارند. اما برندن فري يكي از محققان دانشگاه تورنتو و ديگر دانشمندان اين زمينه تحقيقاتي اكنون به اندازهاي اطلاعات در اختيار دارند تا بتوانند از ماشينها براي انجام مطالعاتشان بهره ببرند.
دانش ژنتيك امروزه به مجموعهاي بيكران از دادههاي قابل پردازش تبديل شدهاست. براي مثال اولين تلاش براي توالينويسي ژنوم كامل انسان 13 سال پيش انجام گرفت و از سال 1990 تا 2003 ادامه داشت. امروزه اما شركتهاي زيادي در اين زمينه فعاليت دارند كه بزرگترين آنها ايلومينا نام دارد كه انتظار ميرود تا سال آينده يك ميليون ژنوم را توالينويسي كند. هر ژنوم حاوي سه ميليارد حرف است، از اين رو حجم دادههاي به دست آمده بسيار عظيم خواهدشد.
براي ذخيرهسازي و پردازش تمامي اين دادهها شركت Deep Genomics پايگاه دادههايي به نام Spidex ايجاد كرده كه حاوي اطلاعاتي درباره چگونگي اثرگذاري طيف گستردهاي از انواع ژنها بر پيرايش RNA، يكي از حياتيترين مراحل در بيان ژن است كه ژنها را به شكلهاي مختلف ويرايش ميكند تا بتوانند پروتئينهاي مختلف توليد كنند.
اگر پيرايش RNA نظم خود را از دست بدهد، عوارض آن ميتواند از هيچ تا بدترين بيماريها از مانند سرطان باشد. Spidex قصد دارد انواع بيضرر ژنها را از انواع مخرب تفكيك كند و ارتباط آنها را با ديگر فرايندهاي ژنتيكي دريابد. اين پايگاه درحال حاضر از توانايي تنظيم 328 ميليون نوع جهش و تشخيص عوارض آنها بر رونويسي RNA برخوردار است اما دانشمندان قصد دارند اين تعداد را به واسطه گنجاندن الگوريتم يادگيري عميق براي دسته بندي و ترجمه دادههاي بيشتر،افزايش دهند.
فري همچنين ميگويد مقدار زيادي از اين جهشها در بخش DNA زباله قرار دارند. اگرچه اين بخش از ژن را دانشمندان نامربوط ناميدهاند اما بخش بزرگي از ژنوم را تشكيل ميدهد. به گفته فري بيشتر تستهاي ژنتيكي پزشكي با جهشهايي سروكار دارند كه به بخشهاي كدگذاري پروتئيني يا اگزونها شهرت دارند. اينها تنها 1.5 درصد از ژنوم را تشكيل ميدهند. 26 درصد باقيمانده، اينترونها، كه طي فرايند پيرايش به همراه بخش بدون كد حذف شدهاند در تنظيم عملكرد ژنوم نقش مهمي به عهده دارند. پروژه Deep Genomic قصد دارد اين بخش از ژنوم را كه كمتر براي مطالعه جهشها مورد تجزيه و تحليل قرار گرفته زير ذرهبين قرار دهد.
هدف ايجاد رايانههايي است كه روزي بتوانند مسئوليت پيشبيني آزمايشها و درمانها را با هدف توليد داروهاي مختلف و شخصيسازي درمانهاي پزشكي به عهده بگيرند.