وبفضل AlphaFold، أداة الذكاء الاصطناعي التي طورتها DeepMind المملوكة لشركة غوغل، تمت الآن مشاركة أكثر من 200 مليون بنية بروتينية عبر الإنترنت في قاعدة بيانات مجانية الوصول إليها وقابلة للبحث، تسمى AlphaFold DB.
ويمهد الإنجاز الطريق لسبل لا حصر لها من الاستكشاف العلمي في البروتينات، اللبنات الأساسية للحياة.
وأوضح طبيب القلب إريك توبول، من معهد Scripps Research Translational في بيان حول إصدار البيانات: "إن تحديد البنية ثلاثية الأبعاد للبروتين الذي كان يستغرق عدة أشهر أو سنوات، يستغرق الآن ثواني.
ومع هذه الإضافة الجديدة للهياكل التي تضيء تقريبا عالم البروتين بأكمله، يمكننا أن نتوقع حل المزيد من الألغاز البيولوجية كل يوم".
وبالتعاون مع العلماء في المعهد الأوروبي للمعلومات الحيوية التابع للمختبر الأوروبي للبيولوجيا الجزيئية (EMBL – EBI)، كشفت DeepMind عن الدفعة الأولى من تنبؤات AlphaFold في يوليو من العام الماضي.
وأعلن عن AlphaFold كأداة ثورية من شأنها أن تحول البحث البيولوجي وتسريع اكتشاف الأدوية، وتتوقع الشكل ثلاثي الأبعاد للبروتينات بناء على تسلسل الأحماض الأمينية.
وترتبط تسلسلات الأحماض الأمينية ببعضها البعض في سلاسل، وتقوم بتخزين البروتينات الطويلة التي يتم طيها إلى صفائح مطوية وشرائط ملتوية.
ومن خلال فهم الشكل الذي يطوى به أي بروتين، يمكن للعلماء التعرف على كيفية عمل هذا البروتين، وفك شيفرة دوره الرئيسي داخل الخلايا.
وتم تصميم AlphaFold لتسريع هذه العملية، ما يوفر في هذه البيانات الأخيرة إطلاق أكثر من 200 مليون بنية متوقعة للبروتينات الموجودة في النباتات والبكتيريا والحيوانات والكائنات الحية الأخرى.
وقال ديميس هسابيس، الرئيس التنفيذي لـDeepMind في بيان حول أحدث إصدار للبيانات: "هذا الأمل أصبح حقيقة أسرع بكثير مما كنا نتجرأ على الحلم".
واستخدم الباحثون الدفعة الأولى من تنبؤات AlphaFold لتحسين فهمهم للأمراض الفتاكة مثل الملاريا، وفتح الباب أمام اللقاحات المحسنة، وفك رموز الألغاز البيولوجية حول البروتينات العملاقة التي حيرت العلماء لعقود. ناهيك عن تحديد الإنزيمات التي لم يسبق لها مثيل والتي يمكن أن تساعد في دورة التلوث البلاستيكي.
وعلى الرغم من أن برنامج AlphaFold مفتوح المصدر كان متاحا للباحثين منذ إطلاقه العام الماضي، فإن وجود الملايين من هياكل البروتين المتوقعة في قاعدة بيانات قابلة للبحث سيؤدي بلا شك إلى تسريع البحث.
ووفقا لـ EMBL-EBI، تم تصنيف حوالي ثلث التوقعات التي تزيد عن 214 مليونا على أنها دقيقة للغاية، على قدم المساواة مع هياكل البروتين المشتقة من الأساليب التجريبية المعتادة، مثل علم البلورات بالأشعة السينية والفحص المجهري الإلكتروني.
ولعقود من الزمن، استنتج العلماء بشق الأنفس الهياكل الجزيئية من الصور الغامضة التي تنتجها هذه الطرق - ولعل أشهرها صورة روزاليند فرانكلين للحمض النووي الحلزوني.
ومع ذلك، فإن جودة تنبؤات AlphaFold تختلف، وقد تكون أقل دقة بالنسبة للبروتينات النادرة التي لا يعرف العلماء عنها إلا القليل. لذلك في بعض الحالات، يمكن استخدام هياكلها المتوقعة لفهم البيانات التجريبية.
وعلى الرغم من التفريغ الضخم للبيانات، لا يزال هناك الكثير من الحياة التي لا يلتقطها AlphaFold، بما في ذلك التنبؤات حول كيفية تفاعل البروتينات بمجرد تجميعها.
كما أن البروتينات الميكروبية التي تم تحديدها من آثار المواد الجينية في التربة ومياه البحر ليست موجودة أيضا في قاعدة البيانات - ومع ذلك فإن هذه الكائنات الحية الدقيقة تمثل موردا غير مستغل للمركبات القوية، نظرا لأن العلماء قاموا بفهرسة جزء صغير فقط من جميع الكائنات الحية الميكروبية على الأرض.
وأثار بعض العلماء أيضا مخاوف بشأن إمكانية الوصول إلى قاعدة بيانات AlphaFold ومحتوياتها المذهلة البالغة 23 تيرابايت، والتي قد تكون أقل جدوى بالنسبة لبعض فرق البحث للوصول إليها نظرا لقوة الكمبيوتر الباهظة وتحليلات البيانات المعقدة للتخزين المستند إلى السحابة التي تتطلبها.
ومع ذلك، فإن الفوائد الوشيكة على صحة الإنسان - والتي تقول DeepMind إنها وزنتها بعناية مقابل المخاطر الأخلاقية الحيوية المحتملة - كبيرة جدا لدرجة أنها لا يمكن تصورها تقريبا.
وسيستمر DeepMind وEMBL-EBI في تحديث قاعدة بيانات AlphaFold بشكل دوري.