مشروع قاعده بيانات جينوم انسنبل

مشروع قاعدة بيانات الجينوم Ensembl هو مشروع علمى فى المعهد الأوروبى لعلم المعلومات الحيوية ، اللى يوفر مورد مركزى لعلما الوراثة وعلما الأحياء الجزيئية والباحثين التانيين اللى يدرسون الجينومات الخاصة بنوعنا والفقاريات التانيه والكائنات الحية النموذجية .[1][2][3] يعد Ensembl واحد من الكتير من متصفحات الجينوم المعروفة لاسترجاع المعلومات الجينومية . قواعد بيانات ومتصفحات مماثلة فى NCBI وجامعة كاليفورنيا، سانتا كروز (UCSC) .

Ensembl genome database project.
المحتويات
الوصفEnsembl
العناوين
مركز الأبحاث
الوصول
الموقعwww.ensembl.org
الأدوات
متنوعات

تاريخ

تعديل

الجينوم البشرى يتكون من 3 مليارات جوز قاعدى ، اللى تشفر يقارب من 20,000 ل25,000 جين . بس الجينوم وحده لا يكون ذا فائدة تذكر، الا اذا نتمكن من تحديد مواقع الجينات الفردية والعلاقات بينها. واحد من الخيارات هو التوضيح اليدوي، حيث يحاول فريق من العلما تحديد الجينات باستخدام البيانات التجريبية من المجلات العلمية وقواعد البيانات العامة. بس، فهذه مهمة بطيئة ومضنية. البديل المعروف باسم التعليق الآلى هو استخدام قوة أجهزة الكمبيوتر للقيام بمدورة الأنماط المعقدة للبروتين مع الحمض النووى .[4][5] تم إطلاق مشروع Ensembl سنة 1999 استجابة للانتهاء الوشيك من مشروع الجينوم البشرى ، و كانت الأهداف الأولية هيا التعليق التلقائى على الجينوم البشري، ودمج ده التعليق مع البيانات البيولوجية المتاحة وجعل كل دى المعرفة متاحة للجمهور.[1] فى مشروع Ensembl، يتم إدخال بيانات التسلسل فى نظام شرح الجينات (مجموعة من "خطوط الأنابيب" البرمجية المكتوبة بلغة Perl ) اللى يقوم بإنشاء مجموعة من مواقع الجينات المتوقعة ويحفظها فى قاعدة بيانات MySQL للتحليل والعرض اللاحق. تجعل Ensembl دى البيانات متاحة مجان لمجتمع الأبحاث العالمي. كل البيانات والرموز اللى أنتجها مشروع Ensembl متاحة للتنزيل، [6] وهناك كمان خادم قاعدة بيانات ممكن الوصول ليه بشكل عام يسمح بالوصول عن بعد. و ذلك، يوفر موقع Ensembl عروض مرئية اتنشأت بواسطة الكمبيوتر لمعظم البيانات.

المشروع مع مرور الوقت، توسع يشمل أنواع إضافية (بما فيها الكائنات النموذجية الرئيسية زى الفأر ، وذبابة الفاكهة ، وسمك الزرد ) و مجموعة أوسع من البيانات الجينومية، بما فيها الاختلافات الجينية والميزات التنظيمية. من ابريل 2009، قام مشروع شقيق، Ensembl Genomes ، بتوسيع نطاق Ensembl ليشمل اللافقاريات ، والنباتات ، والفطريات ، والبكتيريا ، والطلائعيات ، مع التركيز على توفير السياق التصنيفى والتطورى للجينات، فى الوقت نفسه يستمر المشروع الأصلى فى التركيز على الفقاريات.[7][8]

دعمت Ensembl اكتر من 50000 جينوم عبر قواعد بيانات Ensembl وEnsembl Genomes، مضيفة بعض الميزات المبتكرة الجديدة زى Rapid Release ، و هو موقع ويب جديد مصمم لجعل بيانات شرح الجينوم متاحة للمستخدمين بشكل أسرع، و COVID-19 ، و هو موقع ويب جديد للوصول لجينوم مرجعى لـ SARS-CoV-2 .

عرض البيانات الجينومية

تعديل
 
الجين SGCB متوافق مع الجينوم البشرى

إن العنصر الأساسى فى مفهوم Ensembl هو القدرة على إنشاء عروض رسومية تلقائى لمحاذاة الجينات والبيانات الجينومية التانيه مقابل جينوم مرجعى . وتظهر دى الصور كمسارات بيانات، ويمكن تشغيل المسارات الفردية و إيقاف تشغيلها،و ده يسمح للمستخدم بتخصيص العرض بما يتناسب مع اهتماماته البحثية. وتتيح الواجهة كمان للمستخدم تكبير منطقة معينة أو التحرك على طول الجينوم فى أى اتجاه.

وتظهر شاشات تانيه البيانات بمستويات متفاوتة من الدقة، بدايه من النمط النووى الكامل وصول لالتمثيلات النصية لتسلسلات الحمض النووى والأحماض الأمينية ، أو تعرض أنواع تانيه من العرض زى أشجار الجينات المتشابهة ( المتماثلات ) عبر مجموعة من الأنواع. ويتم استكمال الرسومات بعروض جدولية، وفى الكتير من الحالات ممكن تصدير البيانات مباشرة من الصفحة فى مجموعة متنوعة من تنسيقات الملفات القياسية زى FASTA .

يمكن كمان إضافة البيانات المنتجة خارجى لالشاشة عن طريق تحميل ملف مناسب ب واحد من التنسيقات المدعومة، زى BAM أو BED أو PSL .

ياتعمل الرسومات باستخدام مجموعة من وحدات Perl المخصصة عن GD ، مكتبة عرض الرسومات القياسية فى Perl.

طرق الوصول البديلة

تعديل

بالإضافة لموقعها الإلكتروني، توفر Ensembl واجهة برمجة تطبيقات REST وواجهة برمجة تطبيقات Perl [9] اللى تقوم بإنشاء نماذج للأشياء البيولوجية زى الجينات والبروتينات،و ده يسمح بكتابة نصوص بسيطة لاسترداد البيانات ذات الأهمية. يتم استخدام نفس واجهة برمجة التطبيقات داخلى بواسطة واجهة الويب لعرض البيانات. يتم تقسيمها لأقسام زى واجهة برمجة التطبيقات الأساسية، وواجهة برمجة تطبيقات المقارنة (لبيانات الجينوم المقارنة )، وواجهة برمجة تطبيقات التباين (للوصول لSNPs وSNVs وCNVs ..)، وواجهة برمجة تطبيقات الجينوم الوظيفية (للوصول لالبيانات التنظيمية). يوفر موقع Ensembl معلومات شاملة حول كيفية تثبيت واجهة برمجة التطبيقات واستخدامها . ممكن استخدام البرنامج للوصول لقاعدة بيانات MySQL العامة،و ده يتجنب الحاجة لتنزيل مجموعات بيانات هائلة. ممكن للمستخدمين كمان اختيار استرداد البيانات من MySQL باستخدام استعلامات SQL المباشرة، لكن ده يتطلب معرفة واسعة بمخطط قاعدة البيانات دلوقتى .

يمكن استرجاع مجموعات البيانات الكبيرة باستخدام أداة استخراج البيانات BioMart . إنه يوفر واجهة ويب لتنزيل مجموعات البيانات باستخدام الاستعلامات المعقدة.

وأخير، هناك خادم FTP اللى ممكن استخدامه لتنزيل قواعد بيانات MySQL بالكامل و بعض مجموعات البيانات المحددة بتنسيقات تانيه.

الأنواع دلوقتى

تعديل

الجينومات الموضحة تتضمن معظم الفقاريات المتسلسلة بالكامل والكائنات النموذجية المختارة. جميعهم حقيقيات النوى، ومافيش بدائيات النوى. من سنة 2022، هناك 271 نوع مسجل:[10]

شوف كمان

تعديل

مصادر

تعديل
  1. أ ب Hubbard، T. (1 يناير 2002). "The Ensembl genome database project". Nucleic Acids Research. ج. 30 ع. 1: 38–41. DOI:10.1093/nar/30.1.38. PMC:99161. PMID:11752248.
  2. "Ensembl 2011". Nucleic Acids Res. ج. 39 ع. Database issue: D800–D806. نوفمبر 2010. DOI:10.1093/nar/gkq1064. PMC:3013672. PMID:21045057.
  3. "Ensembl's 10th year". Nucleic Acids Res. ج. 38 ع. Database issue: D557–62. يناير 2010. DOI:10.1093/nar/gkp972. PMC:2808936. PMID:19906699.
  4. Davis، Charles Patrick (29 مارس 2021). "Medical definition of Genome Annotation". مؤرشف من الأصل في 2021-06-14. اطلع عليه بتاريخ 2022-08-07.
  5. Curwen، Val؛ Eyras، Eduardo؛ Andrews، T. Daniel؛ Clarke، Laura؛ Mongin، Emmanuel؛ Searle، Steven M. J.؛ Clamp، Michele (مايو 2004). "The Ensembl automatic gene annotation system". Genome Research. ج. 14 ع. 5: 942–950. DOI:10.1101/gr.1858004. ISSN:1088-9051. PMC:479124. PMID:15123590.
  6. Ruffier، Magali؛ Kähäri، Andreas؛ Komorowska، Monika؛ Keenan، Stephen؛ Laird، Matthew؛ Longden، Ian؛ Proctor، Glenn؛ Searle، Steve؛ Staines، Daniel (يناير 2017). "Ensembl core software resources: storage and programmatic access for DNA sequence and genome annotation". Database. ج. 2017 ع. 1: bax020. DOI:10.1093/database/bax020. PMC:5467575. PMID:28365736.
  7. Hubbard، T. J. P.؛ Aken، B. L.؛ Ayling، S.؛ Ballester، B.؛ Beal، K.؛ Bragin، E.؛ Brent، S.؛ Chen، Y.؛ Clapham، P. (يناير 2009). "Ensembl 2009". Nucleic Acids Research. ج. 37 ع. Database issue: D690–697. DOI:10.1093/nar/gkn828. ISSN:1362-4962. PMC:2686571. PMID:19033362.
  8. Howe، Kevin L.؛ Contreras-Moreira، Bruno؛ De Silva، Nishadi؛ Maslen، Gareth؛ Akanni، Wasiu؛ Allen، James؛ Alvarez-Jarreta، Jorge؛ Barba، Matthieu؛ Bolser، Dan M. (8 يناير 2020). "Ensembl Genomes 2020-enabling non-vertebrate genomic research". Nucleic Acids Research. ج. 48 ع. D1: D689–D695. DOI:10.1093/nar/gkz890. ISSN:1362-4962. PMC:6943047. PMID:31598706.
  9. "The Ensembl Core Software Libraries". Genome Research. ج. 14 ع. 5: 929–933. فبراير 2004. DOI:10.1101/gr.1857204. PMC:479122. PMID:15123588.
  10. "Species List". uswest.ensembl.org. مؤرشف من الأصل في 2022-08-06. اطلع عليه بتاريخ 2022-08-05.

لينكات برانيه

تعديل