مشروع قاعده بيانات جينوم انسنبل
مشروع قاعدة بيانات الجينوم Ensembl هو مشروع علمي في المعهد الأوروبي لعلم المعلومات الحيوية ، والذي يوفر موردًا مركزيًا لعلماء الوراثة وعلماء الأحياء الجزيئية والباحثين الآخرين الذين يدرسون الجينومات الخاصة بنوعنا والفقاريات الأخرى والكائنات الحية النموذجية . [1] [2] [3] يعد Ensembl واحدًا من بين العديد من متصفحات الجينوم المعروفة لاسترجاع المعلومات الجينومية . قواعد بيانات ومتصفحات مماثلة في NCBI وجامعة كاليفورنيا، سانتا كروز (UCSC) .
المحتويات | |
---|---|
الوصف | Ensembl |
العناوين | |
مركز الأبحاث | |
الوصول | |
الموقع | www |
الأدوات | |
متنوعات |
تاريخ
تعديلالجينوم البشري يتكون من 3 مليارات زوج قاعدي ، والتي تشفر ما يقرب من 20,000 إلى 25,000 جين . ومع ذلك فإن الجينوم وحده لا يكون ذا فائدة تذكر، ما لم نتمكن من تحديد مواقع الجينات الفردية والعلاقات بينها. أحد الخيارات هو التوضيح اليدوي، حيث يحاول فريق من العلماء تحديد الجينات باستخدام البيانات التجريبية من المجلات العلمية وقواعد البيانات العامة. ومع ذلك، فهذه مهمة بطيئة ومضنية. البديل المعروف باسم التعليق الآلي هو استخدام قوة أجهزة الكمبيوتر للقيام بمطابقة الأنماط المعقدة للبروتين مع الحمض النووي . [4] [5] تم إطلاق مشروع Ensembl في عام 1999 استجابة للانتهاء الوشيك من مشروع الجينوم البشري ، وكانت الأهداف الأولية هي التعليق التلقائي على الجينوم البشري، ودمج هذا التعليق مع البيانات البيولوجية المتاحة وجعل كل هذه المعرفة متاحة للجمهور. [1]في مشروع Ensembl، يتم إدخال بيانات التسلسل في نظام شرح الجينات (مجموعة من "خطوط الأنابيب" البرمجية المكتوبة بلغة Perl ) والذي يقوم بإنشاء مجموعة من مواقع الجينات المتوقعة ويحفظها في قاعدة بيانات MySQL للتحليل والعرض اللاحق. تجعل Ensembl هذه البيانات متاحة مجانًا لمجتمع الأبحاث العالمي. جميع البيانات والرموز التي أنتجها مشروع Ensembl متاحة للتنزيل، [6] وهناك أيضًا خادم قاعدة بيانات يمكن الوصول إليه بشكل عام يسمح بالوصول عن بعد. بالإضافة إلى ذلك، يوفر موقع Ensembl عروضًا مرئية تم إنشاؤها بواسطة الكمبيوتر لمعظم البيانات.
المشروع مع مرور الوقت، توسع يشمل أنواعًا إضافية (بما في ذلك الكائنات النموذجية الرئيسية مثل الفأر ، وذبابة الفاكهة ، وسمك الزرد ) بالإضافة إلى مجموعة أوسع من البيانات الجينومية، بما في ذلك الاختلافات الجينية والميزات التنظيمية. منذ أبريل 2009، قام مشروع شقيق، Ensembl Genomes ، بتوسيع نطاق Ensembl ليشمل اللافقاريات ، والنباتات ، والفطريات ، والبكتيريا ، والطلائعيات ، مع التركيز على توفير السياق التصنيفي والتطوري للجينات، بينما يستمر المشروع الأصلي في التركيز على الفقاريات. [7] [8]
دعمت Ensembl أكثر من 50000 جينوم عبر قواعد بيانات Ensembl وEnsembl Genomes، مضيفة بعض الميزات المبتكرة الجديدة مثل Rapid Release ، وهو موقع ويب جديد مصمم لجعل بيانات شرح الجينوم متاحة للمستخدمين بشكل أسرع، و COVID-19 ، وهو موقع ويب جديد للوصول إلى جينوم مرجعي لـ SARS-CoV-2 .
عرض البيانات الجينومية
تعديلإن العنصر الأساسي في مفهوم Ensembl هو القدرة على إنشاء عروض رسومية تلقائيًا لمحاذاة الجينات والبيانات الجينومية الأخرى مقابل جينوم مرجعي . وتظهر هذه الصور كمسارات بيانات، ويمكن تشغيل المسارات الفردية وإيقاف تشغيلها، مما يسمح للمستخدم بتخصيص العرض بما يتناسب مع اهتماماته البحثية. وتتيح الواجهة أيضًا للمستخدم تكبير منطقة معينة أو التحرك على طول الجينوم في أي اتجاه.
وتظهر شاشات أخرى البيانات بمستويات متفاوتة من الدقة، بدءًا من النمط النووي الكامل وصولاً إلى التمثيلات النصية لتسلسلات الحمض النووي والأحماض الأمينية ، أو تعرض أنواعًا أخرى من العرض مثل أشجار الجينات المتشابهة ( المتماثلات ) عبر مجموعة من الأنواع. ويتم استكمال الرسومات بعروض جدولية، وفي العديد من الحالات يمكن تصدير البيانات مباشرة من الصفحة في مجموعة متنوعة من تنسيقات الملفات القياسية مثل FASTA .
يمكن أيضًا إضافة البيانات المنتجة خارجيًا إلى الشاشة عن طريق تحميل ملف مناسب بأحد التنسيقات المدعومة، مثل BAM أو BED أو PSL .
يتم إنشاء الرسومات باستخدام مجموعة من وحدات Perl المخصصة استنادًا إلى GD ، مكتبة عرض الرسومات القياسية في Perl.
طرق الوصول البديلة
تعديلبالإضافة لموقعها الإلكتروني، توفر Ensembl واجهة برمجة تطبيقات REST وواجهة برمجة تطبيقات Perl [9] التي تقوم بإنشاء نماذج للأشياء البيولوجية مثل الجينات والبروتينات، مما يسمح بكتابة نصوص بسيطة لاسترداد البيانات ذات الأهمية. يتم استخدام نفس واجهة برمجة التطبيقات داخليًا بواسطة واجهة الويب لعرض البيانات. يتم تقسيمها إلى أقسام مثل واجهة برمجة التطبيقات الأساسية، وواجهة برمجة تطبيقات المقارنة (لبيانات الجينوم المقارنة )، وواجهة برمجة تطبيقات التباين (للوصول إلى SNPs وSNVs وCNVs ..)، وواجهة برمجة تطبيقات الجينوم الوظيفية (للوصول إلى البيانات التنظيمية). يوفر موقع Ensembl معلومات شاملة حول كيفية تثبيت واجهة برمجة التطبيقات واستخدامها . يمكن استخدام البرنامج للوصول إلى قاعدة بيانات MySQL العامة، مما يتجنب الحاجة إلى تنزيل مجموعات بيانات هائلة. يمكن للمستخدمين أيضًا اختيار استرداد البيانات من MySQL باستخدام استعلامات SQL المباشرة، ولكن هذا يتطلب معرفة واسعة بمخطط قاعدة البيانات الحالية.
يمكن استرجاع مجموعات البيانات الكبيرة باستخدام أداة استخراج البيانات BioMart . إنه يوفر واجهة ويب لتنزيل مجموعات البيانات باستخدام الاستعلامات المعقدة.
وأخيرًا، هناك خادم FTP الذي يمكن استخدامه لتنزيل قواعد بيانات MySQL بالكامل بالإضافة إلى بعض مجموعات البيانات المحددة بتنسيقات أخرى.
الأنواع الحالية
تعديلالجينومات الموضحة تتضمن معظم الفقاريات المتسلسلة بالكامل والكائنات النموذجية المختارة. جميعهم حقيقيات النوى، ولا يوجد بدائيات النوى. اعتبارًا من عام 2022، هناك 271 نوعًا مسجل: [10]
انظر أيضا
تعديل- قائمة الجينومات حقيقية النواة المتسلسلة
- قائمة قواعد البيانات البيولوجية
- تحليل التسلسل
- أداة تحديد ملف تعريف التسلسل
- نمط التسلسل
- متصفح جينوم جامعة كاليفورنيا سانتا كروز
- ترميز
مراجع
تعديل- ↑ أ ب خطأ لوا في وحدة:Citation/CS1/Identifiers على السطر 558: attempt to index field 'extended_registrants_t' (a nil value).
- ↑ خطأ لوا في وحدة:Citation/CS1/Identifiers على السطر 558: attempt to index field 'extended_registrants_t' (a nil value).
- ↑ خطأ لوا في وحدة:Citation/CS1/Identifiers على السطر 558: attempt to index field 'extended_registrants_t' (a nil value).
- ↑ Davis، Charles Patrick (29 مارس 2021). "Medical definition of Genome Annotation". مؤرشف من الأصل في 2021-06-14. اطلع عليه بتاريخ 2022-08-07.
- ↑ خطأ لوا في وحدة:Citation/CS1/Identifiers على السطر 558: attempt to index field 'extended_registrants_t' (a nil value).
- ↑ خطأ لوا في وحدة:Citation/CS1/Identifiers على السطر 558: attempt to index field 'extended_registrants_t' (a nil value).
- ↑ خطأ لوا في وحدة:Citation/CS1/Identifiers على السطر 558: attempt to index field 'extended_registrants_t' (a nil value).
- ↑ خطأ لوا في وحدة:Citation/CS1/Identifiers على السطر 558: attempt to index field 'extended_registrants_t' (a nil value).
- ↑ خطأ لوا في وحدة:Citation/CS1/Identifiers على السطر 558: attempt to index field 'extended_registrants_t' (a nil value).
- ↑ "Species List". uswest.ensembl.org. مؤرشف من الأصل في 2022-08-06. اطلع عليه بتاريخ 2022-08-05.