انتقل إلى المحتوى

مشروع قاعده بيانات جينوم انسنبل

من ويكيبيديا، الموسوعه الحره
Ensembl genome database project.
المحتويات
الوصفEnsembl
العناوين
مركز الأبحاث
الوصول
الموقعwww.ensembl.org
الأدوات
متنوعات

مشروع قاعدة بيانات الجينوم Ensembl هو مشروع علمى فى المعهد الأوروبى لعلم المعلومات الحيوية ، اللى يوفر مورد مركزى لعلما الوراثة وعلما الأحياء الجزيئية والباحثين التانيين اللى يدرسون الجينومات الخاصة بنوعنا والفقاريات التانيه والكائنات الحية النموذجية .[1][2][3] يعد Ensembl واحد من الكتير من متصفحات الجينوم المعروفة لاسترجاع المعلومات الجينومية . قواعد بيانات ومتصفحات مماثلة فى NCBI و جامعة كاليفورنيا، سانتا كروز (UCSC) .

تاريخ

[تعديل]

الجينوم البشرى يتكون من 3 مليارات جوز قاعدى ، اللى تشفر يقارب من 20,000 ل25,000 جين . بس الجينوم وحده لا يكون ذا فائدة تذكر، الا اذا نتمكن من تحديد مواقع الجينات الفردية والعلاقات بينها. واحد من الخيارات هو التوضيح اليدوي، حيث يحاول فريق من العلما تحديد الجينات باستخدام البيانات التجريبية من المجلات العلمية وقواعد البيانات العامة. بس، فهذه مهمة بطيئة ومضنية. البديل المعروف باسم التعليق الآلى هو استخدام قوة أجهزة الكمبيوتر للقيام بمدورة الأنماط المعقدة للبروتين مع الحمض النووى .[4][5] تم إطلاق مشروع Ensembl سنة 1999 استجابة للانتهاء الوشيك من مشروع الجينوم البشرى ، و كانت الأهداف الأولية هيا التعليق التلقائى على الجينوم البشري، ودمج ده التعليق مع البيانات البيولوجية المتاحة وجعل كل دى المعرفة متاحة للجمهور.[1] فى مشروع Ensembl، يتم إدخال بيانات التسلسل فى نظام شرح الجينات (مجموعة من "خطوط الأنابيب" البرمجية المكتوبة بلغة Perl ) اللى يقوم بإنشاء مجموعة من مواقع الجينات المتوقعة ويحفظها فى قاعدة بيانات MySQL للتحليل والعرض اللاحق. تجعل Ensembl دى البيانات متاحة مجان لمجتمع الأبحاث العالمي. كل البيانات والرموز اللى أنتجها مشروع Ensembl متاحة للتنزيل، [6] وهناك كمان خادم قاعدة بيانات ممكن الوصول ليه بشكل عام يسمح بالوصول عن بعد. و ذلك، يوفر موقع Ensembl عروض مرئية اتنشأت بالكمبيوتر لمعظم البيانات.

المشروع مع مرور الوقت، توسع يشمل أنواع إضافية (بما فيها الكائنات النموذجية الرئيسية زى الفأر ، وذبابة الفاكهة ، وسمك الزرد ) و مجموعة أوسع من البيانات الجينومية، بما فيها الاختلافات الجينية والميزات التنظيمية. من ابريل 2009، قام مشروع شقيق، Ensembl Genomes ، بتوسيع نطاق Ensembl ليشمل اللافقاريات ، والنباتات ، والفطريات ، والبكتيريا ، والطلائعيات ، مع التركيز على توفير السياق التصنيفى والتطورى للجينات، فى الوقت نفسه بيستمر المشروع الأصلى فى التركيز على الفقاريات.[7][8]

دعمت Ensembl اكتر من 50000 جينوم عبر قواعد بيانات Ensembl وEnsembl Genomes، مضيفة بعض الميزات المبتكرة الجديدة زى Rapid Release ، و هو موقع ويب جديد مصمم لجعل بيانات شرح الجينوم متاحة للمستخدمين بشكل أسرع، و COVID-19 ، و هو موقع ويب جديد للوصول لجينوم مرجعى لـ SARS-CoV-2 .

عرض البيانات الجينومية

[تعديل]
الجين SGCB متوافق مع الجينوم البشرى

إن العنصر الأساسى فى مفهوم Ensembl هو القدرة على إنشاء عروض رسومية تلقائى لمحاذاة الجينات والبيانات الجينومية التانيه مقابل جينوم مرجعى . وتظهر دى الصور كمسارات بيانات، ويمكن تشغيل المسارات الفردية و إيقاف تشغيلها،و ده يسمح للمستخدم بتخصيص العرض بما يتناسب مع اهتماماته البحثية. وتتيح الواجهة كمان للمستخدم تكبير منطقة معينة أو التحرك على طول الجينوم فى أى اتجاه.

وتظهر شاشات تانيه البيانات بمستويات متفاوتة من الدقة، بدايه من النمط النووى الكامل وصول لالتمثيلات النصية لتسلسلات الحمض النووى والأحماض الأمينية ، أو تعرض أنواع تانيه من العرض زى شجر الجينات المتشابهة ( المتماثلات ) عبر مجموعة من الأنواع. ويتم استكمال الرسومات بعروض جدولية، و فى الكتير من الحالات ممكن تصدير البيانات مباشرة من الصفحة فى مجموعة متنوعة من تنسيقات الملفات القياسية زى FASTA .

يمكن كمان إضافة البيانات المنتجة خارجى لالشاشة عن طريق تحميل ملف مناسب ب واحد من التنسيقات المدعومة، زى BAM أو BED أو PSL .

ياتعمل الرسومات باستخدام مجموعة من وحدات Perl المخصصة عن GD ، مكتبة عرض الرسومات القياسية فى Perl.

طرق الوصول البديلة

[تعديل]

بالإضافة لموقعها الإلكتروني، توفر Ensembl واجهة برمجة تطبيقات REST وواجهة برمجة تطبيقات Perl [9] اللى تقوم بإنشاء نماذج للأشياء البيولوجية زى الجينات والبروتينات،و ده يسمح بكتابة نصوص بسيطة لاسترداد البيانات المهمه. يتم استخدام نفس واجهة برمجة التطبيقات داخلى بواجهة الويب لعرض البيانات. يتم تقسيمها لأقسام زى واجهة برمجة التطبيقات الأساسية، وواجهة برمجة تطبيقات المقارنة (لبيانات الجينوم المقارنة )، وواجهة برمجة تطبيقات التباين (للوصول لSNPs وSNVs وCNVs ..)، وواجهة برمجة تطبيقات الجينوم الوظيفية (للوصول لالبيانات التنظيمية). يوفر موقع Ensembl معلومات شاملة حول كيفية تثبيت واجهة برمجة التطبيقات واستخدامها . ممكن استخدام البرنامج للوصول لقاعدة بيانات MySQL العامة،و ده يتجنب الحاجة لتنزيل مجموعات بيانات هائلة. ممكن للمستخدمين كمان اختيار استرداد البيانات من MySQL باستخدام استعلامات SQL المباشرة، لكن ده يتطلب معرفة واسعة بمخطط قاعدة البيانات دلوقتى .

يمكن استرجاع مجموعات البيانات الكبيرة باستخدام أداة استخراج البيانات BioMart . إنه يوفر واجهة ويب لتنزيل مجموعات البيانات باستخدام الاستعلامات المعقدة.

وأخير، هناك خادم FTP اللى ممكن استخدامه لتنزيل قواعد بيانات MySQL بالكامل و بعض مجموعات البيانات المحددة بتنسيقات تانيه.

الأنواع دلوقتى

[تعديل]

الجينومات الموضحة تتضمن معظم الفقاريات المتسلسلة بالكامل والكائنات النموذجية المختارة. جميعهم حقيقيات النوى، ومافيش بدائيات النوى. من سنة 2022، هناك 271 نوع مسجل:[10]

شوف كمان

[تعديل]

مصادر

[تعديل]
  1. أ ب Hubbard, T. (2002-01-01). "The Ensembl genome database project". Nucleic Acids Research. 30 (1): 38–41. doi:10.1093/nar/30.1.38. PMC 99161. PMID 11752248.
  2. "Ensembl 2011". Nucleic Acids Res. 39 (Database issue): D800 – D806. November 2010. doi:10.1093/nar/gkq1064. PMC 3013672. PMID 21045057.
  3. "Ensembl's 10th year". Nucleic Acids Res. 38 (Database issue): D557–62. January 2010. doi:10.1093/nar/gkp972. PMC 2808936. PMID 19906699.
  4. Davis, Charles Patrick (29 March 2021). "Medical definition of Genome Annotation". Archived from the original on 14 June 2021. Retrieved 7 August 2022.
  5. Curwen, Val; Eyras, Eduardo; Andrews, T. Daniel; Clarke, Laura; Mongin, Emmanuel; Searle, Steven M. J.; Clamp, Michele (May 2004). "The Ensembl automatic gene annotation system". Genome Research. 14 (5): 942–950. doi:10.1101/gr.1858004. ISSN 1088-9051. PMC 479124. PMID 15123590.
  6. Ruffier, Magali; Kähäri, Andreas; Komorowska, Monika; Keenan, Stephen; Laird, Matthew; Longden, Ian; Proctor, Glenn; Searle, Steve; Staines, Daniel (January 2017). "Ensembl core software resources: storage and programmatic access for DNA sequence and genome annotation". Database. 2017 (1): bax020. doi:10.1093/database/bax020. PMC 5467575. PMID 28365736.
  7. Hubbard, T. J. P.; Aken, B. L.; Ayling, S.; Ballester, B.; Beal, K.; Bragin, E.; Brent, S.; Chen, Y.; Clapham, P. (January 2009). "Ensembl 2009". Nucleic Acids Research. 37 (Database issue): D690–697. doi:10.1093/nar/gkn828. ISSN 1362-4962. PMC 2686571. PMID 19033362.
  8. Howe, Kevin L.; Contreras-Moreira, Bruno; De Silva, Nishadi; Maslen, Gareth; Akanni, Wasiu; Allen, James; Alvarez-Jarreta, Jorge; Barba, Matthieu; Bolser, Dan M. (2020-01-08). "Ensembl Genomes 2020-enabling non-vertebrate genomic research". Nucleic Acids Research. 48 (D1): D689 – D695. doi:10.1093/nar/gkz890. ISSN 1362-4962. PMC 6943047. PMID 31598706.
  9. "The Ensembl Core Software Libraries". Genome Research. 14 (5): 929–933. February 2004. doi:10.1101/gr.1857204. PMC 479122. PMID 15123588.
  10. "Species List". uswest.ensembl.org. Archived from the original on 6 August 2022. Retrieved 2022-08-05.

لينكات برانيه

[تعديل]