LO9: Роля на биоинформатиката в селското стопанство

Геномика, метаболомика и интерактомика за устойчиво селскостопанско развитие

Селското стопанство е не само основен поминък на някои нации, но и начин на живот, култура и обичаи. Зърнени култури като ориз, пшеница, ечемик, царевица, сорго, просо, захарна тръстика винаги са били считани като важна храна за човешкото население на различни континенти. От хиляди години хората използват размножаването и селекцията, за да получат домашни сортове с желани характеристики от различни култури. Значителен напредък е постигнат във вкуса, хранителната стойност и продуктивността, особено по време на "Зелената революция", която се е състояла през 1960 - 1970 година.

Зелената революция обаче е позната и с нейния неуспех, заради който вече не сме способни да оцеляваме само с няколко сортове "с висок добив". Ето защо сега трябва да използваме по-модерни и съвременни биотехнологични методи в агрономството, за да доставяме храна с по-добра хранителна стойност на непрекъснато увеличаващото се население в световен мащаб, като същевременно се съобразяваме с три важни ограничения - по-малкото земя за оран, изчерпване на енергийните ресурси и непредсказуемото изменение на климата. С други думи, трябва да увеличим темпото на научните изследвания, за да можем да осигурим достатъчно храна за бъдещите поколения.

Последните десет години се смятаха за нова ера в биоинформатиката и изчислителната биология, която увеличи темпото на важни научни разкрития. Участието на компютърните науки в областта на растителната биология промени начина, по който обикновено извършваме проучвания на различните растителни видове през предходните десетилетия. Бързият пробив на технологиите за секвениране през последните няколко години направи тази технология толкова рентабилна, че в днешно време е обичайно за всяка експериментална лаборатория да използва методите на секвениране за изследване на геноми, представляващи интерес.

Заедно със съвременния напредък в областта на биотехнологиите в селското стопанство, това определено ще доведе до огромни дивиденти в сектора на биоенергията, агро-индустриите, оползотворяването на вторичните селскостопански продукти, подобряването на растенията и по-доброто управление на околната среда. Геномното и транскрипторно секвениране на растителните видове дава възможност да се разкрие тяхната генетична структура, разликите в хилядите индивиди в и извън популацията, гените и мутациите, които са от съществено значение за подобряване на специфичните търсени комплексни отличителни белези (Фиг. 1).

Фиг. 1. Структурна геномика

Фиг. 1. Структурна геномика

Използването на ресурсите на геномиката, достъпни за много немоделни и моделни растителни видове в резултат на бързия технологичен прогрес в областта на омикс анализите и биоинформатиката, в крайна сметка доведе до създаването на нова транслационна област в растителната наука, позната като "Растителна геномика". В обхвата на растителната геномика е възможно да се извършат следните анализи:

  1. Секвениране и de novo синтез на немоделни растителни видове;
  2. Изготвяне на подробен списък на гените с тяхната функционална анотация и онтология;
  3. Откриване на голямо количество SNP (единичен нуклеотиден полиморфизъм) / InDeLs маркери (маркери за полиморфизъм с дължина инсерция - делеция), които да спомогнат за фино картографиране и селекция на по-добър сорт;
  4. Идентифициране на "кандидат гените/мутациите/алелите" в съчетание с желаните отличителни черти след диференциция на основните локуси за количествени признаци (QTLs) от маркерите, генерирани в т. 2, използвайки QTL методи на картографиране, напр. GWAS (асоциация за обширното проучване на генома);
  5. Създаване на "MarkerChip" панел за целите на генотипирането и селекцията.

В това отношение метаболомиката е също така бързо развиваща се област в света на омиката и обикновено се използва за сканиране на всички метаболити, присъстващи в дадена проба, използвайки LC-MS, NMR-MS и GC-MS инструменти. Например, при хората се използва за дефиниране на всички възможни метаболити, които пряко или косвено показват определена хранителна склонност. Това се осъществва чрез получаване на проби от урина, които се анализират чрез един от инструментите на МS и получените данни се обработват чрез изчислителен процес (Фиг. 2).

Фиг. 2. Технология на метаболомиката

Фиг. 2. Технология на метаболомиката

Също така, интерактомът е съставен от пълен набор от всички протеин-протеинови взаимодействия, спомагайки за разбирането на молекулните вериги, управляващи клетъчните системи. Например, протеиновата карта на Arabidopsis разкрива хиляди силно надеждни връзки между протеините (Arabidopsis Interactome Mapping Consortium 2011).

Влияние на геномното секвениране в селското стопанство

Терминът геном може да се приложи по-специално за целия генетичен материал на организма, включващ пълния набор от ядрена ДНК (т.е. ядрения геном), а също така и за генетичната информация, съхранявана в органелите, които имат собствена ДНК

  • "митохондриален геном" или "хлоропластов геном".

Някои организми имат множество копия на хромозоми, които са диплоидни, триплоидни, тетраплоидни и т.н. В репродуциращия се организъм (обикновено еукариоти) гаметата има половинта от броя на хромозомите на соматичните клетки, като геномът в гаметата има пълен набор от хромозоми.

Освен това, геномът може да съдържа нехромозомни генетични елементи като вируси, плазмиди или елементи, които могат да се транспозират. Повечето биологични организми, които са по-сложно устроени от вирусите, имат допълнителен генетичен материал освен този, който имат в техните хромозоми. Следователно "геном" описва всички гени и информацията за некодиращата ДНК, които присъстват в даден организъм.

Въпреки това, в еукариоти като например растения, протозои или животни, "геном" обикновено се асоциира само с информацията за хромозомната ДНК. Генетичната информация, съдържаща се в ДНК, в рамките на органелите, т.е. хлоропластите и/или митохондриите, не се счита за част от генома. Всъщност, понякога се споменава, че митохондриите носят свой собствен геном, често наричан "митохондриален геном" (Фиг. 3). ДНК, установена в хлоропласта, може да бъде наречена "пластом" (Фиг. 4).

Фиг. 3. Митохондриален геном Фиг. 4. Пластом

Фиг. 3. Митохондриален геном Фиг. 4. Пластом

Фиг. 3. Митохондриален геном Фиг. 4. Пластом

По-доброто разбиране на геномната еволюция идва от сравнителния анализ в микробния геном, който използва метаболитно сравнение и генно организиране на ниво метаболитни реакции с техните оперони, използвайки път, реакция, структура, съединения и генни ортолози. В тази връзка, секвенирането на цели геноми от различни видове позволява да се определи тяхната организация и да се даде изходна точка за разбиране на тяхната функционалност, като по този начин се благоприятства човешката селскостопанска практика.

В този момент, приносът на геномиката към селското стопанство включва идентифицирането и манипулирането на гени, свързани с определени фенотипни белези, както и геномното кръстосване чрез маркер-подпомогната селекция на различни сортове. Наименованието "земеделска геномика" (или агро-геномика) има за цел да намери иновативни решения чрез проучване геномите на растителните култури или селскостопански животини, достигайки до информация както за предпазване и устойчива производителност, така и за различни други аспекти като производство на енергия или дизайн на фармацевтични продукти.

Понастоящем поради факта, че повечето бактериални видове са все още неизвестни, повечето от методите, използвани за профилиране на микробните съобщества и определяне на техните основни функционални характеристики, се основава на екстракция на тотална ДНК и използването на NGS подход (Следващо-Поколение-Секвениране). Изследването се осъществява върху цялата проба, с цел секвениране и характеризиране на ДНК фрагменти от всички включени видове, т.е. метагеном (Фиг. 5).

(Фиг. 5). Метагеномен анализ

(Фиг. 5). Метагеномен анализ

Прилагането на метагеномиката в областта на земеделието също представлява добър подход за представяне на сложните модели на взаимодействия, протичащи между микроорганизмите в почвата и в растителната ризосфера или по-специално в растителните тъкани и органи. Освен това, метагеномиката показа, че е полезна за проследяване измененията в таксономичния състав и функционалните особености на микробното съобщество в ризосферата и почвата, които пряко се повлияват от промените в околната среда, свързани с торенето и управлението на селското стопанство.

Приложения на селскостопанската биоинформатика

Събирането и съхранението на растителен генетичен ресурс може да се използва за производство на по-здрави, устойчиви на болести и вредители култури, както и за подобряване качеството на добитъка, което ги прави по-здрави, по-устойчиви на болести и по-продуктивни.

Сравнителната геномика на моделни и немоделни растителни видове може да открие организацията на дадени техни гени, по отношение едни на други, които данни след това да се използват за прехвърляне на информация от системите на моделните култури към други култури. В тази връзка, примери за съществуващи пълни растителни геноми са на Arabidopsis thaliana (кресон) и Oryza sativa (ориз).

Също така един от основните ресурсите за получаване на биогорива като етанол е биомасата на растителна основа и може да се използва както за превозни средства, така и за самолети. В допълнение, растителни видове като царевица, просо и лигноцелулозни видове като извлек от захарна тръстика и слама, са широко използвани за производството на биогорива. Съответно, използването на геномиката и биоинформатиката в комбинация с класическото кръстосване и селекция вероятно ще увеличи способността на тези култури да се използват като изходна суровина за биогорива. От своя страна това би допринесло за увеличаване използването на възобновяема енергия в съвременното общество.

В допълнение, гените от Bacillus thuringiensis, които могат да контролират редица сериозни вредители, са успешно прехвърлени върху памук, царевица и картофи. Тази нова способност на растенията да устоят на инвазията от насекоми може да намали броя на използваните инсектициди и следователно да повиши хранителната стойност на културите (Фиг. 6).

Фиг. 6. Ген Bacillus thuringiensis

Фиг. 6. Ген Bacillus thuringiensis

Фиг. 6. Ген Bacillus thuringiensis

Учените неотдавна успяха да прехвърлят специфични гени в ориз, с цел да увеличат нивата на витамин А, желязо и други микроелементи. Този успех би могъл да има силно въздействие върху намаляването на случаите на слепота и анемия, причинени съответно от дефицит на витамин А и желязо (Фиг. 7).

Фиг. 7. Трансфер на гени в ориз за увеличение нивата на витамин А

Фиг. 7. Трансфер на гени в ориз за увеличение нивата на витамин А

Друг пример е постигнатият напредък в развитието на житни сортове, които имат по-голяма устойчивост на висока почвена алкалност и токсични концентрации на свободен алуминий и желязо. Тези сортове ще позволят на селското стопанство да се развива в по-бедните почвени райони, като по този начин ще добави много повече земя към световната производствена база.

В тази връзка, основна цел на растителната геномика е да разбере генетичната и молекулярната основа на всички биологични процеси в растенията, които съответстват на вида. Това разбиране е фундаментално, защото ще позволи ефективното използване на растенията като биологични ресурси в развитието на нови култивари с подобрено качество и намалени икономически и екологични разходи. Характерни черти от първостепенно значение са устойчивостта към патогенен и абиотичен стрес, качествените характеристики на растението и репродуктивните характеристики, определящи добива.

Важни за селското стопанство биологични база данни

В началото на "геномната революция" основната задача на биоинформатиката беше да създаде и поддържа база данни за съхраняване на биологична информация като нуклеотидни и аминокиселинни последователности.

Биологичната база данни е голяма, организирана форма на постоянен поток на информация, който обикновено е свързана с компютъризиран софтуер, проектиран да актуализира, запитва и извлича компоненти на информацията, съхранявани в системата. Например, запис, свързан с информация за нуклеотидни последователности, обикновено съдържа данни като име за контакт; входната последователност с описание на типа молекула; научното наименование на съответния организъм, от който е изолиран и често литературни цитати, свързани с последователността.

Разработването на база данни включва не само проектиране и съхранение на информация, но и разработване на лесен за ползване графичен потребителски интерфейс (GUI), така че изследователите да имат достъп до съществуващи данни и да предоставят нови или преработени данни, например NCBI, Ensembl.

Има много полезни бази данни, от които можем да получим съответната информация за конкретни растителни видове.

Например, базата данни PlantTribes 2.0 е база данни за фамилии от растителни гени, базирана на преведените протеоми от пет секвенирани растителни вида: Arabidopsis thaliana, Carica papaya, Medicago truncatula, Oryza sativa и Populus trichocarpa. Тази база данни използва графично базиран клъстерен алгоритъм MCL, за да категоризира всички кодиращи протеин гени в предполагаеми генни семейства, наричани още родове, използвайки три клъстерни нива (ниско, средно и високо). За всички родове той генерира протеинови и ДНК подреждания и филогенетични дървета с максимална вероятност (Фиг. 8).

Фиг. 8. PlantTribes 2.0 база данни

Фиг. 8. PlantTribes 2.0 база данни

Съществува и паралелна база данни за микроарей експериментални резултати, която позволява на изследователите да идентифицират групи от свързани гени и техните експресионни модели.

SuperTribes, изграден чрез вторично повторение на MCL групиране, свързва отдалечени, но потенциално свързани генни клъстери. Цялата информация и анализи са налични чрез гъвкав интерфейс, позволяващ на потребителите да изследват класификацията, да извършват запитвания в класификацията и да изтеглят резултатите за по-нататъшно проучване.

В последната му версия е интегрирана допълнителна фина таблична класификация за идентифициране на ортоложни гени, базирани на OrthoMCL алгоритъм.

Друга база данни, като базата данни на FlagDB, характеризира голяма интегративна колекция от структурни и функционални анотации и ESTs от шест различни растителни вида. Освен това има информация за нови генни прогнози, мутагенни маркери, генни семейства, протеинови мотиви, транскриптомни данни, повторени секвенции, праймери и маркери за геномни подходи, субклетъчно насочване, вторични структури, третични модели, селектирани анотации и мутантни фенотипи, които са достъпни в тази база данни (Фиг. 9).

Фиг. 9. Данни, налични в базата данни FlagDB (FLAGdb ++ v6.2)

Фиг. 9. Данни, налични в базата данни FlagDB (FLAGdb ++ v6.2)

Друг важен пример е базата данни на растителния геном: PlantGDB е каталог на геномните секвенции от всички растителни видове, създадени с цел да се направи сравнителна геномика. Тази база данни също така класифицира EST секвенции в контигове, които могат да характеризират и разграничават уникалните гени (Фиг. 10).

Фиг. 10. Базата данни на растителния геном: PlantGDB

Фиг. 10. Базата данни на растителния геном: PlantGDB

Други важни за селското стопанство бази данни, заедно с описанието и URL адреса, са дадени на Health Science Library System.

Растителна геномика

Ролята на моделния организъм

През последното столетие проучването и изследването на няколко вида форми на живот са изиграли съществена роля в разбирането ни за разнообразните биологични цикли и процеси. Това е така, защото много аспекти на науката, особено биологичните процеси, са сравними във всички живи организми. Въпреки това, често е много по-лесно да се изследва конкретен аспект или процес в един организъм, отколкото в други. В този случай тези организми обикновено се определят като моделни организми, защото техните характеристики ги правят подходящи за лабораторно проучване.

През 80-те години все повече хора започнаха да мислят, че големите инвестиции в изследването на многобройни различни растителни видове като царевица, маслодайна рапица или соя ще размият усилията за пълно разбиране на основните свойства на всички растения. Освен това учените започнаха да осъзнават, че тяхната цел за пълно разбиране на растителната физиология и развитие е толкова амбициозна, че най-доброто решение е да се използват моделни растителни видове.

Най-известните моделни организми трябва да притежават солидни предимства за експериментални изследвания, като бързо развитие с кратък жизнен цикъл, малък размер на възрастния индивид, наличност и добра податливост на обработка. Благодарение на задълбоченото изследване на техните характеристики, тези моделни организми стават още по-ценни. Понастоящем наличието на огромно количество данни за тези организми, позволява извличането на важна информация за анализа на нормалното развитие на човека или на растенията; генетичен контрол, генетични инфекции и болести и еволюционни форми.

Например, Medicago (люцерна) е един действително брилянтен диплоид, който има важна роля при определянето на азота в почвата и е основен фураж. Други треви и бобови растения също се използват за обширно EST секвениране и за конструиране на генетични карти. За щастие, пълното секвениране на всички гени на един представителен растителен вид ще даде много повече знания и информация за всички висши растения. Също така, използването на моделни видове допълнително ще разшири познанията за всички висши растения, особено при разкриването ролята на протеините и на техните функции. Например, сравнението на геномните секвенции на ориза и Arabidopsis разкрива изобилие от полезна информация за растителната геномика поради обширните, но сложни дизайни на синтез.

Arabidopsis thaliana се превърна в добре познато моделно растение за повечето изследователи. Въпреки факта, че не е комерсиално растение, то се предпочита заради възпроизводството, развитието и реакцията му на стрес и болести по същия начин, както и при много други растения. Arabidopsis thaliana има малък геном, който няма повтарящи се, неинформативни ДНК последователности, които да възпрепятстват геномния анализ. Предимствата му са, че има големи генетични и физични карти на всичките 5 хромозоми (MapViewer); бърз жизнен цикъл (около 6 седмици от покълването до узряването на семената); изобилно производство на семена и лесно култивиране в ограничено пространство; огромен брой мутантни линии и геномни ресурси (центрове за съхранение на данни) и многонационално научноизследователско общество на академични, правителствени и индустриални лаборатории.

Целият геном на Arabidopsis се е дуплицирал еднократно в неговото еволюционно развитие и това събитие е последвано от последваща загуба на гени и множество локални генни дупликации. Геномът има 25 498 гени, кодиращи протеини от 11 000 семейства (Фиг. 11).

Фиг. 11. Анализ на Arabidopsis thaliana

Фиг. 11. Анализ на Arabidopsis thaliana

Подобно на други моделни организми, и тук има много повече информация за генома на Arabidopsis, отколкото за цялата геномна последователност. Сайтът за информационния ресурс на Arabidopsis, TAIR, позволява на изследователите да интегрират геномната последователност с голяма EST база данни и заедно с генетичните и физичните карти, предлага линкове към функционалната и молекулярна генетична информация, както и литература за специфичните гени и показва непрекъснато разширяващ се списък на налични мутанти.

Алтернативните растения, които се използват като моделни организми за изследване, са домати, ориз, царевица и пшеница, поради важните им за селското стопанство характеристики.

Всички налични изследвания и генетични данни за различните моделни растения се качват на съответните уебсайтове. Обикновено те се правят от конкретни изследователски групи, които интегрират изследователските усилия от цял свят. Няколко ценни сайтове включват UK CropNet, U.S. Agricultural Research Service и специфични ресурси за организма като MaizeDB. Тези сайтове имат за цел да обединят наличните познания и действителните генетични ресурси с виртуалната база данни, свързана с информация за картографиране. Ето защо различни търсачки и сложни релационни бази данни са в процес на разработка.

Управление и разпространение на данни за растителните геноми

Геномната наука е спечелила значително от напредъка в изчислителните възможности и биоинформатиката, както и в много области на науката и технологиите. Развитието на интернет пространството е жизненоважно за геномните изследователи, както и за подобрената компютърна бързина.

В съчетание с разработването на модерна технология за бази данни, World Wide Web се превърна в естествено средство за управление и разпространение на геномните ресурси и това доведе до създаването на споделени публични ресурси, които бяха използвани за търсене и анализиране на съдържанието на геномните бази данни. Някои от уебсайтовете като NCBI и EMBL осигуряват бърз достъп до колосални количества информация и инструменти за анализ, които са безплатни и достъпни от всяко място по света. В допълнение, предимствата на мрежата са важни за управлението на лабораторни данни с малка или никаква човешка намеса.

LIMS или системи за управление на лабораторната информация, позволява на потребителите на различни работни места или географски местоположения да преглеждат, редактират, анализират и коментират данните. Основната част от геномната информация е система за база данни и повечето бази данни могат да бъдат класифицирани като релационни бази данни (RDB) или обектно-ориентирани бази данни (OODB) (Фиг. 12).

Фиг. 12. Системи за управление на лабораторната информация (LIMS)

Фиг. 12. Системи за управление на лабораторната информация (LIMS)

Има три основни бази данни: GenBank (NCBI), базата данни за нуклеотидните последователности (EMBL) и ДНК базата данни на Япония (DDBJ), които са хранилища на информация за необработените растителни секвенции. Също така, SWISS-PROT и TrEMBL са главните бази данни за съхранение на растителни протеинови последователности. Съществуват и вторични бази данни като PROSITE, PRINTS и BLOCKS, които съдържат последователностите, получени от данните, намиращи се в първоначалните бази данни.

Ранните биоинформационни бази данни наблягаха най-вече на улавянето на данни. В началото на това десетилетие акцентът премина от улавянето на информация към събиране и интегриране на информацията. Базата данни на моделните организми (MODs), които са интегрирани хранилища на всички електронни информационни ресурси, свързани с конкретен експериментален растителен или животински вид, стават първият избор в света на биоинформатиката. Интегрирайки многобройни видове биологична информация за няколко вида, тези ресурси позволяват на анализаторите да правят разкрития, които не биха били възможни само чрез анализ на един вид. Тези системи интегрират информация за многобройни организми и използват сравнителен анализ за намиране на модели в генома, които иначе биха могли да бъдат пропуснати.

Например, геномът на царевицата е приблизително със същата дължина като човешкия геном и няма да бъде напълно секвениран за още няколко години, но оризът, който е една десета от размера на човешкия, вече е напълно секвениран. Тъй като двете култури са тясно свързани в еволюционен аспект, успешно са създадени специфични карти, които свързват генетичната карта на царевицата с последователността на оризовия геном. Това позволява на анализаторите да следват генетично картографирана характерна черта в царевицата, като например толерантност към високите нива на соли в почвата и да се насочат към съответния регион в оризовия геном, разпознавайки по този начин кандидат-гените за толерантност към солта.

Понастоящем се прилагат различни биоинформатични подходи, когато се изследват данните за растителните геноми. Някои от най-популярните са:

Методи за подреждане на последователности и приложения за сравняване на геномни секвенции: Развитието на технологиите за широкомащабно количествено определяне и идентифициране на биологични молекули, съчетано с напредъка на компютърните технологии и интернет, допринесе за улесняване на предоставянето на значителни обеми биологични данни на анализаторите. Повишената производителност се постига чрез автоматизация, миниатюризация и интеграция на технологиите, като прилагането на този подход към анализите на други биологични молекули, включващи иРНК, протеини и метаболити, доведе до голямо увеличаване на генерирането на биологична информация.

Много често главната същност на биоинформатичните стратегии за секвениране на последователностите е сравнението на кДНК /EST и геномните последователности и анотация. В допълнение към цялостното геномно секвениране, информацията за растителната последователност се събира от три основни източника: секвениране на проби от бактериални изкуствени хромозоми (BACs), секвенционно геномно изследване (GSS) и секвениране на експресионни маркери (ESTs).

Сравняване на последователности: Това е сравняването на две или повече аминокиселинни или нуклеотидни последователности от организъм или организми по такъв начин, че да се установят областите на секвенциите, споделящи общи свойства. Известни алгоритми за сравняване по двойки са Smith-Waterman за локално сравняване и Needelman-Wunsch за глобално сравняване.

Сравняване на множество последователности: Сравняването на множество последователности показва взаимовръзките между две или повече секвенции. Когато участващите секвенции са различни, консервативните участъци често са ключови такива, свързани с поддържане на структурна стабилност или биологична функция. Сравняването на множество последователности може да разкрие и много информация за белтъчната структура и функция. Най-често използваният софтуер за подреждане е пакетът ClustalW.

Алгоритми за търсене на сходство на последователности: Вероятно най-използваните от тях са FASTA и BLAST. И двата инструмента BLAST и FASTA осигуряват много бързо търсене на бази данни за последователности (Фиг. 13, 14).

Фиг. 13. FASTA

Фиг. 14. BLAST

Фиг. 13. FASTA Фиг. 14. BLAST

Инструменти за сравняване на геноми: MegaBlast е базиран на NCBI BLAST алгоритъм за обширно търсене на сходни секвенции. MegaBlast се използва за сравняване на необработените геномни секвенции с база данни за секвенции от контаминанти.

Експресионни маркерни секвенции (ESTs): ESTs са частични, генни секвенции, които са били произведени или са в процес на производство в няколко лаборатории, използващи различни видове и сортове, както и разнообразни тъкани и етапи на развитие. ESTs се използват широко в цялото общество на геномиката и молекулярната биология за откриване на гени, картографиране, анализ на полиморфизма, експресионни изследвания и генно прогнозиране.

Молекулярно кръстосване на растения

Разширяването на резолюцията на генетичните карти във важните култури и по-доброто изясняване на молекулната база за определени характеристики или физиологични отговори, дава по-голяма възможност да се свържат кандидат-гените, намерени в моделните видове, със съответните локуси в растителните култури. Съответната сродна информация ще позволи свободно свързване на геноми по отношение на генната последователност, предполагаемата функция или позицията на генетичната карта.

След като този вид инструменти бъдат реализирани и приложени, разликата между размножителната и молекулярната генетика ще изчезне. Развъдниците ще използват компютърни модели, за да формулират предсказуеми хипотези за установяване на фенотипи, които представляват интерес, от трудни и сложни алелни комбинации и след това да направят тези комбинации чрез оценяване на големи популации за многобройни генетични маркери (Фиг. 15).

Фиг. 15. Обратна генетика при многогодишни райграси

Фиг. 15. Обратна генетика при многогодишни райграси

Огромният ресурс, включващ знанията за развъждане, събрани през последните десетилетия, ще стане пряко свързан с основната растителна биология и ще увеличи способността за изясняване на генната функция в моделните организми. Например, характеристики, които са лошо определени на биохимично ниво, но добре установени като видим фенотип, могат да бъдат свързани с картографиране чрез висока резолюция с кандидат-гените.

Ортоложните гени в моделен вид, като например Arabidopsis или ориз, може да нямат добре позната връзка с количествената характеристика като тази, наблюдавана в културата, но може да са участвали в специфичен метаболитен път или верига за сигнализация чрез генетични или биохимични тестове. Този вид кръстосано-геномна препратка ще доведе до сближаване на икономически съответстващата информация за развъждане с основните молекулярни генетични данни.

Специфичните фенотипи с търговски интерес, които се очаква да бъдат грандиозно подобрени от този напредък, включват както подобряването на факторите, които често лимитират селскостопанската производителност (входните черти), така и промяната на количеството и вида на материалите, които културите произвеждат (изходните черти). Примерите включват:

  • толерантност към абиотичен стрес (студ, суша, влага, сол);
  • толерантност към биотичен стрес (гъбна, бактериална, вирусна);
  • ефективност при използването на хранителни вещества;
  • управление на растителната структура и развитие (размер, форма, брой и местоположение, време на развитие, стареене);
  • разделяне на метаболитите (пренасочване на въглероден поток през съществуващи пътища или преминаване към нови пътища).

Рационално подобряване на растенията

Последиците от приложението на геномиката във връзка с производството на храни, фуражи и влакна могат да бъдат визуализирани на много фронтове. На най-съществен напредък е в придобиването на знания, който от своя страна директно ще повлияе върху много аспекти на процесите, свързани с подобряване на растенията. Познаването на функцията на всички растителни гени, в съответствие с по-нататъшното разработване на инструменти за модифициране и изследване на геноми, ще доведе до еволюцията на оригинална генетична инженерна парадигма, в която рационалните промени могат да бъдат планирани и моделирани от първоизточниците.

Целта на растителната геномика е да разбере генетичната и молекулярна основа на всички биологични процеси в растенията, които са свързани с вида. Това разбиране е от съществено значение за ефективното поддържане на растенията като биологични ресурси при разработването на нови сортове с подобрено качество и намалени икономически и екологични разходи (Фиг. 16).

Фиг. 16. Подобряване на растенията

Фиг. 16. Подобряване на растенията

Това знание е също фундаментално и за развитието на нови инструменти за растителна диагностика. Характеристики, които се считат, че са от първостепенно значение, са устойчивост на патогени и абиотичен стрес, качествени характерни черти за растенията и репродуктивни черти, определящи производителността. Геномната програма вече може да се смята за изключително важен инструмент за подобряване на растенията.

Такъв подход за определяне на ключовите гени и разбиране на тяхната функция ще доведе до „квантов скок“ в напредъкът на растениевъдството. Освен това способността за изследване на генната експресия ще ни позволи да разберем как реагират и взаимодействат растенията с околната среда и ще подобри практиките за управление.

Тази информация, заедно с подходяща технология, може да предостави предсказуеми мерки за здравето и качеството на растенията и да се превърне в съществена част от бъдещите системи за управление на решенията за отглеждане на растения.

Текущите геномни програми произвеждат голямо количество информация, която ще изисква обработка, съхранение и подреждане в съответствие с мултинационалното научноизследователско общество. Данните включват не само информация за ДНК и аминикиселинните последователности, но и информация за мутации, маркери, карти, функционални открития и т.н. Основните цели на растителната биоинформатика включват: да се даде предимство на представянето на всички данни за секвенциите в публичното пространство от хранилища, за предоставяне на рационална анотация на гени, протеини и фенотипи и да се създават връзки както в обсега на данните за растенията, така и между растенията и другите организми.

Експерименти за създаване на генотипи

През последните няколко години се събират все повече данни за ДНК полиморфизма и секвенирането в различни сортове растения и култивари. Повечето от тези данни бяха използвани с цел разпознаване на различни сортове, както и за тяхното сравнение по разстояния и аналогия. Този вид разстояния се измерват от полиморфизма върху част от хромозомата с неизвестна функция.

Този вид полиморфизъм е широко използван в изучаването на генома на различни видове. Информацията за полиморфизма се анализира заради потенциална връзка с количествена характеристика, представляваща интерес за конкретните фенотипи. Тъй като такава връзка се открива, тя се нарича индиректен маркер. Индиректните маркери са тясно свързани, от време на време те могат да се припокриват с локус, който определя тази количествена характеристика, QTL.

QTLs се определят като гени или области на хромозоми, които засягат определена черта. QTLs сами по себе си са много трудни за разпознаване. И в двата случая тези данни, или както се наричат, маркери, могат да бъдат използвани в по-нататъшни цели за подбор и селекция. Този процес на подбор се нарича MAS.

Анализ и картографиране на локуси за количествени характеристики (QTLs)

QTLs и картографиране: Основният проблем е да се определи кои популации са подходящи за QTL анализи, неструктурирани и F2 кръстоски - в големи растителни популации, за да се отделят потенциалните QTLs. Тъй като селекцията се базира най-вече на маркерите, по-голямата плътност на картографирането е изключително важна. Интервал между маркера и QTL от около 5 сантиметра изглежда достатъчно за ефективен подбор и селекция. Въпреки това, симулационните изследвания показват, че прецизността на селекцията спада до 81% и 74% при 2 см и 4 см разстояние в сравнение с 1 см (Фиг. 17).

Фиг. 17. QTL картографиране на qGW-5 локус

Фиг. 17. QTL картографиране на qGW-5 локус

Използване на QTL информация: Предполага се, че някои, но не всички локуси са детерминирани, така че подборът трябва да се основава на комбинацията от фенотипни и молекулярни данни; в процеса на селекция връзката на маркерите и отличителните черти би могла да се редуцира и затова тази връзка трябва да се наблюдава през поколенията. В процеса на селекция QTLs демонстрират едновременното съществуване на желаните гени в една линия. В кръстосаните програми QTLs могат да предвидят ефективността на непроверени кръстоски, включително неадитивния им ефект върху данните на родителските линии и ограничения брой кръстоски.

Бъдеща перспектива: С натрупването на молекулярни данни ще бъдат разработени програми за създаване на генотипи, които ще определят хомозиготни желани маркери; в програми за интрогресия - за комбиниране на планираните черти от две линии в една; накрая, реалният свят на селското стопанство е в етап на натрупване на молекулярна информация.

Аналитични подходи: Един от статистическите инструменти за извършване на QTL анализи е мета-анализът, който синтезира солидни QTL данни и подобрява QTL позицията. Програма от този клас е френският BioMercator. Също така PlaNet, Европейската мрежа на бази данни за растителни геноми, която е на разположение, е среда със сложни възможности за научни изследвания.

По-нататъшен напредък и детайлно обсъждане на QTLs включва статистическите аспекти на маркер-опосредствана селекция (MAS) , установяването на прага на важност на маркерните ефекти, надценяването или отклонението при оценката на QTL ефектите, оптимизирането на селекционните програми за различни поколения при едновременното използване на MAS и фенотипните данни. Специфична особеност е, че трябва да се направят открития на специфични за растенията части, листа, корени, плодове и т.н., както е изпитано при гроздето.

Експерименталните резултати не винаги доказват ефективността на MAS по отношение на изграждането на генотипа. Основната причина е недостатъчната точност на първичната оценка на QTL, нейното място и ефект. Също така някои QTLs могат да бъдат загубени в процеса на изграждане на генотипа. За сложните продуктивни отличителни черти епистатичната загуба би могла да бъде причина за промените в стойността на QTL ефекта при родителското и потомствено поколение. След това се препоръчва изборът да бъде базиран на алелните комбинации и по-скоро на отделните QTLs. Това е в съответствие с многобройните ген-околна среда взаимодействия и със селекция в рамките на предпочитаната среда в случай на резистентност към болести/суша. Следователно ефективността на MAS ще зависи от сложността на видовата/отличителната генетична структура, от прогреса на характерната черта в околната среда и от взаимодействието между тях.

За комплексни характерни черти оценката на QTLs трябва да бъде в различни среди. Също така е абсолютно необходимо фенотипното оценяване/проверка на съвместимите поколения. Например: устойчивостта на суша изглежда по-сложна характерна черта от устойчивостта на болест.

От икономическа гледна точка използването на маркери ще струва събиране на ДНК, генотипиране, анализи, откриване на QTLs и т.н. Тази висока стойност се плаща за изграждане на генотипа с характерни черти, които са скъпи за оценка, устойчивост на заболявания или характеристики с ниска унаследяемост.

Литература

  • Boserup E. The conditions of agricultural growth: The economics of agrarian change under population pressure 2005: Transaction Publishers.
  • Lewis W.A. Theory of economic growth. Vol. 7. 2013: Routledge.
  • Yang DT, X. Zhu. Modernization of agriculture and long-term growth. Journal of Monetary Economics, 2013; 60: 367-382.
  • Taiz L. Agriculture, plant physiology, and human population growth: past, present, and future. Theoretical and Experimental Plant Physiology. 2013; 25: 167-181.
  • Zeder MA. 13 Agricultural origins in the ancient world. Anthropology Explored: The Best of Smithsonian AnthroNotes, 2013.
  • Graham RD, Welch RM. Breeding for staple food crops with high micronutrient density 1996: Intl Food Policy Res Inst.
  • Nestel P, Bouis HE, Meenakshi JV, Pfeiffer W. Biofortification of staple food crops. J Nutr. 2006; 136: 1064-1067.
  • Svizzero S, Tisdell C. The Neolithic Revolution and human societies: diverse origins and development paths. School of Economics. University of Queensland. 2014.
  • Randhawa MS. Green Revolution: John Wiley and Sons. 1974
  • Conway GR, Barbier EB. After the green revolution: sustainable agriculture for development. Routledge 2013.
  • Evenson RE, Gollin D. Assessing the impact of the green revolution, 1960 to Science. 2003; 300: 758-762.
  • Pingali PL. Green revolution: impacts, limits, and the path ahead. Proc Natl Acad Sci U S A. 2012; 109: 12302-12308.
  • Wishart DS. Current progress in computational metabolomics. Brief Bioinform. 2007; 8: 279-293.
  • Ouzounis CA. Rise and demise of bioinformatics? Promise and progress. PLoS Comput Biol. 2012; 8: e1002487.
  • Mardis ER. A decade’s perspective on DNA sequencing technology. Nature. 2011; 470: 198-203.
  • Pareek CS, Smoczynski R, Tretyn A. Sequencing technologies and genome sequencing. J Appl Genet. 2011; 52: 413-435.
  • Bayat A. Science, medicine, and the future: Bioinformatics. BMJ. 2002; 324: 1018-1022.
  • Rhee SY, Dickerson J, Xu D. Bioinformatics and its applications in plant biology. Annu Rev Plant Biol. 2006; 57: 335-360.
  • Thompson GA, Goggin FL. Transcriptomics and functional genomics of plant defence induction by phloem-feeding insects. J Exp Bot. 2006; 57: 755-766.
  • Grattapaglia D, Plomion C, Kirst M, Sederoff RR. Genomics of growth traits in forest trees. Curr Opin Plant Biol. 2009; 12: 148-156.
  • Edwards D, Batley J. Plant genome sequencing: applications for crop improvement. Plant Biotechnol J. 2010; 8: 2-9.
  • Tuberosa R, Salvi S. Genomics-based approaches to improve drought tolerance of crops. Trends Plant Sci. 2006; 11: 405-412.
  • German JB, Hammock BD, Watkins SM. Metabolomics: building on a century of biochemistry to guide human health. Metabolomics. 2005; 1: 3-9.
  • Cusick ME, Klitgord N, Vidal M, Hill DE. Interactome: gateway into systems biology. Hum Mol Genet. 2005; 14 Spec No.
  • Morsy M, Gouthu S, Orchard S, Thorneycroft D, Harper JF, Mittler R, et al. Charting plant interactomes: possibilities and challenges. Trends Plant Sci. 2008; 13: 183-191.
  • Arabidopsis Interactome Mapping Consortium. Evidence for network evolution in an Arabidopsis interactome map. Science. 2011; 333: 601-607.
  • Angellotti M.C., Bhuiyan S.B., Chen G. And Wan Xiu-Feng (2007) Nucleic Acids Research, 35, W132-W136.
  • Kale U.K., Bhosle S.G., Manjari G.S., Joshi M., Bansode S. and Kolaskar A.S. (2006) BMC Bioinformatics, S12-S27.
  • Tsuru T. and Kobayashi I. (2008 Molecular Biology Evolution, 25, 2457-2473.
  • Morrell PL, Buckler ES, Ross-Ibarra J. Crop genomics: advances and applications. Nat Rev Genet. 2012;13(2):85–96.
  • Ellegren H. Genome sequencing and population genomics in nonmodel organisms. Trends Ecol Evol. 2014;29(1):51–63.
  • Weigel D, Mott R. The 1001 genomes project for Arabidopsis thaliana. Genome Biol. 2009;10(5):107.
  • Lindblad-Toh K, Garber M, Zuk O, Lin MF, Parker BJ, Washietl S, Kheradpour P, Ernst J, Jordan G, Mauceli E, Ward LD, Lowe CB, Holloway AK, Clamp M, Gnerre S, Alfoldi J, Beal K, Chang J, Clawson H, Cuff J, Di Palma F, Fitzgerald S, Flicek P, Guttman M, Hubisz MJ, Jaffe DB, Jungreis I, Kent WJ, Kostka D, Lara M, et al. A high-resolution map of human evolutionary constraint using 29 mammals. Nature. 2011;478(7370):476–82.
  • Zhang Z, Ober U, Erbe M, Zhang H, Gao N, He J, Li J, Simianer H. Improving the accuracy of whole genome prediction for complex traits using the results of genome wide association studies. PLoS One. 2014;9(3):e93017.
  • Organization EPS. European plant science: a field of opportunities. J Exp Bot. 2005;56(417):1699–709.
  • Iovene M, Barone A, Frusciante L, Monti L, Carputo D. Selection for aneuploid potato hybrids combining a low wild genome content and resistance traits from Solanum commersonii. Theor Appl Genet. 2004;109(6):1139–46.
  • van der Vlugt R, Minafra A, Olmos A, Ravnikar M, Wetzel T, Varveri C, Massart S. Application of next generation sequencing for study and diagnosis of plant viral diseases in agriculture. 2015.
  • Van Borm S, Belák S, Freimanis G, Fusaro A, Granberg F, Höper D, King DP, Monne I, Orton R, Rosseel T. Next-generation sequencing in veterinary medicine: how can the massive amount of information arising from high-throughput technologies improve diagnosis, control, and management of infectious diseases? In: Veterinary infection biology: molecular diagnostics and high-throughput strategies. Berlin: Springer; 2015. p. 415–36.
  • Blanchfield J. Genetically modified food crops and their contribution to human nutrition and food quality. J Food Science. 2004, 69(1):CRH28-CRH30.
  • Yuan JS, Tiller KH, Al-Ahmad H, Stewart NR, Stewart CN Jr. Plants to power: bioenergy to fuel the future. Trends Plant Sci. 2008;13(8):421–9.
  • Ma JKC, Drake PMW, Christou P. The production of recombinant pharmaceutical proteins in plants. Nat Rev Genet. 2003;4(10):794–805.
  • Wilson SA, Roberts SC. Metabolic engineering approaches for production of biochemicals in food and medicinal plants. Curr Opin Biotechnol. 2014;26:174–82.
  • Carbonetto B, Rascovan N, Álvarez R, Mentaberry A, Vázquez MP. Structure, composition and metagenomic profile of soil microbiomes associated to agricultural land use and tillage systems in Argentine Pampas. 2014.
  • Mendes LW, Kuramae EE, Navarrete AA, van Veen JA, Tsai SM. Taxonomical and functional microbial community selection in soybean rhizosphere. The ISME journal. 2014;8(8):1577–87.
  • Fouts DE, Szpakowski S, Purushe J, Torralba M, Waterman RC, MacNeil MD, Alexander LJ, Nelson KE. Next generation sequencing to define prokaryotic and fungal diversity in the bovine rumen. 2012.
  • Rastogi G, Coaker GL, Leveau JH. New insights into the structure and function of phyllosphere microbiota through high-throughput molecular approaches. FEMS Microbiol Lett. 2013;348(1):1–10.
  • Pan Y, Cassman N, de Hollander M, Mendes LW, Korevaar H, Geerts RH, van Veen JA, Kuramae EE. Impact of long-term N, P, K, and NPK fertilization on the composition and potential functions of the bacterial community in grassland soil. FEMS Microbiol Ecol. 2014;90(1):195–205.
  • Bevivino A, Paganin P, Bacci G, Florio A, Pellicer MS, Papaleo MC, Mengoni A, Ledda L, Fani R, Benedetti A. Soil Bacterial community response to differences in agricultural management along with seasonal changes in a mediterranean region. 2014.
  • Souza RC, Hungria M, Cantão ME, Vasconcelos ATR, Nogueira MA, Vicente VA. Metagenomic analysis reveals microbial functional redundancies and specificities in a soil under different tillage and crop-management regimes. Appl Soil Ecol. 2015;86:106–12.
  • Proost S, Van Bel M, Sterck L, Billiau K, Van Parys T, Van de Peer Y, et al. PLAZA: a comparative genomics resource to study gene and genome evolution in plants. Plant Cell. 2009; 21: 3718-3731.
  • Boyle G. Renewable energy2004: OXFORD university press.
  • Turner JA. A realizable renewable energy future Science. 1999; 285: 687-689.
  • Betz FS, Hammond BG, Fuchs RL. Safety and advantages of Bacillus thuringiensis-protected plants to control insect pests. Regul Toxicol Pharmacol. 2000; 32: 156-173.
  • Paine JA, Shipton CA, Chaggar S, Howells RM, Kennedy MJ, Vernon G, et al. Improving the nutritional value of Golden Rice through increased pro-vitamin A content. Nat Biotechnol. 2005; 23: 482-487.
  • Blum A. Plant breeding for stress environments1988: CRC Press, Inc.
  • Xu Y. Molecular plant breeding2010: CABI.
  • Hack C, Kendall G. Bioinformatics: Current practice and future challenges for life science education. Biochem Mol Biol Educ. 2005; 33: 82-85.
  • Enright AJ, Van Dongen S, Ouzounis CA. An efficient algorithm for large-scale detection of protein families. Nucleic Acids Res. 2002; 30: 1575-1584.
  • Wall PK, Leebens-Mack J, Müller KF, Field D, Altman NS, dePamphilis CW. PlantTribes: a gene and gene family resource for comparative genomics in plants. Nucleic Acids Res. 2008; 36: D970-976.
  • Li L, Stoeckert CJ Jr, Roos DS. OrthoMCL: identification of ortholog groups for eukaryotic genomes. Genome Res. 2003; 13: 2178-2189.
  • Samson F, Brunaud V, Balzergue S, Dubreucq B, Lepiniec L, Pelletier G, et al. FLAGdb/FST: a database of mapped flanking insertion sites (FSTs) of Arabidopsis thaliana T-DNA transformants. Nucleic Acids Res. 2002; 30: 94-97.
  • Samson F, Brunaud V, Duchêne S, De Oliveira Y, Caboche M, Lecharny A, et al. FLAGdb++: a database for the functional analysis of the Arabidopsis genome. Nucleic Acids Res. 2004; 32: D347-350.
  • Duvick J, Fu A, Muppirala U, Sabharwal M, Wilkerson MD, Lawrence CJ, et al. PlantGDB: a resource for comparative plant genomics. Nucleic Acids Res. 2008; 36: D959-965.
  • Walsh B (2001) Quantitative genetics in the age of genomics. Theoretical Population Biology, 59: 175-184.
  • Reif JC, Melchinger AE and Frisch M (2005) Genetical and mathematical properties of similarity and dissimilarity coefficients applied in plant breeding and seed bank management. Crop Science, 45: 1-7.
  • Kearsey MJ (1998) The principles of QTL analysis (a minimal mathematics approach). Journal of Experimental Botany, 49(327): 1619-1623.
  • Morgante M and Salamini F. (2003) From plant genomics to breeding practice. Current Opinion in Biotechnology, 14: 214-219.
  • Sen S and Churchill GA (2001) A statistical framework for quantitative trait mapping. Genetics, 159, 371-387.
  • Mohammadi SA and Prasanna BM (2003) Analysis of Genetic Diversity in Crop Plants—Salient Statistical Tools and Considerations. Crop Science, 43: 1235-1248.
  • Orr HA. (2005) The genetic theory of adaptation: a brief history. Nature Review Genetics, 6: 119-127.

Funding

Disclaimer

The European Commission support for the production of this publication does not constitute endorsement of the contents which reflects the views only of the authors, and the Commission cannot be held responsi-ble for any use which may be made of the information contained therein.