Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Сообщества организмов. Экологические системы



Глава 8

БИОСФЕРА, ЭВОЛЮЦИЯ И БИОИНФОРМАТИКА

Сообщества организмов. Экологические системы

Биоинформатика и оценка биологического разнообразия. Биологическое разнообразие любой экосистемы может быть определено как полная генетическая совокупность определенной среды, состоящая из всех обитающих в ней видов, включая в целом биосферу нашей планеты. Здесь также нашла место для своего приложения биоинформатика. Основные направления исследования – изучение организации и функционирования биологических систем разного уровня методами и средствами информатики:

· разработка методологических подходов для изучения эволюции живой природы на основе количественных методов оценки генетической структуры популяции и филогенетических связей таксонов видового и надвидового уровней;

· исследование устойчивости экологических систем;

· компьютерное моделирование процессов получения, накопления, обработки и систематизации данных по биоразнообразию.

Рис. 8.1. Функциональная схема информационных потоков при модельных исследованиях структуры биосистем (по [1]).

Так, для сбора видовых имён, описаний, ареала распространения, генетической информации используются разнообразные базы данных. Специализированное, объектно-ориентированное программное обеспечение применяется для поиска, визуализации и анализа информации, и, что еще важнее, предоставления ее другим исследователям – пользователям. Компьютерные симуляторы моделируют популяционную динамику или вычисляют общее генетическое здоровье культуры в агрономии. Одним из важнейших направлений в этой области является анализ последовательностей ДНК или полных геномов целых вымирающих видов, что позволяет запомнить результаты генетического эксперимента природы в компьютере и дает возможность использовать их вновь в будущем, даже если эти виды полностью вымрут. На рис. 8.1 представлена принципиальная схема информационных потоков при модельных исследованиях структуры биосистем. Однако для начала дадим ряд определений, снова воспользовавшись онлайновыми энциклопедиями Глоссарий.Ру [2] и Сельскохозяйственной электронной библиотекой знаний [3].

Сообщество организмов – совокупность взаимосвязанных и взаимозависимых видов в пределах некоторого естественно ограниченного объема пригодного для жизни пространства. Границы сообщества определяются абиотическими и биотическими факторами, а также его способностью к созданию собственной биосреды. Сообщество имеет свою структуру, т.е. соотношение различных групп организмов, различающихся по систематическому положению, роли, которую они играют в процессах переноса энергии и вещества, месту, занимаемому в пространстве, в пищевой или трофической сети или по иному признаку, существенному для понимания закономерностей функционирования естественных экосистем.

Биоценоз (biocenosis; biocenose – от греч. bios – жизнь + koinos – общий) – взаимосвязанная совокупность микроорганизмов, растений, грибов и животных, населяющих более или менее однородный участок суши или водоема. По систематическим признакам биоценоз делится на фитоценоз (сообщество растений), зооценоз (сообщество животных) и микробоценоз (сообщество микроорганизмов). Часто из состава микробоценоза выделяют в качестве отдельного подразделения микоценоз – самостоятельное грибное сообщество. Функционально биоценоз делится по ступеням экологической пирамиды на группы организмов: продуцентов, консументов и редуцентов, объединенных соответствующими трофическими связями. Продуценты – это автотрофные организмы, синтезирующие органические вещества из неорганических (растения). Консументы являются гетеротрофными растительноядными и плотоядными организмами, потребляющими органические вещества (животные). Наконец, редуценты – это гетеротрофные организмы, перерабатывающие останки мертвых растений и животных и переводящие их в минеральные соединения (бактерии, грибы). Биоценоз характеризуется биомассой и биологической продуктивностью.

Дадим определение для фитоценоза (phytocenose; plant community) – это устойчивая естественная группировки видов растений в пределах одного биоценоза. Фитоценоз отграничен от других подобных группировок условно самостоятельным круговоротом веществ. Фитоценоз образует собственную внутреннюю среду: фитоклимат и др. Фитоценоз характеризуют определенный видовой состав, жизненные формы, ярусность, частота встречаемости видов, размещение, внешний вид, жизненность, сезонные изменения, развитие. С этим понятием тесно связано такое понятие, как агробиоценоз (agrobiocenosis; agrocenosis – от греч. agros – поле + koinos – общий ) – искусственно созданный биоценоз (для получения сельскохозяйственной продукции). Агробиоценоз отличается небольшим разнообразием видов, доминированием культурных растений или домашних животных. Агробиоценоз не способен длительно существовать без вмешательства человека, не обладает саморегуляцией, но характеризуется высокой продуктивностью одного или нескольких сортов растений либо пород животных. Основу агробиоценоза составляет агрофитоценоз – совокупность сельскохозяйственных растений.

Между различными, легко физиологически отличимыми сообществами существует переходная полоса, называемая экотон (ecotone – от греч. oikos – жилище + tonos – напряжение). Обычно экотоны населены организмами значительно гуще, чем сами контактирующие сообщества.

Биотоп – это однородный участок суши (или акватории океана), характеризующийся особыми климатическими условиями. Если речь идет о гидрологических факторах, говорят об гидротопе, климатоп характеризует климат биотопа во всех его проявлениях. Наконец, различают также эдафотоп – участок почвенного покрова вместе с частью литосферы и гидросферы, входящих в состав геоценоза.

Экологические системы. Биотоп и биоценоз формируют биогеоценоз (biogeocenosis – от греч. bios – жизнь + ge – земля + koinos – общий), т.е. эволюционно сложившийся, пространственно ограниченный, длительно самоподдерживающийся, однородный комплекс, в котором функционально взаимосвязаны живые организмы и окружающая их абиотическая среда. Этот термин предложил В.М.Сукачев (1940 г). Биогеоценоз характеризуется относительно самостоятельным обменом веществ и особым типом использования потока солнечной энергии. Примерами биогеоценозов являются луга, леса, поля, водоемы. По сути это определение тождественно понятию экологическая система (экосистема) (ecological system; ecosystem). Раздел биологии, изучающий экологические системы (биоценозы, биогеоценозы), называется биогеоценология. Схема на рис. 8.2. характеризует взаимосвязь различных составляющих биогеоценоза и информационные потоки между ними.

Эволюция экосистем идет по пути эволюции сообществ – условно обратимого преобразования старых и образования новых сообществ в результате возникновения видов, формирования ими новых экологических ниш и отбора сочетаний видов. Как правило, при этом увеличивается экологическое разнообразии, т.е. соотношение между числом видов и численностью особей одного вида в экосистеме. Одна из отраслей биоинформатики – вычислительная эволюционная биология исследует происхождение и появление видов и их развитие с течением времени, используя для этого средства информатики. Применение информационных технологий позволяет изучать эволюцию большого числа организмов, измеряя изменения не только в их строении или физиологии, но и в ДНК, сравнивать целые геномы. Это позволяет количественно изучать более комплексные эволюционные события, такие как дупликация генов или их латеральный перенос. На этой основе создают компьютерные модели популяций – основу для предсказания поведения всей системы во времени. Наконец, биоинформатика дает средства для информационного обеспечения исследований, позволяя отслеживать появление публикаций, содержащих информацию о большом количестве видов.

Популяция (от лат. populatio – население) – термин, используемый в различных разделах биологии, а также в генетике, демографии и медицине. Самый общий смысл заключается в дословном переводе. Популяция – это человеческое, животное или растительное население некоторой местности. Известный советский эколог профессор МГУ Н.П.Наумов в 1955 г. выделил три типа популяций: географическую, экологическую и элементарную. При этом географические популяции делятся на экологические, а они в свою очередь – на элементарные популяции.

Рис. 8.2. Взаимодействие элементов в биогеоценозе. Стрелками отражены потоки информации между элементами экосистемы (по [4]).

Географическая популяция – это крупная территориальная группировка особей общего населения вида. Она адаптирована к особенностям климата, рельефа и составу живого населения разных биогеоценозов на большом географическом пространстве ареала вида. Географические популяции обычно разделены преградами (реки, озера, горы и т.д.). Однако это разделение не ведет к полной изолированности популяций. Географические популяции обычно делятся на группы (в зависимости от биогеоценозов, микроклимата и т.д.). Экологическая популяция – это группа особей, обладающая свойством целостности, с особым местообитанием, характеризуется единством экологических реакций на внешние воздействия. У обитателей одного природного сообщества развивается особый, уникальный, но единообразный тип реакций, образа жизни, биологических ритмов. Популяции такого типа отграничены, но не изолированы друг от друга, что довольно часто приводит к обмену генетической информацией. Наконец, элементарная популяция (микропопуляция) – это небольшая группировка особей одного вида в биогеоценозе. В состав входят близкие в генетическом плане особи. Различие между микропопуляциями определяются средой обитания. Однако различия довольно быстро стираются из-за перемещения особей.

8.2. Экосистемы и теория информации

Сложность экосистем. Различные экосистемы в частности и биосфера в целом, как мы видели выше, относятся к очень большим, сложно организованным комплексам. Мы уже говорили в одной из глав о теории планирования эксперимента как методе изучения сложных ("плохо организованных") систем. Другим подходом к их описанию являются кибернетические методы, в частности теория информации. В самом деле, любая сложная система состоит из частей, элементов, между которыми существуют более или менее сильные связи. Тогда наличие данных о состоянии одной части или элемента системы подразумевает наличие информации о состоянии другого, связанного с ним элемента системы. Эта информация тем больше, чем сильнее связь. С технической точки зрения любая такая взаимосвязь может быть представлена в виде канала, по которому от одного элемента к другому передается информация. Задача описания такой системы сводится, в определенной степени, к оценке эффективности передачи информации между элементами системы.

Чем больше элементов в изучаемой системе, тем сложнее бывает проведение информационного анализа ([5], с. 42–43). Так, в двухкомпонентной системе необходимо учитывать связь между ее частями. Появление третьего элемента (или фактора) осложняет ситуацию так называемой "связью между связями". В системе из четырех элементов приходится учитывать связь между одной из частей и комплексом связей и т.д. Кроме того, в системах, состоящих из большого числа элементов, возможен эффект объединения, когда некоторые компоненты системы сильно взаимодействуют между собой, выступая как единое целое по отношению к остальной части системы. Вряд ли можно рассчитать все информационные потоки в таких сложных системах вручную, без применения вычислительной техники. Одна из возможных схем, примененная к эколого-генетическим процессам, приводится ниже.

Теоретико-информационная мера оценки неопределенности. Теория информации, заложенная работами К.Шеннона и Н.Винера [6,7] как сугубо техническая дисциплина, получила широкое распространение в биологии, психологии, лингвистике и других науках естественного и гуманитарного профиля. По сути дела теория информации представляет собой одну из возможных моделей измерения неопределенности. Основные особенности этого подхода изложены в классической работе Г.Кастлера «Азбука теории информации» ([5], с. 25):

«1. Количество информации есть измеримая абстрактная величина, причем ее значение не зависит от объекта, точно так же, как длина, вес или температура имеют физический смысл независимо от природы нагретого объекта или объекта, имеющего длину или вес.

2. Информация связана с ансамблем возможных исходов некоторого события; ее величина зависит от вероятностей этих исходов, но не от их причин и не от их следствий».

Уже в этом определении видна связь теории информации и математической статистики (см. [8]). На этом сходстве, как и на различиях, мы остановимся ниже.

Согласно К.Шеннону и Н.Винеру, количество информации, заключающееся в некоторой группе событий X = {xi}, реализующихся с вероятностями pi = p(xi), равно

H(X) = – S p(xi)log2(p(xi)). (1)

i

Эта формула является отправной для построения всего математического аппарата теории информации. Ее развитие будет представлено в следующих параграфах на примере генетических процессов. Информационная функция, описываемая формулой (1), очень похожа на энтропийную функцию Больцмана. Связь информации с энтропией и их взаимоотношения обсуждаются во многих работах, в том числе в известной книге Л.Бриллюэна «Наука и теория информации» [9].

В (1) используется логарифм по основанию 2, тогда количество информации измеряется в бинарных символах – бит. В принципе, можно использовать и другие основания логарифма. Когда применяются десятичные логарифмы, единица информации называется хартли в честь американского исследователя Р.В.А.Хартли, занимавшегося в 1920-е годы проблемами передачи информации. Если используются натуральные логарифмы, единица информации называется нит.

Отметим некоторые свойства информационной функции (1). Во-первых, ее элементы независимы. Это значит, что функция

Fi = – pilog2pi (2)

зависит только от pi (а не от какого-либо pо). Во-вторых, она непрерывна, так как малые изменения pi ведут к малым изменениям Fi и H(X) в целом. В-третьих, эта функция аддитивна, т.е.

H(X,Y) = H(X) + H(Y). (3)

В-четвертых, функция Шеннона-Винера (10) правильно нормирована. Это значит, что информация от пары равновероятных альтернативных событий (p1 = p2 = 1/2) равна единице:

H(X) = –(1/2 log2 1/2 + 1/2 log2 1/2) = 1. (4)

Как теория информации, так и математическая статистика имеют дело с вероятностями тех или иных событий и занимаются разработкой методов извлечения максимально полной информации из ограниченного запаса наблюдений или экспериментов. Даже строгое определение информации было впервые введено знаменитым статистиком Р.Фишером в его работе, посвященной теории оценок [10]. Это заставляет многих математиков считать теорию информации всего лишь одной из ветвей математической статистики, связанной с одной из возможных мер информации, а именно логарифмической мерой [8]. Это приводит к замене обычных критериев проверки статистических гипотез на информационные (логарифмические). В частности, как отмечает академик А.Н.Колмогоров в предисловии к монографии С.Кульбака, информационный критерий

I = – S (pi–qi)log (pi/qi) (5)

i

оказывается сильным конкурентом стандартного критерия χ 2:

χ2 = S (pi–qi)2/qi (6)

i

при проверке гипотезы о принадлежности выборки pi к одному общему распределению qi.

Общность корней и имеющееся сходство приводят к тому, что в обеих этих дисциплинах часто используются одни и те же методические приемы, в частности многомерные таблицы сопряженности признаков [11]. Однако цели, ради которых они применяются, в статистике и теории информации различны. В математической статистике таблицы сопряженности признаков применяются в корреляционном и дисперсионном анализе для оценки достоверности различий действия разных факторов по отдельности и в совокупности. Та же самая цель оценки различий остается и при использовании в статистике информационной меры различий факторов [12]. Иначе обстоит дело в теоретико-информационном подходе, как это будет видно из дальнейшего изложения. Здесь таблицы сопряженности признаков являются инструментом для построения так называемых каналов связи и вычисления на этой основе коэффициентов передачи информации от одних факторов (совокупностей факторов) к другим.

Математический аппарат теоретико-информационного подхода [13]. Пусть явление Y имеет m состояний y1,y2,...,ym, а каждый из N факторов Xi имеет n (i) различных состояний x1,x2,...,xn(i). Когда состояния фактора и явления xij и yk независимы, вероятности их одновременного наблюдения связаны между собой хорошо известной формулой

p(yk,xij) = p(yk)p(xij). (7)

При этом для условной вероятности наблюдения состояния yk при условии, что состояние xij уже реализовалось, справедливо равенство

p(yk/xij) = p(yk,xij)/p(xij) = p(yk)p(xij)/p(xij) = p(yk). (8)

Любое взаимодействие между xij и yk нарушает равенство (8). В частности, когда p(yk/xij) > p(yk), говорят, что информация передается от xij к yk. Задача исследователя на первом этапе сводится к отысканию таких взаимодействующих пар yk,xij и к оценке степени этого взаимодействия.

Для этого в теории информации вводятся энтропийные функции

H(Y) = – S p(yk)log2(p(yk)), (9)

k

H(Xi) = – S p(xij)log2(p(xij)), (10)

j

H(Y/xij) = – S p(yk/xij)log2(p(yk/xij)), (11)

k

I(Y,xij) = H(Y) – H(Y/xij), (12)

T(Y,Xi) = S p(xij)I(Y/xij). (13)

j

Здесь H(Y) – максимальная энтропия явления Y, H(Xi) – максимальная энтропия действующего фактора i, H(Y/xij) – условная энтропия явления Y для некоторого фиксированного состояния xij. Физический смысл I(Y,xij) – это условная информация, которую можно получить о любом состоянии явления Y при некотором фиксированном состоянии фактора xij. Средняя информация, содержащаяся в такой системе, дается выражением T(Y,Xi).

Из сопоставления формул (9)–(13) видно, что

T(Y,Xi) = H(Y) + H(Xi) – H(Y,Xi) = T(Xi,Y), (14)

где H(Y,Xi) определяются аналогично H(Y) и H(Xi). Формула (14) говорит, что с теоретико-информационной точки зрения совершенно безразлично, передается информация от Xi к Y или наоборот. Это может быть важно при решении обратной задачи – предсказании значения действующего фактора по известному состоянию явления. Эффективность передачи информации от Xi к Y и от Y к Xi при этом определяется формулами

K(Y;Xi) = T(Y,Xi)/H(Xi), K(Xi;Y) = T(Xi,Y)/H(Y). (15)

Таким путем можно рассчитать все 2 N коэффициентов K(Y;Xi) (прямые информационные потоки) и K(Xi;Y) (обратные информационные потоки) и ранжировать все действующие факторы по величине их влияния на результирующее явление и наоборот. Затем можно редуцировать количество действующих факторов, отбросив те из них, которые дают наименьшую информацию о системе. Дальнейший многофакторный анализ, в котором учитывается взаимодействие двух, трех, четырех и т.д. действующих факторов, ведется уже только по наиболее информативным из них. Формулы для оценки степени взаимодействия факторов аналогичны (9)–(13), где в качестве аргумента стоят сочетания Xi,Xj, Xi,Xj,Xk и т.д. Здесь, правда, встает проблема удобной для биологов интерпретации и верификации полученных оценок, что нуждается в специальном обсуждении.

а б

Рис. 8.3. Пример работы программы ТИА 2.1: а – однофакторный анализ; б – многофакторный анализ.

Для анализа эколого-генетических взаимодействий нами была разработана программа под операционную систему (ОС) MS DOS. К началу XXI века эта программа морально устарела, что потребовало ее адаптации по образцу стандартных программных продуктов на платформе ОС MS Windows. В 2002 г. нами была разработана первая версия такого программного обеспечения, совместимая с форматом Excel, в настоящее время существенно модифицированная. В отличие от ранее созданных систем, новая программа предоставляет пользователю все возможности, предусмотренные Excel. В программный блок входят ввод данных, скрининг факторов на наиболее информативные и собственно многофакторный анализ данных с использованием средств Excel.

Так, в частности, программа осуществляет расчет информативности тех или иных анализируемых факторов, комбинации которых, как и отнесение их к действующим или результирующим, можно задавать вручную, в зависимости от желания исследователя. Разбиение анализируемых данных на классы осуществляется в автоматическом режиме. В табличном виде приводятся расчеты всех основных энтропийных функций, необходимых для анализа. Окончательные результаты расчетов информативности исследуемых факторов и их комбинаций (прямые и обратные коэффициенты передачи) автоматически выводятся на монитор как в табличном, так и в графическом виде. Возможно также их сохранение в соответствующих книгах Excel с последующей распечаткой на принтере. Кроме того, предусмотрен «послойный» вывод отдельных состояний факторов и визуализация их неслучайных комбинаций как элемент этапа прогнозирования.





Дата публикования: 2015-01-14; Прочитано: 826 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.015 с)...