Введение
Экспертная система (ЭС) – это программа, заменяющая человека-эксперта. Потребность в ней возникает, когда требуется получить взвешенное обоснованное решение в условиях дефицита, слабой структурированности и большого разнообразия источников исходной информации. К сожалению, для построения однозначных фундаментальных моделей, полноценно описывающих динамику объекта исследований, зачастую на хватает информации. В этой ситуации прогноз состояния природного объекта приходится делать на основе вероятностных или логических методов, аналогичных мышлению специалиста-эксперта.
Главное достоинство любой экспертной системы состоит в попытке воспроизвести мышление эксперта и при этом использовать гораздо больший объем данных и знаний, чем может вместить поле зрения отдельного исследователя. Экспертная система аккумулирует и сохраняет в своей структуре навыки и умения экспертов, строящих и развивающих ее. Роль экспертной системы состоит в том, чтобы рекомендовать то или иное решение выхода из проблемной ситуации. В отношении экологических задач это может быть как текущая оценка состояния природных экосистем, так и прогноз их динамики при том или ином уровне антропогенных воздействий (рубка леса, разработка недр, гидротехническое строительств и пр.). Значимость построения экспертных систем состоит еще и в том, что имеющаяся информация целенаправленно концентрируется и структурируется, разрабатываются планы по развитию и расширению информационной базы, оптимизации методов ее наполнения и обработки. Например, система REGION, которая на момент создания позиционировалась как экспертная (Костина и др., 2003; Волжский…, 2011), к настоящему времени накопила знания в форме строгих формализованных описаний зависимостей между природными компонентами и тем самым превратилась в полноценную информационную систему (Костина, 2015), обладающую гораздо большим прогностическим потенциалом. В этом ключе создание экспертной системы для Онежского озера мы рассматриваем как средство консолидации накопленных данных и знаний, в том числе с целью осуществления и развития мониторинга его состояния.
К текущему моменту многие компоненты карельских озерных экосистем достаточно хорошо изучены, что позволило сформировать экспертную систему для оценки их состояния и трофического статуса (Меншуткин и др., 2009, 2009а), кроме самых крупных – Онежского и Ладожского озер. Однако в эту систему не был включен зоопланктон вследствие широкой изменчивости исходных данных. Зоопланктон Онежского озера изучается лабораторией гидробиологии (Институт водных проблем Севера КарНЦ РАН) достаточно давно и с определенной регулярностью, что дает возможность взять эту группу за основу при создании экспертной системы.
В этой связи цель нашей публикации состоит в том, чтобы детально описать этапы работы по созданию диагностической экспертной системы на примере зоопланктона, сформулировать требования к данным и предложить путь оптимизации мониторинга за состоянием зоопланктона.
Материалы
В основу работы положен опыт анализа данных по зоопланктону Онежского озера, полученных в период с 1970 по 2016 г. (Сярки, Куликова, 2012).
Зоопланктон пелагиали Онежского озера достаточно хорошо изучен. Описаны состав и биоразнообразие, численность и биомасса зоопланктона, как основных групп, так и отдельных видов. Изучены пространственное распределение, сезонный ход изменения показателей в годовом цикле и его межгодовые колебания. Описаны основные закономерности трансформации сообщества зоопланктона при воздействии антропогенных факторов (в Кондопожской губе) (Сярки, 2008, 2015; Куликова и др., 1997; Куликова, Сярки, 2004 и др.).
Для показателей состояния зоопланктона характерна высокая пространственно-временная изменчивость. Причинами являются морфометрическая гетерогенность озера, в северо-западной части которого находятся крупные вытянутые заливы (Петрозаводская, Лижемская, Кондопожская губы, Повенецкий залив), а также множество небольших заливов, имеющих северо-западное простирание. Природную гетерогенность физико-химических характеристик экосистемы озера усиливает антропогенный фактор – максимальные концентрации фосфора и органического вещества наблюдаются в наиболее загрязненных Кондопожской и Петрозаводской губах.
Существенное различие в гидрологическом, температурном, физико-химическом режимах в разных районах озера накладывает глубокий отпечаток на тип и характер функционирования живых организмов. Онежское озеро представляет собой холодноводный водоем, в котором сезонная цикличность планктонных сообществ ярко выражена. Основные фенологические фазы развития биоты (начало вегетационного периода, максимальные уровни численности и разнообразия, спад и переход к зимнему состоянию) в разных районах озера протекают в разные календарные даты, что определяется явлением термобара и временным разделением водоема на термоактивную и термоинертную зоны. В период весеннего термобара прогретая вода в заливах более чем на месяц (примерно в середине мая – июне) отделена от более холодной основной водной массы в глубоководной части озера. В этот период в северо-западных заливах накапливаются речные воды, резко изменяются гидрохимические показатели – повышается содержание органических, биогенных, взвешенных веществ. Лишь к середине лета формируется прямая температурная стратификация во всех районах озера. Пелагический планктон обладает ярко выраженной пространственно-временной динамикой, которая отмечается как неоднородность состояния планктона в разных областях акватории, особенно в весенний и раннелетний периоды, и объясняется различными фазами сезонного развития в термоактивной и термоинертной зонах озера. Кроме того, в указанный период ярко проявляется межгодовая изменчивость в сроках прогревания воды и скорости весенней сукцессии планктона.
Высокая пространственная гетерогенность и специфические черты биоты Онежского озера предопределяют сложность ее изучения и необходимость развития особых подходов к оценке ее состояния.
Наблюдаемая высокая изменчивость показателей зоопланктона связана с действием сезонных факторов (температура, трофические условия, свет, стратификация и т. д.). Тем не менее существуют предпосылки объяснения как пространственного, так и временного компонентов этой изменчивости (а значит, уменьшения ошибки прогноза). Во-первых, большие размеры и инертность водных масс Онежского озера определяют постоянство условий и однородность сообществ зоопланктона в центральной глубоководной части озера. Во-вторых, сезонная динамика устойчиво воспроизводится от года к году, что позволило формализовать ее в виде модели (Сярки, Чистяков, 2013) и уменьшить неопределенность показателей в годовом цикле, тем самым увеличив их информационную значимость. Эти подходы позволили рассматривать сообщество зоопланктона как весьма информационный показатель для оценки состояния экосистемы озера в его центральной части и крупных губах.
Зоопланктон является важнейшим звеном озерной экосистемы. Его составляют животные, размеры которых различаются на 3–4 порядка. Самые мелкие имеют размеры от 50 мкм (0.050 мм), крупные достигают размеров до 1–1.5 см. В основном зоопланктон пресных вод представлен видами рачков (веслоногие и ветвистоусые) и коловраток.
Зоопланктон является ключевым звеном в системе передачи энергии и органического вещества от продуцентов к высшим трофическим звеньям, в том числе рыбам. Таким образом, он участвует в формировании биоресурсов озера. Так, основную долю уловов (60 %) в Онежском озере составляют планктофаги (Сярки, 2010).
Сообщество зоопланктона Онежского озера – это многокомпонентная сложная система с развитыми связями, обладающая нелинейностью, разномасштабными структурами и процессами. Как центральное звено в трофической сети пелагиали зоопланктон участвует в самоорганизации планктонной системы озера и обеспечивает ее устойчивое функционирование. Сообщества зоопланктона являются регуляторами сукцессионных процессов и проводниками Top-Down и Bottom-Up эффектов в пелагиали озера.
Тесная связь с другими компонентами экосистемы и факторами среды позволяет использовать зоопланктон в качестве индикатора в системе биомониторинга экосистемы озера.
Традиционные методы исследований
Традиционные методы исследования зоопланктона состоят в отборе проб (с помощью планктонной сетки), их фиксации и последующей камеральной обработке. Сохранение единой методической схемы позволяет сравнивать современные данные с материалами 1960–1980-х годов (Зоопланктон Онежского озера, 1972; Куликова, 1982). Для изучения мелкой фракции зоопланктона были использованы другие методы и получены количественные величины, сильно отличающиеся от данных сетных уловов (Куликова и др., 1997).
Схема расположения станций позволяет отразить пространственное распределение показателей зоопланктона (рис. 1) (Сярки, 2010). Точки станций неравномерно распределены по акватории озера и сконцентрированы в Кондопожской и Петрозаводской губах (рис. 1 А) в связи с задачей детально изучать зонирование акваторий от антропогенного воздействия. Вертикальное распределение изучается на стандартных горизонтах (0–5, 5–10, 10–25, 25–50, 50–75, 75–100).
Периодичность отбора проб в период наблюдений была различной (рис. 1 Б). В некоторые годы (1960, 1988, 1989, 1991, 1993, 2016) пробы отбирались с периодичностью по 4–6 раз в год на 6–10 станциях. Чаще проводились одноразовые съемки в различных районах озера с отбором на постоянных 10–15 мониторинговых точках. Сезон отбора проб в этом случае сильно варьировал по годам (май – сентябрь) и определялся финансовыми и людскими ресурсами лаборатории.
Рис. 1. Места (А) и периодичность (Б) отбора проб на акватории Онежского озера
Fig. 1. Points (A) and sampling periodicity (Б) the area of Lake Onega
Пробы фиксировались 4 % формалином, затем проводилась камеральная обработка проб с идентификацией видов (Комплексное гидрохимическое..., 2011). В результате в каждой пробе определялись общие численности и биомассы зоопланктона, количество его основных систематических и трофических групп, половая и размерно-возрастная структура популяций составляющих планктон видов. Всего в зависимости от сезона – 20–40 параметров на каждую пробу, а именно – набор видов, половозрастные группы, их численность и биомасса.
Традиционная классификационная экспертная система ориентирована на получение качественного ответа в терминах «хорошо – плохо» или выбора одного из нескольких заранее определенных вариантов (например, при диагностике заболевания). В арсенал средств экспертных систем входят алгоритмы логических умозаключений из серии посылок (логические решающие правила), а техника самой работы состоит в опросе пользователя по серии вопросов, ответы на которые логически связываются в общее заключение. В основе такой системы лежит множество импликаций (утверждений вида «если…, то…»), связывающих имеющуюся в базе данных информацию с ограниченным числом возможных ответов. В процессе опроса пользователя полученная информация аккумулируется в виде накопления шансов в пользу того или иного варианта решения, а полученный вывод выражает оценки вероятности каждого из них. Развитые экспертные системы для формулирования качественного заключения используют разнообразные алгоритмы обработки количественной информации (построение деревьев классификации и регрессии, исчисление предикатов, байесовский классификатор, логистическая регрессия). Например, экспертная система для оценки трофического статуса озер Карелии, использующая алгоритмы нечеткой логики, основана на частотных таблицах сопряженной встречаемости представителей фауны и флоры. Основной расчетной величиной взята «функция принадлежности», которая принимает значения от 0 до 1 и интерпретируется как численная мера «значимости» импликации.
Упрощенно типичная экспертная система состоит из следующих компонентов (Таунсенд, Фохт, 1990; Джарратано, Райли, 2007 и мн. др.):
база знаний (база данных, база правил),
блок приобретения знаний (ввод, обучение),
управляющий компонент (решатель, интерпретатор),
средства общения с пользователем (оформление запроса, вывод объяснений).
Эта схема легла в основу наших дальнейших построений.
Оригинальные методы исследований
Мы рассматриваем экспертную систему как эффективную стратегию, которая позволяет учесть и формализованно описать эмпирически установленные структурно-функциональные особенности всего комплекса гидробионтов экосистемы Онежского озера.
Ниже будет рассмотрено наше видение путей формирования экспертной системы на примере анализа зоопланктона Онежского озера. Выбор пал всего лишь на одну группу организмов по двум причинам. Если рассматривать все компоненты экосистемы Онежского озера, что можно сразу же утонуть в огромном количестве изучаемых переменных. А наша задача состояла в выработке принципиальных подходов к формализованному представлению имеющихся данных. Кроме того, зоопланктон редко используют при моделировании экосистем, поэтому наше внимание не будет отвлекаться на стереотипные подходы к его описанию. Выбор одного из экосистемных компонентов позволит упростить изложение материала и как можно прозрачнее показать принципы организации планируемой экспертной системы. Это открывает путь для последующего включения в состав экспертной системы других биотических сообществ озера. Кроме того, едва ли не главной задачей является поиск принципиальных путей оптимизации мониторинга состояния как зоопланктона, так и других сообществ озерной экосистемы для уточнения признаков нарушения ее состояния.
Экспертная система включает в себя два главных компонента – блоки модели объекта и блоки экспертной оценки состояния объекта. Сопоставляя результаты моделирования с заранее выработанными критериями «нормы» и «нарушения», получаем оценку текущего состояния зоопланктона (рис. 2).
Рис. 2. Схема экспертной системы
Fig. 2. Scheme of expert system
В соответствии с системным подходом (Коросов, 2002) построение любой «системы» необходимо вести, отталкиваясь от простой конструкции в направлении более полноценной модели путем последовательной дифференциации ее компонентов (в структуре, пространстве и времени), стараясь включить в нее все имеющиеся знание. Такой подход гарантирует изначальную интегрированность и, следовательно, управляемость модельного построения. В рамках экспертной системы модель биосистемы представляет собой «базу знаний»; в свою очередь, создание и развитие модели биосистемы представляет собой процесс «обучения» на основе имеющихся знаний.
Структура базы знаний
Связи между компонентами изучаемой системы описываются моделью динамики зоопланктона, которая основана на состоянии среды обитания (физико-химические компоненты экосистемы) и имеет выходом оценки его численности. Простейшим вариантом исходной модели зоопланктона можно взять конечный автомат с ограниченным числом дискретных переходов между ясно различимыми состояниями (рис. 3). Условием переходов могут быть определенные уровни таких характеристик среды, как фотопериод, температура, минерализация, органическое загрязнение. Простейшая модель будет состоять из 5 или 7 переходов между 3–5 состояниями в разные сезоны года, одно из которых можно определить как опасное или критическое.
Рис. 3. Простейшая модель биосистемы в виде конечного автомата
Fig. 3. Simplest model of biosistem as a finite state machine
Таким образом, результат работы автомата будет определяться текущим уровнем абиотических и антропогенных факторов. В экспертной системе, основанной на такой модели, важнейшим моментом оказывается определение границы «нормы» и «патологии» состояния зоопланктона. Идти к этой оценке можно бесконечно долго, однако для грубой дискретной модели эта граница очевидна. Для загрязняемых акваторий Онежского озера летняя биомасса зоопланктона выше 2 г/куб. м говорит о серьезных физико-химических отклонениях в составе воды. Применяя такую модель к конкретному составу воды, можно сразу получить оценку состояние зоопланктона.
Развитие (дифференциация) базовой модели в пространстве состоит в разбиении всего водного пространства (акватории) Онежского озера на крупные блоки, в каждом из которых выполняется самостоятельное моделирование динамики зоопланктона. Важнейший вопрос, который при этом придется решать, это размер (площадь, объем) таких блоков (камер), т. е. по существу вопрос о репрезентативности отдельных проб, возможностях экстраполяции точечных оценок на площади акватории. Результатом этого этапа станет карта акватории, на которую наносятся меняющиеся по сезонам параметры состояния. Первоначально ячейки могут рассматриваться изолированно, а в дальнейшем будут объединены связями переноса в общую камерную модель (это необходимо, например, для имитации распространения физико-химических водных компонентов – температуры, загрязнителей и пр.). При этом не обойтись без вертикальной стратификации для учета явлений осаждения (Литвинова, Коросов, 1998).
Развитие (дифференциация) базовой модели во времени состоит в разбиении времени жизни модели на периоды (сезоны, фенофазы). Простейший вариант – оценка состояния группы в отдельный (летний) сезон. Учитывая высокую скорость репродукции популяций этой группы, сложно построить модель с учетом преемственности поколений. Выходом может быть, видимо, реконструкция динамики численности в отдельном блоке и использование всего этого ряда (например, из 4–5 значений для отдельных фенофаз) при сравнении с другими рядами из других частей акватории. Очевидно, что в отдельные сезоны состоянию «норма» будут соответствовать разные уровни численности. Это значит, что оценка отклонений от «нормы» зоопланктона в данной части акватории будет более полноценной, если сравнивать не единичные значения, а их наборы, представляющие сезонную динамику. Другой, более важный аспект развития модели во временном плане – это реконструкция многолетней динамики на фоне изменения климатических условий (Филатов и др., 2014) и антропогенной нагрузки (Калинкина и др., 2016). Для реализации этих моделей и построения прогнозов по ним необходимо составить карты распространения ключевых физико-химических компонентов экосистемы по годам. Зная положение дел (Крупнейшие озера-водохранилища..., 2015), необходимо построить имитационные реконструкции распределения указанных компонентов по акватории, а также прогноз такого распределения на следующие годы.
Структурное развитие (дифференциация) базовой модели будет иметь два аспекта. Очевидно, что должно быть выполнено раздельное моделирования динамики отдельных компонентов зоопланктона (трофических и таксономических групп). В качестве метрик могут выступать как преобразованные оценки численности групп, так и полученные на их основе экологические индексы. Не менее очевидно, что безусловные переходы конечного автомата из одного состояния в другое придется сделать вероятностными с использованием, например, байесовской формулы. Поскольку вероятность смены состояний может определяться широким спектром факторов (как внешних абиотических, так и внутренних биотических), значит для их учета необходимо рассчитывать накопление шансов сменить состояние. Байесовский подход предполагает независимость частных вероятностей (Баженов, 2016а), что для биологических систем неправдоподобно и не позволяет оценить степень участия каждой переменной в выборе (Гублер, 1978). Возможно, придется апробировать новый подход, учитывающий зависимость внешних обстоятельств при расчете вероятностей выбора, – метод MaxEnt (Баженов, 2016). На этом пути, вероятно, полезными окажутся традиционные статистические методы оценки апостериорной принадлежности объекта к той или иной группе – методы логистической регрессии (Шитиков и др., 2003; Леонов, 2016), дискриминантный анализ, нейронные сети и пр. Однако уже имеющийся опыт (Сярки, Чистяков, 2013) говорит о том, что при столь широкой изменчивости и, следовательно, очевидной неточности оценок численности зоопланктона не следует рассчитывать на то, что точные статистические методы позволят уточнить исходно неопределенные оценки.
Обобщая изложенные подходы, видится следующая композиция экспертной системы. В ее основе лежит камерная модель перехода между состояниями (например, зоопланктона), распространенная на всю акваторию и на все годы исследований. Переход из одного состояния в другое осуществляется по вероятностной матрице переходов, составленной при исследовании связей между зоопланктоном и условиями обитания. Для выполнения таких переходов во всех ячейках модели предварительно строится карта (камерная модель: ячейки акватории связаны функциями переноса) уровней физико-химических характеристик воды акватории. Результатом наложения модели смены состояний зоопланктона на модель переноса компонентов воды выступает карта пространственного распределения состояний зоопланктона. Сопоставляя карту с заранее принятыми критериями «нормы» и «нарушения», получаем карту зон обычного и аномального состояния зоопланктона. В данном случае роль экспертной системы состоит в целесообразной интеграции имеющихся знаний и выработке критериев «нормы» для состояний зоопланктона.
Очевидно, что в процессе расширения и углубления экспертной системы будут меняться как полнота информации, так и алгоритмы формирования знаний и принятия решений (такова, например, динамика экспертной системы по озерам Карелии – Чухарев, 2011).
Выбор числа решений
Перед планируемой экспертной системой будет стоять один вопрос – оценить в качественных категориях состояние экосистемы на данной акватории Онежского озера по показателям зоопланктона. В отношении зоопланктона предлагаемая экспертная система призвана давать оценку вероятности одного из двух альтернативных решений – «состояние нативное», «состояние нарушенное». С ростом числа гидробиологических, гидрохимических, гидрофизических и пр. объектов, включенных в экспертную систему, количество классов возможных решений может возрасти или же она может обрести несколько блоков принятия разного числа решений. Учитывая ограниченный объем информации по динамике численности зоопланктона, указанный вопрос должен быть ориентирован на годовой отрезок времени, а именно: «Каков характер динамики зоопланктона (в данной части акватории озера) в данном году: естественный или нарушенный?» Вопрос о том, что следует считать «естественным» состоянием, можно решить, используя имеющиеся материалы гидрохимических и гидробиологических исследований, выполненных в разных областях Онежского озера – как в загрязненых акваториях, так и не испытывающих антропогенной нагрузки. Нами уже выполнены описания зоопланктона Онежского озера по районам, а именно, среднемноголетнее его состояние, даны оценки межгодовых колебаний, экспертные оценки сильных отклонений от среднемноголетнего хода кривых и выяснение их причин (вынос сточных вод, изменение термического режима и т. д.) (Геоэкологические закономерности..., 2012; Биогеохимические критерии..., 2016).
Основой для таких сравнений может выступить модель «типичной» посуточной динамики и распределения вокруг нее оценок численности зоопланктона Онежского озера, полученной методами взвешенного сглаживания (Сярки, 2013), а также с помощью аппроксимации заданной функцией многолетних рядов данных (Сярки, Чистяков, 2013). Степень отклонения данных от модели может быть выражена количественно, в том числе в вероятностных показателях, и стать критерием «нормы» и «экстремальности» состояния зоопланктона.
Рассмотренные процедуры могут служить только прологом для собственно работы эксперта, который дает заключение о «нормальности» состояния биосистемы. В первом варианте экспертная система будет ориентироваться на мнение эксперта (в случае с зоопланктоном – М. Т. Сярки) о критериях отнесения того или иного состояния данного компонента экосистемы к норме.
Алгоритм принятия решений
В простейшем варианте экспертная система призвана дать рассматриваемому состоянию зоопланктона одну из двух оценок: «хорошо» или «плохо».
Более развитая формулировка проблемы состоит в том, чтобы для конкретного набора характеристик природного объекта оценить вероятность его принадлежности к тому или иному классу. Эта процедура классификации состоит в поочередной обработке предоставленных данных по ранее построенным правилам и получении вероятностного ответа на вопрос.
В отношении биологических объектов обычно используются следующие процедуры разнесения объектов по заранее заданным классам с использованием количественных и качественных характеристик: дискриминантный анализ, нечеткая логика, байесовский классификатор, логистическая регрессия, метод максимума энтропии, искусственные нейронные сети и пр. В нашем случае дискриминантный анализ не подходит, поскольку, во-первых, распределение изучаемых характеристик не соответствует нормальному, во-вторых, используются не только количественные показатели, в-третьих, результат выдается в виде непрерывной величины, а не в форме рекомендаций (вероятности) для выбора альтернативы (Мурадов, 2011; Бабушкин, 2016). Методы нечеткой логики ориентированы на анализ взаимозависимости нескольких метрик (Круглов и др., 2001; Меншуткин и др., 2009; Паклин, 2016) и вполне могут быть уместны в многокомпонентной экспертной системе. Структура же имеющихся данных такова, что из числа существенных общих факторов, влияющих на зоопланктон, можно назвать лишь сумму накопленных температур в весенний период, задающих всего две градации существенно различных типов динамики зоопланктона – «ранняя весна» и «типичная весна». Для таких ограниченных данных применять аппарат нечеткой логики представляется избыточным. Использование нейронных сетей в нашем случае вряд ли будет эффективно, поскольку для их построения, как правило, требуются большие объемы исходной информации (чем мы не располагаем), а векторы «нагрузок» для учитываемых переменных не несут биологического смысла. Точные прогнозы могут быть получены и с использованием методов бутстреп-агрегирования деревьев: бэггинга (bagging) (Шитиков, Мастицкий, 2017).
Байесовский классификатор прост в использовании, однако, во-первых, он предполагает независимость изучаемых характеристики, во-вторых, оценивает вероятность решения с помощью обратного преобразования отношения шансов и поэтому может накапливать ошибку, а также не позволяет оценить степень участия каждой переменной в диагнозе (Гублер, 1978; Баженов, 2016). Классификация методом логистической регрессии (Шитиков и др., 2003; Леонов, 2016) и методом максимальной энтропии (Баженов, 2016) строится с учетом возможной зависимости между изучаемыми переменными, выдает вероятностные оценки для каждого из альтернативных решений.
Базы данных
В основу работы положена база данных по зоопланктону Онежского озера (Сярки, Куликова, 2012), которая содержит первичные данные обработки 1300 проб на 425 станциях с 1988 г. по настоящее время (формат – таблица MS Excel, объем 10 Мб). База содержит информацию об организмах зоопланктона, об их таксономической принадлежности, поле, возрасте и количестве в пробе, всего 47 тыс. строк; все данные имеют пространственно-временную привязку: дату и координаты места отбора проб.
Число и состав учитываемых характеристик определяется наличными данными. Поскольку по категориям «хорошо – плохо» классифицируется такой объект, как годовая динамика численности зоопланктона, рассмотрим набор ее характеристик. Сезонная динамика зоопланктона характеризуется многократным изменением численности, следовательно, корректно сопоставлять можно только значения для конкретных фаз сезонного цикла. Например, можно отдельно говорить про 4 фазы естественной периодизации для зоопланктона (Сярки, 2013). Динамика зоопланктона во многом определяется температурными и трофическими факторами среды, в силу чего в отдельные годы сходные фазы динамики смещаются по времени. Следовательно, актуальна разработка метода выделения сезонных фаз (Сярки, 2013; Сярки, Фомина, 2014). Поскольку в течение года соотношение отдельных групп зоопланктона изменяется, исходный массив может быть представлен четырьмя систематическими группами (коловратки, веслоногие, ветвистоусые, каляноиды) и двумя-тремя индикаторными видами. Таким образом, состояние зоопланктона для отдельного года будут представлять 6 характеристик (6 пар распределений). Значения этих характеристик – единицы обилия. В практике гидробиологических исследований бытуют численность, биомасса, комплексные показатели на их основе (Шитиков и др., 2003). Кроме того, в экспертных системах часто используются условные показатели, назначенные конкретным значениям по заранее разработанным шкалам, например показатели «принадлежности», «информационной значимости» (Меншуткин и др., 2009), «желательности» (Адлер и др., 1976), «относительной важности» (Саати, Кернс, 1991) и др.
Многие из полезных характеристик можно почерпнуть из Интернета. Для Онежского озера в открытом доступе есть данные по температуре, количествe органического вещества, взвесей (ESA, 2016; GRHSST, 2016), концентрации хлорофилла (Plymouth marine laboratory, 2016). Используя материалы сайтов, можно получить временные ряды для этих показателей за последние 10–20 лет. Важно отметить, что получение данных с указанных сайтов можно прописать как внутренние процедуры экспертной системы, что позволит не хранить, но непосредственно получать актуальные данные.
Помимо физико-химических факторов, в систему должны быть включены пространственные географические данные – координаты точек отбора проб, модельные карты акваториальных зон распространения изученных гидрологических процессов (Сярки, 2010), в том числе внешние данные с указанных сайтов. Среда ГИС дает возможность не только ввести в анализ географические характеристики объектов, но также выполнить пространственную экстраполяцию прогнозных оценок, наглядно показав зоны благополучия и нарушения естественных экологических процессов (Коросов, Коросов, 2006).
Пополнения баз данных: практика мониторинга состояния зоопланктона
Развитие предлагаемой экспертной системы видится в существенном расширении базы фактических данных по зоопланктону. Достичь это можно, модифицировав практику выполнения мониторинга, а именно – резко увеличить количество собираемых проб – географически и хронологически, отказаться от видовой диагностики, перейти на автоматизированные методы распознавания при разборе проб. Увеличение числа отбираемых проб возможно при использовании (аренда, подряд) современных высокоскоростных катеров, широко применяемых сейчас для троллинга во всех частях Онежского озера. Возможна организация отбора проб со специальных, рейсовых и туристических, судов, выполняющих маршруты по акватории Онежского озера (как это делают зарубежные коллеги на паромах Балтийского моря).
Разбор части проб для выполнения экстренных задач мониторинга можно существенно упростить, проводя определение только основных групп, составляющих зоопланктон, и некоторых индикаторных видов (например, Daphnia cristata). Для ускоренной разборки большого числа проб по упрощенной методике можно привлекать исполнителей из числа сотрудников других подразделений КарНЦ РАН. Кроме того, можно воспользоваться системами распознавания фотографий проб, аналогичными распознаванию паразитов при клинических медицинских исследованиях (iMICROTEC, 2016). Для исследования размерных фракций сестона и планктона и поведения в нем движущихся организмов зоопланктона возможно применение цифрового голографического прибора, разработанного в Физико-техническом институте Петрозаводского государственного университета (Ekimov et al., 2010; Ипатов и др., 2015). Прибор позволяет измерять амплитуду и фазу оптической волны в произвольном сечении объема измерения без необходимости какого-либо сканирования. За счет этого достигается большая глубина резкости, на порядок превышающая значения, характерные для обычного микроскопа с такой же разрешающей способностью, в результате чего оказывается возможным измерить координаты и форму объектов в объеме и в динамике.
Программная реализация
Интерфейс экспертной системы проще всего представить как web-сайт и создать на языке Java (Java, 2016). Ведение баз данных можно также написать на языках Java или R (The R…, 2016). Организовать источник картографических данных для ГИС (карты, снимки, статистические поверхности) можно в среде QGIS (Коросов, Зорина, 2016), однако выполнять считывание географической информации с подготовленных подложек следует в среде R. Программы для расчетов следует написать на R и оформить как встроенные процедуры. В среде программирования R (The R…, 2016) реализованы все необходимые процедуры обработки данных (Мастицкий, Шитиков, 2014; Jurka, Tsuruoka, 2013; Шитиков, Мастицкий, 2017).
Обсуждение
Наиболее интересный и наиболее сложный вопрос организации экспертной системы по зоопланктону состоит в необходимости учитывать изменчивость этой группы в контексте сезонной динамики условий обитания. Иногда проблема оценки взаимной зависимости компонентов экосистем карельских озер (Меншуткин и др., 2009) решается с помощью перекрестной таблицы частот совместной встречаемости, т. е. как обобщение статичной информации. В другом варианте (Волжский бассейн, 2011) для выражения зависимости планктона от факторов среды приняты многомерные и эволюционные методы, поскольку объемы накопленной информации позволяют выполнять строгий количественный анализ этой зависимости. В нашем случае есть возможность учесть изменение объекта во времени, но информация весьма фрагментарна. Таким образом, стоит задача восстановления информации (передача данных) для целей классификации состояний. Решение проблемы сопряжения динамических рядов откроет дорогу для включения в экспертную систему других биотических и абиотических компонентов озерной экосистемы.
Заключение или выводы
1. Зоопланктон рассматривается как удобный и надежный индикатор в системе биомониторинга состояния пелагического планктона и экосистемы озера в целом.
2. Предлагаются принципы консолидации накопленной информации по зоопланктону Онежского озера в форме экспертной системы с целью оптимизации мониторинга состояния зоопланктона и озерной экосистемы в целом.
3. Предлагается реорганизация мониторинга зоопланктона в направлении роста его масштабности: увеличение числа проб, расширение географии и упрощение процедуры разбора проб, в том числе путем ее автоматизации.
Библиография
Адлер Ю. П., Макарова Е. В., Грановский Ю. В. Планирование эксперимента при поиске оптимальных условий . М.: Наука, 1976. 280 с.
Бабушкин Э. Когда дискриминантный анализ предпочтительней логистической регрессии // Блог про HR-аналитику. URL: http://edwvb.blogspot.ru/2014/02/chem-diskriminantnyjj-analiz-predpochtitelnyjj-logisticheskojj-regressii.html (дата обращения 26.05.2016).
Баженов Д. Классификация методом максимальной энтропии . URL: http://bazhenov.me/blog/2013/04/23/maximum-entropy-classifier.html (дата обращения 26.05.2016).
Баженов Д. Наивный байесовский классификатор . URL: http://bazhenov.me/blog/2012/06/11/naive-bayes.html (дата обращения 26.05.2016а).
Биогеохимические критерии состояния экосистемы Онежского озера и ее устойчивости к антропогенному воздействию : Отчет о научно-исследовательской работе ИВПС КарНЦ РАН. № гос. регистрации 01201362240. Петрозаводск, 2016. 267 с.
Волжский бассейн. Устойчивое развитие: опыт, проблемы, перспективы / Под ред. Г. С. Розенберга. М.: Институт устойчивого развития Общественной палаты Российской Федерации; Центр экологической политики России, 2011. 104 с.
Геоэкологические закономерности устойчивого функционирования крупных озер и водохранилищ Северо-Запада России : Отчет о научно-исследовательской работе ИВПС КарНЦ РАН. Т. 2. № гос. регистрации 01201001300. Петрозаводск, 2012. 489 с.
Гублер Е. В. Вычислительные методы анализа и распознавания патологических процессов . Л.: Медицина, Ленинградское отд-ние, 1978. 296 с.
Джарратано Дж., Райли Г. Экспертные системы: принципы разработки и программирование . М.: ООО «И. Д. Вильямс», 2007. 1152 с.
Зоопланктон Онежского озера . Л.: Наука, 1972. 327 с.
Ипатов А. А., Бахмет И. Н., Екимов Д. А., Кулдин Н. А. Автоматическая система раннего оповещения об экологической опасности на водоемах и ее апробация // Труды Карельского научного центра Российской академии наук. 2015. № 12. С. 80–86.
Калинкина Н. М., Сидорова А. И., Полякова Т. Н., Белкина Н. А., Березина Н. А., Литвинова И. А. Снижение численности глубоководного макрозообентоса Онежского озера в условиях многофакторного воздействия // Принципы экологии. 2016. Т. 5. № 2. С. 47–68. DOI: 10.15393/j1.art.2016.5182.
Комплексное гидрохимическое и биологическое исследование качества вод и состояния водных и околоводных экосистем : Метод. руководство. Ч. 1. Полевые исследования / Под ред. Т. И. Моисеенко. Тюмень: Изд-во Тюменского гос. ун-та, 2011. 128 с.
Коросов А. В. Имитационное моделирование в среде MS Excel (на примерах из экологии) . Петрозаводск, 2002. 212 с.
Коросов А. В., Зорина А. А. Экологические приложения Quantum GIS . Петрозаводск: Изд-во ПетрГУ, 2016. 210 с.
Коросов А. В., Коросов А. А. Техника введения в ГИС: Приложение в экологии . Петрозаводск: Изд-во ПетрГУ, 2006. 186 с.
Костина Н. В. Информационная система Region: 25 лет развития и практического применения // Известия Самарского научного центра РАН. 2015. Т. 17. № 4. С. 115–124.
Костина Н. В., Розенберг Г. С., Шитиков В. К. Экспертная система экологического состояния бассейна крупной реки // Известия Самарского НЦ РАН. 2003. Т. 5. № 2. С. 284–294.
Круглов В. В., Дли М. И., Голунов Р. Ю. Нечеткая логика и искусственные нейронные сети. М.: ФИЗМАТЛИТ, 2001. 201с.
Крупнейшие озера-водохранилища Северо-Запада Европейской части России: современное состояние и изменения экосистем при климатических и антропогенных воздействиях . Петрозаводск: Карельский научный центр РАН, 2015. 375 с.
Куликова Т. П. Зоопланктон залива Большое Онего и его продуктивность // Лимнологические исследования на заливе Онежского озера Большое Онего. Л.: Наука, 1982. C. 130–155.
Куликова Т. П., Кустовлянкина H. Б., Сярки М. Т. Зоопланктон как компонент экосистемы Онежского озера . Петрозаводск, 1997. 112 с.
Куликова Т. П., Сярки М. Т. Влияние антропогенного евтрофирования на распределение зоопланктона в Кондопожской губе Онежского озера // Водные ресурсы. 2004. Т. 31. № 1. С. 91–97.
Леонов В. П. Логистическая регрессия в медицине и биологии // Биометрика. URL: www.biometrica.tomsk.ru/logit_1.htm (дата обращения 26.05.2016).
Литвинова И. А., Коросов А. В. Имитационное моделирование распространения сточных вод КЦБК в Кондопожской губе Онежского озера // Антропогенное воздействие на природу Севера и его экологические последствия / Всерос. совещ. и выездная научная сессия. Апатиты, 22-25 июня 1998 г. Атапиты, 1998. С. 116-118.
Мастицкий С. Э., Шитиков В. К. Статистический анализ и визуализация данных с помощью R. . 2014. URL: http://r-analytics.blogspot.com (дата обращения 26.05.2016).
Меншуткин В. В., Филатов Н. Н., Потахин М. С. Разработка экспертной системы «Озера Карелии». Ч. 1. Порядковые и номинальные характеристики озер // Водные ресурсы. 2009. Т. 36. № 2. C. 160–171.
Меншуткин В. В., Филатов Н. Н., Потахин М. С. Разработка экспертной системы «Озера Карелии». Ч. 2. Классификация озер // Водные ресурсы. 2009а. Т. 36. № 3. C. 300–311.
Методика комплексного гидрохимического и биологического исследования качества вод и состояния водных и околоводных экосистем: методическое руководство. Ч. 1. Полевые исследования / Под. ред. Т. И. Моисеенко. Тюмень: Изд-во Тюменского гос. ун-та, 2011. С. 63.
Мурадов Д. А. Logit-регрессионные модели прогнозирования банкротства предприятий // Труды РГУ нефти и газа им. И. М. Губкина. 2011. № 3 (264). С. 160–172.
Паклин Н. Математические основы нечеткой логики // Научная библиотека по физике и новым технологиям. URL: http://bourabai.ru/tpoi/fuzzy.htm#5 (дата обращения 26.05.2016).
Паклин Н. Нечеткая логика — математические основы // BaseGroup Labs. URL: https://basegroup.ru/community/articles/fuzzylogic-math (дата обращения 26.05.2016).
Саати Т., Кернс К. Аналитическое планирование. Организация систем . М.: Радио и связь, 1991. 224 с.
Сярки М. Т. Оценка рыбопродуктивности по состоянию кормовой базы. Зоопланктон // Биологические ресурсы Онежского озера. Петрозаводск, 2008. С. 54–67.
Сярки М. Т. Зоопланктон // Онежское озеро: Атлас / Отв. ред. Н. Н. Филатов. Петрозаводск: Карельский научный центр РАН, 2010. С. 117–119.
Сярки М. Т. Как долго длится лето для зоопланктона Онежского озера? // Принципы экологии. 2013. № 4. С. 70–75. DOI: 10.15393/j1.art.2013.2781.
Сярки М. Т. Оценка современного состояния экосистемы Онежского озера по гидробиологическим показателям и устойчивости функционирования водных сообществ. Зоопланктон // Крупнейшие озера-водохранилища северо-запада европейской территории России. Современное состояние и изменения экосистем при климатических и антропогенных воздействиях. Петрозаводск: Карельский научный центр РАН, 2015. С. 121–127.
Сярки М. Т., Куликова Т. П. «Зоопланктон Онежского озера». База данных . Рег. номер 2012621150 (9/11/2012). Правообладатель Федеральное государственное бюджетное учреждение науки Институт водных проблем Севера Карельского научного центра РАН (ИВПС КарНЦ РАН) (RU).
Сярки М. Т., Чистяков С. П. О применении метода ортогональных расстояний для моделирования сезонной динамики планктона Онежского озера // Экология. 2013. № 3. С. 234–236.
Сярки М. Т., Фомина Ю. Ю. Oсобенности сезонных явлений в зоопланктоне Петрозаводской губы Онежского озера // Принципы экологии. 2014. Т. 3. № 3. С. 36–43. DOI: 10.15393/j1.art.2014.3682.
Таунсенд К., Фохт Д. Проектирование и программная реализация экспертных систем на персональных ЭВМ . М.: Финансы и статистика, 1990. 320 с.
Филатов Н. Н., Руховец Л. А., Назарова Л. Е., Георгиев А. П., Ефремова Т. В., Пальшин Н. И. Влияние изменений климата на экосистемы озер севера Европейской территории России // Ученые записки Российского государственного гидрометеорологического института. № 34. СПб.: РГГМУ, 2014. С. 49–55.
Чухарев А. Л. Развитие экспертной системы «Озера Карелии» // Водная среда и природно-территориальные комплексы: исследование, использование, охрана: Материалы IV Школы-конференции молодых ученых с международным участием (26–28 августа 2011 г.). Петрозаводск: Карельский научный центр РАН, 2011. C. 261–262.
Шитиков В. К., Розенберг Г. С., Зинченко Т. Д. Количественная гидроэкология: методы системной идентификации . Тольятти: ИЭВБ РАН, 2003. 463 с. URL: http://www.ievbras.ru/ecostat/Kiril/Library/Book1/Content0/Content0.htm (дата обращения 26.05.2016).
Шитиков В. К. , Мастицкий С. Э. Классификация, регрессия и другие алгоритмы Data Mining с использованием R.
Электронная книга. 2017. 351 с. URL: https://github.com/ranalytics/data-mining (дата обращения 23.03.2017).
Шурига Л. 6 простых шагов для освоения наивного байесовского алгоритма (с примером кода на Python) // DataReview. URL: http://datareview.info/article/6-prostyih-shagov-dlya-osvoeniya-naivnogo-bayesovskogo-algoritma-s-primerom-koda-na-python/ (дата обращения 26.05.2016).
iMICROTEC. URL: http://www.imicrotec.com/ (дата обращения 26.05.2016).
Ekimov D., Kaikkonen V., Mäkynen A. Using digital holographic microscopy for 4D tracking of colloid particles. The XII International Conference on Laser Applications in Life Sciences, LALS, June 9–11, 2010, Oulu, Finland, in Proc. SPIE 7376, 737615 (2010). DOI: 10.1117/12.871449.
ESA. Climate change initiative. URL: http://www.esa-sst-cci.org/?q=node/134 (дата обращения 26.05.2016).
GRHSST. Group for High Resolution Sea Surface Temperature. URL: https://www.ghrsst.org/products-and-services/historical-data-2a/ (дата обращения 26.05.2016).
Java. URL: https://java.com/ (дата обращения 26.05.2016).
Jurka T. P., Tsuruoka Y. Low-memory Multinomial Logistic Regression with Support for Text Classification. 1.3.3.1. 2013. 13 p. URL: http://127.0.0.1:22282/library/maxent/html/00Index.html (дата обращения 26.05.2016).
Plymouth marine laboratory. URL: https://www.oceancolour.org/portal/ (дата обращения 26.05.2016).
Ray S. 6 Easy Steps to Learn Naive Bayes Algorithm (with code in Python) // Analytics Vidhya. URL: https://www.analyticsvidhya.com/blog/2015/09/naive-bayes-explained/?utm_source=FBPage&utm_medium=Social&utm_campaign=150914 (дата обращения 26.05.2016).
The R Project for Statistical Computing. URL: https://www.r-project.org/ (дата обращения 26.05.2016).
Благодарности
Исследование выполнено за счет гранта Российского научного фонда (проект № 14-17-00766).