pora.zavantag.com Российские зоологические базы данных в интернете
страница 1

Российские зоологические базы данных в интернете




А.Л. Лобанов, И.С. Смирнов, М.Б. Дианов, А.Ф. Алимов, А.Г. Кирейчук, В.А. Кривохатский

Зоологический институт РАН (ЗИН), г.Санкт-Петербург

Зоологи начали использовать возможности баз данных (БД) еще в самом начале компьютерной эры. Это были примитивные с нынешней точки зрения таблицы, где вся информация помещалась обычно в одном файле, хранящемся на одном компьютере. По мере развития компьютерных технологий усложнялось и содержание зоологических БД. Базой данных еще называли отдельную таблицу, но достижения теории реляционных БД проникали и в среду биологов. Информацию одного банка данных уже распределяли по нескольким связанным таблицам, появились словари, классификаторы, тезаурусы. Программисты стали писать отчуждаемые программы с ориентированным на пользователя интерфейсом, которые позволяли легко переносить БД на другие компьютеры. Появление персональных компьютеров сделало технологии БД доступными практически каждому биологу. Компьютер стал массовым инструментом и это вызвало цепную реакцию быстрой эволюции БД и систем управления БД (СУБД). Особенно важные изменения принесло с собой появление и бурное развитие сетевых технологий. В итоге – интерактивные БД с мультимедийной информацией в сети Интернет доступны теперь любому зоологу. Самый далекий от программирования пользователь легко изучает в сети чужие БД и с минимальной затратой усилий может выставить на всеобщее обозрение свои (Алимов и др., 2001). СУБД присутствует теперь на каждом компьютере с Windows (даже если об этом не знает его хозяин). БД без графики и цветных изображений уже воспринимаются как анахронизм. Мультмедийные технологии так органично слились с Интернетом, что биолог может не думать о том, как ему воспроизвести на компьютере звук или видео-клип, – теперь он размышляет о научном наполнении своих БД и о способах запечатления в файлах красок, форм, движений и звуков своих живых и музейных объектов (Lobanov et al., 2000).

Тщательный поиск в русском секторе Интернета показал практически полное отсутствие интерактивных БД по зоологии. Выдаваемые поисковыми системами многочисленные ссылки на запрос "зоологические базы данных" на самом деле содержат в основном информацию о проектах – развивающихся или планируемых, декларации о концепциях и стандартах, обсуждение структур БД и т.п. Одним из редких исключений является БД по хирономидам из электронного атласа "Биоразнообразие животного и растительного мира Сибири" (http://www-sbras.nsc.ru/win/elbib/atlas/chironomids/). Пользователь может просмотреть список представленных видов, получить по каждому из них сведения об изученных популяциях, их морфологиии и изменчивости. На сегодняшний день большая часть информации о таксонах животных представлена простыми списками, а использование современных сетевых технологий сводится только к связыванию их при помощи гипертекстовых ссылок. Вызывает досаду тот факт, что при обилии данных, которыми располагают отечественные зоологи, доступ к ним в сети ограничен или затруднен. Между тем в Зоологическом институте давно разработаны концепции и стандарты ведения зоологических БД, обладающих значительной спецификой. Одной из таких особенностей является всепроникающая иерархичность зоологической информации, которая на первый взгляд плохо вписывается в плоские таблицы реляционных БД. Нами разработаны способы преодоления этой трудной проблемы (Лобанов, Смирнов, 1997).

В последние годы процесс всеобщей компьютеризации и желание зоологов упорядочить свои данные привели к увеличению числа попыток создания таксономических электронных списков, таблиц и БД. Это потребовало разработки некоторых первичных правил унификации зоологических баз данных для создания условий интеграции накопленной информации и кооперации специалистов при работе над различными проектами. Нам кажутся существенными следующие рекомендации для построения таксономических БД, которые должны облегчить общение зоологов и создание интегрированных систем (http://www.zin.ru/projects/zooint_r/zooint02.htm):



  1. Должна использоваться реляционная модель БД.

  2. В соответствии с требованиями нормализации БД информационные системы должны включать отдельные таблицы по каждому аспекту сведений о животных.

  3. Каждый элемент сведений должен храниться в конкретной системе только в одной записи одной таблицы. Это правило влечет за собой широкое использование словарей и классификаторов (или тезаурусов – словарей с иерархической структурой и родо-видовыми отношениями между понятиями).

  4. В основе системы должны лежать классификаторы животных -специализированные таксономические БД.

  5. Часто используемые биологами данные о географическом распространении организмов должны быть строго разделены на отдельные аспекты (административно-территориальный, физико-географический, биогеографический, ландшафтный, природно-зональный и т.п.). Термины каждого аспекта должны быть зафиксированы в отдельных классификаторах.

  6. Добиться ведения разных БД в одной СУБД невозможно даже внутри одного института и к этому не нужно стремиться. Важно только использовать профессиональные коммерческие СУБД, имеющие проверенные механизмы импорта и экспорта. В качестве критерия пригодности СУБД предлагается использовать возможность импорта и экспорта в формат DBF (dBaseIII).

  7. Для обеспечения простоты обмена данными между СУБД, работающими в разных версиях операционных систем, следует ограничить длину имен файлов 8 символами, длин расширений имен 3 символами, а названия полей баз данных 10 символами; при этом использовать в во всех этих именах только латинские буквы, цифры и символ подчеркивания (при этом не стоит использовать разницу между аглавными и строчными буквами, если какая-то система такую озможность поддерживает). В системах, где длина символьного поля не ограничивается или может быть очень большой, не делать длину поля более 254 символов.

  8. Если для представления иерархии не используется стандарт ZOOCOD (Лобанов, Смирнов, 1997), то все же нужно стремиться к соблюдению некоторых правил, облегчающих переход к этому стандарту:

а) для указания ранга таксона или понятия использовать только одно поле таблицы, приводя в нем коды или полные названия рангов;

б) иметь поле с уникальным кодом таксона и использовать эти коды для связи с таблицами фактов о таксонах;

в) в отдельном поле отмечать факт синонимии, указывая уникальный код алидного названия для каждого синонимичного;

г) иметь поле для указания систематического порядка записей (упорядочение по нему должно создавать аналог "систематического списка", который привычен и необходим большинству биологов);

д) наличие двух полей, отражающих иерархию способом, принятым теперь в приложениях для Windows (поля для отражения иерархии методом TreeView), ни в коей мере не отменяет необходимость унктов а) и г), так эти два поля не отражают истинные ранги таксонов и нужный порядок среди дочерних таксонов одного родительского.

Сравнение с зарубежными сайтами по зоологии показывает наше значительное тставание в использовании богатейших возможностей современных нформационных технологий. Правда, в ряде случаев, степень доступности к важным БД очень ограничена коммерческим использованием накопленных сведений (например, Zoological Record).

Сотрудники Зоологического института, при существенной поддержке РФФИ, пытаются исправить существующее положение. Используя мощный вебсервер, мы развиваем интерактивные информационно-поисковые системы по биоразнообразию животных, которое изучают наши крупнейшие специалисты, и по ценнейшим коллекциям, хранящимся в нашем институте (Алимов, 1999;Смирнов, Рысс, 1999; Алимов и др., 2001).

Благодаря актуальности выставленной нами на обозрение мировой научной общественности информации мы достигли впечатляющих показателей, для чисто научного, лишенного всякой коммерции и рекламы, портала. За 2001 год число визитов на наш портал превысило 130 тысяч и доходило до 1700 визитов в день. Посетители нашего вебсервера, представляющие более 100 стран со всех континентов, переписали у нас за год более 17 гигабайт информации. Это очень большой для нас показатель, близкий к пределу пропускной способности нашей линии. Порой от нас забирали до 235 мегабайт информации в сутки.

Самый большой сайт на нашем портале посвящен жукам и изучающим их ученым (наука о жуках имеет собственное название колеоптерология). Сайт сейчас состоит из 1500 вебстраниц на русском языке (около 15 мегабайт текстовой информации), включающих 4,5 тысячи изображений (еще 100 мегабайт). Постоянная аудитория сайта составляет пока около 30 посетителей в сутки, но благодаря поддержке проекта по развитию этого сайта РФФИ, мы надеемся добиться полноты его английской версии и превратить его в мировой центр колеоптерологии.

В настоящее время на нашем вебсервере функционируют десять интерактивных БД, охватывающих такие разные группы животных, как коловратки, насекомые, офиуры, птицы и другие. Круг сведений о них включает данные по географическому распространению, экологии и коллекционным материалам. Планируется создание интерактивной информационной системы в Рунете по биоразнообразию фауны России.



Поддержка: РФФИ, гранты 01-07-90284, 02-07-90105 и 02-07-90217, проект 15 подпрограммы "Изучение и исследование Антарктики" ФЦП "Мировой океан" и проект "Информационная система по биоразнообразию".
ЛИТЕРАТУРА:


  1. Алимов А.Ф. Компьютеризация биологического учреждения (на примере Зоологического института РАН)// Информационно-поисковые системы в зоологии и ботанике, Труды Зоологического института РАН, т. 278, Санкт-Петербург, 1999: 6,7.

  2. Алимов А.Ф., Смирнов И.С., Рысс А.Ю., Дианов М.Б., Лобанов А.Л., Голиков А.А. Современные биологические электронные публикации: коллекции, идентификационные системы и базы данных// Информационные и телекоммуникационные ресурсы в зоологии и ботанике. Тезисы 2-го международного симпозиума. СПб. 2001. с. 5-19.

  3. Лобанов А.Л., Смирнов И.С. Принципы построения и использования классификаторов животных в стандарте ZOOCOD// Базы данных и компьютерная графика в зоологических исследованиях, Труды Зоологического института, т. 269, Санкт-Петербург, 1997: 66-75.

  4. Lobanov A.L., Dianov M.B., Medvedev S.G., Panov V.E., Smirnov I.S. Presentation and use of zoological information in the global Internet network. Trudy Zool. Inst. Ross. Akad. Nauk, 286, 2000: 87-92.

  5. Смирнов И.С., Рысс А.Ю. Биологические коллекции и базы данных//Информационно-поисковые системы в зоологии и ботанике, Труды Зоологического института РАН, т. 278, Санкт-Петербург, 1999: 30-38.







страница 1
скачать файл

Смотрите также:
Российские зоологические базы данных в интернете
62.77kb. 1 стр.

Темы дипломных проектов специальности 230105 Базы данных
122.96kb. 1 стр.

Пояснительная записка к курсовой работе на тему: "База данных Зоопарки-Звери-Клетки" По курсу "Базы данных" Рябухин С. Г
105.19kb. 1 стр.

© pora.zavantag.com, 2019