|
Конференция
-
За последнее десятилетие в разных областях человеческой деятельности
наблюдается лавинный рост объема получаемой информации, который ежегодно
удваивается. Однако, при современном уровне компьютерных технологий
проблема больших данных (Big Data) создается не столько порождаемым
объемом, а сколько проблемой восприятия и осознания информации.
Потребность и способность порождать данные оказалась сильнее, чем
способность и потребность их воспринимать.
-
В бизнесе и социальной деятельности большие данные разделяются по объемам
и методам анализа достаточно условно на три группы. Это - "быстрые данные"
терабайтных объемов и применяемые к ним методы анализа, которые используют
априорные знания, что позволяет прогнозировать или детальнее изучить уже
известный феномен; архивные данные большего объема, где средствами
интеллектуального анализа производится кластеризация, классификация,
поиск зависимостей; других методов работы требуют хранилища петабайтных
объемов для обнаружения априорно неизвестных знаний и закономерностей.
-
Не всегда в фундаментальных исследованиях соблюдаются три определяющие
характеристики для больших данных - объем, скорость (прироста и/или
обработки) и многообразие (структурированные и неструктурированные
данные), но всегда присутствует нацеленность на получение нового знания,
даже при наличии небольших объемов информации, что подталкивает к
разработке новых способов интеллектуального анализа.
-
Grid- и cloud-технологии, большие данные, их анализ и извлечение значимой
информации являются взаимосвязанными факторами определяемыми и определяющими
развитие компьютерных и инфокоммуникационных технологий, методов
статистического анализа и искусственного интеллекта. "Большие данные
объединяют техники и технологии, которые извлекают смысл из данных
на экстремальном пределе практичности" (цитируя Forrester).
-
Информационные системы приобретают все более важное значение в связи с
увеличением объема информации, поступающей от новых экспериментальных
комплексов, и развитием новых подходов и технологий обработки и хранения
экспериментальных данных, а также обеспечением доступа к ним максимально
возможному числу научных коллективов и индивидуальных исследователей.
-
Создание и поддержка инфраструктур, которые опираются на интегрированные
и интероперабельные информационные системы, сейчас является необходимым
условием для поддержки фундаментальных исследований в разных областях
науки, одновременно являясь инструментами для образования и популяризации
науки. В качестве примера такой инфраструктуры можно привести виртуальную
обсерваторию, координируемую международным астрономическим альянсом IVOA.
В Специальной астрофизической обсерватории РАН с 2002г. по 2009г. при
поддержке РФФИ проведено шесть всероссийских семинаров-совещаний
"Информационные системы в фундаментальной науке" по актуальным проблемам
создания информационных систем для повышения эффективности научных
исследований. Очередной VII семинар посящен обсуждению феномена
"Больших Данных" - Big Data, а именно: методам, технологиям и средствам
применительно к доступу, хранению и интеллектуальному анализу данных
большого объема в разных областях фундаментальной науки.
|