Zen: scidb scientific challenges

��

�� , �� .�. �� (�� ) �� - �� , � �� .

�� e-Science - �� , �� . �� e-�� (�� ) �� - �� , �� , �� : �� (� �� ), �� , ��, ��, ��, ��. � �� , � �� (��-�� ). ��, �� , �� . � �� (�� ) �� .

�� "�� " � �� :

�� . �� 70-� �� , �� , � �� , �� .
�� . �� , �� . �� , � �� .
�� . �� XIX �� : �� - �� . �� , �� . �� , �� , �� XIX �� XX �� "�� ". �� , ��, �� (�� ). �� "��" �� -�� . �� , �� , �� .
�� . �� NASA, ESA � �� ESO �� 1 �� . �� 10 �� (�� - �� ) �� 2 �� .
�� "Early Science"("�� "): �� , �� . �� (��, �� ).

�� , �� . �� , �� . �� :

�� (� �� , �� ) �� -�� .
�� .
�� .
�� .
� �� "��" ��: ��, � �� SNAP (�� ) ��

�� "��" �� (raw data, - �� , �� ) , �� .

�� , �� (�� , � �� 5-10 �� - �� -�� ):

�� "��" �� , �� .
�� "��" ��. �� "��" �� , � �� . �� , �� , �� "��" ��, �� .
�� - �� . �� , �� . ��, �� - �� . ��, �� , � �� . �� . � �� , � � �� , ��, �� "��" ��. �� (��, ��, ��, �� …).
��, ��-�� , �� -�� , � �� . �� . �� , �� , �� , �� "��" ��, �� - �� .
�� - �� , �� , �� . � �� , � �� , �� . �� , �� .
�� - �� , �� , �� , �� ;
�� , ��, �� "��" ��, �� , ��; �� (��, ��, ��,..). �� , �� , � �� , ��, ��, �� . �� data provenance, lineage, pedigree. �� data provenance - �� query inversion. ��, �� -�� , � � �� -�� , ��, �� , �� . �� ! �� : �� (�� ) �� , �.�. - �� .
�� - �� - �� , �� . �� ;
�� , �� ;
�� - �� , �� , �� .�.;
�� ,�� , �� ;
�� "��" �� ("Early Science");
�� , �� c�� , � �� , �� , �� . �� .

�� , �� (��) �� , �� , � ��, � �� .

�� ?

�� , �� , �� (�� ).

�� - Yahoo Everest, �� 2008 �� 2 Pb, �� , � �� 24 �� 1/2 �� . � 2009 �� 10Pb. �� , �� Yahoo Everest - �� PostgreSQL � �� -�� . � 2010 �� , �� Yahoo �� Hadoop. ��
�� (LHC, http://lhc.web.cern.ch/lhc/), �� 15 Pb ��, �� 200 ��
�� (LSST, http://www.lsst.org), � �� 8.4 �� 3.2 �� (��-��). �� 49 �� (256 ��), 2.8 �� (56 ��). � 2025 �� 14 Pb �� !
�� "��" (�� ), �� -�� , �� 400 �� , � �� 400 �� .

�� ?

��
- �� (http://www.b-eye-network.com/view/7188) �� (http://en.wikipedia.org/wiki/Moore_Law)
�� , �� - �� , �� , ��, �� 10 �� .
�� , �� - �� (AJAX), �� , �� -�� , ��
�� - �� , �� , �� http, ��

�� , �� , �� (Oracle, SQL Server, PostgreSQL, MySQL, Firebird, Ingres,…), �� , �� (�� ) �� , � �� , �� (Vertica, H-Store, StreamDB..). �� , �� . �� , �� . �� , �� :

�� . �� (��,��, …);
�� (��,��) �� - �� Project Voldemort, Scalaris, Dymomite, MemcacheDB, CouchDB, Cassandra, HBase, Hypertable, SimpleDB (�� NoSQL �� 40 �� ). �� (��,��) �� ACID � BASE, �� "� �� " (eventually consistent).

�� -�� NoSQL ��. �� , ��,Vertica (C-Store), MonetDB - �� �� �� SQL. �� -�� .

�� ? ��, �� , �� , �� (CI � ACID) �� , �� WOR� (Write Once Read Many) � �� eventual consistency. �� , �� , � �� "��-��" ��, �� , �� ! � �� . ��, �� , ��

CREATE TABLE Observation (I integer NOT NULL, J integer NOT NULL, V float NOT NULL);

SELECT A1.I, A1.J, AVG(A2.V)
  FROM Observation A1, Observation A2
 WHERE A2.I BETWEEN A1.I ? 1 AND A1.I + 1
   AND A2.J BETWEEN A1.J ? 1 AND A1.J + 1
 GROUP BY A1.I, A1.J;

��, �� .

�� , �� . � �� , �� (��, ��). �� , �� - �� . �� , �� , �� , ��, �� , �� , �� , �� , �� .

�� , �� "��" �� , �� , � �� - �� . �� , �� (http://www.databasecolumn.com/2007/09/one-size-fits-all.html) � �� , �� , �� , ��, �� , �� , �� .

�� ,�� (�� ) �� XLDB 2007,2008,2009 ��, � �� SciDB �� MIT �� . �� - �� , � �� (�� ), �� .

��

�� SciDB �� . SciDB �� . �� SciDB, �� . ��, �� , � SciDB �� , �� . ��, SciDB ? �� , �� . �� , � �� . �� , �� .

�� , � SciDB �� , �� . �� SciDB �� , �� , �� . �� SciDB �� , SciDB �� . ��, SciDB �� , �� . �� , �� , �� , � �� -�� . ��, SciDB �� , �� R, Matlab � ��, �� SciDB.

��

�� "��" ��, �� (�� ) - �� ;
�� - �� (�� );
�� (��) �� -��;
�� ;
�� x1000 �� x10 ��;
�� ;
�� , �� (WORM - Write Once Read Many), � �� . �� ACID �� BASE (eventual consistency), �� .

��

�� , ��-�� , �� , � �� , �� . SciDB �� , �� . �� SciDB �� , �� . �� , �� , � � �� . �� SciDB �� -�� , �� , �� , �� . �� , SciDB �� , �� , �� , �� .

��

SciDB �� ? �� . � �� SciDB �� , ��: ��, ��, ��, ��, �� , ��, � ��. �� , �� , LSST (Large Synaptic Survey Telescope) � �� (�� 16-17 �� ), �� SciDB � �� . ��, �� SciDB �� .

�� "��"

�� "��" - �� 16-17 �� , �� -�� (�� . �.�. ��, �� . �.�.��) � �� "��" �� No.351-8623/07 �� 05.06.2007 �.. � �� 400 ��. ��. �� 1%, � �� (�� 12 ��. ��) - 0.1%. �� 10 �� 0.2 �� 1.0 �� (�.�. � �� ) � �� . �� - 2013 ��. �� 5 �� 400 �� , �� (data mining).

�� SciDB � ��

�� (��,��,�� )
�� , �� SIGMOD 2009 (Providence, USA) , VLDB 2009 (Lyon, France)
�� 2010 �� SciDB �� .
�� SciDB
��
� 2012 �� SciDB � �� LSST

�� SciDB

�� (�� ) �� SciDB � �� .

� �� (�� ) �� PostgreSQL, �� , �� . �� "��" �� , �� , � �� , �� .

� ��

�� "��":

�� 10 �� -��
��
��

� �� :

��
�� 30 ��
�� (�� )
��

scidb scientific challenges

Projects

Links

��

��

��

��

��

��

�� "��"

�� SciDB � ��

�� SciDB

� ��

scidb scientific challenges

Projects

Links

������� ������ ����������� ����

��������

����� ���� ��� ������� ������� ������� ������

�������� �������������� ��������������� ����

����������� ��������� ������� ����� ������ � �������� �������

�������������� � �������� �������� ���������

����������� ����������� "����"

������� ������ SciDB � ����� ��������

���������� ������� ������������� SciDB

� ������� ����

��

��

��

��

��

��

�� "��"

�� SciDB � ��

�� SciDB

� ��