0

Ocean danych na Białołęce

OCEAN na Białołęce
OCEAN – na Białołęce
fot. mAT. PRASOWE

Najnowocześniejsze w Polsce centrum informatyczne powstało na warszawskiej Białołęce.

OCEAN to Otwarte Centrum Danych i ich Analiz, którego budowa dobiega końca.

Białołęckie Centrum OCEAN to najnowocześniejszy w Polsce ośrodek obliczeniowy zbudowany z myślą o przetwarzaniu wielkich zbiorów danych (ang. Big Data). Będą tam prowadzone zaawansowane prace analityczne, a także przetwarzane i przechowywane duże zbiory danych. Z OCEAN-u będą mogły korzystać zarówno zespoły naukowe, jak i administracja państwowa oraz przedsiębiorcy.

OCEAN to Centrum Kompetencji utworzone w Interdyscyplinarnym Centrum Modelowania Matematycznego i Komputerowego Uniwersytetu Warszawskiego – jednostce działającej od przeszło 20 lat na Uniwersytecie Warszawskim. ICM zajmuje się analizowaniem i modelowaniem danych z wykorzystaniem nowoczesnych technologii informatycznych, jak również zapewnia wsparcie programistyczne w projektach wymagających dużych mocy obliczeniowych. ICM prowadzi badania z zakresu m.in. biotechnologii, inżynierii materiałowej, kosmologii, medycyny czy meteorologii. Dzięki OCEAN-owi możliwości ICM znacznie się zwiększą.

W Centrum staną maszyny, które sobie znakomicie radzą w zaawansowanych operacjach na wielkich zbiorach danych. Znakomicie to znaczy szybko je przetwarzają.

Główne elementy OCEANu

  • superkomputer Cray.
    Zastosowanie ma do obliczeń wielkoskalowych i do przeprowadzania prac symulacyjnych. Zastosowanie znajduje zarówno w nauce, jak i w produkcji. Przykładem może być symulacja zjawisk pogodowych wykonywana przez meteorologów czy wykonywanie skomplikowanych obliczeń układów równań opisujących opływ strumienia powietrza wokół skrzydła samolotu czy samochodu.
  • System do analizy wielkich zbiorów danych – umożliwiający szybkie wydobywanie z baz danych różnych danych i łatwe przetwarzanie informacji.
    Wielkie zbiory to takie, których rozmiary sięgają petabajtów.
    Peta  to przedrostek jednostki miary o symbolu P oznaczający mnożnik 1.000.000.000.000.000 = 1015 (biliard)
    W informatyce oznacza on częściej 250 = 10245 = 1.125.899.906.842.624,
    np. 1 PB (petabajt) to 250 bajtów .
    Mówiąc bardzo ogólnie każda litera w tym artykule to jeden bajt, a liter jest ok. 1400.
    By zapełnić jeden PB potrzeba ponad 800 miliardów takich artykułów (804 214 219 173.3)
  • System do przechowywania wielkich zbiorów danych – ogromny przyrost danych i informacji we wszystkich dziedzinach wiedzy i życia wymaga rozwiązań zapewniających bezpieczne ich gromadzenie na długie lata.
    Jeśli 1 PB danych chcielibyśmy przechować na dyskach jakie są w standardowym komputerze przenośnym, czyli np. 500 GB, potrzeba by ich było ponad pół miliona (524 288)
  • Laboratorium wizualizacji –umożliwi ono wysokiej jakości analizy wizualne danych pochodzących z różnych obszarów wiedzy oraz procesów z nimi związanych. Przykładem może być system wyszukiwania obrazów w zbiorach plików graficznych, zdjęć czy filmów, porównywanie ich ze sobą, określanie podobieństw. Może to być badanie autentyczności obrazów, wyszukiwanie twarzy w tłumie, porównywanie tekstów w poszukiwaniu plagiatów.

W ramach inwestycji, której wartość wyniosła 162 000 000 zł, zbudowano serwerownię o powierzchni użytkowej przekraczającej 6 tys. m² oraz zakupiono nowoczesną, wysokowydajną infrastrukturę informatyczną (łączność pomiędzy maszynami, macierzami dysków, systemami archiwizowania danych i kopii zapasowych). Budynek został zaprojektowany z uwzględnieniem zasad ekologii i energooszczędności.

W grudniu rozpoczął się okres prowadzenia testów, które potrwają kilka miesięcy.

Otwarcie Centrum dla użytkowników jest planowane wiosną 2016 r.

Projekt Centrum współfinansowany jest ze środków Unii Europejskiej w ramach Europejskiego Funduszu Rozwoju Regionalnego.

Szczegóły można znaleźć na stronie OCEANu

UD Białołęka

28 grudnia 2015 19:10
[fbcomments]