Raport IDC Digital Universe ujawnia lukę wielkich zbiorów danych

Przed firmami, które potrafią chronić informacje i efektywnie korzystać z coraz większego wszechświata danych otwiera się wiele nowych możliwości. Do 2020 r. największym producentem danych staną się rynki wschodzące.

W skrócie

  • Według najnowszego raportu IDC Digital Universe (?Big Data, Bigger Digital Shadows, and Biggest Growth in the Far East??), sponsorowanego przez EMC, potencjał wielkich zbiorów danych jest dziś wykorzystywany w nikłym stopniu, chociaż ilość użytecznych danych przez cały czas rośnie.
  • IDC prognozuje, że do 2020 roku rozmiary cyfrowego wszechświata osiągną 40 ZB (zettabajtów), czyli o 5 ZB więcej niż przewidywano wcześniej. W latach 2010-2020 cyfrowy wszechświat powiększy się 50-krotnie.
  • W tegorocznych badaniach firma IDC po raz pierwszy sprawdziła skąd pochodzą informacje w cyfrowym wszechświecie, lub gdzie zostały po raz pierwszy zgromadzone albo wykorzystane. Okazało się, że pod tym względem zachodzą obecnie duże zmiany.
  • Ilość danych wymagających ochrony rośnie znacznie szybciej, niż rozmiary całego cyfrowego wszechświata. Poziom rzeczywistej ochrony nie nadąża jednak za tym wzrostem.
  • Z badań wynika, że w 2012 roku ilość utworzonych i zreplikowanych danych osiągnie 2,8 ZB.
  • Głównym czynnikiem wzrostu ilości danych na świecie są dane generowane przez komputery. Do 2020 r. ich ilość może wzrosnąć nawet piętnastokrotnie.
  • Do 2020 roku rynki wschodzące będą wytwarzać najwięcej danych na świecie i zastąpią na tym miejscu kraje rozwinięte.
  • Nakłady na infrastrukturę związaną z cyfrowym wszechświatem czyli na rozwiązania IT, oprogramowanie, usługi, telekomunikację oraz kadrę informatyczną wzrosną w latach 2012-2020 o 40%. Inwestycje związane z zarządzaniem rozwiązaniami pamięci masowej, bezpieczeństwem, wielkimi zbiorami danych oraz przetwarzaniem w chmurze będą rosły w jeszcze szybszym tempie.
  • Dołącz do nas na  Twitterze wykorzystując tagi: #DigitalUniverse i #EMC.

Pełna treść informacji prasowej:

Warszawa, 12 grudnia 2012 r. ? Firma EMC przedstawiła wyniki badania IDC Digital Universe ?Big Data, Bigger Digital Shadows, and Biggest Growth in the Far East? (?Duże zbiory danych, większy cyfrowy cień, największy wzrost na Dalekim Wschodzie?). Sponsorowane przez firmę EMC badanie wykazało, że choć cyfrowy wszechświat rośnie w nienotowanym dotąd tempie ze względu na  ogromne ilości danych codziennie tworzonych przez ludzi i urządzenia, w skali globalnej analizowanych jest zaledwie 0,5% informacji.

Multimedialna wersja informacji prasowej dostępna jest na stronie:http://www.emc.com/about/news/press/2012/20121211-01.htm

Dynamiczny rozwój rynku urządzeń cyfrowych, od komputerów po smartfony, coraz lepszy dostęp do Internetu na rynkach wschodzących oraz szybki wzrost ilości danych generowanych przez takie urządzenia, jak kamery monitoringu lub inteligentne liczniki, spowodował, że tylko w ciągu ostatnich dwóch lat cyfrowy wszechświat powiększył się dwukrotnie, do imponujących 2,8 zettabajtów (ZB). IDC prognozuje, że do roku 2020 wskaźnik ten osiągnie 40 ZB, czyli o 14 % więcej niż przewidywano wcześniej.

Z czym można porównać 40 zettabajtów? Oto kilka przykładów:

  • Liczba ziaren piasku na wszystkich plażach świata wynosi 700 500 000 000 000 000 000 (czyli 700 trylionów 500 biliardów) – 40 zettabajtów to 57 razy więcej.
  • Gdyby zapisać 40 zettabajtów danych na używanych obecnie dyskach Blue-ray, to bez kopert lub kaset, ważyłyby one tyle, co 424 lotniskowce klasy Nimitz.
  • W 2020 roku 40 zettabajtów danych będzie oznaczać, że na każdego mieszkańca świata przypadnie 5247 GB danych.

W tegorocznych badaniach firma IDC sprawdziła, skąd pochodzą informacje w cyfrowym wszechświecie, bądź gdzie zostały po raz pierwszy zgromadzone lub wykorzystane. Okazało się, że pod tym względem zachodzą obecnie duże zmiany. Badania Digital Universe, przeprowadzone już po raz szósty, obejmowały zwykle pomiary i prognozy dotyczące ilości informacji cyfrowych tworzonych i kopiowanych w ciągu roku. W najnowszej edycji uwzględniono również tzw. lukę wielkich zbiorów danych (Big Data Gap) czyli różnicę między potencjalną, a rzeczywiście wykorzystywaną wartością danych, porównanie wymaganego poziomu ochrony danych z rzeczywistym oraz rozkład geograficzny  danych tworzonych na całym świecie.

Najważniejsze ustalenia

  • Szybki wzrost cyfrowego wszechświata. IDC przewiduje, że do 2020 roku cyfrowy wszechświat osiągnie wielkość 40 ZB, czyli więcej niż przewidywano wcześniej.
    • W latach 2012 do 2020 roku rozmiary cyfrowego wszechświata będą się podwajać co dwa lata.
    • W roku 2020 na każdego mieszkańca Ziemi będzie przypadać ok. 5247 GB danych.
    • Główną przyczyną ekspansji cyfrowego wszechświata jest wzrost ilości danych generowanych przez maszyny. W roku 2005 stanowiły one 11% wszystkich danych, natomiast w 2020 r. wskaźnik ten przekroczy 40%.
  • Niewykorzystywanie dużych ilości użytecznych danych. Koncepcja Big Data umożliwia osiąganie korzyści z dużych, niewykorzystanych wcześniej zbiorów danych. Większość nowych danych stanowią jednak dane nieustrukturyzowane i nieotagowane ? co znaczy, że niewiele o nich wiadomo.
    • W 2012 r. będzie można wykorzystać zgodnie z koncepcją Big Data 23% (tj. 643 eksabajtów) wszystkich danych, pod warunkiem, że zostaną one otagowane i przeanalizowane. Obecnie jednak zaledwie 3% potencjalnie użytecznych danych jest otagowanych, a jeszcze mniej ? analizowanych.
    • Ilość użytecznych danych rośnie wraz z rozwojem cyfrowego wszechświata. Do 2020 roku 33% wszystkich danych (tj. ponad 13 000 eksabajtów) będzie można wykorzystać zgodnie z koncepcją wielkich zbiorów danych, o ile zostaną one otagowane i przeanalizowane.
  • Brak ochrony znacznej części cyfrowego wszechświata. Ilość danych, które wymagają ochrony, rośnie szybciej niż sam cyfrowy wszechświat.
    • W 2010 r. ochrony wymagała mniej niż jedna trzecia danych cyfrowego wszechświata, ale w 2020 r. wskaźnik ten ma przekroczyć 40%.
    • W 2012 r. ochrony wymagało około 35% danych cyfrowego wszechświata, ale mniej niż 20% było rzeczywiście chronione.
    • Poziom ochrony danych zależy od regionu. Na rynkach wschodzących jest on znacznie niższy.
    • Takie czynniki, jak zaawansowane zagrożenia, niedobór kwalifikacji w zakresie bezpieczeństwa informatycznego oraz nieprzestrzeganie najlepszych praktyk dotyczących bezpieczeństwa przez klientów indywidualnych i firmy będą nadal powodować problemy.
  • Zmiana ról na mapie świata. Cyfrowy wszechświat był początkowo zjawiskiem specyficznym dla rozwiniętej części świata. Ostatnio ulega to zmianie, ponieważ szybko rośnie znaczenie rynków wschodzących.
    • W 2010 r. na rynki wschodzące przypadało tylko 23% cyfrowego wszechświata, ale już w 2012 ? aż 36%.
    • IDC prognozuje, że do roku 2020 wskaźnik ten osiągnie 62%.
    • Udziały poszczególnych regionów w cyfrowym świecie obecnie przedstawiają się następująco: Stany Zjednoczone ? 32%, Europa Zachodnia ? 19%, Chiny ? 13%, Indie ? 4%, reszta świata ? 32%.
    • W 2020 r. same tylko Chiny będą generować 22% wszystkich danych na świecie.

Inne ważne wnioski

  • W zarządzaniu wielkimi zbiorami danych coraz większą rolę odgrywają technologie przetwarzania w chmurze. Przewiduje się, że w związku z tym liczba serwerów na całym świecie wzrośnie dziesięciokrotnie, a ilość informacji zarządzanych bezpośrednio przez centra przetwarzania danych w przedsiębiorstwach ? czternastokrotnie.
  • W ciągu najbliższych pięciu lat dużym zmianom ulegną również typy danych przechowywanych w chmurze. IDC prognozuje, że w 2020 roku 46,7% takich danych będzie związanych z rozrywką (nie będą to informacje przedsiębiorstw), natomiast pozostała część przypadnie na dane z systemów monitoringu, dane osadzone, informacje medyczne oraz dane generowane przez komputery, telefony i elektroniczne urządzenia domowe.
  • Ilość przechowywanych w cyfrowym wszechświecie danych na temat użytkowników indywidualnych przekroczy ilość danych tworzonych przez nich samych.
  • Obecnie najwięcej w zarządzanie cyfrowym wszechświatem inwestuje Europa Zachodnia, która przeznacza na ten cel 2,49 USD na gigabajt. Kolejne miejsca zajmują Stany Zjednoczone (1,77 USD/GB), Chiny (1,31 USD/GB) i Indie (0,87 USD/GB).
  • Infrastruktura cyfrowego wszechświata jest coraz lepiej skomunikowana, więc informacje nie muszą i nie będą pozostawać w regionie, w którym są używane. IDC szacuje, że w 2020 roku około 40% danych będzie przetwarzane w chmurze. Oznacza to, że między miejscem pochodzenia i wykorzystania dane będą przechowywane lub przetwarzane w chmurze (publicznej i prywatnej).

Wypowiedź przedstawiciela firmy EMC

Jeremy Burton, wiceprezes, dział produktów i marketingu (Product Operations and Marketing) w firmie EMC

?Przedsiębiorstwa zalewane są coraz większą ilością danych o coraz wyższym stopniu złożoności. Działy IT mają więc dwie możliwości: albo dać się sparaliżować przez nadmiar informacji albo podjąć wysiłek w celu wykorzystania tkwiącego w nich ogromnego potencjału. Wyniki tegorocznych badań zwróciły uwagę na ogromne możliwości stojące przed firmami, które potrafią nie tylko odkryć potencjalne korzyści z cyfrowego wszechświata, ale też umiejętnie się po nim poruszać wykorzystując odpowiednie technologie, praktyki dotyczące bezpieczeństwa oraz kwalifikacje informatyków. EMC ma wszelkie podstawy, aby pomóc klientom w zarządzaniu informacjami, ich zabezpieczaniu oraz wykorzystaniu ich ogromnego potencjału w sposób zapewniający przewagę nad konkurencją?.