Home Analizy Poukładać dane

Poukładać dane

0
0
340

Skutki tej swoistej inwazji zaczynają odczuwać osoby zarządzające firmami. Dwie trzecie menedżerów badanych przez Reutera uważa, że cyfrowa lawina zmniejszy satysfakcję z pracy lub pogorszy relacje osobiste. Natomiast 33 proc. respondentów obawia się, że spowoduje uszczerbek na ich zdrowiu. W wielu innych badaniach właściciele firm przyznają, że większość informacji, która do nich trafia, jest bezużyteczna. O cyfrowych zasobach najczęściej dyskutuje się w kontekście ich przechowywania. Ale to tylko czubek góry lodowej. Coraz więcej kłopotów sprawia ich wyszukiwanie i analiza. Czasami dotarcie do potrzebnych informacji przypomina szukanie igły w stogu siana.

Kto wygra na potopie danych

Firmy oczekują na nowe rozwiązania, pozwalające zapanować im nad cyfrowym chaosem. Producenci aplikacji oraz sprzętu stoją przed dużym wyzwaniem, ale i niepowtarzalną szansą. Pierwsi, którzy znajdą receptę, będę spijać śmietankę. Wyścig już się zaczął. Uważni obserwatorzy rynku IT z pewnością zwrócili uwagę na dwie ubiegłoroczne transakcje na rynku pamięci masowych. EMC wchłonęło Greenplum, dostawcę rozwiązań do zarządzania danymi. Podobny krok wykonał IBM, kupując firmę Netezza, jednego z głównych konkurentów Greenplum. Co ciekawe, IBM w ciągu ostatnich pięciu lat wyłożył 12 mld dol. na zakup 23 firm zajmujących się analityką biznesową. Te dwa przykłady pokazują, że firmy utożsamiane z hardwarem przykładają ogromną wagę do analizy danych. Ale zmiany zachodzą również wśród firm od lat specjalizujących się w opracowywaniu systemów hurtowni danych, takich jak SAP, Sybase, Oracle czy Comarch.

„Tradycyjne hurtownie danych, oparte na starych, relacyjnych bazach danych, które były zaprojektowane do procesów transakcyjnych, po prostu nie działają. Wraz z dodatkowym zalewem informacji, organizacje zmuszone są do szukania kompromisów, a to rzutuje na ich biznes” – tłumaczy Euan MacAra z Sybase.

Nowe sposoby na cyfrową lawinę

Dane w przedsiębiorstwach w ciągu najbliższych pięciu lat wzrosną o 650 proc. Tym, co spędza sen z powiek menedżerom IT, jest inwazja tzw. danych nieustrukturyzowanych – ich udział w przyrastających zasobach cyfrowych będzie wynosić ok. 80 proc. Do tej grupy należą dokumenty tekstowe, obrazy, pliki wideo czy zapisy medyczne. Pozostałe 20 proc. to dane ustrukturyzowane, uporządkowane zasoby znajdujące się w systemach bazodanowych.

„Ustrukturyzowane dane w relacyjnych bazach danych są łatwe do analizy. Działy IT muszą znaleźć platformę, dzięki której będą mogły wykorzystać informacje z nowych źródeł” – mówi MacAra.

Sybase IQ?

Być może przedsiębiorcy sięgną po Sybase IQ. To serwer analityczny, który zamiast magazynowania informacji w rzędowej bazie danych, wykorzystuje arkusz danych informacyjnych i faktycznie przechowuje je jako kolumny. Co daje takie rozwiązanie? Zadając zapytanie systemowi w bazie rzędowej, trzeba sprawdzić 1000 rzędów danych, a w bazie kolumnowej tylko 5 kolumn.

Z kolei receptą SAP na przetwarzanie ogromnych ilości danych ma być technologia in-memory. Jej koncepcja polega na ładowaniu i analizie danych w pamięci operacyjnej. Według Gartnera, w najbliższych latach 70 proc. największych i najszybciej rozwijających się firm na świecie będzie wykorzystywało tę technologię, jako podstawową metodę optymalizacji wydajności i elastyczności aplikacji analitycznych. Na technologii przetwarzania „w pamięci” opiera się platforma SAP HANA. Obejmuje ona warstwę sprzętową, oprogramowanie, bazę danych i jest dostarczona we współpracy z takim partnerami, jak Cisco, Dell, Fujitsu, HP oraz IBM. System radzi sobie ze skomplikowanymi obliczeniami w przeciągu ułamków sekund. SAP podaje przykład klienta z sektora transportowego – SAP HANA pozwala przeszukać 360 mln rekordów dotyczących ruchu ulicznego w nieco ponad sekundę. Ale nie tylko SAP podkręca tempo.

„Ten produkt zapewnia dziesięć razy większą kompresję i przynajmniej dziesięciokrotny wzrost wydajności. Gdyby ten wzrost odnieść do przelotu samolotem pasażerskim nad Atlantykiem, „Exadata Jet” przewiózłby 5 tys. pasażerów w 42 minuty” – opowiada o możliwościach systemu Tomasz Iwanciw z Arrow ECS.

Exadata

Maszyna bazodanowa Exadata to na pierwszy rzut oka pakiet serwerów spiętych szybką magistralą. W rzeczywistości rozwiązanie stanowi spójny klaster, odpowiedzialny za przetwarzanie i składowanie danych. Nowa architektura sprawia, że zakres inteligencji warstwy obliczeniowej i składowania jest porównywalny. To pozwala na porozumiewanie się wszystkich komponentów nie na poziomie prostych bloków, lecz poprzez wymianę informacji i poleceń za pośrednictwem relacyjnej bazy danych. W rezultacie serwer nadrzędny może podzielić się zadaniami z serwerem składowania, zaś sam zająć się wypracowaniem wyniku końcowego

Hadoop

W świecie wielkich danych coraz głośniej mówi się o Hadoop. To projekt open source administrowany przez Apache, bazujący na technologii Google MapReduce. Hadoop pozwala na tworzenie aplikacji przetwarzających olbrzymie zbiory danych. Melanie Posey z IDC widzi przyszłość tej technologii w jasnych barwach. Z jednej strony jest już na tyle dojrzała, żeby mogły z niej korzystać przedsiębiorstwa, a z drugiej, jej wdrożenie nie wymaga kosztownych, wewnętrznych badań. Warto zaznaczyć, że Apache Hadoop jest wykorzystywany m.in. przez Amazon, AOL, Facebook, Yahoo. Niedawno o wsparciu tej technologii w SQL Server oraz platformie Parallel Data Warehouse poinformował Microsoft. Również nowe platformy Greenplum HD Community Edition oraz Greenplum HD Enterprise Edition zintegrowane i wspierane przez Apache Hadoop.

Resellerzy potrzebni

Zmiany otwierają nowe możliwości przed kanałami sprzedaży. Gros przedsiębiorców już wkrótce stanie przed dylematem – jak okiełznać lawinę cyfrowych zasobów. Dlatego resellerzy powinni uważnie przyglądać się wprowadzonym innowacjom. Co ważne, producenci i dystrybutorzy wykazują dużą aktywność w zakresie popularyzacji nowinek.

  • Dla przykładu, Arrow ECS zainwestował ponad milion złotych na stworzenie środowiska testowo-demonstracyjnego Exadaty. Na silne wsparcie ze strony partnerów liczy Comarch. Hurtownie danych, oprócz oprogramowania bazodanowego, zawierają rozwiązania dostawców sprzętu i innych aplikacji.

Ktoś będzie musiał tą układankę poskładać, przy okazji wzbogacając swój portfel. To może być całkiem niezły biznes.


""

Dodaj komentarz

Przeczytaj również

Twój e-PIT bez przysługujących Ci ulg? Zadbaj o swój interes i obniż podatek. Kto prześpi – straci.

Koniec miesiąca zbliża się wielkimi krokami, a wraz z nim – ostateczny termin na złożenie …