Połącz się z nami

Cześć, czego szukasz?

Poradniki

Big data – co to takiego i dlaczego musisz o tym wiedzieć?

Czym jest big data?

Każda osoba prowadząca swoją działalność w sieci prędzej czy później spotka się z terminem big data. Mamy tu do czynienia z ogromną ilością informacji. Warto jednak podkreślić, że odpowiednio usystematyzowane, mogą okazać się kluczowe dla rozwoju firm, które z nich korzystają. Wypada więc przyjrzeć się bliżej temu zagadnieniu.

Czym jest big data?

W dużym skrócie można powiedzieć, że jest to termin obejmujący zmienne, różnorodne zbiory danych o dużej objętości. Dotyczy on również wszelkich procesów analitycznych oraz systematyzujących, a także technologii ich składowania.

Gromadzenie danych nie jest niczym nowym. Takie zjawisko miało miejsce w zasadzie od początku istnienia komputerów. Jednak rozwój technologii i internetu na przestrzeni ostatnich lat spowodował gwałtowny przyrost danych, niemożliwy do przetworzenia przez zwykłe komputery. Potrzeba do tego specjalnego oprogramowania, które ma dostęp do baz danych na całym świecie. Po co pracować z tymi danymi? Zastosowań jest mnóstwo, jednak o nich powiemy sobie w dalszej części wpisu.

Samo określenie „big” można interpretować na dwa sposoby, które zresztą się nie wykluczają. Najbardziej oczywisty to ten nawiązujący do ogromu informacji, reprezentowanego przez big data. Drugi z kolei akcentuje, jak wielkie ma to obecnie znaczenie dla rozwoju firm z nich korzystających.

Historia big data

Big data – historia

Samo zjawisko gromadzenia ogromnej ilości informacji zostało dostrzeżone już w latach czterdziestych XX wieku. Było to na długo przed rozwojem informatyzacji i popularyzacją tego zjawiska w formie, którą znamy obecnie. Jednak ówcześni analitycy alarmowali, że biblioteki i archiwa już pękają w szwach od nagromadzonych informacji, a dalszy przyrost w tym tempie może stać się niemożliwy do usystematyzowania.

Wraz z pojawieniem się komputerów oraz generowanych przez nie plików danych, problem wrócił w nowej odsłonie. Początkowo nie było to zjawisko powszechne. Jednak wraz z upowszechnieniem tychże urządzeń oraz rozwojem internetu, ponownie pojawił się problem z analizą produkowanych danych. Żeby zobrazować, jak bardzo postępuje obecnie to zjawisko, wystarczy przytoczyć przykład, że w ciągu 48 godzin jesteśmy w stanie wyprodukować więcej danych niż cała ludzkość, odkąd zaczęła gromadzić jakiekolwiek informacje aż do 2003 roku! Wobec tego obecnie poszukuje się jak najskuteczniejszych systemów big data, które umożliwią wykorzystanie potencjału drzemiącego w danych, które nie zostały dotąd usystematyzowane.

Współczesne pojęcie „big data” pojawiło się na początku XXI wieku. Analityk Doug Laney zaproponował kanon jego wykorzystania, który składał się z trzech „V”:

  • volume, czyli ilość. Zakłada gromadzenie jak największej liczby danych ze stron internetowych, mediów społecznościowych, a także tych wymienianych między urządzeniami;
  • velocity – szybkość przetwarzania uzyskanych informacji big data;
  • variety, czyli różnorodność. Mowa tu o wyborze formatu dostarczanych danych (konkretna struktura lub jej brak).

W Polsce zwykle do określania big data używamy schematu 4W:

  1. wykorzystywanie najpierw danych uzyskanych przez siebie;
  2. wnioskowanie na podstawie własnej analizy albo opinii ekspertów;
  3. wzbogacanie swojej bazy o informacje z rynku;
  4. weryfikacja hipotez i wniosków.

Jak działa big data i jak nimi zarządzać?

Już w latach 90. pojawiały się głosy, które zakładały powstanie maszyn, które będą w stanie analizować dane big data oraz odpowiednio je segregować i wyciągać wnioski. Wtedy wyobrażano je sobie jako potężne komputery, które będą wykonywały tę tytaniczną pracę. Dziś wiemy, że wygląda to nieco inaczej, gdyż większość danych przechowywana jest w sieci. Zarządzanie dużymi woluminami danych zmusiło firmy IT  do wynalezienia nowych rozwiązań w zakresie ich przechowywania, a także oprogramowania, które temu ma służyć. W chwili obecnej kluczowe role w tej dziedzinie spełniają programy Apache Hadoop, projekt Stratosphere oraz model Cloud Computing.

Co to jest big data I jakie ma zastosowanie?

Big data w dzisiejszym świecie analityki – gdzie znajduje zastosowanie?

Big data jest wszędzie. Korzystają z nich finanse, firmy analityczne, edukacja – szczególnie uczelnie wyższe, służba zdrowia czy organy ścigania. Szybki dostęp do wybranych informacji pozwala uzyskać niezbędne dane wtedy, kiedy najbardziej tego potrzeba. Dobrze widać to na przykładzie marketingu internetowego, gdzie odpowiednia analiza big data pozwala dobrać właściwą kampanię reklamową. Z kolei przedsiębiorstwa produkujące najróżniejsze rzeczy, od żywności, przez ubrania, aż po elektronikę, są w stanie dobrze zidentyfikować potrzeby konsumentów i dostarczać im tego, czego poszukują.

Przy tej okazji warto wspomnieć o konsekwencjach związanych z nieuczciwym pozyskiwaniem danych, a także nadmiernej ingerencji w prywatność użytkowników. Wynikiem tego typu praktyk była reakcja Unii Europejskiej i wprowadzenie RODO. Miało to ograniczyć dostęp firm do prywatnych danych. Warto tu pamiętać, że jeszcze kilka lat temu problem dotyczył jedynie komputerów i laptopów, a obecnie każdy używa smartfonów, które są doskonałym źródłem informacji o nas samych. Już dekadę temu analitycy przewidywali, że dojdzie do sytuacji, gdy w internecie będą dostępne jakby indywidualne profile osobowościowe każdego z użytkowników, utworzone na podstawie zebranych od nich danych, odnośnie przeglądanych stron, tworzonych postów itd. Stąd warto kontrolować to, komu udzielamy zgody na wykorzystywanie naszych danych.

Może wydawać się, że korzystanie z big data jest przeznaczone tylko dla wielkich korporacji, dysponujących odpowiednim oprogramowaniem, ale prawda jest taka, że taka możliwość stoi przed każdym. Dostępne systemy CRM korzystają z baz danych i pozwalają na efektywne prowadzenie biznesu w internecie. Jest to tym istotniejsze, że czas pandemii przeniósł większość zakupów i usług do sieci. W związku z tym odpowiednia analiza danych może sprawić, że nawet mały biznes trafi na niszę, która wyniesie go na zupełnie inny poziom. Nie należy się bać nowych narzędzi, których dostarcza nam nowoczesna technologia. Trzeba z nich mądrze korzystać i pozwolić sobie na rozwinięcie skrzydeł. Nastały prawdziwe czasy big data!

NEWSLETTER

Przeczytaj również

Wydarzenia

Format wydarzenia: prelekcje online Termin: 27.04.2021r., godz. 15:00-16:30 Forma uczestnictwa: wydarzenie bezpłatne Link do wydarzenia: https://dimaq.pl/dimaq-voice-online/ Już niebawem – 27 kwietnia 2021 r. odbędzie się...

Poradniki

Google Analytics 4, czyli nowa wersja popularnego narzędzia do analityki internetowej, jest z nami już od prawie dwóch lat. Ale co tak naprawdę się zmieniło? Przyjrzyjmy...

Wydarzenia

Format wydarzenia: webinar Termin: 15.04.2021, godz. 10:00 Forma uczestnictwa: wydarzenie bezpłatne Link do wydarzenia: http://bit.ly/akademia-marketingu-antyporadnik Już niebawem – 15 kwietnia 2021 r. odbędzie się kolejne...

Poradniki

Ostatnie czasy znacząco zwiększyły wymagania dotyczące pracodawcy. Duża konkurencyjność innych przedsiębiorstw i niewielu pracowników (zwłaszcza na specjalistycznych stanowiskach) na rynku pracy sprawiają, że znacząco...