Big data to hasło, które pojawia się regularnie w technologicznej dyskusji. Mało tego, według niektórych ekspertów dane są dziś najważniejszym elementem technologicznych startupów.
Na czym polegają i jak działają biznesy oparte na danych? W jaki sposób i ile na danych można zarabiać? Przekonamy się poniżej:
Big data – podstawowe informacje
Big data to termin odnoszący się do dużych, zmiennych i różnorodnych zbiorów danych, których przetwarzanie i analiza jest trudna, ale jednocześnie wartościowa, ponieważ może prowadzić do zdobycia nowej wiedzy. Pojęcie Big data jest względne i oznacza sytuację, gdy zbioru nie da się przetwarzać przy użyciu trywialnych, powszechnie dostępnych metod.
Termin big data stał się częścią technologicznego leksykonu pod koniec lat dziewięćdziesiątych. Wtedy to John Mashey, Chief Scientist w firmie SGI zastosował to wyrażenie do opisania ogromnych i stale rosnących zasobów danych przedsiębiorstw, które były trudne do przechowywania i analizy przy użyciu dostępnej wtedy technologii.
Reguła trzech V
Z kolei w 2001 roku analityk firmy Gartner, Doug Laney zaproponował definicję Big data, która charakteryzowała dane za pomocą reguły “trzech V”:
- Volume (objętość)
- Velocity (prędkość)
- Variety (różnorodność).
W ciągu następnych kilku lat definicja Laney’a stała się czymś w rodzaju standardu branżowego, a z czasem rozszerzano ją o kolejne ‘V’ oznaczające Variability (zmienność) czy też Veracity (wiarygodność).
Przełomowy okazał się rok 2005, kiedy to Yahoo udostępniło społeczności open source platformę Hadoop – o rozproszonej architekturze, pozwalającą gromadzić i przetwarzać ogromne zbiory danych w skali dotychczas niedostępnej. Był to impuls dla rozwoju całego ekosystemu zarówno komercyjnych jak i otwartych rozwiązań do gromadzenia i analizy dużych zbiorów danych dla przedsiębiorstw.
Big data dziś
Obecnie punkt ciężkości z rozwiązań technologicznych, pozwalających gromadzić i zarządzać rosnącą ilością danych różnego rodzaju, przesuwa się w kierunku analityki, data science i uczenia maszynowego. Według badań obejmujących gospodarki dojrzałe, zarządzanie danymi jest w firmach traktowane, jako część podstawowej działalności.
Jak firmy pozyskują dane?
Zdecydowanie najczęściej firmy pozyskują dane za pomocą następujących metod:
- Masowo
- Agregacja i ujednolicanie
- Zdobywanie od partnerów (afiliacja)
- Crowdsourcing.
Masowe zbieranie danych
Z tej metody korzysta między innymi Google. Polega ona na tym, że roboty (algorytmy) tej firmy bezustannie przeszukują Internet poszukując nowych stron, indeksując je i oceniając na potrzeby wyszukiwarki.
Agregacja i ujednolicanie
Z tej metody korzystają agregatory informacji. Zbierają one dane z dostępnych (niekoniecznie publicznie) źródeł i publikują je w ujednoliconej formie – dostępnej dla użytkownika końcowego. W ten sposób działają na przykład takie agregatory informacji, jak Crunchbase czy Dealroom.
Zdobywanie od partnerów
Tym sposobem pozyskiwania danych posługuje się Meta – właściciel portali Facebook i Instagram. Jego model polega na tym, iż poprzez zainstalowanie na stronie “pixela Facebooka” strona zdobywa możliwość korzystania z szeregu dodatkowych funkcji reklamowych (na przykład kierowania reklam do osób, które ją odwiedziły lub zrobiły na niej zakupy), a w zamian przekazuje firmie dane.
Crowdsourcing
Crowdsourcing polega na oferowaniu darmowego dostępu do aplikacji i zawartych w nich informacji w zamian za dane. W taki sposób działa między innymi narzędzie Mapy Google. Zbiera ono dane o trasie użytkownika i tempie jego przemieszczania się, dostarczając w ten sposób informacji o korkach.
Jak zarabiać na zebranych danych?
Gdy już nasza firma zgromadzi wystarczające dane, istnieją sposoby, aby na nich zarobić. Po pierwsze, możemy założyć biznes, który będzie bazował na tych konkretnych danych, jeśli są one w jakiś sposób przetworzone i ujednolicone. Mowa tutaj o wprowadzeniu na rynek unikalnego produktu – zazwyczaj aplikacji lub narzędzia, który będzie je wykorzystywał.
W ten sposób działa chociażby już wspomniany wcześniej agregator informacji Crunchbase. Pozwala on na publikację i sprawdzenie wielu rodzajów danych o firmach – rund finansowania, exitów, ogłoszeń, newsów czy zarządów biznesów.
Dodatkowo uwzględnia on profile wielu organizacji z ekosystemu startupowego – funduszy, akceleratorów czy inkubatorów. Co więcej, informuje on również o eventach czy inkubatorach akademickich.
Sprzedaż danych
Ponadto, możemy zebrane dane po prostu sprzedać. Jest to jednak z reguły kwestia dość drażliwa z poziomu użytkownika końcowego.
Natomiast nie zawsze musi tak być – w wielu przypadkach możemy sprzedawać dane, które nie są danymi osobowymi. Mowa tutaj choćby o danych geolokalizacyjnych lub danych użytkowania aplikacji.
Ponadto, sprzedaż danych nie musi dotyczyć koniecznie osób. Cennymi danymi mogą być też konkretne zdarzenia. Mało tego, dane mogą być także przetworzone (zagregowane) w taki sposób, by ukryć tożsamość użytkowników.
Ile można zarobić?
Nie ma żadnych wątpliwości, że przychody biznesów opartych na danych mogą skutecznie zawrócić w głowie. Omawiany wyżej portal Crunchbase założony został w 2007 roku.
Dziś jest oddzielną spółką prywatną, która zatrudnia ponad 270 pracowników, a jego średni roczny przychód w ostatnich pięciu latach szacowany jest na 40 milionów dolarów. Ponadto, do tej pory firma pozyskała już ponad 56 milionów USD zewnętrznego finansowania.
Przykład z polskiego rynku
Z kolei biznesem opartym na danych na rodzimym rynku jest Brand24. Spółka ta w październiku 2011 roku wypuściła na rynek narzędzie do ochrony reputacji i monitoringu treści pojawiających się w Internecie – zarówno na portalach, blogach, jak i w mediach społecznościowych.
Od maja 2021 roku Brand24 jest notowane na głównym parkiecie Giełdy Papierów Wartościowych w Warszawie. Kapitalizacja spółki przekracza w tym momencie 51 milionów złotych, a jej przychody ze sprzedaży w trzecim kwartale bieżącego roku przekroczyły 5,8 miliona złotych. Ponadto, dziś w gronie klientów Brand24 znajdują się takie marki jak Intel, Carlsberg, IKEA, H&M, Vichy, GlaxoSmithKline, czy Crédit Agricole.
Podsumowanie
Jak zatem widzimy, big data to niezwykle perspektywiczny sektor, a jeśli mamy dobry, unikalny pomysł na biznes, to możemy sporo zarobić. Jednak w każdym przypadku niezbędne w pierwszej kolejności będzie zebranie danych odpowiedniej ilości.
A to już niestety zdecydowanie czasochłonny proces – chyba, że dzięki prowadzonej do tej pory działalności nasza firma dysponuje już szeregiem dotyczących klientów, produktów, usług, czy ich realizacji. W takiej sytuacji nic nie stoi na przeszkodzie, by zacząć z nich korzystać.