2 Czym Są Duże Zbiory Danych?
Czym Są Duże Zbiory Danych?
- Dane o bardzo dużym rozmiarze, zwykle w zakresie, w jakim ich manipulacja i zarządzanie stanowią poważne wyzwania logistyczne. Słownik angielski oxford.
- Nowe podejście firm, organizacji non-profit, agencji rządowych i osób prywatnych, które zdaje sobie sprawę, że łączenie danych z wielu źródeł może prowadzić do lepszych decyzji. Gill Press w Forbes, 2014.
- Zasoby informacyjne o dużej objętości, dużej prędkości i różnorodności, które wymagają opłacalnych, innowacyjnych form przetwarzania informacji w celu lepszego wglądu i podejmowania decyzji. Gartner, 2014
Zanim zaczniemy, zapoznajmy się z historią Modelu T Forda.
Modelu T Forda.
Ford Model T to samochód produkowany przez Ford Motor Company od 1 października 1908 r. do 26 maja 1927 r. Jest powszechnie uważany za pierwszy tani samochód – samochód, który otworzył amerykańskiej klasie średniej możliwość podróżowania.
Fabryka Forda Piquette Avenue nie była w stanie nadążyć za popytem na model T. – w pierwszym pełnym miesiącu produkcji zbudowano tam tylko 11 samochodów. W 1910 roku, po zmontowaniu prawie 12 000 egzemplarzy modelu T, Henry Ford przeniósł firmę do nowego kompleksu w Highland Park. W tym czasie system produkcji modelu T stał się kultowym przykładem produkcji na linii montażowej; w kolejnych dziesięcioleciach będzie on również postrzegany jako klasyczny przykład sztywnej linii produkcyjnej pierwszej generacji.
W 1914 roku Ford wyprodukował więcej samochodów niż wszyscy inni producenci samochodów razem wzięci. Model T był wielkim sukcesem komercyjnym i zanim Henry wyprodukował swój 10-milionowy samochód, połowa wszystkich samochodów na świecie była Fordami. Odniósł tak duży sukces, że Ford nie musiał inwestować w reklamę w latach 1917–1923.
Ideologiczne podejście Henry’ego Forda do projektu modelu T polegało na stworzeniu sprawnego pojazdu, a następnie utrzymaniu go na tym samym poziomie; wierzył, że model T był jedynym samochodem, którego klient będzie mógł pożądać. Ponieważ inne firmy oferowały korzyści w zakresie komfortu i stylizacji w konkurencyjnej cenie, model T zaczął tracić udział w rynku. Przeprowadzono zmiany w projekcie auta, ale idea niezmiennego modelu pozostała nietknięta. Ostatecznie 26 maja 1927 r. Ford Motor Company wstrzymało produkcję w USA.
Interpretacja:
W dzisiejszym świecie pomysł na JEDEN typ produktu wydaje się bardzo nieaktualny. Ford stracił udział w rynku, ponieważ konsumenci oczekiwali różnych typów samochodów o różnych cechach, dostosowanych do ich potrzeb i gustów.
Dzisiejsi konsumenci chcą spersonalizowanych usług. Rentowność przedsiębiorstwa zależy od tego. Nie możemy już więcej tworzyć rzeczy „ogólnych”.
Porównaj model T (tzw. „jeden rozmiar dla wszystkich”) z dzisiejszym sklepem, w którym znajomość potrzeb i zainteresowań klientów jest niezbędna zdobycia ich serc.
W jaki sposób możemy poznać potrzeby i zainteresowania klientów, aby dopasować do nich nasze usługi?
To właśnie siła drzemiąca w danych.
2.1 Zasada 5 V
Wielkość
Wszystko w świecie zarządzania danymi rośnie masowo, wykładniczo i bezlitośnie.
Tak długo, jak codzienna działalność będzie prowadzona online, dane będą nadal rosły pod względem ilości i wielkości.
Prędkość
Technologia Big Data pozwala nam analizować dane podczas ich generowania, bez umieszczania ich w bazach danych.
Dla wielu firm szybkość tworzenia danych jest nawet ważniejsza niż ich ilość.
Informacje w czasie rzeczywistym
MIT Media Lab wykorzystało dane lokalizacji z telefonów, aby ustalić, ile osób było na parkingach Macy w Czarny piątek.
Mogli oszacować sprzedaż w tym krytycznym dniu, nawet zanim samo Macy odnotowało tę sprzedaż.
Szybkie analizy zapewniają analitykom i menedżerom oczywistą przewagę konkurencyjną.
Różnorodność
Zanim dane stały się wstępnie ustrukturyzowane – były liczbowe i wysoce zorganizowane. Obecnie 80% światowych danych jest nieuporządkowanych (w tym zdjęcia, aktualizacje w mediach społecznościowych, odczyty z czujników itp.)
Dzisiejsza technologia Big Data pozwala na jednoczesne gromadzenie, przechowywanie i wykorzystywanie danych ustrukturyzowanych i nieustrukturyzowanych.
Wiarygodność
Duże zbiory danych mogą być kluczowe dla strategii rozwoju biznesu, ale nie ma z nich wiele korzyści, jeśli są niedokładne.
Główne problemy to niekompletność i niekonsekwentność. Gdy weźmie się te czynniki pod uwagę, łatwiej jest oczyścić dane.
Wartość
Przy tak dużej ilości danych łatwo wpaść w pułapkę i wkroczyć w ten świat bez jasnego zrozumienia wartości biznesowej, jaką dane ze sobą niosą.
Dostosowanie danych do potrzeb Twojej firmy pozwoli Ci uwolnić potencjał ukryty w zebranych informacjach, co oznacza, że uzyskasz maksymalną wartość z posiadanych danych.
2.2 Zrozumieć Dane
DANE GENEROWANE MECHANICZNIE
Obejmują transakcje w systemach finansowych, aplikacje w chmurze, zapisy szczegółów połączeń, urządzenia medyczne, dane GPS i dane z czujników. Są cenne, ponieważ zawierają ostateczny zapis zachowań użytkowników i ich transakcji w czasie rzeczywistym.
DANE SPOŁECZNE
Informacje, które publicznie udostępniają użytkownicy mediów społecznościowych, w tym metadane, takie jak lokalizacja użytkownika, język, dane biograficzne i/lub udostępnione linki. Jest to przydatne dla marketerów poszukujących informacji o klientach, które mogą zwiększyć sprzedaż.
DANE GENEROWANE PRZEZ CZŁOWIEKA
Występują jako nieliczbowe, nieustrukturyzowane dane z ankiet online, wpisów w mediach społecznościowych, a nawet rozmów telefonicznych. Są cenne, ponieważ opisują zainteresowania danej osoby w społecznych aspektach interakcji międzyludzkich, ale ich analiza może być bardzo trudna.
METADANE
Dane, które zawierają informacje o innych danych. Na przykład informacje o tytule, temacie, autorze i rozmiarze dokumentu stanowią metadane dotyczące tego dokumentu.