4. Analiza danych
Ocena danych przy użyciu narzędzi analitycznych i statystycznych w celu znalezienia przydatnych informacji i pomocy w podejmowaniu decyzji biznesowych.
Analiza
CZYSZCZENIE. Niedokładne lub niekompletne dane mogą prowadzić do wypaczonych wyników. Analitycy czyszczą zestawy danych, na przykład usuwając nieprawidłowe wpisy lub duplikaty informacji.
ZBIERANIE. Surowe dane mogą być gromadzone i przechowywane w kilku różnych formatach. Agregacja danych to kompilacja informacji z różnych zestawów danych, dzięki czemu narzędzia analizy danych mogą je importować i pracować z nimi.
ANALIZA STATYSTYCZNA. Najczęstszy rodzaj analizy, polega na dokładnym zbadaniu głównie danych ilościowych w celu zidentyfikowania trendów. Standardowe analizy obejmują średnią arytmetyczną, odchylenie standardowe, regresję i testowanie hipotez.
ANALIZA TEKSTU. Częściowo ustrukturyzowane lub nieustrukturyzowane dane w formie tekstów narracyjnych można analizować poprzez „parsowanie” tekstów w celu wyodrębnienia fragmentów danych, które można odczytać maszynowo.
WYDOBYWANIE DANYCH. Jeśli pracujesz z bardzo dużymi zestawami danych, eksploracja danych wykorzystuje uczenie maszynowe, sztuczną inteligencję i statystyki do znajdowania wzorców i korelacji w celu przewidywania wyników.
ANALITYKA WIZUALNA. Aby zidentyfikować wartości odstające, luki, trendy i interesujące punkty danych, wielu analityków tworzy wykresy i reprezentacje wizualne, które zapewniają różne perspektywy i wskazują obszary wymagające dalszych badań.
CZEGO SZUKAĆ
FAKTZ
- Liczby, które oferują ogólne podsumowanie twoich danych.
- Podają informacje, które warto znać, i pomagają zapoznać się ze zbiorem danych.
Np.
- 100 odbiorców,
- 50 kliknięć w e-mail,
- 50% współczynnik klikalności.
STATYSTYKI
- Podstawowe statystyki opisowe, takie jak średnia, mediana, tryb, rozkład itp.
- Pomagają lepiej wizualizować wszelkie wzorce, które mogą występować w danych i zapewniają podsumowanie zmiennych na wysokim poziomie.
TRENDY
- Porównania i zmiany w czasie, w obrębie tej samej grupy w różnych punktach czasowych lub między grupami w tym samym czasie lub w różnych punktach czasowych.
- W połączeniu z faktami i statystykami ujawnia bardziej wyrafinowane wzory.
Np.
- poziom zadowolenia między dwoma różnymi programami
Ocena danych przy użyciu narzędzi analitycznych i statystycznych w celu znalezienia przydatnych informacji i pomocy w podejmowaniu decyzji biznesowych.
“Jaka jest różnica między analizą danych i wizualizacją danych?”
SOURCE Forbes, March 2019 Jackson, Ann. “Sales and profitability by US state”, in Murray, Eva