Biznes opiera się na wyszukiwaniu danych i wyciąganiu z nich właściwych wniosków. Chodzi o to, by analizować je szybko i poprawnie, tak by zapewnić własnej firmie jak największy sukces. Czy można się tego nauczyć z książki? Poradnik „Analiza danych w biznesie. Sztuka podejmowania skutecznych decyzji” udowadnia, że jak najbardziej – można.
Kilka słów o autorach
Książka jest dziełem Fostera Provosta i Tom Fawcetta. Są oni pracownikami naukowymi na New York University Stern School of Business. Provost dodatkowo jest też zaangażowany w tworzenie 5 startupów – Dstillery, Integral Ad Science (IAS), Everyscreen Media, Predicube oraz Detectica.
Nisza na rynku wydawniczym
„Analiza danych w biznesie” to książka, która doskonale wpisuje się w niszę na rynku wydawniczym. Problem analizy danych jest bardzo szeroki. Wielu przedsiębiorców chciałoby dobrze radzić z tą tematyką. Niestety, jest ona dość rozbudowana i skomplikowana. W związku z tym każdy z poradników tego typu trafia na bardzo podatny grunt. Ta książka również zdobyła wielu czytelników i szybko zyskała tytuł bestsellera.
Dla wszystkich
Książka skierowana jest właściwie dla wszystkich, którzy mają styczność z danymi i chcieliby zyskać umiejętność wyciągania z nich właściwych wniosków. Ta ponad 360 stronicowa pozycja zajmuje się badaniem związków przyczynowo-skutkowych. Niektóre przedstawiane przez nich przykłady są bardzo proste – do miasta zbliża się huragan, czy w sklepach powinno pojawić się większe zatowarowanie? Czy to dobry czas na sprzedaż produktów spożywczych, czy może będą sprzedawać się wiertarki i młotki? Pojawiają się też przykłady bardziej zaawansowanej analizy danych. Autorzy przedstawiają jak na podstawie wieku, zmian w garderobie, zażywanych witamin oraz zakupów robionych przez daną grupę ludzi można wnioskować, czy aktualnie starają się o dziecko. W związku z tym, można też wystartować dla nich specjalną kampanię marketingową.
Szeroki wstęp
Książka rozpoczyna się bardzo rozbudowanym wstępem. Autorzy przedstawiają w nim dlaczego warto myśleć w sposób analityczny oraz jak taki sposób myślenia można przekształcić w sposób na zarobek. Wykazują też istotność właściwego, nowoczesnego spojrzenia na dane. Wyjaśnione zostały też podstawowe pojęcia: „zbiór kanonicznych zadań związanych z eksploracją danych”, „nadzorowania i nienadzorowania eksploracji danych”, a także sam proces „eksploracji danych”.
Budowa książki
Podręcznik „Analiza danych w biznesie” składa się z czternastu rozdziałów. Każdy z nich rozpoczyna się wyjaśnieniem podstawowych pojęć, bez których nie byłoby możliwości zrozumienia dalszej treści. Każdy z rozdziałów jest też zakończony podsumowaniem. Umieszczono w nim najważniejsze informacje w wersji skróconej i dużo mniej rozbudowanej. Zawiera w sobie skondensowaną wiedzę, którą można wykorzystać do szybkiego przypomnienia sobie materiału z całego rozdziału. Jako dodatki do książki przygotowano „Przewodnik dotyczący oceny propozycji”, a także słowniczek, obszerną bibliografię i skorowidz.
Najważniejsze problemy
W książce poruszono wszystkie najważniejsze problemy związane z analizą danych. Dzięki niej można dowiedzieć się sporo o modelowaniu predykcyjnym oraz wszystkim od korelacji aż do nadzorowanej segmentacji. Następnie poruszono temat dopasowywania modelu do danych. Jest to niezbędne do jakiejkolwiek analizy danych. Foster Provost i Tom Fawcett tłumaczą też jakie ryzyko niesie ze sobą nadmierne dopasowanie, czyli tzw. przeuczenie. Wyjaśniają jasno i dobitnie (a nawet przy pomocy wykresów) dlaczego nadmierne dopasowanie jest niekorzystne oraz jak powinno się go unikać. W tym poradniku sporo miejsca poświęcono też wnioskowaniu na podstawie podobieństw, najbliższego otoczenia i sąsiadów. Okazuje się, że można określić jak duży wpływ na podejmowane przez nas decyzje mają sąsiedzi. Pojawia się tu przykład analityki whisky. Następnie skupiają się na tym czym właściwie jest dobry model i jak go rozpoznać. Jak wybrać klasyfikatory oraz jak przeprowadzić generalizację poza klasyfikacją. Ważna jest też wizualizacja skuteczności modelu. Dzięki niej, można określić czy model faktycznie został odpowiednio dobrany. Przedstawiono tu krzywe zysku, krzywe łącznej reakcji, krzywe przyrostu oraz krzywe ROC. Wyjaśniono też, kiedy ranking sprawdza się lepiej niż klasyfikowanie oraz dlaczego warto się na niego decydować. Następny rozdział dotyczy dowodów i prawdopodobieństwa. Są to pojęcia czysto matematyczne, które można wykorzystać także w innych dziedzinach życia, a jedną z nich jest właśnie analiza danych.
Słowa są trudne
Według autorów książki „Analiza danych w biznesie” słowa mają ogromną moc. Z tego powodu też są trudne. Mimo to, mają swoje spore znaczenie w analizie danych. Pod uwagę należy wziąć reprezentację worka słów (tzw. bag of words), częstość termów, mierzenie rzadkości, odwrotna częstość w dokumentach oraz łączenie reprezentacji TFIDF. Książka uczy też myślenia w kategoriach analityki decyzji. Udowadnia, że naukę o danych można wykorzystywać do rozwiązywania problemów biznesowych. Wszystko jednak należy zacząć od inżynierii analitycznej. Nie trzeba też obawiać się wykorzystania dostępnych danych, narzędzi i technik. Nauka o danych i strategia biznesowa wymaga wprowadzenia w życie stosownych zasad (przedstawionych w książce). Dzięki nim zwiększa się szansę firmy na osiągnięcie pożądanego sukcesu. Każdy przedsiębiorca powinien poznać te zasady i skorzystać z nich.
Podręcznik dla maniaków
Pomimo, że „Analiza danych w biznesie” została napisana bardzo przystępnym językiem to raczej nie nadaje się dla laika. Jest to bardziej kwestia związana z materiałem, który obejmuje. Analiza danych jest dziedziną, która ma silne korzenie w matematyce. W związku z tym poszczególne rozdziały bardzo przypominają lekcje tego przedmiotu. W książce umieszczono wiele wyliczeń, liczb, tabelek i wykresów. Dla kogoś, kto się ich nie spodziewa – może to być prawdziwym szokiem. Jednak osoby obeznane już z analizą danych i mające świadomość, że jest to dziedzina bardziej matematyczna niż psychologiczna – będą zachwycone.