Lista 10 najlepszych książek o nauce o danych i opisów dla generalisty

Lista 10 Najlepszych Ksiazek O Nauce O Danych I Opisow Dla Generalisty



Data Science to dziedzina nauki, która zajmuje się przetwarzaniem ogromnych ilości danych przy użyciu metod naukowych, procesów, algorytmów i systemów w celu znajdowania niewidocznych wzorców, uzyskiwania znaczących informacji, podejmowania decyzji biznesowych w firmach, a także wykorzystywania ich w instytucjach pozabiznesowych. Instytucje niebiznesowe obejmują branże związane z opieką zdrowotną, grami, rozpoznawaniem obrazu, systemami rekomendacji, logistyką, wykrywaniem oszustw (instytucje bankowe i finansowe), wyszukiwaniem w Internecie, rozpoznawaniem mowy, reklamą ukierunkowaną, planowaniem tras linii lotniczych i rzeczywistością rozszerzoną. Data Science to podzbiór sztucznej inteligencji. Dane wykorzystywane do analizy mogą pochodzić z wielu różnych źródeł i są prezentowane w różnych formatach. Niektóre dane źródłowe mogą być zestandaryzowane; inne mogą nie być znormalizowane.

Innymi słowy, do gromadzenia danych stosuje się różne metodologie (liczba mnoga od danych). Następnie z zebranych danych wydobywana jest wiedza (warte wnioski). W procesie, po zebraniu danych, przeprowadza się na nich (dane) badania w celu uzyskania nowych danych (wyników), z których rozwiązuje się problemy.







Data Science jako (główna) dyscyplina istnieje na poziomie studiów licencjackich i magisterskich na uniwersytecie. Jednak tylko kilka uniwersytetów na świecie oferuje Data Science na poziomie licencjata lub magistra. Na poziomie licencjata student kończy studia z tytułem Data Science. To jest jak stopień ogólnego przeznaczenia. Na poziomie magisterskim student kończy studia podyplomowe w dziedzinie nauki o danych, specjalizując się w analizie danych, inżynierii danych lub jako naukowiec danych.



Może zaskoczyć czytelnika i być może niestety, że uczenie maszynowe, modelowanie, statystyka, programowanie i bazy danych to wiedza niezbędna do studiowania nauki o danych na poziomie licencjata, mimo że są one szanowanymi kursami uniwersyteckimi na swoich prawach, studiowanymi w inne dyscypliny na poziomie licencjata lub magistra. Niezależnie od tego, kiedy student idzie na uniwersytet, aby studiować Data Science na poziomie dyplomowym, wszystkie te kursy będą nadal studiowane, obok lub przed właściwymi kursami, dla Data Science.



Data Science for Bachelor's Degree lub jego specjalizacje, takie jak Data Analytics, Data Engineering lub jako Data Scientist są wciąż w fazie rozwoju; chociaż osiągnęły etap, w którym są stosowane w branżach po przestudiowaniu (na uniwersytecie). Nauka o danych jest ogólnie stosunkowo nową dyscypliną.





Pamiętaj, że najpierw powinieneś być generalistą, zanim zostaniesz specjalistą. Rozróżnienia między programami specjalistycznymi nie są jeszcze jasne. Rozróżnienie między programami ogólnymi i specjalistycznymi nie jest jeszcze jasne.

Ponieważ nauka o danych jest stosunkowo nową dyscypliną, książki opisane w tym dokumencie są oparte na zakresie treści, a nie na pedagogice (jak dobrze uczy książka). I są przeznaczone dla programu studiów licencjackich (ogólnych). Istnieją różne kursy ogólne.



Lista

Aby uzyskać więcej informacji i możliwość zakupu za pomocą karty kredytowej, podano hiperłącze do każdej z książek. Żadna z książek nie obejmuje wszystkich kursów ogólnych.

Podstawowa matematyka dla nauki o danych: rachunek różniczkowy, statystyka, teoria prawdopodobieństwa i algebra liniowa

Scenariusz: Hadrien Jean

  • Wydawca: Hadrien Jean
  • Data publikacji: po 30 września 2020 r
  • Język: angielski
  • Liczba stron: ponad 400

Treść tej książki może być postrzegana jako kurs matematyki dla nauki o danych. Chociaż samodzielna nauka Data Science nie jest zalecana, absolwent szkoły średniej, który chce samodzielnie uczyć się Data Science, powinien zacząć od tej książki.

Treść: Rachunek; Statystyka i prawdopodobieństwo; Algebra liniowa; skalary i wektory; macierze i tensory; Rozpiętość, zależność liniowa i transformacja przestrzeni; Układy równań liniowych; Wektory własne i wartości własne; Rozkład według wartości osobliwych.

https://www.essentialmathfordatascience.com/

Zdroworozsądkowy przewodnik po strukturach danych i algorytmach: popraw swoje podstawowe umiejętności programowania / wydanie drugie

Scenariusz: Jay Wengrow

  • Wydawca: Pragmatic Bookshelf
  • Data publikacji: 15 września 2020 r
  • Język: angielski
  • Wymiary: 7,5 x 1,25 x 9,25 cala
  • Liczba stron: ‎508

Ta książka dotyczy algorytmów i struktur danych, które są używane w nauce o danych. Zakładając, że ktoś sam uczy się Data Science po ukończeniu szkoły średniej, to jest to kolejna książka do przeczytania po przeczytaniu poprzedniej książki do matematyki. Przykładowe programy podano w językach JavaScript, Python i Ruby.

Treść: Dlaczego struktury danych mają znaczenie; Dlaczego algorytmy mają znaczenie; O tak! Notacja dużego O; Przyspieszenie kodu dzięki dużemu O; Optymalizacja kodu z dużym O i bez niego; Optymalizacja pod kątem optymistycznych scenariuszy; Wielkie O w codziennym kodzie; Błyskawicznie szybkie wyszukiwanie dzięki tablicom skrótów; Tworzenie eleganckiego kodu ze stosami i kolejkami; Rekurencyjnie rekurencyjnie z rekurencją; Nauka pisania w trybie rekurencyjnym; Programowanie dynamiczne; Algorytmy rekurencyjne dla szybkości; Struktury danych oparte na węzłach; Przyspieszenie wszystkich rzeczy dzięki drzewom wyszukiwania binarnego; Utrzymywanie prostych priorytetów dzięki stosom; Nie zaszkodzi spróbować; Łączenie wszystkiego za pomocą wykresów; Radzenie sobie z ograniczeniami przestrzennymi; Techniki optymalizacji kodu

Inteligentniejsza nauka o danych: sukces dzięki projektom związanym z danymi i sztuczną inteligencją klasy korporacyjnej / 1 ul Redagowanie

Scenariusz: Neal Fishman, Cole Stryker i Grady Booch

  • Wydawca: Wiley
  • Data publikacji: 14 kwietnia 2020 r
  • Język: angielski
  • Liczba stron: ‎286

Treść: Wspinaczka po drabinie AI; Ramy Część I: Uwagi dla organizacji korzystających ze sztucznej inteligencji; Framing Part II: Uwagi dotyczące pracy z danymi i sztuczną inteligencją; Spojrzenie wstecz na analitykę: więcej niż jeden młot; Spojrzenie w przyszłość na temat analiz: nie wszystko może być gwoździem; Zajęcie się dyscyplinami operacyjnymi na drabinie AI; Maksymalne wykorzystanie Twoich danych: kierowanie się wartością; Wycena danych za pomocą analizy statystycznej i umożliwienie sensownego dostępu; Konstruowanie na dłuższą metę; Koniec podróży: IA dla AI.

Uczenie maszynowe: perspektywa probabilistyczna (seria obliczeń adaptacyjnych i uczenia maszynowego) wydanie ilustrowane

Scenariusz: Kevin P. Murphy

  • Wydawca: The MIT Press
  • Data publikacji: 24 sierpnia 2012 r
  • Język: angielski
  • Wymiary: 8,25 x 1,79 x 9,27 cala
  • Liczba stron: ‎1104

Ta książka jest dobra dla początkujących. Ponownie, podobnie jak wszystkie pozostałe książki opisane w tym dokumencie, ta książka nie obejmuje wszystkiego, co jest potrzebne do programu ogólnego, który niestety wciąż nie jest sfinalizowany (programy specjalistyczne również nie są jeszcze sfinalizowane). Typowym początkującym jest tu absolwent szkoły średniej z zaliczeniem z matematyki i informatyki.

Treść: Wprowadzenie (Uczenie maszynowe: co i dlaczego?, Uczenie bez nadzoru, Podstawowe pojęcia w uczeniu maszynowym); Prawdopodobieństwo; Modele generatywne dla danych dyskretnych; modele gaussowskie; statystyki bayesowskie; Statystyki frekwencjonistów; regresja liniowa; regresja logistyczna; Uogólnione modele liniowe i rodzina wykładnicza; Skierowane modele graficzne (sieci Bayesa); Modele mieszanin i algorytm EM; Utajone modele liniowe; Rzadkie modele liniowe; Jądra; procesy gaussowskie; Adaptacyjne modele funkcji bazowych; Markowa i ukryte modele Markowa; Modele przestrzeni stanów; Niekierowane modele graficzne (pola losowe Markowa); Dokładne wnioskowanie dla modeli graficznych; Wnioskowanie wariacyjne; Więcej wnioskowania wariacyjnego; wnioskowanie Monte Carlo; Wnioskowanie Monte Carlo łańcucha Markowa (MCMC); Grupowanie; Graficzne uczenie się struktury modelu; Modele zmiennych ukrytych dla danych dyskretnych; Głęboka nauka.

Nauka o danych dla biznesu: co musisz wiedzieć o eksploracji danych i analizie danych / wydanie 1

Scenariusz: Tom Fawcett i Foster Provost

  • Wydawca: O’Reilly Media
  • Data publikacji: 17 września 2013 r
  • Język: angielski
  • Wymiary: 7 x 0,9 x 9,19 cala
  • Liczba stron: ‎413

Treść: Myślenie oparte na analizie danych; Problemy biznesowe i rozwiązania do nauki o danych; Wprowadzenie do modelowania predykcyjnego: od korelacji do nadzorowanej segmentacji; Dopasowanie modelu do danych; Nadmierne dopasowanie i jego unikanie; Podobieństwa, sąsiedzi i klastry; Analityczne myślenie decyzyjne I: Co to jest dobry model?; Wizualizacja wydajności modelu; Dowody i prawdopodobieństwa; Reprezentowanie i eksploracja tekstu; Analityczne myślenie decyzyjne II: w kierunku inżynierii analitycznej; Inne zadania i techniki analizy danych; Nauka o danych i strategia biznesowa; Wniosek.

https://www.amazon.com/Data-Science-Business-Data-Analytic-Thinking/dp/B08VL5K5ZX

Statystyki praktyczne dla naukowców zajmujących się danymi: ponad 50 podstawowych pojęć z wykorzystaniem języka R i Pythona / wydanie drugie

Scenariusz: Peter Bruce, Andrew Bruce i Peter Gedeck

  • Wydawca: O’Reilly Media
  • Data publikacji: 2 czerwca 2020 r
  • Język: angielski
  • Wymiary: 7 x 0,9 x 9,1 cala
  • Liczba stron: ‎368

Treść: eksploracyjna analiza danych, dystrybucje danych i próbkowania, eksperymenty statystyczne i testowanie istotności, regresja i przewidywanie, klasyfikacja, statystyczne uczenie maszynowe, uczenie bez nadzoru.

Księga dlaczego: nowa nauka o przyczynie i skutku

Scenariusz: Judea Pearl, Dana Mackenzie

  • Wydawca: Podstawowa książka
  • Data publikacji: 15 maja 2018 r
  • Język: angielski
  • Wymiary: 6,3 x 1,4 x 9,4 cala
  • Liczba stron: ‎432

Podczas gdy wiele książek o nauce o danych wykorzystuje przemysł czysto biznesowy jako ilustrację, ta książka wykorzystuje przemysł medyczny i inne dyscypliny jako ilustrację.

Treść: Wstęp: Umysł ponad danymi; Drabina przyczynowości; Od korsarzy do świnek morskich: geneza wnioskowania przyczynowego; Od dowodów do przyczyn: wielebny Bayes spotyka pana Holmesa; Wprawianie w zakłopotanie i dekonfundowanie: albo zabijanie czyhającej zmiennej; Debata wypełniona dymem: oczyszczanie powietrza; Mnóstwo paradoksów!; Beyond Adjustment: The Conquest of Mount Intervention; Kontrfakty: górnicze światy, które mogły istnieć; Mediacja: poszukiwanie mechanizmu; Big Data, sztuczna inteligencja i wielkie pytania.

Zbuduj karierę w Data Science

Scenariusz: Emily Robinson i Jacqueline Nolis

  • Wydawca: Manning
  • Data publikacji: 24 marca 2020 r
  • Język: angielski
  • Wymiary: 7,38 x 0,8 x 9,25 cala
  • Liczba stron: ‎354

Treść: Wprowadzenie do nauki o danych; Znalezienie pracy związanej z nauką o danych; Osiedlenie się w Data Science; Rozwój w roli Data Science.

https://www.manning.com/books/build-a-career-in-data-science

Data Science for Dummies / 2nd Edition

Scenariusz: Lillian Pierson

  • Wydawca: Dla bystrzaków
  • Data publikacji: 6 marca 2017 r
  • Język angielski
  • Wymiary: 7,3 x 1 x 9 cali
  • Liczba stron: ‎384

Ta książka zakłada, że ​​czytelnik ma już niezbędną wiedzę z zakresu matematyki i programowania.

Treść:  Zajmowanie się nauką o danych; Eksploracja potoków i infrastruktury inżynierii danych; Stosowanie spostrzeżeń opartych na danych w biznesie i przemyśle; Uczenie maszynowe: uczenie się na podstawie danych za pomocą Twojej maszyny; Matematyka, prawdopodobieństwo i modelowanie statystyczne; Używanie klastrowania do dzielenia danych; Modelowanie z instancjami; budowanie modeli obsługujących urządzenia Internetu rzeczy; Przestrzeganie zasad projektowania wizualizacji danych; Używanie D3.js do wizualizacji danych; aplikacje internetowe do projektowania wizualizacji; Badanie najlepszych praktyk w projektowaniu pulpitów nawigacyjnych; Tworzenie map z danych przestrzennych; Używanie Pythona do nauki o danych; Wykorzystanie Open Source R do nauki o danych; Wykorzystanie SQL w Data Science; Nauka o danych w Excelu i Knime; Nauka o danych w dziennikarstwie: przybijanie pięciu W (i H); Zagłębianie się w naukę o danych środowiskowych; Nauka o danych dla napędzania wzrostu w handlu elektronicznym; Wykorzystanie nauki o danych do opisywania i przewidywania działalności przestępczej; Dziesięć fenomenalnych zasobów dla otwartych danych; Dziesięć bezpłatnych narzędzi i aplikacji do analizy danych.

Eksploracja ogromnych zbiorów danych / 3 r & D Redagowanie

Scenariusz: Jure Leskovec, Anand Rajaraman, Jeffrey David Ullman

  • Wydawca: Cambridge University Press
  • Data publikacji: 13 lutego 2020 r
  • Język angielski
  • Wymiary: 7 x 1 x 9,75 cala
  • Liczba stron: ‎565

Ta książka zakłada również, że czytelnik ma już niezbędną wiedzę z zakresu matematyki i programowania.

Treść: Eksploracja danych; MapReduce i nowy stos oprogramowania; Algorytmy wykorzystujące MapReduce; Wyszukiwanie podobnych przedmiotów; Wydobywanie strumieni danych; Analiza linków; Częste zestawy przedmiotów; Grupowanie; Reklama w Internecie; Systemy rekomendacji; Wydobywanie wykresów sieci społecznościowych; redukcja wymiarowości; Uczenie maszynowe na dużą skalę.

Wniosek

Rozróżnienia między programami specjalistycznymi nie są jeszcze jasne. Rozróżnienie między programami ogólnymi i specjalistycznymi również nie jest jeszcze jasne. Jednak po przeczytaniu podanej listy książek czytelnik będzie w stanie lepiej docenić szczególne role analityka danych, inżynierii danych i naukowca danych, a następnie przejść dalej.