Zaawansowana analiza danych w PySpark:

metody przetwarzania informacji na szeroką skalę z wykorzystaniem Pythona i systemu Spark

Tytuł oryginalny:
Adanced analytics with PySpark
patterns for learning from dta at scale using Python and Spark
Autorzy:
Akash Tandon
Sandy Ryza
Uri Laserson
Sean Owen ...
Tłumacz:
Andrzej Watrak
Wydawcy:
Helion (2023)
ebookpoint BIBLIO (2023)
ISBN:
978-83-8322-069-7, 978-83-8322-070-3
Autotagi:
dokumenty elektroniczne
druk
e-booki
książki
podręczniki
publikacje dydaktyczne
Więcej informacji...

Potrzeby w zakresie analizy dużych zbiorów danych i wyciągania z nich użytecznych informacji stale rosną. Spośród dostępnych narzędzi przeznaczonych do tych zastosowań szczególnie przydatny jest PySpark - interfejs API systemu Spark dla języka Python. Apache Spark świetnie się nadaje do analizy dużych zbiorów danych, a PySpark skutecznie ułatwia integrację Sparka ze specjalistycznymi narzędziami PyData. By jednak można było w pełni skorzystać z tych możliwości, konieczne jest zrozumienie interakcji między algorytmami, zbiorami danych i wzorcami używanymi w analizie danych.

Oto praktyczny przewodnik po wersji 3.0 systemu Spark, metodach statystycznych i rzeczywistych zbiorach danych. Omówiono w nim zasady rozwiązywania problemów analitycznych za pomocą interfejsu PySpark, z wykorzystaniem dobrych praktyk programowania w systemie Spark. Po lekturze można bezproblemowo zagłębić się we wzorce analityczne oparte na popularnych technikach przetwarzania danych, takich jak klasyfikacja, grupowanie, filtrowanie i wykrywanie anomalii, stosowane w genomice, bezpieczeństwie systemów IT i finansach. Dodatkowym plusem są opisy wykorzystania przetwarzania obrazów i języka naturalnego. Zaletą jest też szereg rzeczywistych przykładów dużych zbiorów danych i ich zaawansowanej analizy.

Dzięki książce poznasz:

  • model programowania w ekosystemie Spark
  • podstawowe metody stosowane w nauce o danych
  • pełne implementacje analiz dużych publicznych zbiorów danych
  • konkretne przypadki użycia narzędzi uczenia maszynowego
  • kod, który łatwo dostosujesz do swoich potrzeb

PySpark: systemowa odpowiedź na problemy inżyniera danych!

Więcej...
Wypożycz w bibliotece
Dostęp online
Dodaj link
Kup
Brak ofert.
Recenzje

Brak recenzji - napisz pierwszą.

Dyskusje

Brak wątków

Przejdź do forum
Nikt jeszcze nie obserwuje nowych recenzji tego dzieła.
Opis
Inne tytuły:patterns for learning from dta at scale using Python and Spark
Autorzy:Akash Tandon Sandy Ryza Uri Laserson Sean Owen Josh Wills
Tłumacz:Andrzej Watrak
Wydawcy:Helion (2023) ebookpoint BIBLIO (2023)
ISBN:978-83-8322-069-7 978-83-8322-070-3
Autotagi:dokumenty elektroniczne druk e-booki książki literatura literatura stosowana podręczniki publikacje dydaktyczne zasoby elektroniczne
Powyżej zostały przedstawione dane zebrane automatycznie z treści 2 rekordów bibliograficznych, pochodzących
z bibliotek lub od wydawców. Nie należy ich traktować jako opisu jednego konkretnego wydania lub przedmiotu.
Okładki
Kliknij na okładkę żeby zobaczyć powiększenie lub dodać ją na regał.

Projekt współfinansowany ze środków Unii Europejskiej w ramach Europejskiego Funduszu Rozwoju Regionalnego
Dotacje na innowacje - Inwestujemy w Waszą przyszłość
foo