Recherche

Apache Spark. Développez en Python pour le big data

Rédacteurs

Dossiers

ActuaLitté

Dossier

En route pour l'aventure : des livres pour voyager et s'évader

Sur terre et sur les mers, à la découverte d’horizons inconnus, voici une liste de livres qui vous embarquent vers des destinations folles. Ce sont des récits de voyage, des essais, des textes empreints de poésie, ou des biographies d’aventuriers, comme autant de panoramas de la splendeur de notre planète.

ActuaLitté

Dossier

Nuit de la lecture 2023 : 12 livres jeunesse pour se faire peur

Du 19 au 22 janvier, les Nuits de la lecture joueront avec des récits parfois très inquiétants. Organisé par le Centre national du livre, cet événement s’accompagne d’une bibliographie illustrant la thématique de l’édition 2023, La Peur. Et pour débuter, voici douze ouvrages de littérature jeunesse.

ActuaLitté

Dossier

Avant de parler d'écologie, dix livres pour en explorer les facettes

Il n’y a résolument pas de Planète B, et plutôt que de mettre des pansements partout, mieux vaudrait, résolument, changer d’optique quant à notre relation avec l’environnement. Écologie, écoresponsabilité, protection de la Terre, autant de messages qui portent leur voix dans de nombreux livres. Voici une sélection de dix ouvrages, depuis la jeunesse jusqu’au théâtre, pour explorer les mondes par les mots.

ActuaLitté

Dossier

Pour 2023, Un Week-end à l'est invite Tbilissi, capitale de la Géorgie

Après avoir exploré des villes telles que Varsovie, Kyiv, Budapest, Belgrade, Sofia et récemment Odessa en soutien à l'Ukraine, "Un week-end à l'Est" pose ses valises pour sa septième édition à Tbilissi, le cœur de la Géorgie. Cette année, la réalisatrice et auteure Nana Ekvtimishvili en est la marraine, avec Nino Haratischwili comme invitée principale, et un focus spécial sur l'auteur d'origine géorgienne, Emmanuel Carrère.

ActuaLitté

Dossier

Dix poètes pour entretenir le goût de la poésie

Du 7 au 23 mars, le Printemps des poètes ouvre le bal aux vers, en vers, et contre tout. Parce que le goût pour la poésie dépasse amplement le seul plaisir solitaire d’une lecture intime, voici neuf auteurs à redécouvrir, neuf textes, traduits ou en français, dont les échos restent puissants aujourd’hui encore. 

ActuaLitté

Dossier

Des lectures pour les vacances, pour les enfants de 6 à 8 ans

Durant les vacances, la lecture offre l'occasion d'apprendre et découvrir, en dehors de l'école. En partenariat avec l'association Lire et Faire Lire, ActuaLitté propose une sélection d'ouvrages pour les enfants de 6 à 8 ans. En puisant dans les différentes sélections que le Comité de lecture a réalisées entre 2017 et 2022, voici huit ouvrages pour embellir la période de Pâques.

Extraits

ActuaLitté

Informatique

Apache Spark. Développez en Python pour le big data

Ce livre sur le framework Apache Spark vous permet d'apprendre à développer des applications en Python en vous appuyant sur l'analyse et le traitement de données volumineuses ainsi que sur la notion d'apprentissage automatique. Après quelques définitions de termes liés au domaine de la data, vous découvrez les fondements de Spark. Vous appréhendez l'architecture logicielle du framework, ses composants et les différents langages avec lesquels il est possible de développer. Vous entrez ensuite concrètement dans la transformation de données. Fonctions numériques, alphanumériques, ajouts d'information, suppressions, agrégations de premier ordre et plus complexes sont à l'honneur. Des fonctionnalités plus avancées telles que les fonctions de fenêtrage et celles définies par les utilisateurs sont étudiées et les nombreuses API de Spark parcourues, tout en étant illustrées par des exemples. Dans la suite du livre, l'auteur dévoile l'apprentissage machine. Apprentissage supervisé, non supervisé, profond et moteurs de recommandation sont autant de concepts détaillés. Vous découvrez les différents algorithmes présents dans Spark, les manières de préparer des données à l'entraînement ainsi que les possibilités d'évaluation d'un système prédictif au travers de plusieurs mises en pratique. Les notions d'arbres de décision, de forêts aléatoires, de réseaux de neurones, de régressions linéaires et de factorisation de matrices vous sont expliquées ainsi que le traitement des informations numériques et la vectorisation de textes. Pour finir, un chapitre met en avant l'industrialisation de Spark. Déployer, déboguer et tester son application ainsi que les subtilités de l'outil pour assurer une performance optimale sont autant d'éléments cruciaux détaillés. Si les exemples de code du livre sont en Python, langage aujourd'hui le plus utilisé avec Spark, certains sont en Scala, API la plus aboutie, pour vous apporter une vision complète du framework.

01/2022

ActuaLitté

Programmation

Apache Spark et Python. Coffret en 2 volumes : Maîtrisez le développement pour le Big Data

Ces deux livres offrent au lecteur un maximum d'informations sur le langage Python et le framework Apache Spark pour maîtriser le développement pour le Big Data. 1010 pages par nos experts. Des éléments complémentaires sont en téléchargement sur le site www. editions-eni. fr. Un livre de la collection Ressources Informatiques Python 3 - Les fondamentaux du langage (4e édition) Extrait du résumé : Ce livre sur les fondamentaux du langage Python 3 (ici en version 3. 11) s'adresse à tout professionnel de l'informatique, ingénieur, étudiant (et particulièrement en BTS Services Informatiques Organisations), enseignant ou même autodidacte, qui souhaite maîtriser ce langage très abouti. Il détaille tout le coeur du langage et du traitement de données et ouvre des perspectives importantes sur tout ce que Python 3 permet de faire. Le livre est consacré à la branche 3 de Python et présente bien sûr les nouveautés apportées par la version 3. 11. Toutefois, comme le langage Python 2 est encore très présent, lorsqu'elles existent, l'auteur présente les différences importantes avec la branche antérieure de Python... Un livre de la collection Expert IT Apache Spark - Développez en Python pour le big data Extrait du résumé : Ce livre sur le framework Apache Spark vous permet d'apprendre à développer des applications en Python en vous appuyant sur l'analyse et le traitement de données volumineuses ainsi que sur la notion d'apprentissage automatique...

02/2024

ActuaLitté

Programmation

Python pour la data science

Le best-seller O'Reilly sur la data science avec Python enfin traduit en Francais ? Pour de nombreux chercheurs, Python est un outil essentiel en raison de ses bibliothèques pour stocker, manipuler et obtenir un aperçu des données. Ce livre décrit toutes les ressources dont vous pouvez disposer pour mettre en oeuvre vos applications : IPython, NumPy, Pandas, Matplotlib, Scikit-Learn et d'autres outils associés. Les scientifiques en activité et les utilisateurs de données familiarisés avec la lecture et l'écriture de code Python trouveront avec cette référence complète l'outil idéal pour s'attaquer aux problèmes quotidiens : manipuler, transformer et nettoyer les données ; visualiser différents types de données ; utiliser les données pour créer des modèles statistiques ou d'apprentissage automatique. Ce livre est tout simplement la référence incontournable pour le calcul scientifique en Python. Vous apprendrez à utiliser : IPython et Jupyter : fournissent des environnements de calcul pour les data scientists utilisant Python NumPy : inclut le ndarray pour un stockage et une manipulation efficaces de tableaux de données denses en Python Pandas : comprend le DataFrame pour un stockage et une manipulation efficaces des données étiquetées / en colonnes en Python Matplotlib : inclut des fonctionnalités pour une gamme flexible de visualisations de données en Python Scikit-Learn : pour des implémentations Python efficaces et propres des algorithmes d'apprentissage automatique les plus importants et les plus établis

04/2022

ActuaLitté

Sports

Big Data Foot. Comment les datas révolutionnent le football ?

Des expected goals au Packing, en passant par la dangerousity et le ghosting, un nombre spectaculaire de statistiques, d'indices, de modèles complexes sont récemment apparus dans le football. Pourquoi pouvait-on prévoir l'éclosion de Sadio Mané dès son transfert du RB Salzbourg à Southampton ? Pourquoi Arsenal et Naples auraient dû priver respectivement Leicester et la Juventus de leur titre de champions en 2016 ? Quels sont les secrets offensif et défensif des équipes entraînées par Lucien Favre ? En quoi la paire Pogba-Kanté était-elle si complémentaire lors de la Coupe du monde 2018 ? Dans cet ouvrage passionnant, Christoph Biermann montre, à partir d'exemples récents piochés dans les plus grands championnats européens, l'influence croissante du big data appliqué au football.

09/2019

ActuaLitté

Informatique

Python pour la data science pour les nuls

Découvrez Python le langage de prédilection de la science des données La science des données ou data science consiste à extraire des connaissance dans un flot de données. Elle utilise des techniques et des théories tirées de domaines comme les mathématiques et la statistique. Les méthodes qui s'adaptent aux big data sont particulièrement intéressantes dans la science des données. Ce livre est destiné à tous ceux qui travaillent dans le domaine de l'analyse de données et montre comment mettre en oeuvre le langage Python pour dans ce domaine et uassi celui de la statistique. Il traite également de Google Colab, un outil qui permet d'cire du code Python dans le cloud. Au programme : Probabilités Distributions aléatoires Tests d'hypothèses Regressions Modèles de prédiction

11/2019

ActuaLitté

Informatique

Big Data & Streaming. Le traitement streaming & temps réel des données en Big Data

Le Big Data est désormais bien établi ! Il a atteint son paroxysme ces dernières années avec les objets connectés, l'intégration des capteurs dans les objets de la vie courante (voiture, réfrigérateur, télévision, etc.). Ces objets produisent des données en streaming. Beaucoup de cas d'usage et de modèles économique s'appuient aujourd'hui sur des données générées en streaming. Cet ouvrage est un manuel didactique qui a pour but de vous aider à développer les compétences de base nécessaires pour valoriser les don- nées produites en streaming. Que vous soyez freelance, consultant, Data Scientist, Architecte, Développeur ou Manager, cet ouvrage vous aidera à - Comprendre les concepts et notions essentiels pour aborder avec aisance la gestion des données streaming : - Appréhender et mettre en oeuvre les architectures nécessaires pour ingérer efficacement les données générées en streaming, notamment le Data Lake, les bus d'événements, les architectures Lambda, les architectures kappa, et les architectures hybrides ; Monter en compétence sur les technologies de l'écosystème Hadoop dédiées à l'ingestion et au traitement des données produites en streaming, notamment Apache Kafka, Spark Streaming, Flume, Apache Samza, Apache Storm et S4. Pour faciliter l'atteinte de ces trois objectifs, chaque chapitre s'achève par un rappel des points clés et un guide d'étude.

07/2019

Tous les articles

ActuaLitté
ActuaLitté
ActuaLitté
ActuaLitté
ActuaLitté
ActuaLitté
ActuaLitté
ActuaLitté
ActuaLitté
ActuaLitté
ActuaLitté
ActuaLitté
ActuaLitté
ActuaLitté
ActuaLitté
ActuaLitté
ActuaLitté
ActuaLitté
ActuaLitté