BPN

Big Data Pour les Nuls

In-memory Computing

Le computing in-memory est une technique permettant de transférer des ensembles de données complets vers la mémoire collective d’un cluster et d’éviter d’écrire des calculs intermédiaires sur le disque. Apache Spark est un système de computing in-memory offrant une vitesse nettement supérieure à Hadoop MapReduce.

Hadoop

Le Framework logiciel open source Hadoop est inextricablement lié au Big Data. Ce framewok repose sur le système de fichiers distribué Hadoop (HDFS) et permet le stockage et l’analyse de larges ensembles de données par le biais de hardware distribué. Apache Foundation, qui a créé Hadoop, est également à l’origine de Pig, Hive et Spark.

Spark

Spark est un puissant moteur de traitement de données capable d’effectuer des tâches de streaming, de machine Learning, ou de requêtes SQL nécessitant un accès itératif rapide aux ensembles de données. Spark est généralement beaucoup plus rapide que MapReduce.

NoSql

SQL (Structured Query Language) est la base des systèmes de gestion de bases de données relationnelles traditionnels (RDBMS). NOSQL est l’acronyme de Not Only SQL. Ce terme désigne les systèmes de gestion de base de données conçus pour prendre en charge de larges volumes de données n’ayant pas de structure ou de schéma, contrairement aux bases de données relationnelles. Les bases de données NoSQL sont généralement bien adaptées aux systèmes Big Data pour leur flexibilité et leur architecture.

Stream processing

Le Stream processing permet d’agir en temps réel sur les données à l’aide de requêtes continues. Combiné avec les streaming analytics, comme les analyses mathématiques ou statistiques au sein du Stream, les solutions de Stream processing sont conçus pour prendre en charge de larges quantités de données en temps réel.

Algorithme

Un algorithme est une formule mathématique ou un traitement statistique utilisé pour effectuer une analyse de données. Les algorithmes sont utilisés dans de nombreux autres domaines, mais ont une importance capitale dans le secteur du Big Data.

Vous n'avez pas trouvé de réponse ?

L'objectif de notre BPN est de fournir des informations sur les termes les plus utilisés en matière de Big Data. Toutefois, il est possible que vous ne trouviez pas dans notre BPN les réponses à vos questions. Dans ce cas, n'hésitez pas à nous contactez.

Nous Contactez

Cookie	Durée	Description
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.