Kitchen

Aug 31 2017

Big Data: comparatif des technos, actualit – s, conseils #emc #big #data #analytics


#

Big Data. faire parler les donn es pour cr er de la valeur

Pour faire face à l’explosion du volume des données, un nouveau domaine technologique a vu le jour. le Big Data. Inventées par les géants du web, ces solutions sont dessinées pour offrir un accès en temps réel à des bases de données géantes.

Comment d finir le Big Data, et quelle est sa promesse?

Face l explosion du volume d informations, le Big Data vise proposer une alternative aux solutions traditionnelles de bases de donn es et d analyse (serveur SQL, plateforme de Business Intelligence. ). Confront s tr s t t des probl matiques de tr s gros volumes, les g ants du web, au premier rang desquels Yahoo (mais aussi Google et Facebook), ont t les premiers d ployer ce type de technologies. Selon le Gartner, le Big Data (en fran ais m gadonn es ou Grandes donn es ) regroupe une famille d outils qui r pondent une triple probl matiques. un V olume de donn es important traiter, une grande V ari t d informations (en provenance de plusieurs sources, non-structur es, structur es, Opendata. ), et un certain niveau de V locit atteindre – c est- -dire de fr quence de cr ation, collecte, traitement/analyse et partage de ces donn es. C est la r gle dite des 3V .

Quelles sont les principales technologies de Big Data ?

Elles sont nombreuses. Pour optimiser les temps de traitement sur des bases de donn es g antes, plusieurs solutions peuvent entrer en jeu :

Des bases de donn es NoSQL (comme MongoDB, Cassandra ou Redis) qui impl mentent des syst mes de stockage consid r s comme plus performants que le traditionnel SQL pour l analyse de donn es en masse (orient cl /valeur, document, colonne ou graphe).

Des infrastructures de serveurs pour distribuer les traitements sur des dizaines, centaines, voire milliers de n uds. C est ce qu on appelle le traitement massivement parall le. Le framework Hadoop est sans doute le plus connu d entre eux. Il combine le syst me de fichiers distribu HDFS, la base NoSQL HBase et l algorithme MapReduce. D autres technologies visant tendre vers des traitements plus temps r el ont merg dans la foul e (c est le cas d Apache Spark).

Lestockage des donn es en m moire (Memtables) permet d acc l rer les temps de traitement des requ tes.

La donnée est aujourd’hui le point d’ancrage de la relation client. Si comprendre le comportement utilisateur reste un enjeu critique, l’analyse des interactions entre ces utilisateurs et la marque est la clé d’une expérience utilisateur unique vectrice de fidélisation et de satisfaction client.

Pour utiliser au mieux le nouvel or noir qu’est la data les entreprises doivent commencer par éliminer les obstacles internes et externes qui les empêchent d’optimiser le potentiel des informations clients.

Après WannaCry, le ransomware NotPetya montre que les cybercriminels exploitent massivement les outils des agences gouvernementales pour lancer des attaques ciblant un maximum de victimes.

Les smart cities s’appuient sur les nouvelles technologies de l’information et de la communication pour faire émerger des villes durables, plus efficientes et participatives.

Tous les jours les patients utilisent internet et les réseaux sociaux pour parler de leur maladie. Il est indispensable de réussir à compiler et analyser cette masse de données non structurées pour améliorer les prises en charge.

Centraliser des données en un lieu unique est un excellent moyen de collaborer autour d’un capital data commun, de comparer des sources de données multiples externes et internes.


Written by admin


Leave a Reply

Your email address will not be published. Required fields are marked *