X

ITPT'26 : le HTAP en vedette

Lors de notre périple IT Press Tour rien moins que 3 entreprises relevaient de ce créneau qui combine le traitement des données dans une base et l’analytique avec à chaque fois des approches différentes. Gridgain, Aerospike et MapD sont les étoiles montantes de ce secteur défini par le Gartner.

Depuis la création du terme par le Gartner en 2014, le HTAP (Hybrid Transaction / Analytical Processing) ne cesse de se développer et propose de nouvelles architectures pour répondre aux limitations des architectures plus classiques impliquant des réplications de données avant leur traitement analytique.

Les bases de données HTAP évitent cette migration en rendant les données disponibles pour l’analyse dès leur entrée dans la base. Ces analyses pointent directement sur les données les plus fraîches présentes dans l’application HTAP. Cela induit des économies importantes. Plus besoin d’avoir des datawarehouses ou datamarts pour réaliser l’analyse. Les solutions HTAP évitent aussi la gestion de multiples copies de la donnée. De plus comparativement aux environnements classiques des bases de données transactionnelles, les solutions sont plus simples à faire évoluer ou à mettre à l’échelle voulue pour les traitements.

Ces solutions font généralement appel à des traitements en mémoire. Selon le Gartner, l’utilisation de l’IMC (In-Memory Computing) va connaître un fort développement et représenter un marché de près de 11 milliards de dollars à la fin de 2019. Selon l’institut, 75 % des applications nativement développées pour le cloud utiliseront cette technologie à la même date. Plus de 25 % des compagnies globales dans le monde utiliseront des plates-formes combinant différentes technologies en mémoire en 2021. L’année suivante 40 % des entreprises globales s’appuieront sur cette technologie pour éviter la prolifération des référentiels physiques pour la publication de données. SAP HANA est un représentant de cette famille. Plusieurs autres acteurs investissent maintenant ce secteur avec succès.

GridGain, le plus récompensé

Nous avions déjà rencontré GridGain lors d’un tour précédent. Il était intéressant de voir comment l’entreprise avait progressé durant l’année écoulée. Depuis notre dernière visite, l’entreprise a connu un fort développement de sa base installée dans de nombreux secteurs d’activités différents. Le point commun de tous les clients : le besoin de performance et de rapidité des traitements analytiques à l’échelle des millisecondes tout en conservant la consistance des données.

Nikita Ivanov, le CTO et fondateur de GridGain, parle d’ailleurs de « Fast Data » et non de big data lorsqu’il décrit sa solution. Parmi les clients nous pouvons citer : la banque ING aux Pays-Bas et Workday, l’éditeur de solutions SaaS de ressources humaines et de finance.

Pour rappel, la solution de GridGain reprend les caractéristiques citées plus haut et se construit sur Apache Ignite, un des projets les plus suivis de la Fondation Apache. Le projet connaît un million de téléchargement par an et se classe 5ème dans les commits. Sa mailing list se classe 3ème loin devant des projets comme Cassandra, Flink ou Tomcat.

Abe Kleinfeld, CEO de GridGain.

Aerospike, très présent dans le secteur financier

Créée en 2009, Aerospike compte aujourd’hui 80 salariés. La société est surtout présente dans le secteur financier avec comme clients des fournisseurs de cartes de crédit, des systèmes de paiements et des mastodontes des services financiers. La société revendique plus de 125 clients.

Aerospike a un écosystème assez développé avec comme partenaires clés Intel, Nokia, Amdocs, HCL et Wipro.

L’entreprise met en avant la performance que lui permet d’atteindre sa technologie de mémoire hybride. La solution s’appuie sur une base NoSQL Key/Value dans laquelle le traitement des données est effectué par des accès massivement parallèles avec une répartition automatique des données sur les différents éléments du cluster. La solution rebalance l’équilibre de la charge sur le cluster après un incident ou un changement de configuration ou un ajout de nœud par un algorithme, Smart Partitions, un système breveté d’Aerospike.

La solution supporte le stretch cluster et une fonction de réplication synchrone entre centres de données assure une disponibilité maximale. Un agent sur chaque serveur a une double fonction : exécution des tâches sur le cluster et monitoring du nœud de cluster. L’architecture se veut la plus simple possible et ne requiert pas de cache avec une optimisation de la performance sur les supports Flash. La solution fournit une performance prédictible et peut se déployer sous tous types d’environnements (bare metal, machines virtuelles, containers, Cloud). De plus les clusters se gèrent de manière dynamique. L’ensemble fournit des ratios de performance de 1 pour 10 et des réductions du nombre de serveurs dans le même ordre d’idée pour une charge identique.

MapD joue sa carte !

L’aventure de cette entreprise démarre lors d’études à Harvard sur le printemps arabe. Un des étudiants, Todd Mostak, passait des heures à attendre les résultats de ses requêtes sur l’analyse des messages sur les réseaux sociaux en rapport avec son mémoire. Ne pouvant avoir accès à plus de puissance de calcul il lui vient l’idée d’utiliser les processeurs graphiques de sa carte pour aller plus vite. Il développe la première version de ce qui deviendra MapD. Il continue ensuite ses recherches sur son logiciel au MTI. En 2013 il crée l’entreprise.

La version 3.4 du logiciel a été annoncée en janvier dernier. Il positionne la solution sur les environnements analytiques extrêmes, en particulier ceux ayant besoin d’utiliser des informations géospatiales. La solution se décompose en 3 éléments : MapD Core, un moteur qui permet de requêter sur des milliards de lignes en quelques millisecondes par un moteur SQL optimisé pour les environnements GPU en open source, un moteur de rendering qui fait le lien entre le moteur de requête et MapD Immerse, un outil de visualisation des données interactif. Un outil de compilation rapide permet à la solution de fonctionner à la fois sur des CPU ou des GPU suivant le choix des utilisateurs et du volume des données. Un cache intelligent place les données chaudes dans la mémoire principale ou la mémoire virtuelle des GPU.

Le système peut s’appuyer sur des disques Flash pour assurer la persistance des données. La solution évolue en Scale-out fournissant des performances prédictibles lors de son évolution. Les visualisations peuvent être partagées et être interactives même avec des milliards de points par l’API Vega dont les spécifications de rendus sont générées en tâche de fond.

Dans cette catégorie HTAP ou « Translytique », combinant transactionnel et analytique, Nous avons vu 3 approches différentes s’adaptant à de nombreux cas d’usages même si chacun garde sa spécificité suivant les architectures ou les outils sous-jacents. Ces 3 exemples ne sont là que pour illustrer une tendance bien plus large sur ce qui évolue en ce moment dans les bases de données où les entreprises visent peut-être plus à mieux exploiter les données existantes plutôt que d’ajouter à toutes fins d’autres flux de données.

Todd Mask, CEO et fondateur de MapD.


Inscription gratuite à la newsletter de L'Informaticien.


Noter cet article (de 1 = Nul à 5 = Excellent) Valider

Offres d'emploi informatique avec  Emploi en France
jooble

Datacenters sur le grill

Datacenters sur le grill

Véritable usine de production de l’économie numérique, le datacenter focalise les critiques des associations environnementales. Ces installations dont les plus grosses peuvent consommer jusqu’à une centaine...

Apps de messagerie

Apps de messagerie

Le succès d’une application de messagerie instantanée débute souvent dans une cour d’école et finit entre les mains… de PDG. De plus en plus de collaborateurs échangent des invitations, des...

Le lourd poids de la dette technique

Le lourd poids de la dette technique

Prévisible et bien souvent inévitable, la dette technique continue cependant de donner des sueurs froides aux développeurs. Le problème ne vient pourtant pas toujours du code, mais plutôt de la prise de...

RSS
Afficher tous les dossiers

GESTIONNAIRE DE MOTS DE PASSE : un outil indispensable ? - Pandémie & Tech : gagnants et perdants - Multicloud : réalité d'aujourd'hui, impacts sur l'infrastructure et l'applicatif - Project Reunion Microsoft - No Code/Low Code en plein essor - Cobol V6 - Cyberattaques Covid-19 - L'emploi au temps du Corona...

 

COMMUNICATIONS UNIFIÉES : une convergence accrue entre communication et collaboration - Réussir StopCovid ! - Énergie : les datacenters sur le grill - Le lourd poids de la dette technique - GitLab comme solution DevSecOps - Les femmes, avenir de la filière IT ? - Apps de messagerie, attention danger ? - Pôle IA Toulouse...

 

POSTMORTEM cyberattaque CHU Rouen - OUTILS : Cyber, le risque n°1 - SecNumCloud, référentiel de confiance - Techno : pourquoi il devient urgent de mettre en oeuvre des algorithmes post-quantiques - CAHIER SPÉCIAL : DPO externe, quelles conditions pour une prestation idéale ?...

 

Afficher tous les derniers numéros

Actuellement, il existe un gouffre entre les environnements informatiques traditionnels des entreprises et le cloud public. Tout diffère : les modèles de gestion, de consommation, les architectures applicatives, le stockage, les services de données.


Les avantages de l’architecture hyperconvergée étant de plus en plus reconnus, de nombreuses entreprises souhaitent l’utiliser pour des types d’applications variés. Cependant, son manque de souplesse pour une mise à niveau des ressources de calcul indépendantes de celles de stockage ne lui permet pas d’être utilisée plus largement.

Au cours de l’événement HPE Discover qui s’est tenu en juin 2019, HPE a répondu à cette préoccupation en présentant la plateforme HPE Nimble Storage dHCI.

Ce Livre Blanc IDC se penche sur les exigences du marché ayant stimulé le besoin de solutions HCI plus flexibles, puis il examine brièvement la solution HPE Nimble Storage dHCI en expliquant pourquoi elle répond à ce besoin.


Malgré des investissements massifs dans le développement à hauteur de près de 4 milliards de dollars l'année dernière, près de la moitié du temps consacré au DevOps est perdu dans la répétition des tâches et dans la logistique. Ceci fait que 90% des entreprises qui ont adopté ces pratiques sont déçues par les résultats, selon une étude publiée par le Gartner.


Découvrez dans ce livre blanc, les avantages des toutes nouvelles solutions NETGEAR, pour simplifier et rentabiliser vos déploiements, et gérer votre réseau à distance, où que vous soyez, au bureau ou en télé-travail.


OneTrust est une plateforme logicielle innovante de gestion de la confidentialité, de la sécurité des données personnelles et des risques fournisseurs. Plus de 4 000 entreprises ont choisi de faire confiance à cette solution pour se conformer au RGPD, au CCPA, aux normes ISO 27001 et à différentes législations internationales de confidentialité et de sécurité des données personnelles.

OneTrust vous propose de télécharger le texte officiel du Règlement Général sur la Protection des Données (RGPD). Vous aurez également la possibilité de recevoir la version imprimée de ce texte, sous forme de guide pratique au format A5, spiralé, en complétant le formulaire.


Tous les Livres Blancs
Derniers commentaires
Un Français a été interpellé soupçonné d'avoir administré des sites sur le darknet, permettant "Il était dans le Top 10 des pédophiles les plus recherchés au monde": un père de famille français de 40 ans, inconnu de la justice, a été arrêté dans un village du Sud-Ouest de la France, soupçonné d'avoir animé des sites pédopornographiques accessibles à des "milliers de personnes" sur le darknet, la partie cachée d'internet. [Lire la dépêche...]

Un Français a été interpellé soupçonné d'avoir administré des sites sur le darknet, permettant "Il était dans le Top 10 des pédophiles les plus recherchés au monde": un père de famille français de 40 ans, inconnu de la justice, a été arrêté dans un village de Gironde, soupçonné d'avoir animé des sites pédopornographiques accessibles à des "milliers de personnes" sur le darknet, la partie cachée d'internet. [Lire la dépêche...]

Le dirigeant des Travaillistes britanniques Keir Starmer, le 3 juin 2020 à Londres Le parti travailliste britannique a décidé de se joindre au boycott publicitaire lancé contre Facebook pour exiger du réseau social qu'il fasse davantage pour lutter contre les contenus haineux, a annoncé dimanche l'une de ses responsables. [Lire la dépêche...]

E3 electronic entertainment expoExit le numéro deux, la DRH et le chef de l'unité canadienne: l'éditeur de jeux vidéo français Ubisoft, au cœur d'un scandale d'agressions et de harcèlement, a annoncé un remaniement spectaculaire de sa direction et promis des "changements majeurs dans sa culture d'entreprise". [Lire la dépêche...]

Le patron de Twitter Jack Dorsey à New Delhi en Inde en novembre 2018Le patron de Twitter Jack Dorsey va donner trois millions de dollars pour permettre aux maires de plusieurs villes des Etats-Unis d'expérimenter la mise en place d'un revenu universel, a-t-il annoncé dans un tweet. [Lire la dépêche...]

La reconnaissance faciale est de plus en plus utilisée par les forces de police et les agents de douane à travers le monde, ainsi que par des banques ou des magasinsLes régulateurs britannique et australien chargés de la protection des données ont annoncé une enquête conjointe sur la start-up américaine Clearview AI, dont la technologie de reconnaissance faciale suscite les inquiétudes. [Lire la dépêche...]

Photo transmise à l'AFP le 7 juillet 2020 par la Farmhouse Garden Animal Home montrant l'ânesse Buckwheat Devenue une vedette sur Zoom avec ses irruptions surprises - et payantes - au milieu de visioconférences,une ânesse a permis de renflouer les finances d'un refuge pour animaux de ferme au Canada, déserté de ses visiteurs pour cause de coronavirus. [Lire la dépêche...]

Des chercheurs d'emploi lors d'un événement Amazon en septembre 2019 à Crystal City en VirginieLes entreprises ne sont pas souvent prêtes à se lancer dans un examen de conscience sur la diversité - ou son absence - au sein de leur personnel, mais l'élan de colère provoqué par la mort de George Floyd aux Etats-Unis les a obligées à afficher leur solidarité avec les Afro-Américains, voire à faire des dons ou des promesses. [Lire la dépêche...]

Toutes les dépêches AFP
AgendaIT

BIG DATA

Conférences et exposition sur le Big Data les 14 et 15 septembre 2020 à Paris, Porte de Versailles. Organisé par Corp Agency.

AI PARIS

Conférence, exposition et rendez-vous d'affaires sur l'intelligence artificielle à Paris, Porte de Versailles les 14 et 15 septembre 2020. Organisé par Corp Agency.

DOCUMATION

Congrès et exposition Documation du 22 au 24 septembre 2020  à Paris Porte de Versailles (Pavillon 4.3). Organisé par Infopromotions.

AP CONNECT

La 3ème édition d'AP Connect qui vise à réunir les innovations, technologies et solutions dédiées à la transition numérique des administrations publiques centrales et des collectivités territoriales a lieu les 22 et 23 septembre 2020 à Espace Grande Arche, Paris La Défense. Organisé par PG Organisation.

RSS
Voir tout l'AgendaIT
0123movie