DataStax’s 4,5 Cassandra branden up Apache Spark in-memory analytics

Cloudera over hoe de uitvoering motor Apache Spark verbreedt wat bedrijven kunnen doen met de big data framework Hadoop.

DataStax zegt dat de nieuwste versie van zijn Apache Cassandra NoSQL-database legt de focus op analytics, het aanbieden van voor de eerste keer in het geheugen via verwerking, de Apache Spark open-source engine.

Het gebruik van Spark in DataStax Enterprise 4.5, nu algemeen beschikbaar, betekent ook dat de database biedt in-memory analytics in aanvulling op haar bestaande in-memory transacties verwerken, aldus het bedrijf.

Samen met een verbeterde visuele management tools, en geautomatiseerde diagnostiek en performance tuning, is DataStax 4.5 ook gecertificeerd om te draaien op de Cloudera en Hortonworks Hadoop distributies, die integratie van de operationele en historische gegevens.

Kritische stappen voor een succesvolle SMB big data strategie; Onderzoek: Big Data trends – Kosten, uitbetalingen, resultaten, personeel, Hadoop naar voren als de kern kader van big data; Big Data Primer voor IT-professionals

“Wat we brengen naar de tafel met 4.5 zijn twee nieuwe analytische mogelijkheden. We waardoor meer in de buurt van real-time mogelijkheden met de Spark integratie, dus dat is nummer één,” zei DataStax producten VP Robin Schumacher.

Nummer twee is de noodzaak voor het koppelen van uw operationele database transactionele database met historische Hadoop data warehouses of data meren. Er zijn tijden die u nodig hebt om de twee van hen aan elkaar te koppelen aan bepaalde operationele use cases te voldoen.

Schumacher zei online apps vaak nodig verschillende analytische tempo’s, met een aantal aspecten van een aanvraag eist snelle analytische responstijden, maar in andere situaties die langer lopende sets van analytics.

Samen met een betere zoek- en management tools, de volgende versie van de Cassandra-gebaseerde DataStax Enterprise big data platform biedt in-memory computing.

“Zij kunnen programmatisch karakter, computationele zijn, kraken een heleboel dingen, en ze gaan langzamer lopen,” zei hij.

Met Spark we in staat om de zeer nabije real-time analytics te verwerken. Met de externe Hadoop mogelijkheden, we waardoor de langer lopende, batch analytische natuur waar je wilt in staat zijn om te koppelen van uw operationele databank met een externe Hadoop-systeem, dat op Cloudera of Hortonworks.

Couchbase CEO: Slechts drie NoSQL bedrijven te onderscheiden van de verpakking, Teradata is gericht op R analytics meer enterprise vriendelijker te maken; MongoHQ: Database is een hulpmiddel, geen oplossing, Hadoop en big data: Waar Apache Slider sleuven in en waarom dat van belang; Hadoop big data analytics: Kan SQL-ondersteuning breng het naar de massa; Hoe DataStax voor Accenture Google en richt up opkomst Cassandra’s; Cassandra 2.0:? de volgende generatie van big data; DataStax Enterprise 3.1: NoSQL, Ja, CQL.

Enterprise Software;? TechnologyOne tekenen AU $ 6,2m deal met de landbouw; Samenwerking; Wat is het organiserend principe van de hedendaagse digitale werkplek;? Enterprise Software; Sweet SUSE! HPE haken en ogen zelf een Linux distro, Enterprise Software, Apple vrij te geven iOS 10 op 13 september, MacOS Sierra op 20 september

Deze mogelijkheid is aanwezig in de verhouding wereld voor een tijdje. Bijvoorbeeld, zou je samen deelnemen aan een lijst van Oracle en SQL Server-tabel omdat ze verschillende use cases, verschillende toepassingen voldoen aan. Nu zijn we brengen diezelfde mogelijkheid om de moderne NoSQL-Hadoop wereld.

Een praktisch voorbeeld hiervan is het runnen van een Hadoop Hive query die met elkaar verbindt een Cassandra tafel met een Cloudera Hive tafel, het uitvoeren van de dezelfde query tegen die objecten en terug te keren een analytisch resultaat te stellen dat ofwel blijft DataStax Enterprise of die kan worden overgedragen aan de Hadoop deployment .

Schumacher in praktijk zoals Spark worden gebruikt DataStax Enterprise zou worden bepaald door de beheerder bij het opgeven van een cluster nodes Dit kunnen bijvoorbeeld transactionele, analytische of zoeken.

Het idee van het runnen van transacties en analytics op dezelfde database is niet nieuw, maar het is al weer door de technologie gehouden. Maar de dingen in de hybride wereld is aan het veranderen.

“Nu is een van de opties die je hebt voor uw analytische workloads is dat de knooppunten die analytische operaties te behandelen zijn Spark. Je begint gewoon die knooppunten in Spark-modus en kunt u Spark draaien op de top van Cassandra, ‘zei hij.

Er is geen noodzaak voor HDFS of iets dergelijks. Het werkt direct op Cassandra data. Het eindresultaat is een veel snellere responstijden voor analytische vragen over wat zij in het verleden met Hadoop Hive queries en dat soort dingen, dat liep op Cassandra data hebben gehad.

DataStax heeft gewerkt met Databricks, het commerciële bedrijf achter Spark. Cassandra en HDFS zijn de gegevensbron doelen die Spark kan gebruiken.

Naast analyses, de andere rode draad door de DataStax Enterprise 4.5 release is de prestaties en de middelen om het beheer te verbeteren, zei Schumacher.

“In het verleden hebben we verschillende sets van statistieken die [mensen] kunnen controleren ingeschakeld, maar het is niet goed georganiseerd,” zei hij.

Enterprise 4.5 biedt een performance dienst bestaat uit een Cassandra-query-taal gebaseerde set van diagnostische-objecten voor het beantwoorden van vragen, variërend van cluster problemen en de oorzaken daarvan, heetste draaiende objecten, waaraan verklaringen verbruiken de meeste middelen.

“Wat we doen is helpen we twee verschillende soorten personas als het gaat om de database het oplossen van problemen. Er zal aan de persoon die wil werken op de opdrachtregel. Ze vinden het leuk om queries te schrijven en al dat soort dingen zijn , “zei Schumacher.

Dus voor de command-line mensen die u onze nieuwe voorstelling dienst gekregen. Dan voor mensen die willen een point-and-click manier van doen is er onze OPSCenter 5.0 release.

OPSCenter is een web-based visuele hulpprogramma voor taken zoals het maken van nieuwe clusters, backup terugvorderingen en systeem monitoring. De nieuwe release is nu beter schaalbaar, zodat een enkele installatie kan ondersteunen nu tot 1000-node cluster.

Samen met meer zekerheid over de clusters die individuen kunnen beheren en te controleren, OPSCenter 5.0 bevat ook een service die automatisch scant clusters voor afwijkingen van de best practice.

“Misschien heb je niet geconfigureerd je zekerheidsrecht, misschien heb je niet het opzetten van je geheugen configuratieparameters optimaal. Het scant je clusters automatisch voor u, brengt weer afwijkingen zij vaststelt dat in dat best practice, en dan geeft u deskundig advies over hoe dit te verhelpen, “zei Schumacher.

DataStax zal open inkoop deel van het werk dat zij op Apache Spark heeft gedaan.

“De connectiviteit met Cassandra van Spark, het type data mapping, een aantal prestaties optimalisaties die we hebben gemaakt – we geven alles wat terug naar de open-source Spark en Cassandra gemeenschappen,” zei Schumacher.

We houden een paar dingen op de commerciële kant voor Spark. Automatische failover in de functie, zeer eenvoudige installatie en configuratie, point-and-click beheer en dat soort dingen zijn enkele van de dingen die we het behoud binnen DataStax Enterprise – en certificatie tussen Spark en Cassandra.

? TechnologyOne tekent AU $ 6,2m deal met Landbouw

Wat is het organiserend principe van de hedendaagse digitale werkplek?

Sweet SUSE! HPE haken en ogen zelf een Linux distro

Apple vrij te geven iOS 10 op 13 september, MacOS Sierra op 20 september

Meer over NoSQL en Hadoop