Alle dingen database: Q&A met DataStax is Jonathan Ellis

Twitter
LXF: denk je dat het je per jaar?
JE: Er zullen momenten wanneer de behoeften van de gemeenschap en een bedrijf zijn hetzelfde, en er zullen ook momenten zijn waar de gemeenschap ziet het als haar doelen zijn niet in lijn met wat de business wil bereiken. Een van die momenten was toen ik een stap terug en leidt de Apache Cassandra Comité (PMC) in 2016 om leden van de gemeenschap meer ruimte om te leiden op wat ze wilden maken.
LXF: En u waarschijnlijk gestopt omdat het zo cavalier over het duwen van wijzigingen.
LXF: ik heb gehoord dat je een keer brak Facebook… is dat waar?
Lanceerden We onze eerste DataStax Versnellen conferentie dit jaar om de gemeenschap bij elkaar en een getuige over wat Cassandra kunnen doen, en we breiden ons assortiment van ontwikkelaar gebeurtenissen, zodat meer mensen hun ervaringen kunnen delen en meer te leren.

LXF: Wanneer heb je je realiseert dat je kan draaien van een winstgevend bedrijf om de database zelf?
LXF: In dat opzicht één van de thema ‘ s van de conferentie is DataStax re-engagement met de Cassandra van de gemeenschap. Maar wat betekent dat eigenlijk in kwantificeerbare termen?

LXF: In dat opzicht één van de thema ‘ s van de conferentie is DataStax re-engagement met de Cassandra van de gemeenschap. Maar wat betekent dat eigenlijk in kwantificeerbare termen?

LXF: ik sprak Robin Schumacher over de aard van de symbiotische relatie tussen DataStax en de open source Cassandra gemeenschap en de voordelen van een dergelijke relatie. Maar deze relatie heeft ook enkele problemen toch? Met Twitter, bijvoorbeeld, terug in 2010?
LXF: Twitter?
In reactie, we hebben het automatiseren van de vaste onderdelen als onderdeel van onze Sterrenbeeld cloud-platform dat de lancering van dit jaar, en we zijn ervan overtuigd dat een heleboel mensen vinden dit waardevolle bron.
(Image credit: de Toekomst)
LXF: In uw keynote u zei dat de uitroeiing van de complexiteit bij de uitrol van een Cassandra-cluster is één van de belangrijkste drijfveren achter de aankondigingen op de conferentie. Maar er is meer aan de exploitatie van een Cassandra-cluster. Wat is het volgende probleem dat u wilt oplossen? Dit betekende dat we een manier nodig had om bij te houden welke gebruikers hadden kopieën van de bestanden – schalen naar miljoenen gebruikers en miljarden bestanden. Toen realiseerde ik me dat we nodig nieuwe database architecturen om te gaan met de uitdagingen van web-en mobiele toepassingen. Bestaande databases werden geoptimaliseerd voor toepassingen die behandeld zijn met een enkel bedrijf is de moeite waard van gebruikers, maar nu hebben we nodig om op te schalen naar een heel land. Het was een heel ander probleem dat vereist verschillende trade-offs.
(Image credit: Shutterstock)
De Cassandra project niet een Welwillende Dictator Voor het Leven, maar als het wel dat de titel zou zeker gaan voor Jonathan Ellis. De mede-oprichter van DataStax, Jonathan Ellis is betrokken geweest bij Cassandra sinds de tijd was het open-source door Facebook. Als het project eenmaal is afgestudeerd aan de incubator aan de Apache Software Foundation (ASF), diende hij als eerste Project Stoel voor de komende zes jaar.
JE: Er is een beetje een nerd-politiek, recht? Zoals wanneer je een architect bij een bedrijf dat wil om dingen te doen op een manier, er is net als de politieke hoofdstad. Het is niet “Wat is de juiste technische beslissing”, zijn er ego ‘ s op de lijn. Maar ik denk dat het grotere factor met Facebook of Twitter, is dat deze beide bedrijven hebben een aantal serieus uitgebreide tools die ze hebben gebouwd en die het beheer van tienduizenden MySQL servers.
JE: Ah, ik bedoel de problemen waren nooit echt tussen de PMC (Project Management Comité) en DataStax, het was meer de Apache Raad van Bestuur. De korte versie is dat we op goede voet met de PMC, en we zullen laten.
Facebook
In retrospect had ik al wat minder verlegen, maar ik vertelde hem dat ik dacht dat het te vroeg starten van een bedrijf rond Cassandra. Wat gaf mij de extra push was toen een begin van Cassandra gebruiker ging met een andere, nog erger technologie, omdat het alternatief was commerciële ondersteuning beschikbaar. Dus ongeveer een jaar na het eerst te praten met John, ik begon DataStax, en Johannes, en Lightspeed Venture Partners besloten om te leiden van onze serie A financieringsronde.
JE: citeren van de voormalige Microsoft-CEO Steve Ballmer, voor ons is het over “ontwikkelaars, ontwikkelaars, ontwikkelaars”. De gemeenschap die bestaat rond Cassandra is groot, en wij willen dat het bewustzijn een veel groter publiek.

JE: ik beschouw dat als een compliment…
JE: ik denk het wel, ja. Ik denk dat de gemeenschap moet de gebeurtenis, en DataStax behoeften van de gebeurtenis, er is een goede afstemming er om dat mogelijk te maken op een jaarlijkse basis.

Slechts een paar maanden na de Facebook open-sourced de Cassandra project, Rackspace mij ingehuurd om te werken aan de uitdaging van schaalbare databases. Ik heb te diep in Cassandra en de alternatieven die begonnen te groeien in deze ruimte, en ik was echt aangetrokken tot haar huwelijk van een rijke, tabular data model met een volledig gedistribueerd, masterless aanpak schaalbaarheid en fouttolerantie. Als een resultaat, begon ik te werken aan de code en aan het bouwen van de community, en wanneer Cassandra afgestudeerd aan de ASF-incubator, ik was het eerste project stoel. Betrokken te raken met Cassandra is een van de beste beslissingen die ik ooit heb gemaakt.
Als meer mensen denken over de cloud en hoe het te laten werken voor hen, Cassandra zal een grote rol spelen in het uitvoeren van deze diensten op grote schaal.
LXF: U bent als de Linus Torvalds van databases.
JE: We kunnen praten over Kubernetes, Kafka-integratie of DataStax nieuwe Grafiek release, maar het thema dat bindt deze samen is het maken van DataStax en Cassandra, makkelijker en beter te ontwikkelen tegen. Als ik praat met onze klanten, bijna niemand van hen klagen dat we niet krachtig genoeg of snel genoeg of er iets langs deze lijnen. Waar we soms moeite is het maken van dat vermogen beschikbaar, begrijpelijk en verbruiksartikelen. De volgende grens is echt over de dingen eenvoudiger maken, en al die dingen vallen in die categorie.
Jonathan Ellis: Het is waar dat ik ben altijd geïnteresseerd geweest in de database technologie, maar ik aanvankelijk dacht dat de database ruimte was gewoon te maken incrementele verbeteringen op goed begrepen oplossingen totdat ik bij een cloud back-up bedrijf genaamd Mozy in 2005. Ik bouwde een object store er op dat de schaal van petabytes aan data en gigabits per seconde voor doorvoer, en een van zijn kenmerken was single instance storage. Dat is, maakt niet uit hoe veel gebruikers geüploade dezelfde video of dezelfde binaire, hadden we slechts één exemplaar in de opslag van back-ups.
JE: ik ben waarschijnlijk een van de enige mensen die niet werken voor Facebook dat heeft gebroken Facebook. Het gebeurde nadat ik was committer op de Apache-project; ik denk dat de functie [aangepast] is het toevoegen van ondersteuning voor het verwijderen van rijen, die nog niet bestond toen Facebook open-source – dat is hoe rauw het was.

We zijn enthousiast over het ondersteunen van ApacheCon dit jaar, over de nieuwe functies die we bij te dragen aan de Cassandra-stuurprogramma ‘ s, en over wat er zal gebeuren als Cassandra 4.0 van start.
JE: EEN venture capitalist met de naam John Vrionis bijgehouden me neer in het voorjaar van 2009, op slechts een paar maanden na Cassandra lid van de ASF. Hij was op zoek naar een vroeg stadium projecten in de big data-ruimte, en we hadden een goed gesprek over NoSQL databases in het algemeen en Cassandra in het bijzonder.

Ik wil naar de mensen voor wie MySQL replicatie is een echte pijn in de punt en het oplossen van hun problemen, omdat ik dat kan doen is makkelijker dan een MySQL consulting winkel. Als je kijkt naar een aantal van Facebook ‘ s dochterondernemingen, Instagram is een grote Cassandra gebruiker. Ik geloof dat het hun belangrijkste datastore op Instagram. Netflix is een ander voorbeeld waar ze ging van Oracle op het terrein, en ze zei: “We zijn van plan om te verhuizen naar de cloud en we gaan vast een betere database technologie zoals we dat doen”, dus ze ging met Cassandra. De database tent is groot genoeg voor veel gezinnen om in te wonen.
Het was moeilijk om te scheuren Jonathan van zijn fans op DataStax de Accelerate-conferentie in Washington, maar Mayank Sharma gelokt hem door vermommen zich als een zo goed.
JE: Ja, ze eigenlijk begonnen met hun product op onze Cassandra-Top in 2015. Zij gaven een lezing “Hoe we het versnelde Cassandra” en wij zeiden: “Oh, dat klinkt interessant, komen spreken”. En ze zei: “Oh, we eigenlijk herschreef Cassandra”.
Echter, we willen graag benadrukken hoe toegewijd we zijn naar de gemeenschap. Op DataStax, we verhogen onze steun voor Cassandra, te blijven investeren in een verbetering van de stuurprogramma ‘ s en het bijdragen ondersteuning te krijgen Cassandra 4.0 productie-klaar door middel van testen en bug fixes. Naast de in de code en stuurprogramma ‘ s leveren we een bijdrage willen we het gemakkelijker maken om meer ontwikkelaars aan de slag met Cassandra, dus dat betekent dat het onderhouden van de documentatie en de hosting van meer evenementen om mensen blootstellen aan wat Cassandra kunt bereiken en wat is er nieuw in de laatste versie.
De groei van de cloud in de afgelopen paar jaar enorm geweest, maar mensen willen niet worden geplakt met één enkele aanbieder. Ze willen profiteren van hun investeringen in hun eigen infrastructuur, evenals de sterke punten van de cloud, en het beste van beide werelden. Cassandra is uniek in staat om te lopen over meerdere cloud-diensten, of over de interne en externe diensten, zoals een naadloze database.
Dit interview werd voor het eerst gepubliceerd in Linux Format probleem 256
(Image credit: Kevin Ku / Pexels)

LXF: Je hebt al een soort van brandbestrijding sinds altijd. Mensen gebruikt om te zeggen dat je op de juiste plaats op het juiste moment, dat had je klanten van de get-go. Maar je heb ook tegenstanders. Ik herinner me dat in het begin van de discussie op Slashdot mensen waren er snel bij om erop te wijzen dat Twitter niet gebruiken Cassandra te redden tweets. En dan is Facebook probeerde haar best te zeggen dat het geen gebruik maakt van Cassandra.
JE: Nou ja, bijna letterlijk waren zij de enige mensen met Cassandra op het moment, en ik realiseerde me niet dat ze werden uitgevoerd vanuit de trunk. Het was waarschijnlijk over een half jaar of zo, voordat we hadden zelfs niet-Facebook mensen die het gebruiken.
LXF: Je doet conferenties rond Cassandra bijna tien jaar, sinds de Cassandra-Top in 2010. Wie is uw publiek dit jaar?
LXF: Je hebt opgelost, de problemen die u had met de gemeenschap?
JE: Nou, ik zou zeggen dat de meest meetbare stuk is dat we de verdeling van de Apache Cassandra nu, en we hebben altijd bijgedragen bug fixes van de DataStax Enterprise terug naar Apache Cassandra. Maar het is op een soort van “dat doen We wanneer het handige” soort, maar op basis van onze incentives zijn een stuk meer in lijn, nu dat wij eigenlijk een product dat ondersteund open source, een bijdrage te leveren die terug in een meer directe manier. Dus intern hebben we het opzetten van de processen om dat te realiseren en zorgen dat we niet met een achterstand in beide richtingen.
Linux Format: Je hebt altijd al een database man… Hoe heb je je weg te vinden naar de Apache Cassandra?
U noemde onze Database-as-a-Service in het voorbijgaan eerder. We zijn erg enthousiast over hoe dramatisch eenvoudig dit maakt het uitvoeren van Cassandra. Cassandra is zonder twijfel een grote database, maar het is eerlijk om te zeggen dat je de nodige ervaring om het meeste uit te halen.