de waarde van Schemaless Databases

Schemaless databases (of “schema-less”) zijn het nieuwste modewoord in de IT-wereld. Geek programmeurs lijken te houden van de flexibiliteit en lage kosten en deze attributen hebben vele een start-up. Na afkomstig te zijn van een zwaar relationele database achtergrond de waarde die schemaless databases brengen naar een onderneming waren eye-opening voor mij. Het is tijd om schemaless databases te nemen uit de achtertuin van de ontwikkelaar en breng het naar de bredere onderneming.

dit blog onderzoekt waarom het zo relevant is in de huidige datagerichte wereld. Als er één ding dat bedrijven zou doden om te doen vandaag, het is om te begrijpen en snel uit te lokken bruikbare inzichten uit hun gegevens. Ze blijven miljoenen dollars investeren om het effectief te doen. Big Data is een groot deel van deze vergelijking. Gartner heeft de 3V ‘ s van big data vereeuwigd-Volume, variëteit en snelheid. En als er een gebied is waar traditionele databasesystemen worstelen is het in het bijhouden van de snelheid waarmee gegevens aankomen, bijna elke tool it in it toolkit legt een vorm van een data-model of formaat waardoor het moeilijk om snel te lezen of instantiate gegevens.

dit is waar schemaless databases stap in om een enorme waarde toe te voegen.

Wat is een Schemalessdatabase?

laten we eerst definiëren wat een schemalessdatabase is.

  1. een schemalessdatabase vereist geen overeenstemming met een Star schema (database, schema, gegevenstypen, tabellen enz.) die men nodig heeft om te leven door het leven van een systeem.
  2. legt geen beperkingen van het gegevenstype af op individuele waarden die betrekking hebben op één kolomtype
  3. modelleert het bedrijfsgebruik en niet een databaseschema, – toepassing of-product.
  4. kan gestructureerde en ongestructureerde gegevens opslaan.
  5. elimineert de noodzaak om extra lagen (ORM-laag) in te voeren om het relationele model te abstracteren en bloot te stellen in een objectgeoriënteerd formaat.

in gewone Engelse databases:

  1. vereisen geen modeling (3NF vorm van normalisatie) dat heeft de carrières van veel van de database architecten, waaronder ondergetekende,
  2. hoeven niet vooraf instellen van gegevenstypen in je archief die sterk vermindert de tijd die nodig is om op te staan een data repository
  3. gegevens Kunt opslaan met verschillende eigenschappen en kan tolereren wijzigen om dat te bepalen, zonder vooruit te plannen voor complexe storingen en wijzigingen en elimineert complexe schema migraties
  4. Kan gemakkelijk worden getransformeerd bijv. een rekeningnummer kan beginnen als alle tekens of het kan nummers of een combinatie van beide zijn. Het wordt alleen beperkt door de definitie en verbeelding van de gebruiker!

Schemalessdatabases slaan gegevens op als sleutel/waardeparen (ook bekend als KV) of als JSON-documenten. Op basis van de use cases hebben gebruikers de keuze om gegevens op te slaan als KV-paren of als JSON-documenten. JSON documenten zijn over het algemeen zeer rijk aan de manier waarop gegevens worden weergegeven en stelt gebruikers in staat om zeer nauw model van de entiteit relatie model dat we allemaal zeer vertrouwd zijn met en hebben gevonden zeer nuttig. Voor bijv.: Een accountentiteit kan worden gemodelleerd in een JSON-document met alle vereiste attributen en geneste waarden die bij een typisch Accountobject horen – het meerdere adres, e-mails, aliassen enz. JSON-documenten bieden ook het extra voordeel dat ze individuele waarden kunnen indexeren, waardoor de toegang veel performanter wordt, waardoor gegevens uit verschillende documenten kunnen worden samengevoegd.

deze blog richt zich niet op de fijne kneepjes van een JSON-document, maar gewoon om een snelle introductie te bieden een JSON-document in een schemalessdatabankwereld lijkt veel op een rij in een relationele database met de mogelijkheid om bijvoorbeeld een Rekeningrij volledig te verschillen van een andere Rekeningrij, wat precies is hoe real life zakelijke gegevens eruit zien.

voordelen van Schemalessdatabases

wat betekent dit voor een onderneming die miljoenen dollars heeft geïnvesteerd in complexe propriëtaire hardware-en softwaredatabankoplossingen om de 3V ‘ s te beteugelen? Laten we eerst kijken naar de hoeveelheid tijd die ondernemingen besteden aan de hierboven genoemde activiteiten. In mijn gedachten zijn de activiteiten die het meest tijdrovend en duur zijn

  1. Database ontwerp of normalisatie

het ontwerpen van het schema in het algemeen aangeduid als normalisatie van gegevens om het te krijgen naar een relationele formaat duurt enkele weken, zo niet maanden en zeer bekwame middelen. In de relationele wereld behoort elk stuk gegevens tot een tabel, database of schema en blijft daar voor het grootste deel voor de hele levensduur van het product. Elke verandering zal applicaties en gebruikers nodig hebben om kopieën van deze gegevens die anomalieën kunnen veroorzaken en gaat tegen de principes van normalisatie te creëren.

Schemalessdatabase elimineert deze activiteit in zeer grote mate en vermindert de complexiteit van deze activiteit aanzienlijk. De enige beslissingen die een gebruiker nodig heeft om vooraf te bepalen welke attributen van een entiteit ze willen collocated houden.

  1. ETL / ELT of vereist om gestructureerde/ongestructureerde gegevens te formatteren en op te slaan

het extraheren van gegevens uit bronnen en het landen (gewoonlijk aangeduid als ETL of ELT) het naar een staging gebied in databases vereist de bron en het doel om de structuur van de gegevens in een relationele wereld te begrijpen. De gebruiker moet de database/tabel/kolom/veld lay-out kennen. Er zijn beperkingen en prestaties implicaties bij het extraheren van de gegevens. Tenzij de hoeveelheid gegevens erg klein is, is er echt geen manier om deze gegevens te extraheren en in het databasesysteem te laden zonder een soort batchstream. En dit vertaalt zich meestal naar vele uren of overnight processen en een paar duizend regels code of dure ETL tools. Er is zeer weinig tolerantie voor fouten in dit back-to-back proces en elke fout resulteert meestal in het niet hebben van nauwkeurige gegevens op tijd. Voor een onderneming die afhankelijk is van gegevens om te overleven is dit een enorme tegenslag en elke onderneming die niet afhankelijk is van haar gegevens en latency kan tolereren geeft waarschijnlijk niet om concurrentie. Een poging om latency te voldoen vereist enorm kapitaal en operationele uitgaven om state-of-the-art apparatuur te verwerven. En deze kosten zijn voortdurend en groeit elk jaar.

Schemalessdatabase heeft geen langdurige transformatie-en reinigingsprocessen nodig, omdat het model flexibel is en de gebruiker niet aan een strikt schema voldoet.

  1. doorlopend verandermanagement inclusief schemawijzigingen

    die enorme codewijzigingen kunnen veroorzaken in systemen (applicatielaag, ORM-laag) die gegevens lezen en schrijven van en naar de database

zodra een schema is aangekomen op, het wijzigen van het schema vereist geplande uitval om de getroffen objecten offline te krijgen en te voltooien en te testen wijzigingen in de applicatielaag om de wijzigingen te benutten. Handmatige implementatiefouten kunnen gevolgen hebben die enkele dagen of maanden kunnen oplopen. In een wereld waar verandering de enige constante is lijkt dit model een beetje verouderd. Schemaless databases model het bedrijf in plaats van een data-model. De definitie en attributen van een stuk gegevens veranderen voortdurend, dus waarom leven met een database die je dwingt om te voldoen aan dezelfde definitie?

Schemalessdatabases elimineren complexe migratieactiviteiten en veranderen synchronisatie dankzij het flexibele gegevensopslagmodel.

  1. Real-time analytics op streaming data

de noodzaak om waarde te kunnen halen uit de gegevens is van het grootste belang in de huidige data driven wereld waar bedrijven petabytes aan gegevens uit verschillende bronnen genereren – sommige die van grote waarde zijn en sommige die niet. Moeten wachten tot de gegevens volledig is gereinigd en geladen in het systeem om de waarde te begrijpen betekent montage kosten op te slaan, te reinigen en te transformeren van de gegevens. Een schemaless database kunt u het land, analyseren en de grootte van de waarde van de gegevens zeer snel. Als de gegevens niet van enige waarde is, zou men snel willen falen en gegevens zonder waarde willen elimineren om de opslag-en verwerkingskosten te verlagen.

sommige use cases zoals fraudedetectie, just In time marketing vereisen de noodzaak om gegevens te analyseren en inzichten in real-time te bieden. De behoeften zijn zeer tactisch. Er is behoefte aan het combineren van nieuwe data met bestaande data om inzichten te bieden. Dit alles vertaalt zich in veel geld en een enorm concurrentievoordeel. Vandaag de dag is het niet alleen de tech savvy ingenieurs toegang tot en het analyseren van gegevens veel van de gebruikers van deze gegevens zijn niet zeer technisch.

met een schemalessdatabase kunt u uw weergave van gegevens definiëren in plaats van een schema te maken dat u moet bestrijden om waarde te extraheren. Dit laat uw niet-technische it-afhankelijke personeel snel en gemakkelijk extraheren informatie en doen wat ze zijn ingehuurd om te doen in plaats van complexe datamodellen te begrijpen en uren te besteden aan het creëren van hun universum van de gegevens. Dit vertaalt zich weer in enorme kostenbesparingen.

  1. schaalbaarheid op aanvraag om te voldoen aan extreme Volumes, snelheid en verscheidenheid aan data

de dagen dat ondernemingen het comfort hadden om vooruit te plannen voor anomalieën in de volumes, snelheid en verscheidenheid aan gegevens zijn helaas voorbij. Als je niet Schaal je gewoon falen – zo grimmig als het klinkt dit is echt de waarheid als het kost miljoenen dollars aan winst en verloren kansen.

Schemaloze databases vereisen geen complexe / propriëtaire infrastructuur die enorme kapitaal/operationele uitgaven op schaal vereist. Een kleine instantie kan heel gemakkelijk worden geschaald met een druk op de knop. Terwijl sommige traditionele databases bieden deze functie alleen de stijfheid van het schema legt grenzen. Schaalbaarheid is niet alleen de mogelijkheid om de gegevens te scherpen, het is ook de mogelijkheid om zich snel aan te passen aan veranderende schema ‘ s, Schemaless databases doen dit naadloos. En dit alles kan worden ingezet op goedkope grondstoffen hardware.

samenvatting

zoals beschreven in dit artikel is het duidelijk dat schemaless (“schema-less”) databases een zeer belangrijke rol spelen in de huidige data-centric wereld. Ze zijn duidelijk hier om in een of andere vorm te blijven. Betekent dit dat de wereld zal stoppen met het gebruik van traditionele databases, met ETL/ELT van hun gegevens en met het gebruik van propriëtaire oplossingen? Terwijl alleen de tijd die vraag zal beantwoorden, wijsheid vertelt me traditionele gegevensbronnen kan niet blijven negeren de voordelen die schemaless databases brengen aan de tafel. Het is slechts een kwestie van tijd voordat ze een aantal van deze functies van schemaless databases en dit zou een win-win voor de veeleisende klanten van vandaag.

dit artikel is geschreven door Sandhya Krishnamurthy, Senior Solutions Engineer bij Couchbase, een toonaangevende leverancier van Schemalessdatabases.

neem Contact op met de auteur op [email protected]

  • Praten met ons op Forums
  • Volg ons @couchbasedev en @couchbase

Bezoek de sites hieronder om meer te leren over Couchbase producten, gratis downloads van producten en gratis opleiding

www.couchbase.com

http://www.couchbase.com/nosql-databases/downloads

http://training.couchbase.com/online

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.