hodnota Schemaless databází

Schemaless (nebo „schema-less“) databáze jsou nejnovější buzzword ve světě IT. Zdá se, že Geek programátoři milují flexibilitu a nízké náklady a tyto atributy vyvolaly mnoho start-upů. Poté, co jsem přišel z pozadí silně relační databáze, hodnota, kterou databáze bez schémat přinášejí podniku, pro mě otevírala oči. Je na čase, aby se schemaless databáze ze dvorku developera a přivést ji do širšího podniku.

tento blog zkoumá, proč je v dnešním světě zaměřeném na data tak relevantní. Pokud existuje jedna jediná věc, kterou by podniky dnes zabíjely, je to pochopit a rychle získat z jejich údajů užitečné poznatky. Nadále investují miliony dolarů, aby to udělali efektivně. Velká Data jsou obrovskou součástí této rovnice. Gartner zvěčnil 3V velkých dat-objem, rozmanitost a rychlost. A pokud existuje jedna oblast, kde tradiční databázové systémy bojují, je to v souladu s rychlostí, s jakou data přicházejí, téměř každý nástroj v IT toolkit ukládá nějakou formu datového modelu nebo formátu, což ztěžuje rychlé čtení nebo instanci dat.

to je místo, kde schemaless databáze krok do Přidat obrovskou hodnotu.

co je databáze bez schémat?

nejprve definujme, co je databáze bez schémat.

 1. databáze bez schémat nevyžaduje shodu s pevným schématem (databáze, schéma, datové typy, tabulky atd.).), že člověk musí žít až do konce života systému.
 2. nevynucuje omezení datového typu na jednotlivých hodnotách vztahujících se k jednomu typu sloupce
 3. modeluje obchodní využití a ne databázové schéma, aplikaci nebo produkt.
 4. může ukládat strukturovaná a nestrukturovaná data.
 5. eliminuje potřebu zavádět další vrstvy (ORM layer) pro abstrakci relačního modelu a jeho vystavení v objektově orientovaném formátu.

Put in plain English fundamentally schemaless databases:

 1. nevyžadují žádné modelování (3NF forma normalizace), která učinila kariéru mnoha databázových architektů, včetně vaší opravdu
 2. nevyžadují přednastavení datových typů ve vašem úložišti, což výrazně zkracuje čas potřebný k vytvoření datového úložiště
 3. může ukládat data s různými charakteristikami a může tolerovat změnu této definice, aniž by bylo nutné plánovat dopředu pro složité výpadky a změny a eliminuje složité migrace schémat
 4. lze snadno transformovat např. Číslo účtu může začínat jako všechny znaky nebo to mohou být čísla nebo kombinace obou. Je omezena pouze definicí a představivostí uživatele!

databáze bez schémat ukládají data jako páry klíčů/hodnot (také známé jako KV) nebo jako dokumenty JSON. Na základě případů použití mají uživatelé možnost ukládat data jako páry KV nebo jako dokumenty JSON. Dokumenty JSON jsou obecně velmi bohaté na způsob, jakým jsou data reprezentována, a umožňují uživatelům velmi pečlivě modelovat model vztahu entity, se kterým jsme všichni velmi dobře obeznámeni a považovali jsme je za velmi užitečné. Například: Účetní jednotka může být modelována v dokumentu JSON se všemi požadovanými atributy a vnořenými hodnotami, které jdou s typickým objektem účtu-více adres, e-mailů, aliasů atd. JSON dokumenty také poskytují další výhodu v tom, že jsou schopni indexovat jednotlivé hodnoty, takže přístup mnohem výkonnější, což umožňuje kousky dat z různých dokumentů, které mají být spojeny dohromady.

tento blog se nezaměřuje na složitosti dokumentu JSON, ale jen proto, aby poskytl rychlý úvod dokument JSON ve světě databáze bez schémat je podobně jako řádek v relační databázi se schopností říci, že jeden řádek účtu je zcela odlišný od jiného řádku účtu, což je přesně to, jak vypadají obchodní data v reálném životě.

výhody Schemaless databází

co to všechno znamená pro podnik, který investoval několik milionů dolarů do komplexních proprietárních hardwarových a softwarových databázových řešení, aby se udržel na uzdě v 3Vs? Podívejme se nejprve na množství času, který podniky tráví ve výše uvedených činnostech. V mé mysli jsou činnosti, které jsou časově nejnáročnější a nejdražší

 1. návrh databáze nebo normalizace

navrhování schématu obecně označovaného jako normalizace dat, aby se dostalo do relačního formátu, trvá několik týdnů, ne-li měsíců, a velmi kvalifikované zdroje. V relačním světě patří každý kus dat do tabulky, databáze nebo schématu a zůstává tam z větší části po celou dobu životnosti produktu. Jakákoli změna bude vyžadovat, aby aplikace a uživatelé vytvořili kopie těchto dat, které by mohly způsobit anomálie a jsou v rozporu s principy normalizace.

Schemaless databáze eliminuje tuto aktivitu do značné míry a výrazně snižuje složitost této aktivity. Jediné rozhodnutí, které uživatel musí předem určit, jsou atributy entity, které chce zachovat.

 1. ETL / ELT požadované pro přeformátování a ukládání strukturovaných / nestrukturovaných dat

extrahování dat ze zdrojů a jejich přistání (běžně označované jako ETL nebo ELT) do pracovní oblasti do databází vyžaduje, aby zdroj a cíl porozuměli struktuře dat v relačním světě. Uživatel potřebuje znát rozložení databáze / tabulky/sloupce / pole. Při extrahování dat existují omezení a důsledky výkonu. Pokud není množství dat velmi malé, neexistuje žádný způsob, jak extrahovat a načíst tato data do databázového systému bez nějakého dávkového proudu. A to se obvykle promítá do mnoha hodin nebo nočních procesů a několika tisíc řádků kódu nebo drahých nástrojů ETL. V tomto procesu zády k sobě je velmi malá tolerance k chybám a jakákoli chyba obvykle vede k tomu, že nemáte přesná data včas. Pro podnik, který závisí na datech pro přežití, je to obrovský neúspěch a každý podnik, který není závislý na svých datech a může tolerovat latenci, se pravděpodobně nestará o konkurenci. Pokus o splnění latence vyžaduje obrovské kapitálové a provozní výdaje na získání nejmodernějšího vybavení. A tyto náklady probíhají a každým rokem rostou.

Schemaless databáze nepotřebuje dlouhé nakreslené transformační a očistné procesy vzhledem k tomu, že model je flexibilní a uživatel není v souladu s přísným schématem.

 1. průběžná správa změn včetně změn schématu

  , které by mohly způsobit masivní změny kódu v systémech (Aplikační vrstva, ORM vrstva), které čtou a zapisují data do a z databáze

jakmile je schéma dosaženo, změna schématu vyžaduje plánované výpadky, aby se postižené objekty offline a dokončily a otestovaly změny v aplikační vrstvě, aby se změny využily. Chyby manuálního nasazení by mohly způsobit dopady, které by mohly trvat několik dní nebo měsíců. Ve světě, kde je změna jedinou konstantou, se tento model zdá být trochu zastaralý. Databáze bez schémat modelují podnikání spíše než datový model. Definice a atributy kusu dat se neustále mění, tak proč žít s databází, která vás nutí přizpůsobit se stejné definici?

Schemaless databáze eliminuje složité migrace aktivity a změnit synchronizaci díky tomu flexibilní model ukládání dat.

 1. analýza datových proudů v reálném čase

potřeba být schopen extrahovat hodnotu z dat má zásadní význam v dnešním světě založeném na datech, kde společnosti generují petabajty dat z různých zdrojů-některé mají velkou hodnotu a jiné ne. Muset počkat, až budou data zcela vyčištěna a načtena do systému, aby pochopili hodnotu, znamená zvýšení nákladů na ukládání, čištění a transformaci dat. Databáze schemaless umožňuje přistát, analyzovat a velikost až hodnotu dat velmi rychle. Pokud data nemají žádnou hodnotu, chtěli bychom rychle selhat a eliminovat data bez hodnoty, aby se snížily náklady na skladování a zpracování.

některé případy použití, jako je detekce podvodů, just in time marketing vyžadují potřebu analyzovat data a poskytovat informace v reálném čase. Potřeby jsou velmi taktické. Je třeba kombinovat nová data se stávajícími daty, aby bylo možné poskytnout informace. To vše znamená velké peníze a obrovskou konkurenční výhodu. Dnes to není jen tech důvtipný inženýři přístup a analýzu dat mnoho uživatelů těchto dat nejsou vysoce technické.

schemaless databáze umožňuje definovat svůj pohled na data, spíše než vytvořit schéma, které budete muset bojovat extrahovat hodnotu. To umožňuje netechnické it závislé zaměstnance extrahovat informace rychle a snadno a dělat to, co jsou najati dělat, spíše než pochopit složité datové modely a trávit hodiny vytvářet svůj vesmír dat. To se opět promítá do obrovských úspor nákladů.

 1. škálovatelnost na vyžádání pro splnění extrémních objemů, rychlosti a rozmanitosti dat

dny, kdy podniky měly pohodlí plánování dopředu pro případné anomálie v objemech, rychlost a rozmanitost dat jsou bohužel pryč. Pokud nechcete měřítko jednoduše selžete-tak ostrý, jak to zní to je opravdu pravda, jak to stojí miliony dolarů v zisku a ztracené příležitosti.

databáze bez schémat nevyžadují složitou / proprietární infrastrukturu, která vyžaduje obrovské kapitálové / provozní výdaje. Malá instance může být velmi snadno změněna stisknutím tlačítka. Zatímco některé tradiční databáze nabízejí tuto funkci, pouze tuhost schématu ukládá limity. Škálovatelnost není jen schopnost shard dat je také schopnost přizpůsobit se rychle mění schéma, Schemaless Databáze to bez problémů. A to vše lze nasadit na levný komoditní hardware.

shrnutí

jak je popsáno v tomto článku, je zřejmé, že databáze bez schémat („schema-less“) hrají v současném světě zaměřeném na data velmi důležitou roli. Jsou tu zjevně proto, aby zůstali v nějaké formě. Znamená to, že svět přestane používat tradiční databáze, zastaví ETL / ELT jejich dat a přestane používat proprietární řešení? Zatímco na tuto otázku odpoví pouze čas, moudrost mi říká, že tradiční zdroje dat nemohou nadále ignorovat výhody, které databáze bez schémat přinášejí ke stolu. Je to jen otázkou času, než přijmou některé z těchto funkcí schemaless databází a to by mohlo být win-win pro dnešní náročné zákazníky.

tento článek napsal Sandhya Krishnamurthy, Senior Solutions Engineer ve společnosti Couchbase, přední poskytovatel databází bez schémat.

kontaktujte autora na adrese [email protected]

 • Promluvte si s námi na fórech
 • Sledujte nás @couchbasedev a @couchbase

navštivte níže uvedené stránky, kde se dozvíte více o produktech Couchbase, ke stažení zdarma a školení zdarma

www.couchbase.com

http://www.couchbase.com/nosql-databases/downloads

http://training.couchbase.com/online

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.