Primerjava MongoDB in PostgreSQL za obdelavo in analizo velikih podatkov

Programsko inženirstvo

Študent: Nejc Drobnič

Nejc Drobnič je diplomant Višje strokovne šole Academia, program Informatika - modul Programsko inženirstvo. Svoje diplomsko delo je zagovarjal v juniju 2024.

PDF

Diplomsko delo Nejc Drobnič

V zadnjem obdobju smo opazili izjemno rast in razvoj podatkovnih baz, ki postajajo ključni gradniki pri obdelavi obsežnih količin podatkov, znanih kot veliki podatki. Veliki podatki ne le vsebujejo ogromne količine informacij, temveč pogosto vključujejo tudi raznolike vrste podatkov, kot so tekst, slike, zvok, video posnetki in številni drugi formati.

Zaradi te raznolikosti in obsega je ključno imeti ustrezne podatkovne baze, ki omogočajo učinkovito shranjevanje, upravljanje in analizo teh podatkov. MongoDB in PostgreSQL sta med vodilnimi podatkovnimi bazami, ki se uporabljajo za reševanje izzivov velikih podatkov, vsaka s svojimi edinstvenimi lastnostmi, prednostmi in omejitvami.

To diplomsko delo se osredotoča na primerjalno analizo podatkovnih baz MongoDB in PostgreSQL, ter njihovo uspešnost in učinkovitost pri obdelavi in analizi velikih podatkov. MongoDB, kot predstavnik ne-relacijskih podatkovnih baz, se izkaže kot zelo uporabno orodje v ekosistemu velikih podatkov.

Zmožnost shranjevanja nestrukturiranih podatkov in enostavno horizontalno skaliranje postavljata MongoDB med priljubljene izbire organizacij, ki se spoprijemajo z raznolikimi in hitro rastočimi podatki.

Na drugi strani je PostgreSQL, klasična relacijska podatkovna baza, ki se je s prilagodljivostjo in močjo SQL jezika izkazala kot zanesljiva rešitev za kompleksne analize podatkov. Njena integracija s sistemom za upravljanje transakcij (ACID) omogoča doslednost in zanesljivost v kritičnih okoljih.

V okviru te raziskave bomo izvedli štiri ključne meritve. Prva meritev nam bo podala rezultate hitrosti vstavljanja dokumentov in poizvedb na sekundo. Druga bo osredotočena na hitrost vstavljanja podatkov v obe bazi. S to meritvijo bomo ugotovili njihovo zmogljivost pri obvladovanju večjih količin podatkov.

Tretja meritev se bo posvetila učinkovitosti transakcijskega vstavljanja s poudarkom na zagotavljanju doslednosti in integritete podatkov. Četrta in zadnja meritev bo preučila obseg in razširljivost ter porabo pomnilnika pri vstavljanju v podatkovno bazo. Z našo raziskavo želimo jasno predstaviti, kje so močne točke, omejitve in prednosti MongoDB ter PostgreSQL pri obdelavi in analizi velikih podatkov.

Cilj je pridobiti vpogled v njihove zmožnosti, omejitve in kako se obnesejo pri različnih scenarijih obdelave podatkov.


 

Diplomsko delo Nejc Drobnič

PDF

Diplomsko delo Nejc Drobnič

Želite biti obveščeni o novicah na Academii?

Ko bo kaj novega vam to enostavno sporočimo na vaš e-naslov.

X