Databasemotor

En databasemotor (eller lagringsmotor^[1]^[2]) er den underliggende programvarekomponenten som et databasestyringssystem (DBMS) bruker til å opprette, lese, oppdatere og slette (CRUD) data fra en database. De fleste databasehåndteringssystemer (DBMS) inkluderer sitt eget applikasjons-programmeringsgrensesnitt (API) som lar brukeren samhandle med den underliggende motoren uten å gå gjennom brukergrensesnittet til databasehåndteringssystemet.

Begrepet "databasemotor" forveksles av og til med databasetjener og databasehåndteringssystem. En "databaseinstans" refererer til prosessene og minnestrukturene til den kjørende databasemotoren.

Lagringsmotorer[rediger | rediger kilde]

Mange av de moderne databasehåndteringssystemer støtter flere lagringsmotorer i samme database. For eksempel støtter MySQL både InnoDB og MyISAM.

Noen lagringsmotorer er transaksjonelle.

Navn	Lisens	Transaksjonell	Kompabilitet	Kommentar
Aria	GPL	Nei	MariaDB og MySQL
Falcon	GPL	Ja	MySQL	Avviklet
InnoDB	GPL	Ja	MySQL og MariaDB	Standard for MySQL og MariaDB
Memory	GPL	Nei	MySQL og MariaDB
MyISAM	GPL	Nei	MySQL	Var standard for MySQL
InfiniDB	GPL	Nei
TokuDB	GPL	Ja	MySQL og MariaDB	Bruker fraktal treindeks
WiredTiger	GPL	Ja	MongoDB	Standard for MongoDB
XtraDB	GPL	Ja	MariaDB og Percona Server for MySQL
RocksDB / MyRocks	GPL v2 eller Apache 2.0	Ja	ArangoDB, Cassandra, MariaDB, MongoDB, MySQL, SurrealDB

Ytterligere motortyper inkluderer:

Designhensyn[rediger | rediger kilde]

Informasjon i en database lagres som biter anlagt som en lagret datastrukturer i maskinvaren som effisient kan leses fra og skrives til. Vanligvis er selve lagringen designet for å møte krav til ulike områder som i stor grad bruker lagring, inkludert databaser. Et databasehåndteringssystem i drift bruker alltid flere lagringstyper samtidig (for eksempel minne og ekstern lagring) med sine respektive layoutmetoder.

I prinsippet kan databaselagringen sees på som et lineært adresserom hvor hver bit av data har sin unike adresse i dette adresserommet. I praksis er det bare en svært liten prosentandel av adressene som beholdes som innledende referansepunkter (som også krever lagring), mens de fleste dataene aksesseres indirekte ved bruk av beregninger (bitavstand fra referansepunktene) og ved datastrukturer som definerer tilgangsstier (ved hjelp av pekere) til alle nødvendige data på en effektiv måte som er optimalisert for nødvendige datatilgangsoperasjoner.

Databaselagringshierarki[rediger | rediger kilde]

En database som er i drift har flere typer lagring samtidig, og danner et lagerhierarki. I moderne datamaskiner er mesteparten av databasedelen som er vert for DBMS (delvis replikert) i flyktig lagring. Data (deler av databasen) som blir manipulert ligger inni en prosessor, muligens i prosessoren sitt hurtigminne. Disse dataene blir lest fra og skrevet til minnet, vanligvis gjennom en databuss (typisk flyktige lagringskomponenter). Datamaskinminne kommuniserer data (overført til/fra) ekstern lagring, vanligvis gjennom et standard lagringsgrensesnitt eller nettverk (for eksempel fiberkanal, iSCSI).

Et lagringsarray (en vanlig ekstern lagringsenhet) har typisk et eget lagringshierarki, fra en rask hurtigbuffer som typisk består av (flyktig og rask) DRAM, som er koblet (via standardgrensesnitt) til stasjoner med muligens forskjellige hastigheter som fastminne-stasjoner og magnetiske diskstasjoner (ikke-flyktig). Stasjonene kan være koblet til magnetbånd, som vanligvis de minst aktive delene en stor database kan ligge på, eller sikkerhetskopier av databaser.

For tiden per 2020-årene er det vanligvis en korrelasjon mellom lagringshastighet og pris, men den raskeste lagringen er vanligvis volatil.

Datastrukturer[rediger | rediger kilde]

En datastruktur er en abstrakt konstruksjon som holder på data på en veldefinert måte. En effisient datastruktur tillater manipulering av dataene på effisiente måter. Datamanipulasjonen kan omfatte datainnsetting, sletting, oppdatering og uthenting i ulike moduser. En gitt datastrukturtype kan være svært effektiv i visse operasjoner, og svært ineffektiv i andre. En datastrukturtype velges ved utvikling av DBMS for best å møte operasjonene som trengs for datatypene den inneholder. Typen datastruktur valgt for en bestemt oppgave tar vanligvis også i betraktning hvilken type lagring den ligger i (for eksempel tilgangshastighet, minimal størrelse på lagringsstykkene man får tilgang til, og så videre). I noen DBMS-er har databaseadministratorer fleksibilitet til å velge mellom ulike datastrukturer for å lagre brukerdata av ytelsesgrunner. Noen ganger har datastrukturene velgbare parametere for å justere databaseytelsen.

Databaser kan lagre data i mange datastrukturtyper.^[3] Noen vanlige eksempler er:

Ordnede/uordnede flatfiler
Hashtabeller
B+ trær
ISAM
Hauger (heaps)

Dataorientering og klynging[rediger | rediger kilde]

I motsetning til konvensjonell radorientering kan relasjonsdatabaser også være kolonneorienterte eller korrelasjonsorienterte i måten de lagrer data på i en bestemt struktur.

Generelt oppnås betydelig ytelsesforbedring hvis forskjellige typer databaseobjekter som vanligvis brukes sammen lagres i nærheten og blir "gruppert". Dette gjør det vanligvis mulig å hente nødvendige relaterte objekter fra lagring med minimum antall innputtoperasjoner (som kan være betydelig tidkrevende). Selv for hovedminnedatabaser gir klynging ytelsesfordeler på grunn av vanlig bruk av store hurtigminner (caches) for innputt-utputt-operasjoner i minnet, med lignende resulterende oppførsel.

For eksempel kan det være fordelaktig å gruppere en oppføring for en "vare" på lager med alle dens respektive "ordre"-oppføringer. Beslutningen om å gruppere bestemte objekter eller ikke avhenger av objektenes bruksstatistikk, objektstørrelser, hurtigminnestørrelser, lagringstyper, og så videre.

Databaseindeksering[rediger | rediger kilde]

Indeksering er en teknikk noen lagringsmotorer bruker for å forbedre databaseytelsen. De mange typene indekser deler den felles egenskapen at de reduserer behovet for å undersøke hver oppføring når man kjører en spørring. I store databaser kan dette redusere spørretiden/kostnadene i flere størrelsesordener. Den enkleste formen for indeks er en sortert liste over verdier som kan søkes ved hjelp av et binært søk med en tilstøtende referanse til plasseringen av oppføringen, analogt med indeksen bak i en bok. De samme dataene kan ha flere indekser (en ansattdatabase kan indekseres etter etternavn og ansettelsesdato).

Indekser påvirker ytelsen, men ikke resultatene. Databasedesignere kan legge til eller fjerne indekser uten å endre applikasjonslogikk, noe som reduserer vedlikeholdskostnadene etterhvert som databasen vokser og databasebruken utvikler seg. Indekser kan øke hastigheten på datatilgangen, men bruker plass i databasen og må oppdateres hver gang dataene endres. Indekser kan derfor øke hastigheten på datatilgangen, men sinke datavedlikeholdet. Disse to egenskapene avgjør hvorvidt en gitt indeks er verdt kostnaden.

Referanser[rediger | rediger kilde]

^ Brombach, Harald (7. april 2006). «MySQL klargjør om bruk av lagringsmotorer». Digi.no (norsk). Besøkt 13. mai 2024.
^ Brombach, Harald; Jørgenrud, Marius B. (16. april 2012). «MySQL med NoSQL». Digi.no (norsk). Besøkt 13. mai 2024.
^ Lightstone, S.; Teorey, T.; Nadeau, T. Physical Database Design: the database professional's guide to exploiting indexes, views, storage, and more. Morgan Kaufmann Press. ISBN 978-0-12-369389-1.

[1] Brombach, Harald (7. april 2006). «MySQL klargjør om bruk av lagringsmotorer». Digi.no (norsk). Besøkt 13. mai 2024.

[2] Brombach, Harald; Jørgenrud, Marius B. (16. april 2012). «MySQL med NoSQL». Digi.no (norsk). Besøkt 13. mai 2024.

[Physical_Database_Design-3] Lightstone, S.; Teorey, T.; Nadeau, T. Physical Database Design: the database professional's guide to exploiting indexes, views, storage, and more. Morgan Kaufmann Press. ISBN 978-0-12-369389-1.

[1]

[2]

[3]

v d r Database
Hoved	Krav Teori Modeller Databasehåndteringssystem Databasemotor Databasemaskin Tjener Applikasjon Databasetilkobling Datakilde DSN Administrator Lås
Språk	Datadefinisjon Datamanipulering Spørrespråk Informasjonsuttrekk
Sikkerhet	Aktivitetsovervåkning Revisjon Etterforskning Negativ database
Design	Entiteter og relasjoner (og forbedret notasjon) Normalisering Skjema Refaktorisering Kardinalitet
Programmering	Abstraksjonslag Objekt–relasjonell avbilding
Håndtering	Virtualisering Tuning Mellomlagring Datamigrering Databaseintegritet
Se også	Database-sentrert arkitektur Intelligent database