Welcome to TechNet Blogs Sign in | Join | Help

Syndication

SQL Server 2008 R2 ja Project Madison mahdollistavat petatavujen tietovarastot tehokkaasti ja skaalautuvasti

Toistaiseksi SQL Server on tukenut pelkästään SMP (Symmetric Multi-Processing) -ympäristöjä, missä tietokantakyselyjen käsittely on tapahtunut yksinomaan yhdessä fyysisessä tietokantainstanssissa. Skaalautuvuuden, ETL-latausten sekä tietokantakyselyiden rajoituksena ovat olleet fyysisen palvelimen suorittimien määrä ja teho, käytettävissä olevan muistin määrä sekä tallennusjärjestelmän (mukaanlukien levyohjaimet, väyläarkkitehtuuri yms) IO.

SQL Server 2008 R2:n julkistuksen myötä saataville tulee myös Project "Madison" -nimellä toistaiseksi kulkeva teknologia, joka mahdollistaa MPP (Massively Parallel Processing) -ympäristöjen rakentamisen. Madison-teknologia tarkoittaa käytännössä sitä, että suuret, jopa petatavujen kokoluokkaa olevat tietovarastotaulut hajautetaan ohjelmallisesti useiden fyysisten palvelimien hallintaan. Jokaisella fyysisellä palvelimella on omat suorittimensa, työmuisti sekä oma levyalijärjestelmänsä. Jokaisessa palvelimessa ajetaan omaa SQL Server -instanssia mutta niitä käytetään ETL-välineen, hallinnan, OLAP-kuutioiden ja raportoinnin näkökulmasta kuin yhtä fyysistä palvelinta. ETL-prosessissa syntyvä datavirta hajautetaan hash-algoritmilla näiden fyysisten palvelimen rinnakkaiseen käsittelyyn ja koska käytettävä rauta on nk. referenssiarkkitehtuuriin perustuvaa teknologiaa, pullonkaulat on jo valmiiksi minimoitu mm. levyn suorituskyvyn näkökulmasta. Tämä mahdollistaa erittäin nopeat tietokantalataukset tietovarastoon ja käyttökohteita löytyy niin suurissa kauppaketjuissa kuin teleoperaattoreillakin.

Kyselyt ja päivitykset SQL Server 2008 R2 Madison -teknologiassa tehdään tätä varten dedikoituun palvelimeen, nk. kontrollinoodiin - joka hajauttaa kyselyt ja päivitykset automaattisesti kaikille fyysisille palvelimille ja palauttaa kyselyjen tulokset sovellukselle ikäänkuin kysely olisi tehty yhdellä palvelimella. Koska tietovarastossa oleva data on hajautettu tasaisesti useamman fyysisen palvelimen ja levyalijärjestelmän kesken, kyselyt ovat merkittävästi nopeampia kuin tehtäessä ne yhtä fyysistä palvelinta vasten. Tietovarastoteknologia mahdollistaa myös uusien palvelimien lisäämisen "lennossa", jolloin uuden palvelimen käyttöönotto tapahtuu tietovaraston näkökulmasta automaattisesti ja palvelimen omille levyille siirretään osajoukko tietovarastossa sijaitsevasta datasta taustalla. Madison -tietovarastoteknologia on myös varustettu automaattisella levypeilauksella jolloin yksittäisen fyysisen palvelimen tai sen "omistamien" levyjen rikkontuminen ei vaikuta datan saatavuuteen.

Teknologia on huomattavasti kustannustehokkaampi sekä rautakustannuksiltaan että ylläpidettävyydeltään kuin kilpailijoiden (esim. TeraData ja Oraclen Exadata / Real Application Cluster), koska Madison-arkkitehtuuri ei vaadi mitään eksoottista rautaa niin palvelimien kuin levyjärjestelmienkään osalta.

Teknologia tulee tuotantoon SQL Server 2008 R2:n myötä keväällä 2010 mutta sitä on jo benchmarkattu erittäin lupaavin tuloksin. Kerron näistä hieman myöhemmin blogissani.

Lisätietoja SQL Server 2008 R2:sta ja Project Madisonista löytyy osoitteesta: http://www.microsoft.com/sqlserver/2008/en/us/madison.aspx

T. Marko

 

Published Tuesday, October 27, 2009 10:05 PM by markohot

Comment Notification

If you would like to receive an email when updates are made to this post, please register here

Subscribe to this post's comments using RSS

Comments

No Comments

Leave a Comment

(required) 
required 
(required) 

  
Enter Code Here: Required
© 2009 Microsoft Corporation. All rights reserved. Terms of Use  |  Trademarks  |  Privacy Statement  
Page view tracker