Anne Õuemaa   enna@lai.ut.ee

Sots. dok.

 

Nimi (muudetud): Geospatial and Statistical Data Center (Geostat)

(Endine nimi: The Social Sciences Data Center and Geographic Information Systems Lab)

Asukoht (uus): http://fisher.lib.virginia.edu/

Temaatiline suund: Tegemist on ühiskonnateadustealase andmebaasiga, mis sisaldab informatsiooni peamiselt Põhja-Ameerika (USA, Kanada) kohta. Teemadest on kajastatud sotsiaal-demograafia, poliitika, sise- ja välismajandus, haridus ja tervishoid.

Arhiveeritud andmestike arv: Interaktiivsetest andmestikest peaksid olema kättesaadavad vähemalt 19 andmestikku. Täpset arvu on andmebaasis surfates raske kontrollida, sest kõikidele andmestikele pole juurdepääs vaba, osad andmestikud pole ajutiselt kättesaadavad. Samas puudub viimaste kohta täpne informatsioon, mis andmestikud need on ja kui palju neid on.

Lisaks on kasutajal võimalik liikuda linkide kaudu mitmete teiste sotsiaalteaduslike uurimuste keskuste kodulehekülgedele, et jätkata meelepäraste andmestike otsinguid.

2. Uurimuste kohta esitatud info:

Väga kindlalt järgitavat standardit siin pole. Põhjuseks on interaktiivsete andmestike mitmekesisus. Andmestikud võivad erineda nii andmekogumisperioodide, meetodite, andmete täielikkuse kui ka sisukuse poolest. Enamuse andmestike kogujaks on kohaliku, osariikliku või föderaalse tähtsusega statistikabürood. Tegemist on pigem andmebaasiga, mis kajastab teatud ajavahemike tagant fikseeritud olukorda, kui unikaalsete uurimuste arhiiviga.

Kindlasti on esitatud konkreetse andmestiku taga oleva uurimuse temaatika, informatsioon andmete päritolu kohta, andmete koguja/haldaja, andmetega kaetud periood, olemasolul ka koodiraamat. Detailsema info saadavus sõltub konkreetsest andmestikust (vt ka punkt 3).

 

Päringusüsteem ja otsimisvõimalus vajaliku metainformatsiooni leidmiseks uurimuste kohta:

Üldjuhul on andmestiku juurde lisatud informatsioon andmete päritolu, sisu, mahu ja aja jooksul metoodikas tehtud muudatuste kohta. Üldjuhul on esitatud koodiraamat või instruktsioon andmestikus sisalduvate tunnuste paremaks mõistmiseks. Sageli on metainformatsiooni blokis link originaalandmete koguja või haldaja koduleheküljele; samuti võib olla lisatud koguja või haldaja e-posti aadress detailsema informatsiooni saamiseks andmete kohta.

Üldjuhul on lisatud ka see, kas andmed on kättesaadavad originaalandmestikuna, agregeeritud kujul või tekstina.

Ülevaatlikum informatsioon on esitatud vastava andmestiku sissejuhatava osana. Detailsete koodiraamatute ja instruktsioonide juurde viivad lingid.

Üldhinnanguna võib öelda, et metainformatsiooni on piisavalt, et teha järeldusi selle kohta, kas ja millistel eesmärkidel andmeid tasub kasutada või millised probleemid võivad andmete kasutamisel tekkida.

 

Võimalused esitada päringuid originaalandmete kohta, agregeeritud resultaatide esitamine, elektroonilised publikatsioonid vms:

Päringusüsteemid on suhteliselt kasutajasõbralikud. Lihtkasutajale kättesaadavate andmestike päringusüsteemid võimaldavad esitada lihtsamaid päringuid nii osariikide, maakondade kui ka väiksemate haldusüksuste tasandil teatud aastate lõikes. Vastust on võimalik lasta esitada näiteks tekstina, tabelitena, samuti ka ftp failina. Olenevalt andmestikust on päringu vastuste esitamisvõimalused siiski mõnevõrra erinevad. Alati pole originaalandmete kättesaamine toorkujul (so töödeldava andmefailina) võimalik. Sel juhul esitatakse vastus näiteks tekstina, tekstifailina, tabelites või graafiliselt. Lisaks originaalandmetele on mõnel juhul lisatud ka sobiv tarkvaraprogramm andmete töötlemiseks. Kui tarkvaraga varustamine puudub, siis on lisatud sobivate programmide nimistu ja võimalusi faili konverteerimiseks kasutajale sobivasse programmi.

Mõnevõrra häirivaks osutus tõsiasi, et arvukate tunnustega varustatud andmestike (nt ARL) puhul tuleb päringut sooritades või saadud vastust tõlgendades pöörduda taas koodiraamatu juurde, et sealt vajalik informatsioon tunnuste märgistamisviisi jms kohta üles leida.

Andmebaasi Geostat vahendusel on võimalik võtta ühendust teiste poliitika- ja sotsiaalteadustealaste andmekollektsioonidega. Protseduur toimub läbi kasutajasõbraliku päringusüsteemi. Päringuks on märksõna või märksõnad. Vastuseks saadakse märksõna(de)ga seotud elektrooniliste publikatsioonide nimistu, kust võib liikuda edasi iga üksiku uurimuse autorite, läbiviimisaja, meetodi, lühikokkuvõtte jms juurde.

Olenemata sellest, kuidas on andmestik kasutajale vahendatud, on enamus andmestikke andmebaasis Geostat vaba juurdepääsuga. Andmestike kättesaamine toimub vastavate linkide kaudu. Seisuga 09.11.1998 oli vaba juurdepääs järgmistele interaktiivsetele andmestikele:

County & City Data Books;

1990 Census PUMS;

Uniform crime reporting data;

National income & Product Accounts;

Regional Economic Informational System;

NBER Productivity Database;

US Imports and Exports Database;

Regional Economic Projections;

Standard Industrial Classification Manual;

United States Imports & Exports;

County Business Patterns;

State Personal Income;

Direction of Trade Statistics IMF;

World Resources 1996-1997;

World Tables of Economic & Social Indicators;

Assotiation of Research Libraries Statistics.

Piiratud juurdepääsuga andmestike kättesaamiseks tuleb tõenäoliselt jõuda oma kvalifikatsioonilt vastava regiooni vastavasse tipp-ekspertrühma ja taotelda seeläbi endale lihtkasutajale juurdepääsuta andmestiku kasutamise luba.

Ühenduse kiirus Geostst serveriga on võrdlemisi hea. Suuremaid takistusi tekib, kui otsitav info asub mõne teise serveri halduses. Näiteks ei õnnestunud mul ära oodata NBER Productivity Databasei ega US Imports and Exports Databasei saabumist.

Lehekülgede disain ja kasutamismugavus on suhteliselt hea. Samas võiks soovida otselinkide olemasolu agregeeritud resultaatide ja koodiraamatute tunnuste vahel.

Üldhinnang Eesti sotsiaalteaduslikes uuringutes kasutatavuse seisukohalt:

Enamus informatsioonist on Eesti sotsiaalteaduslikes uuringutes suhteliselt raskesti kasutatav Geostat andmete regionaalse eripära tõttu. Võib arvata, et spetsiifilise uurimisülesande puhul on informatsioon teatud võrdlusmaterjalina siiski kasutatav.

Eesti seisukohalt võiksid pakkuda suuremat huvi rahvusvahelist informatsiooni sisaldavad andmestikud (nt World Resources 1996-1997, World Tables of Economic & Social Indicators), mille kättesaadavus pole aga tavakasutajale võimalik.

Täiendavad märkused:

Andmebaasi sisenemisel meeldis, et lisaks teatele andmebaasi nime ja asukoha muutusest, suunati “eksinu” ka automaatselt õigele aadressile.

Veel meeldis see, et andmebaasil Geostat on otseühendused paljude teiste andmebaasidega, nii et kasutaja võib minna sujuvalt üle teise andmebaasi (ilma et ta seda ise märkakski).