Databaser

 

Bibliografiska databaser och Multilingual Thesaurus

Mitt jobb på GTK:s informationsbyrå ledde i ett tidigt stadium till att jag blev involverad och engagerad i ett mångårigt internationellt samarbete som rörde utbyte av bibliografiskt material mellan olika språkområden. Det var ett intressant projekt där jag kunde kombinera mina intressen för geologi, språk och den gryende datoriseringen. I det här sammanhanget fick jag vara med om hålkorten på 1970-talet, magnetbanden på 1980-talet och Internet på 1990-talet.

När datorer började användas i geologiska organisationer på 1960-talet uppstod tanken att skapa bibliografiska databaser med referenser till geologisk litteratur för att underlätta sökning och tillgång till geologisk information. Speciellt AGI (American Geological Institute) i USA och BRGM (Bureau de Recherches Géologiques et Minières) i Frankrike hade i ett tidigt stadium ambitiösa planer på att producera globala bibliografiska databaser över all geologisk litteratur i världen. Man kom dock snart till att det var omöjligt för en enskild organisation att täcka hela världens geologiska litteratur, som dessutom publicerades på många olika språk i olika delar av världen. I början av 1970-talet kom man till att det var nödvändigt att samarbeta, till en början t.ex. så att AGI behandlade den engelskspråkiga litteraturen och det västra halvklotet medan BRGM bevakade den franskspråkiga litteraturen samt det östra halvklotet genom samarbete med andra länders geologiska organisationer. För att allt skulle lyckas måste man dock komma överens om gemensamma regler för bl.a. indexeringen, d.v.s. ett kompatibelt system för sökorden på olika språk, så att informationen om publikationerna kunde utbytas mellan de organisationer som var med i systemet på deras eget språk.

Dr. Marjatta Okko, min föregångare som chef för informationsbyrån, var medlem i IUGS:s (International Union of Geological Sciences) kommitté för geologisk dokumentation. Vid den internationella geologiska kongressen i Montréal 1972 bildades en arbetsgrupp för att utarbeta och upprätthålla en flerspråkig geologisk tesaurus, Multilingual Thesaurus of Geosciences (MT). Ändamålet med tesaurusen var att fungera som en kopplingsmekanism mellan olika språk och olika tesaurussystem vid de organisationer som deltog i samarbetet. MT var alltså mer än en ordbok. Den var en mångspråkig synonymordbok, som visade vilka termer de olika organisationerna använde eller inte använde för ett visst begrepp. Varje organisation kunde m.a.o. indexera på sitt sätt men genom MT kunde man överföra informationen till ett annat språk med ett kanske lite annorlunda indexeringssystem.

GTK började samarbeta med BRGM redan i början av 1970-talet. För att säkerställa att informationen om finländska geologers publikationer fanns med i de internationella databaserna började GTK:s informationsbyrå fylla i BRGM:s indexeringsblanketter med franska indexeringstermer till att börja med och senare med engelska termer. På så sätt inkluderades publikationerna från Finland i BRGM:s databas PASCAL/GEODE, därifrån den senare skickades till AGI:s databas GeoRef. Det här var väsentligt för att säkerställa de finländska forskningsresultatens synlighet på internationell nivå. I början av 1980-talet började vi sammanställa en bibliografisk databas över Finlands geologi, FINGEO, som indexerades med både engelska och finska söktermer. Vi strävade till att göra databasen kompatibel med motsvarande nationella och internationella databaser. I början av 1990-talet kunde vi därför utbyta referensmaterialet direkt mellan FINGEO och BRGM, och senare under 1990-talet med AGI. Samtidigt kunde vi också sända materialet till den nationella vetenskapliga bibliografiska databasen i Finland, KATI.

MT-databasen omfattade indexeringstermer på åtta språk: engelska, franska, tyska, ryska, spanska och italienska som upptogs i de tryckta versionerna, samt tjeckiska och finska. En tryckt version av tesaurusen utkom 1988 på Pergamon Press. Den omfattade 4781 termer. En uppdaterad version utkom 1995 och den omfattade 5823 termer. För att hålla kostnaderna nere producerade jag tryckoriginalet på 645 sidor från databasen med hjälp av WordPerfect. Den publicerades genom Information Today, Medford, NJ, USA under titeln Multilingual Thesaurus of Geosciences: Deutsch, English, Español, Français, Italiano, Russkij by J. Gravesteijn, C. Kortman, R. Potenza & G.N. Rassam.

Arbetet med att utveckla det gemensamma arbetsverktyget MT var arbetsdrygt och långsiktigt. Arbetsgruppen med 10-15 deltagare från olika geologiska organisationer i olika länder möttes årligen för att diskutera uppdateringen av termerna i MT. Gruppen utvecklades med tiden till ett väl fungerande nätverk för geologisk dokumentation och information, och deltagarna lärde känna varandra väl under årens lopp. Deltagarna var främst från från USA, Ryssland, Frankrike, Tyskland, Spanien, Italien, Tjeckoslovakien och Finland. Eldsjälarna i projektet var Frankrikes och USA:s huvudrepresentanter. De var bägge polyglotta och hade mångkulturella bakgrunder. Jacobus (Jack) Gravesteijn från franska BRGM var holländare och hade arbetat i Västafrika, medan Ghassan (Gus) Rassam från amerikanska AGI var irakier och hade studerat i USA. Det var ett nöje att se hur de kunde hantera deltagare från olika språkgrupper och kulturer.

Första gången jag deltog i ett MT-möte var 1976 i Bologna. Jag var därefter involverad i MT-samarbetet under mer än tjugo år och deltog i olika sammanhang i möten bl.a. i Madrid 1977, Prag 1978, Esbo 1979, Paris 1980 (26th IGC), Hannover 1983, Prag 1984, Adelaide 1986 (GeoInfo III), Milano 1987, Washington DC 1989 (28th IGC), Pribram 1989, Ottawa 1990 (GeoInfo IV), Madrid 1990, Esbo 1992, Hannover 1992, Kyoto 1992 (29th IGC), Orléans 1993, Milano 1994, Prag 1994 (GeoInfo 5), Köpenhamn 1995, Alexandria, VA, USA 1996, Wien 1997, Washington D.C. 1998 (GeoInfo 6), Bryssel 1999, Budapest 1999, Rio de Janeiro 2000 (31st IGC) och Burgdorf 2003.

Arbetsgruppens namn var ursprungligen “Joint ICSTI/IUGS Working Group on a Multilingual Geological Thesaurus” för att den hade grundats i början av 1970-talet gemensamt av International Council for Scientific and Technical Information (ICSTI) och International Union of Geological Sciences (IUGS). Inom IUGS hörde arbetsgruppens verksamhet under IUGS Commission on Geological Documentation (IUGS/COGEODOC). Jag var medlem i arbetsgruppen sedan 1976 och blev vid den internationella geologkongressen i Washington D.C. 1989 också medlem i IUGS-kommissionen COGEODOC. Vid geologkongressen i Kyoto i Japan 1992 sammanslogs de två IUGS-kommissionerna COGEODOC och COGEODATA till en ny kommission med namnet Commission on the Management and Application of Geoscience Information (IUGS/COGEOINFO). Arbetsgruppen för tesaurussamarbetet (WGMT) fortsatte inom COGEOINFO och jag blev ordförande för arbetsgruppen, som 1997 fick namnet “Working Group on Communications and Standards for Data Integration and Use” (COGEOINFO/WGCOM). Jag fortsatte som ordförande för den nya arbetsgruppen till 2003, året före jag blev pensionerad från GTK.

 

-> Samarbete med Sovjetunionen

-> Tillbaka till Internationellt Samarbete

-> Tillbaka till GTK