Project beschrijving, (1ste versie) SGML (en HTML ?) in OASIS J.C. vd Weerd, R. de Bie. 5 aug. 1994 Aangenomen op OASIS projectvergadering 6 sept. 1994. (*) m.n. op de hiermee aangegeven punten zouden nog aanvul- lingen/wijzigingen gegeven kunnen worden. 1 Samenvatting hoofdpunten: 1.1 Deelproject OASIS, dus ook analoge menskrachtinvulling (UB en CRI). 1.2 Proef met OASIS collectie "levensberichten MNL". 1.3 Streven naar gebruik public domain software, maar com- merciele software niet uitsluiten. 1.4 Rekening houden met (toekomstige integratie van bestaande Gopher service van OASIS met) WWW/HTML. 1.5 Rekening houden met vele bestaande bescheiden client con- figuraties (*) aan de RUL voor eindgebruikers, maar uitgaan van beschikbaarheid voor informatieleveranciers van rede- lijk goede client configuratie. 1.6 Rekening houden met ontwikkelingen in het RUL-CWIS project "Klikspaan". 1.7 Streven naar eerste resultaat eind 1994, bestaande uit: - Afweging van SGML tegenover alternatieven. - Werkende demo service met de levensberichten. - Advies voor SGML beleid in OASIS. - Concept ontwerp beheer/organisatie SGML aan de RUL. - Voorstel beleid WWW/HTML voor OASIS. 1.8 Begroting: (*) - Menskracht: tot eind 1994: 1 mensdag/week CRI + 1 mensdag/- week UB. - Geld voor evt. software: kf 10.- per werkplek, 1 op UB + 1 op CRI, samen: kf 20.- 2 Inleiding met historie. Op het gebied van electronische document- en informatie service is het afgelopen jaar aan de RUL in verschillend verband en in toenemende mate het onderwerp SGML ter sprake gekomen: 2.1 Binnen het OASIS project werd SGML vaak als goede oplossing genoemd waar de meest voor de hand liggende documentformaten niet bleken te voldoen, zoals: - integratie van tekst met images, - opnemen van bestaande electronische documenten in OASIS, - kiezen van een toekomst vaste basis voor documentfor- mats, - een standaard format waarmee "special characters" goed kunnen worden verwerkt. - Een document format waarmee navigatie- en zoek problemen beter kunnen worden opgelost dan met Gopher/WAIS. 2.2 In het aan de RUL lopende vooronderzoek voor een CAPCAS project (samenwerking met Elseviers voor de opzet van een online tijdschriften service): Het basis materiaal van Elseviers bestaat uit SGML bestanden. 2.3 SGML is een van de uitgangspunten geweest bij de opzet van (het document format HTML van) WWW, het systeem dat alom wordt genoemd als waarschijnlijke opvolger van Gopher. 2.4 Niet alleen voor OASIS maar ook voor Klikspaan (Leidse CWIS) wordt WWW genoemd als waarschijnlijke toekomstige basis technologie. 2.5 Bij het bezoek aan een aantal instellingen in de U.S.A., november 1994, waar aan electronische documentverwerking werd gedaan, kwam SGML steeds naar voren als een belangrijk en toekomstvast basisformat. 2.6 Ook in de CD/ROM wereld wordt SGML genoemd als documentfor- maat van toenemend belang. 2.7 Op het congres over MM in de universitaire wereld in Lough- borough (U.K.), juni 1994, kwam SGML naar voren als document opmaak taal van toenemend belang, en HTML voor de ontsluit- ing ervan. Omdat het werk in OASIS zich aanvankelijk concentreerde op het in de lucht brengen van een documentservice m.b.v. de meest voor de hand liggende middelen, en de keuze voor SGML ook weer niet zo van zelf sprekend is, en de invoering van SGML wel enig onderzoek en voorwerk vereist, is binnen OASIS nog niet tot die invoering over gegaan. Om bovengenoemde redenen wordt binnen het project nu echter de tijd daartoe wel rijp geacht. 3 Nadere toelichting van het plan. 3.1 De keuze van de collectie. Net als voor het hele OASIS project zelf, ligt voor dit deelpro- ject de uitvoering voor de hand a.d.h.v. een concrete document- verzameling. We kiezen hiervoor de collectie van levensberichten der MNL om de volgende redenen: (*) - de collectie bestaat al binnen OASIS. - de collectie is in beheer bij de UB zelf. - de collectie is eenvoudig van structuur. - de collectie is relatief stabiel - de collectie bevat teksten en images (*?) - het is een collectie van betekenis, ook voor gebruikers buiten de RUL. 3.2 Het verband SGML - HTML/WWW Over het beleid binnen OASIS t.a.v. HTML/WWW wordt al enige tijd een discussie gevoerd ((*:)zie binnen OASIS: /projectinformatie / beleid t.a.v. WWW/HTML), maar waar wel overeenstemming over bestaat is: - het nauwe verband tussen HTML en SGML - In de toekomst zal in OASIS op zijn minst een "HTML tak" komen. Nadere aandacht binnen OASIS voor HTML is dus onvermijdelijk, en het ligt voor de hand om bij het SGML deelproject hiermee rekening te houden. 3.3 Public domain software vs commerciele software en client configuraties. Van SGML werd steeds gezegd dat het zo duur is door gebrek aan PD software. Mede door de opkomst van HTML is dit aan het veranderen, maar hoe snel de beschikbaar komende PD software stabiel genoeg is voor serieuze productieomstandigheden, zowel voor informatie- beheerders als voor informatieconsumenten, is nu nog niet duide- lijk. Omdat de informatieleveranciers meer software nodig hebben dan de -consumenten, zullen voor hun voorzieningen zwaardere eisen moeten worden gesteld. Om anderzijds de beoogde service bereikbaar te maken voor een realistische gebruikersgroep, moet voor de informatieconsumptie voorlopig nog gerekend worden met een bescheiden PC configuratie. (* ?) 3.4 Verband met overige ontwikkelingen aan de RUL. CAPCAS en Klikspaan hebben met OASIS veel gemeen. Zowel voor serviceverschaffers als -consumenten zal uniformering leiden tot besparingen en eenvoud in gebruik.