[Mirrored from: http://www.droit.umontreal.ca/crdp/fr/equipes/technologie/textes/sgml/virtual.html]

Une classe virtuelle pour l'enseignement des droit fondamentaux

Daniel Poulin
Centre de recherche en droit public
Faculté de droit, Université de Montréal
poulind@droit.umontreal.ca

Version française d'une texte préparé pour la
Conférence LETT' 96 tenue à Victoria, du 19 au 20 mars 1996

Introduction

Le développement de didacticiels pour l'enseignement du droit, adaptés à des enseignements universitaires, présente des défis considérables. Certains de ces défis sont communs à toutes les disciplines; la préparation de logiciels pour soutenir l'enseignement universitaire se heurte toujours aux problèmes liés à l'évolution rapide des connaissances à transmettre, à la taille relativement petite des clientèles et à la faible reconnaissance académique obtenue par les auteurs de ce type de publications. D'autres écueils sont plus spécifiques au droit, il en va ainsi de la nature nationale ou locale de la majeure partie des connaissances à être enseignées qui a pour effet de réduire encore la clientèle.

Aujourd'hui cependant, ces difficultés, si elles demeurent toujours, se posent dans un contexte plus favorable qu'auparavant. Le développement récent des technologies liées à l'Internet et au World Wide Web (WWW) entraîne une chute importante des coûts de production et de distribution d'outils pédagogiques hautement interactifs. Autre avantage, les systèmes conçus à l'aide de ces technologies sont plus ouverts, en ce sens que leurs éléments peuvent être plus facilement rendus accessibles pour être réutilisés par d'autres. Cette nouvelle formulation de l'équation économique du didacticiel juridique est susceptible d'accroître considérablement l'offre aux étudiants. C'est dans ce contexte, traditionnellement hostile, mais aujourd'hui plus favorable, qu'a été élaboré notre projet de système d'enseignement des libertés fondamentales (SELF).

Dans les prochaines lignes, nous décrirons ce système d'information organisé autour de la Charte Canadienne des droits et libertés. Nous en présenterons d'abord l'architecture générale et le fonctionnement, puis nous aborderons les divers questions techniques soulevées par sa réalisation. Nous discuterons alors du recours au SGML (Standard Generalized Markup Language) et de sa mise en oeuvre, de l'enrichissement hypertexte du corpus, du repérage de l'information et de la diffusion de SELF sur l'Internet.

Le système d'enseignement des libertés fondamentales (SELF)

L'environnement didactique proposé donne accès à l'ensemble des documents qui constituent les sources fondamentales nécessaires à l'étude du droit canadien des libertés publiques. Essentiellement, il regroupe dans un ensemble homogène l'ensemble des documents de base ainsi que bon nombre d'autres documents pertinents. Sur ce corpus, se superposent les notes de cours des divers professeurs et les exercices.

De façon concrète, la base documentaire diffusée se structure autour de la collection des décisions de la Cour suprême en matière de Charte, soient près de 500 décisions totalisant environ de 25 000 pages dans chaque langue. Le corpus comportera également la Charte canadienne des droit et libertés ainsi que la Déclaration canadienne des droits. Par la suite, il est prévu de compléter cet ensemble de divers textes doctrinaux au fur et à mesure de l'obtention du droit de les publier. D'autres corpus apparentés se joindront aussi à cet ensemble de base. Ce sera le cas, par exemple, d'un ensemble documentaire comportant la Charte québécoise des droit et libertés et la collection complète des décisions du Tribunal québécois des droits de la personne.

Le système proposé offre un riche environnement pédagogique. Du point de vue du professeur, le SELF est tout d'abord d'un système didactique facilitant l'enseignement des concepts liés aux droits fondamentaux. Le système comporte tant les ressources documentaires que les exercices permettant la vérification de l'acquisition des connaissances. L'utilisation de l'Internet permet de plus l'utilisation de divers mécanismes de communication propres à favoriser l'interactivité avec les étudiants comme le courrier électronique et les listes de distribution. Deuxièmement, SELF apparaît aux professeurs comme un dépôt de matériaux prêts à être utilisés pour divers enseignements. En effet, l'ouverture du système favorise son utilisation pour la préparation d'enseignements différenciés. Il sera, par exemple, possible à un professeur de droit pénal de puiser à même SELF pour trouver les documents utiles à la partie de son cours traitant de droits fondamentaux. En fait, avec un minimum de travail, il sera possible à quiconque ayant accès à l'Internet de produire à partir de SELF un recueil électronique personnalisé et adapté à son enseignement. Troisièmement, pour le professeur, mais aussi pour l'ensemble des intéressés, il s'agit d'un outil documentaire précieux donnant accès tant aux sources premières de droit qu'à divers textes doctrinaux.

Du point de vue de l'étudiant, le SELF apparaît comme une ressource WWW spécialement adaptée à un de ses apprentissages. De son ordinateur personnel ou d'un poste du laboratoire, il pourra y conduire des recherches ou le parcourir, soit à partir du syllabus électronique que lui propose son professeur ou encore, comme une ressource quelconque de l'Internet. L'étudiant pourra aussi être amené à développer un système documentaire personnel sur la matière enseignée en créant ses propres documents électroniques. De fait, l'outil pédagogique autorise des utilisations individuelles; il sera loisible à un étudiant d'annoter les documents électroniques, d'en souligner les passages importants et, de façon plus générale, de structurer l'information à sa façon.

Choix techniques et réalisation de SELF

Architecture et choix techniques. Au coeur de SELF se trouve une base de documents SGML augmentée de liens hypertextes. Au moment de leur utilisation, les documents SGML sont convertis en documents HTML (HyperText Markup Language) pour être envoyés aux usagers à l'aide du protocole du WWW, le HyperText Transport Protocol (HTTP). En somme, il s'agit d'une utilisation originale et innovatrice des technologies associées au WWW et au SGML pour les fins de la réalisation d'un système d'enseignement.

Le choix du SGML. Plusieurs préoccupations ont contribué à orienter notre choix vers le SGML pour l'emmagasinage des documents. Nous étions tout d'abord à la recherche d'une solution ouverte et compatible avec les normes de l'Internet. L'ouverture et la compatibilité à l'Internet nous semblait incontournable pour rendre possible notre conception coopérative de la mise en place de ressources informationnelles communes pour l'enseignement du droit au Canada. Nous souhaitions aussi que le format choisi soit stable. Notre expérience de diffusion sur l'Internet nous avait convaincu de l'intérêt d'adopter des formats durables. Finalement, nous étions à la recherche d'un format de stockage qui soit susceptible de faciliter le repérage. Nous souhaitions en effet offrir aux usagers la possibilité de faire des requêtes par champs. Or, pour cela, il fallait expliciter la structure des documents. Il fallait les baliser.

Trois types de solutions ont été considérées, certains formats propriétaires (Folio, Acrobat et RTF), le HTML et le SGML. Nous avons rapidement écarté les Folio, Acrobat et RTF et cela, pour assurer l'ouverture du SELF et en raison des coûts et des inconvénients que ces choix auraient entraîné pour nous et nos usagers. Il nous est également apparu que le HTML bien qu'extrêmement utile pour la diffusion sur l'Internet ne possédait pas la richesse et la stabilité nécessaires à notre base documentaire. C'est le SGML, la norme ISO-8879, un langage de balisage stable et ouvert, qui nous est apparu le mieux en mesure de permettre l'enrichissement et la conservation des documents.

La mise en oeuvre du SGML. La mise en oeuvre du SGML comporte plusieurs éléments. Les documents doivent d'abord être modélisés, puis convertis et finalement, bien sûr, publiés. Le processus s'amorce donc par la modélisation ou la conception d'un modèle du document, généralement appelé DTD (Document Type Definition). Cette DTD prend la forme d'une grammaire dont les éléments correspondent aux éléments structurels des documents. Il s'agit en quelque sorte d'une description abstraite des documents. Lors du balisage en SGML des documents, chaque élément de la DTD est utilisé comme une balise (tag) et sert à identifier une instance de l'élément structurel auquel il correspond. Dans le projet SELF, nous utilisons deux DTD principales, la DTD RCS pour les arrêts de la Cour suprême et la DTD HTML 3.0 -- la norme HTML n'étant qu'une DTD particulière -- pour les documents à être diffusés sur l'Internet. D'autres DTD ont été élaborées ou le seront pour les divers autres types de documents qui se retrouvent dans SELF.

Une fois la DTD conçue, il faut procéder au balisage des documents. En effet, la mise en oeuvre du SGML dans un contexte où les documents ont été préparés de façon traditionnel impose une conversion rétrospective (up-conversion) pour que soient ajoutées au texte des documents les balises qui viendront en expliciter la structure. À cet égard, la réalisation du SELF impose un travail de conversion considérable, environ 50 000 pages doivent être balisées en SGML. Le marquage à la main ayant été écarté pour des raisons évidentes, des programmes capables de reconnaître la structure des décisions à partir d'indices lexicaux et typographiques ont été conçus. La conversion initialement prévue en une étape a plutôt pris la forme d'un processus comportant des raffinements successifs. En effet, au fur et à mesure que nous traitions le corpus, des structures imprévues se révélaient dans les textes analysés obligeant une mise à jour de la DTD et, par conséquent, des programmes de conversion.

À la conversion vers le SGML s'ajoute la conversion du SGML vers le HTML nécessaire à la diffusion des documents et surtout à leur consultation avec les outils de navigation (browsers) courants. Cette trans-conversion (cross-conversion) a elle aussi été automatisée. Disposant dorénavant, d'une base documentaire balisée en SGML, pouvant être convertie à la demande en HTML, il restait à assurer l'enrichissement hypertexte de l'ensemble.

L'enrichissement hypertexte et la gestion externe des liens. Au plan de la dimension hypertexte, deux problèmes ont dû être solutionnés. Tout d'abord, les liens hypertextes potentiels que constituent les références juridiques contenues dans les documents durent être explicités et transformés en liens hypertextes fonctionnels. Encore une fois, la taille du corpus et le nombre de liens à être installés nous ont imposé la conception de mécanismes d'analyse automatisés. Nous avons pu compter pour réaliser le repérage et l'analyse des références sur la rigueur des modes de citation en usage en droit, par exemple, "R. v. Oakes, [1986] 1 S.C.R. 103". L'ensemble des références intra-corpus, c'est-à-dire, celles allant d'une décisions à l'autre ou d'une décision à la Charte ont été facilement reconnues. D'autres liens pourront être ajoutées à mesure que l'espace documentaire juridique s'enrichira sur l'Internet.

La seconde difficulté liée à la dimension hypertexte du corpus a trait à la gestion des liens eux-mêmes. Dans l'univers WWW, la solution habituelle consiste à inscrire le lien hypertexte dans le document lui-même. On utilise pour cela l'attribut href de la balise d'ancrage (anchor). Dans la figure qui suit, le premier élément montre la méthode de référence et le second l'illustre avec un exemple. Dans cet exemple, il s'agit d'un lien vers la page 105 de l'arrêt Oakes situé sur le serveur de l'Université de Montréal.

<A HREF="URL"> Le texte marquant le lien</A>

<A HREF="http://www.droit.umontreal.ca/CSC/arrets/1986/vol1/oakes.fr.html#p105">br>R. v. Oakes, à la p. 105</A>

Cette solution nous est apparue peu satisfaisante. En effet, le déplacement du moindre document impose une mise à jour de toute la base pour ajuster les adresses. Encore pire, du point de vue de la conception d'un système d'enseignement, nous aurions eu à documenter les adresses de tous les documents pour permettre à nos usagers, professeurs ou étudiants, d'y référer par liens hypertextes. Enfin, nous voulons encourager l'utilisation de nos ressources par d'autres facultés or, si nos documents servent directement de destination à des liens hypertextes, le moindre mouvement sur notre serveur risque d'avoir des répercussions partout où le corpus est en usage.

Nous nous sommes donc orientés vers une solution apparentée à la norme PURL (Persistant Uniform Resource Locator) actuellement proposée par l'OCLC (Online Computer Library Center, Inc.). Nous gérerons donc les adresses pointées par les liens hypertextes à l'extérieur des documents. Dans ce contexte, lors du traitement préparatoire des textes, les références sont remplacées par les liens hypertextes désignant une adresse emmagasinée dans une base de données. Advenant une modification d'adresse, seul l'enregistrement correspondant de notre base de données doit être changé. Par la suite, l'inscription des véritables URLs peut facilement être fait au moment de la conversion des documents SGML vers HTML.

Le repérage de l'information. Le SELF doit comporter des mécanismes de repérage fort efficaces. En effet, comme toutes les décisions traitent en principe de la même question, les mécanismes de repérage les plus simples y sont relativement peu efficaces. C'est pourquoi nous avons eu recours un mécanisme de recherche plein texte capable de gérer des requêtes par champ (a full text retreival engine supporting fields). En utilisant certaines balises SGML pour délimiter les champs, il est devenu possible de chercher, par exemple, les documents où l'on trouve tel mot dans telle partie et, tels autres, ailleurs.

La grande taille de plusieurs de documents du corpus, plusieurs centaines de pages, posait un second défi au plan du repérage. Dans ce contexte, il ne suffit pas de retrouver un document, mais il faut encore repérer à l'intérieur de celui-ci ce qui est pertinent eu égard à la requête formulée. C'est par la conception d'un interface usager permettant des appels répétés aux mécanismes de repérage que ce problème a été résolu. Vous en traiterons plus en détail dans la prochaine section.

L'interface et la diffusion sur l'Internet. L'ensemble documentaire pourra être abordé de plusieurs façons. L'usager pourra naviguer à travers un syllabus hypertexte préparé par son professeur. Il pourra encore feuilleter nos ressources comme n'importe quelles autres sur l'Internet ou finalement faire appel aux divers mécanismes de repérage.

Pour permettre les deux premiers types d'utilisation, notre travail se limite à la conception des pages HTML appropriées. Ainsi, pour permettre la navigation à l'aide d'un syllabus électronique, il suffit d'aider le professeur à concevoir une page d'ensemble donnant accès aux contenus prévus pour chacune de ses treize rencontres avec ses étudiants. Une page particulière peut préparée pour chacune où certaines de ces rencontres et on y trouvera, outre la présentation des notions introduites au cours, des liens hypertextes vers les documents fournissant l'arrière-plan informationnel.

L'accès au moyen des mécanismes de repérage est un peu plus complexe à organiser. Pour consulter SELF, l'usager indique, dans un formulaire, les mots clés devant apparaître dans chacune des parties du document cherché. Le système lui fournit alors la liste triée par pertinence des documents qui semblent correspondre à sa requête. Lorsque l'usager veut consulter un de ces documents, le système répète la requête mais cette fois l'applique à ce seul document. Comme résultat de cette requête, l'usage se voit présenter une fiche-résultat lui donnant accès à la structure du document -- construite à l'aide des balises SGML-- et à une liste des pages les plus pertinentes compte tenu de sa requête. S'il choisit de consulter un des éléments du texte repéré, comme les motifs d'un des juges dissident dans une décision, ou encore, une des pages suggérées, l'usager voit s'afficher l'élément du document enrichi, le cas échéant, de liens hypertextes vers d'autres documents du corpus. Il peut par la suite poursuivre son étude, soit en consultant d'autres parties du document repéré, soit en allant vers un des autres documents présentés dans la réponse à la requête initiale, soit en faisant d'autres requêtes ou encore, soit en suivant les liens hypertextes qui lui ont été présentés.

État des travaux et perspectives

La réalisation du SELF s'est révélée plus ardue que nous l'avions estimé. Le lancement, initialement prévu pour janvier 1996, s'effectuera plutôt au début de l'été 1996. Plusieurs raisons expliquent ce retard. D'une part, le volume de l'ensemble documentaire n'a pas été pris en compte dans l'évaluation de l'échéancier. Or, la réalisation du SELF dépasse en complexité la préparation d'un ouvrage de jurisprudence de 50 000 pages. Il faut donc s'attendre à ce que le volume de l'information traitée fasse sentir son poids par moment. Par ailleurs, le retard s'explique aussi par la complexité d'une première mise en oeuvre du SGML et celle des interfaces développés. Notons enfin, que lors de son lancement, SELF ne comportera pas tous les éléments initialement prévus. Ainsi, les pages HTML pour un cours particulier et le mécanisme de gestion des exercices ne seront pas en ligne.

Remerciements

Le projet a été élaboré avec Jacques Frémont, professeur de droit constitutionnel à la Faculté de droit. Jacques a également supervisé le travail d'Hervé Rivet dans le choix des arrêts et leur annotation. Cette partie du travail a été supportée par le Fonds de développement de l'enseignement de l'Université de Montréal.

La réalisation des divers aspects techniques du projet s'appuie sur le concours de nombreux collaborateurs : Stéphane Denis, pour les procédures de conversion; Yanik Grignon, pour les mécanismes de repérage; Chantal Lefebvre, pour la conception et la réalisation des interfaces ainsi que Guy Huard, pour la modélisation des décisions de la Cour suprême en SGML. Cette portion du projet bénéficie du support financier du Fonds de l'autoroute de l'information du Québec (#94-035) ainsi que de celui Fonds FCAR (#96-ER-1557).

Ce projet n'aurait pas été possible sans l'appui de la Cour suprême du Canada.