SGML: Revised SGML Declaration for XML 1.0

Revised SGML Declaration for XML 1.0

From [email protected] Fri Jun 27 06:43:13 1997
Date: Fri, 27 Jun 1997 21:35:26 +1000
From: Rick Jelliffe <[email protected]>
Subject: Revised SGML Declaration for XML 1.0
To: [email protected]

         ------------------------------------------------------

Here is a revised SGML declaration for XML 1.0.   I think 
it addresses all the defects brought up by Gavin, Murata,
and others recently:

* Compatability zone characters should not be valid SGML 
  name characters.

* Ideographic and other spaces should not be valid SEPCHARS.

* ":" and "_" are allowed in names. 

* Symbols not used in natural language should not be valid
  SGML name characters. I.e. none between U+2000 to U+200B, 
  and U+2010 to U+2FFF.

* Only ISO 646 digits are not valid SGML digits. Other digits
  are NAMESTRT.


I have also given new-style formal public identifiers.


Rick Jelliffe


-------SNIP

<!SGML� "ISO�8879:1986�(ENR)"
    -- "+//IDN W3.ORG//SD SGML Declaration for XML 1.0//EN"   --
����
    CHARSET
��������BASESET 
������������"ISO�Registration�Number�176//CHARSET
������������ISO/IEC�10646-1:1993�UCS-2�with�implementation�
��� ��������level�3//ESC�2/5�2/15�4/5"
��������DESCSET
������������0�������9�UNUSED
� ����������9�������2�9
������������11������2�UNUSED
�������� ���13������1�13
������������14�����18�UNUSED
������������32�����95�32
������������127�����1�UNUSED
������������128����32�UNUSED
�������     160�65376�160

����CAPACITY�SGMLREF
��������-- Capacities�are�not�restricted�in�XML�--
��������TOTALCAP�99999999
��������ENTCAP���99999999
��������ENTCHCAP�99999999
��������ELEMCAP��99999999
��������GRPCAP���99999999
��������EXGRPCAP�99999999
��������EXNMCAP��99999999
��������ATTCAP���99999999
��������ATTCHCAP�99999999
��������AVGRPCAP�99999999
������  NOTCAP���99999999
��������NOTCHCAP�99999999
��������IDCAP����99999999
��������IDREFCAP�99999999
��� ����MAPCAP���99999999
��������LKSETCAP�99999999
��������LKNMCAP��99999999

����SCOPE�DOCUMENT

����SYNTAX    
        -- "+//IDN W3.ORG//SYNTAX ERCS for XML 1.0//EN"   --
��������
        SHUNCHAR�NONE
��������BASESET�"ISO�Registration�Number�176//CHARSET
����������������ISO/IEC�10646-1:1993�UCS-2�with�implementation�
��������������� level�3//ESC�2/5�2/15�4/5"
��������DESCSET
������������0�65536�0
��������FUNCTION
����       �RE����13
������������RS����10
������������SPACE�32
����� ������TAB���SEPCHAR�9
    -- The following space characters are not valid SEPCHAR.--
    -- However, use of these characters to separate tokens  --
    -- in markup is an error of validity not WFness.        --
���������--�ITAB�� 12288��ideographic�space�--
         -- ENSP   8194 --
         -- EMSP   8195 --
         -- EMSP3  8196 --
         -- EMSP4  8197 --
         -- EMSP6  8198 --
         -- FGSP   8199 --
         -- PUNKSP 8200 --
         -- THINSP 8201 --
         -- HAIRSP 8202 --
         -- NBSP   160  --
            

��������NAMING
������������LCNMSTRT
������������ ���224-246�248-255�257�259�261�263�265�267�269�271�273
����������������275�277�279�281�283�285�287�289�291 293�295�297�299
����������������301�303�305�307�309�311�314�316�318�320�322�324�326
�������� �������328�331�333�335�337�339�341�343�345�347�349�351�353
����������������355�357�359�361�363 365�367�369�371�373�375�378�380
����������������382�383�387�389�392�396�402�409�417�419�421�424�429
�� �������������432�436�438�441�445�453�454�456�457�459�460�462�464
����������������466�468�470�472�474�476�479�481�483�485�487�489�491
����������������493�495�498�499�501�507�509�511�513�515�517 519�521
����������������523�525�527�529�531�533�535�595�596�598-601�603�608
������������    611�616�617�623�626�643�648�650�651�658 940-943
����������������945-961�963-974�976�977�981�982�995�997�999�1001
����������������1003�1005�1007-1009�1072-1103�1105-1116�1118�1119
����������������1121 1123�1125�1127�1129�1131�1133�1135�1137�1139
����������������1141�1143�1145�1147�1149�1151�1153�1169�1171�1173
�  �������������1175�1177�1179�1181�1183�1185�1187�1189�1191�1193
����������������1195�1197�1199�1201�1203�1205�1207�1209�1211�1213
����������������1215�1218�1220�1224�1228�1233�1235�1237�1239�1241
����� ��������� 1243�1245�1247�1249�1251�1253�1255�1257�1259�1263
����������������1265�1267�1269�1273�1377-1414�7681�7683�7685�7687
����������������7689�7691�7693�7695�7697�7699�7701�7703�7705�7707
�������� �������7709�7711�7713�7715�7717�7719�7721�7723�7725�7727
����������������7729�7731�7733�7735�7737�7739�7741�7743�7745�7747
����������������7749�7751�7753�7755�7757�7759�7761�7763�7765�7767
����������� ����7769�7771�7773�7775�7777�7779�7781�7783�7785�7787
����������������7789�7791�7793�7795�7797�7799�7801�7803 7805�7807
����������������7809�7811�7813�7815�7817�7819�7821�7823�7825�7827
��������������  7829�7841�7843�7845�7847�7849�7851�7853�7855�7857
����������������7859�7861�7863�7865�7867�7869�7871�7873�7875�7877
����������������7879�7881�7883�7885�7887�7889�7891�7893�7895�7897
����������������789 9�7901�7903�7905�7907�7909�7911�7913�7915�7917
����������������7919�7921�7923�7925�7927�7929�7936-7943�7952-7957
���  �����������7968-7975�7984-7991�8000-8005�8017�8019�8021�8023
����������������8032-8039�8048-8061�8064-8071�8080-8087�8096-8103
����������������8112�8113�8115�8131�8144�8145�8160�8161�8165�8179
���������  

������������UCNMSTRT
��  ������������--�305�and�383�should�be�73�and�83�respectively,�
����������������but�SGML�does not�allow�a�letter�to�be�assigned�
����������������to�UCNMSTRT�--
����������������192-214�216-222�376�256�258�260�262�264�266�268�270
����������������272�274�276�278�280�282�284�286�288�290�292� 294�296
����������������298�300�302�305�306�308�310�313�315�317�319�321�323
������������ ���325�327�330�332�334�336�338�340�342�344�346�348�350
����������������352�354�356�358�360�362�364�366�368�370�372�374�377
����������������379�381�383�386�388�391�395�401�408�416�418�420�423
������ ���������428�431�435�437�440�444�452�452�455�455�458�458�461
����������������463�465�467�46 9�471�473�475�478�480�482�484�486�488
����������������490�492�494�497�497�500�506�508�510�512�514�516�518   
��������������� 520�522�524�526�528�530�532�534�385�390�393�394�398
��������������� 399�400�403�404�407�406�412�413�425�430�433�434�439
����������������902�904-906�913-929�931-939�908�910�911�914 920�934
����������������928�994�996�998�1000�1002�1004�1006�922�929
��������������  1040-1071�1025-1036�1038�1039�1120�1122�1124�1126
����������������1128�1130�1132�1134�1136�1138�1140�1142�1144�1146
�  �������������1148�1150�1152�1168�1170�1172�1174�1176�1178�1180
����������������1182�1184�118 6�1188�1190�1192�1194�1196�1198�1200
����������������1202�1204�1206�1208�1210�1212�1214�1217�1219�1223
����� ����������1227�1232�1234�1236�1238�1240�1242�1244�1246�1248
����������������1250�1252�1254�1256�1258�1262�1264�1266�1268�1272
����������������1329-1366�7680�7682�7684�7686�7688�7690�7692�7694
�������  �������7696�7698�7700�7702�7704�7706�7708�7710�7712�7714
����������������7716�7718�7720�7722�7724�7726�7728�7730�7732�7734
����������������7736�7738�7740�7742�7744�7746�7748�7750�7752�7754
���������   ����7756�7758�7760�7762�7764�7766�7768�7770�7772�7774
����������������7776�7778�7780�7782�7784�7786�7788�7790 7792�7794
����������������7796�7798�7800�7802�7804�7806�7808�7810�7812�7814
�������������� �7816�7818�7820�7822�7824�7826�7828�7840�7842�7844
����������������7846�7848�7850�7852�7854�7856�7858�7860�7862�7864
����������������7866�7868�7870�7872�7874�7876�7878�7880�7882�7884
����������������7886�7888�7890�7892�7894�7896�7898�7900�7902�7904
����������������7906�7908�7910�7912�7914�7916�7918�7920�7922�7924    
�������������  �7926�7928�7944-7951�7960-7965�7976-7983�7992-7999
����������������8008-8013�8025�8027�8029 8031�8040-8047�8122�8123
����������������8136-8139�8154�8155�8184�8185�8170�8171�8186�8187
���������� �����8072-8079�8088-8095�8104-8111�8120�8121�8124�8140
����������������8152�8153�8168�8169�8172�8188�  

������������NAMESTRT
�����������  ���170�181�186�223�304�312�329�384�397�405�410�411�414
����������������415�422�426�427�442�443�446-451�477�496�
                688-696�699-705�736-740
����������������768-837�864�865�890�912�944�962�978-980�986�988�990
����������������992�1010�1011�1155-1158�1216�1369�1415�1425-1441
��������������� 1443-1465�1467-1469�1471�1473�1474�1476�1488-1514
����������������1520-1522�1569-1594�1601-1618�1632-1641 1648-1719
1722-1726
�������         1728-1742�1744-1747�1749-1768�1770-1773�1776-1785
2305-2307
����������������2309-2361�2364-2381�2385-2388�2392-2403�2406-2415
2433-2435
�  �������������2437-2444�2447�2448�2451-2472�2474-2480�2482
����������������2486-2489�2492�2494-2500 2503�2504�2507-2509�2519 
����������������2524�2525�2527-2531�2534-2543�2544�2545�2562�2565-2570
2575
������������  ��2576�2579-2600�2602-2608�2610�2611�2613�2614�2616
����������������2617�2620�2622-2626�2631�2632�2635-2637�2649-2652   
�������������  �2654�2662-2671�2672-2676�2689-2691�2693-2699�2701
2703-2705
����������������2707-2728�2730-2736�2738 2739�2741-2745�2748-2757
����������������2759-2761�2763-2765�2784�2790-2799�2817-2819�2821-2828
2831
�������������� �2832�2835-2856�2858-2864�2866�2867�2870-2873  
����������������2876-2883�2887�2888�2891-2893�2902�2903�2908�2909
����� ����������2911-2913�2918-2927�2946�2947�2949-2954�2958-2960
2962-2965
����������������2969�2970�2972�2974�2975�2979 2980�2984-2986
����������������2990-2997�2999-3001�3006-3010�3014-3016�3018-3021
����������������3031�3047-3055 3073-3075�3077-3084�3086-3088�3090-3112
����������������3114-3123�3125-3129�3134-3140�3142-3144�3146-3149
����������� ����3157�3158�3168�3169�3174-3183�3202�3203�3205-3212
3214-3216
����������������3218-3240�3242-3251�3253-3257�3262-3268�3270-3272
��� ������������3274-3277�3285�3286�3294�3296�3297�3302-3311�3330�3331
����������������3333-3340�3342-3344�3346-3368 3370-3385�3390-3395
����������������3398-3400�3402-3405�3415�3424�3425�3430-3439�3585-3630
����������������3632-3642�3648-3653�3655-3662�3664-3673�3713�3714�3716
3719
����������������3720�3722�3725�3732-3735�3737-3743�3745-3747�3749
����    ��������3751�3754�3755�3757�3758�3760-3769�3771-3773
����������������3776-3780�3784-3789�3792-3801�3804�3805�3864�3865
3872-3881 3893�3895
����������������3897�3902-3911�3913-3945�3953-3972�3974-3979
����������������3984-3989�3991 �3993-4013�4017-4023�4025�4256-4293
����������������4304-4342�4352-4441�4447-4514�4520-4601�7830-7835
����������    ��8016�8018�8020�8022�8114�8116�8118�8119�8126�8130
����������������8132�8134�8135�8146�8147�8150�8151�8162-8164 8166
����������������8167�8178�8180�8182�8183�12295�12321-12335
���������  �����12353-12436�12441�12442�12449-12538�12549-12588
����������������12593-12686�19968-40869�44032-55203� ����������
����������   ���
������������ LCNMCHAR�
�� ����������UCNMCHAR�
                
������������ NAMECHAR
                "."   -- Suggestion: properties e.g. "dog.collar"   --
                "-"   -- Suggestion: selectors  e.g. "iso8859-1"    --
                "_"   -- Suggestion: spaces     e.g. "last_cat"     --
                ":"   -- Suggestion: namespace  e.g. "cals::table"  --
����������������183�720�721�1600��3654�3782 8204-8207�
����������������12293�12337-12341�12443-12446�12540-12542� 
������������NAMECASE
����������������GENERAL�YES
����������������ENTITY��NO
    
���     �DELIM
������������GENERAL�SGMLREF
������������NET�"/>"
������������PIC "?>"
������������SHORTREF�NONE
��������NAMES
������������SGMLREF

��������QUANTITY�SGMLREF
������������--�Quantities�are�not�restricted�in XML�--
������������ATTCNT������99999999
������������ATTSPLEN����99999999
����   �����--�BSEQLEN��not�used�--
������������--�DTAGLEN��not�used�--
������������--�DTEMPLEN �not�used�--
������������ENTLVL������99999999
������������GRPCNT������99999999     
������    ��GRPGTCNT����99999999
������������GRPLVL������99999999
������������LITLEN������99999999
������������NAMELEN�����99999999
������������--�no�need�to�change�NORMSEP �--
������������PILEN�������99999999
������������TAGLEN������99999999
����� ������TAGLVL������99999999

����FEATURES  
����MINIMIZE
������������DATATAG�NO
������������OMITTAG�NO
������������RANK    NO
������������SHORTTAG�YES�--�SHORTTAG�is�needed�for�NET�--
��������LINK
������������SIMPLE�NO
������������IMPLICIT�NO
������������EXPLICIT�NO
��������OTHER
������     �CONCUR�NO
������������SUBDOC�NO
������������FORMAL�NO
����APPINFO�NONE
>