ー付言语関连规定议论今后展望.docx
- 文档编号:6868488
- 上传时间:2023-01-11
- 格式:DOCX
- 页数:17
- 大小:34.72KB
ー付言语関连规定议论今后展望.docx
《ー付言语関连规定议论今后展望.docx》由会员分享,可在线阅读,更多相关《ー付言语関连规定议论今后展望.docx(17页珍藏版)》请在冰豆网上搜索。
ー付言语関连规定议论今后展望
マーク付け言語関連規定のこれまでの議論と今後の展望
OverviewandPerspectivesforMarkupLanguagesandRelatedStandards
小町祐史
YushiKOMACHI
大阪工業大学
OsakaInstituteofTechnology
〒573-0196大阪府枚方市北山1-79-1
E-mail:
komachi@y-
ISOがSGMLを制定することにより,マーク付け言語が国際的な舞台に登場した.HTMLの構文としてSGMLが採用されてからSGMLはインターネット上での圧倒的な利用者を獲得して,それはXMLの開発に繋がった.XMLの公表と共にXML関連規定が充実し,マーク付け言語の第二世代が始まる.ここにDTDに代わるスキーマ言語の開発競争が激化し,この分野での日本のリーダシップが表面化すると共に,DSDLの国際標準化が進んだ.これらの議論を紹介し,今後の展望に言及する.
国際規格,マーク付け言語,SGML,XML,HTML,DSDL,ODF,OOXML
InternationalStandard,MarkupLanguage,SGML,XML,HTML,DSDL,ODF,OOXML
1.まえがき
情報知識学フォーラムがSGML/XMLフォーラムとして開始されたとことに基づき,それに係わるテーマとして"SGMLから始まるマークアップ言語の歴史と今後"についての講演を依頼された.
筆者は"XMLの標準化"と題して2002年9月に第7回SGML/XML研修フォーラム[1][2]にて講演を行い,その時期までのXMLの標準化の経緯を紹介した.そこで本稿では,この"XMLの標準化"に対して,XMLの前身であるSGMLに関する記述を加え,さらに,SGMLを標準化したISO/IECJTC1のSC18/WG8がその後SC34となって,その作業グループのWG1の主要検討課題として議論が続いている文書スキーマ定義言語(DSDL)について加筆する.
SC18/WG8,SC34で開発された幾つか文書関連規格,およびW3C(WorldWideWebConsortium)のHTML/XML関連の主要規定は,ちょうど国内で標準情報TRの制度が始まった時期に開発され公表された.そこで,この制度(後に,標準報告書TR,標準仕様書TS)を利用して,それらの翻訳が公表されて利用者のレビューを受けた.レビュー結果は直ちに国際にフィードバックされてCorrigendaやErrataとして発行され,次の改訂に反映されるという,国際と国内との同期的協調関係が成立し,国際への寄与を継続した.そこで本稿では関連する国内でのSGML/XML標準化活動にも言及する.
XMLは著しい普及を示し,XMLを利用してデータ構造を記述する数多くの規定等が開発されている.それらに関する紹介は他稿に譲ることとし,ここでのSGML/XML応用は,JTC1/SC34の中で検討されたものにとどめる.
2.SGML
文書の文字列中へのマーク付けは,タイブセッタ(植字機)用の命令コードに始まる[3].この機器依存の命令コードは,やがて文書を構成する論理的要素に対するマーク付けに発展し,ここに至って文書の論理構造を扱うシステムとフォーマタとが分離された.
マーク付けはさらに,ある文書クラスの論理的要素を共通に識別するようなタグ集合へと一般化され,共通マーク付け(genericmarkup)と呼ばれた.要素に関する属性記述をもタグに含めて,多様なアプリケーションに対応できるようにしたマーク付けも行われ,一般化マーク付け(generalizedmarkup)となった.
ISO/IECJTC1/SC18/WG8はこのようなタグ集合の定義方法を国際的に取り決め,言語としての体系付けを行って,標準一般化マーク付け言語(StandardGeneralizedMarkupLanguage,SGML)を規定するISO8879[4]とそのAmendment1[5]を開発し,それらはそれぞれ1986年と1988年に制定された.この国際規格SGMLによって,さまざまな文書やアプリケーションに対してマーク付けが定義可能となり,利便性の向上のために各種の補助機能も用意された.SGMLを規定するJISX4151は,ISO8879とそのAmendment1とを含めた規定内容となっている.
その後,SGML開発者達はAmendment2を目指してさまざまな拡張機能を議論したが,普及のためには規定内容を安定化する必要があるとの基本方針に阻まれてAmendment2が公表されることはなかった.
SGMLの関連する規定としては次のSGML支援ファシリティが開発され,ISOから出版された.
(a)公開テキスト所有者識別子
ISO/IEC9070:
RegistrationProceduresforPublicTextOwnerIdentifiers
(b)SGML文書交換様式
ISO9069:
SGMLDocumentInterchangeFormat
(c)SGML構文主導形編集システムの指針
ISO/IECTR10037:
GuidelinesforSGMLSyntax-DirectedEditingSystems
(d)数学及び科学用公開実体集合
ISO/IECTR9573-13:
PublicEntitySetsforMathematicsandScience
(e)非ラテン系アルファベット用公開実体集合
ISO/IECTR9573-15:
PublicEntitySetsforNon-LatinBasedAlphabets
SGMLは米国国防総省の調達仕様に続いて,米国出版協会(AAP),EC出版局(OPOCE)などに採用されたが,最も大きな普及はWeb文書の記述に用いるHTMLへの採用であった.HTMLでは構文としてSGMLが用いられ,比較的簡素な構造をもつ文書の記述のための文書型定義(DTD)が規定される.
3.HTML
WWW(WorldWideWeb)は,スイスのCERN(欧州素粒子物理研究所)において,所内の研究者間の研究成果の共有を支援することを目的として,1990年に分散形広域ハイパテキストシステムの構築のためのプロジェクトによって考案された.このハイパテキストでは,文書にアンカ(端点)を定義して,アンカ間の関係としてハイパリンクを規定している.ハイパリンクを辿ることによって,必要な文書の必要な個所へのアクセスを物理的なページ概念を使わずに容易にした.
WWWのプロジェクトができた当初は,CERNにおいて特定マシン上のラインモードブラウザが用意されただけであったが,その後CERN以外でもWWWの利用が可能になり,Xウィンドウシステム用のブラウザが開発された.イリノイ大学はMOSAICを発表して文書中の画像表示を可能とし,やがてマルチメディアのサポートが可能になって,Webの普及に拍車をかけた.
Webの普及と共にハイパテキストの構造記述の標準化への問題意識が高まり,IETF(InternetEngineeringTaskForce)において,HTML(HyperTextMarkupLanguage,ハイパテキストマーク付け言語)とHTTP(HypertextTransferProtocol)の作業グループが設立されて本格的な標準化作業が開始され,その後HTMLの標準化作業は,W3Cに移された.
XMLの普及の後,構文としてXMLを用いて,充実したXMLのサービス機能をHTML環境へ導入することを容易にしたXHTMLが開発された.その結果,たとえばHTMLへの機能追加が必要になっても,その拡張HTMLを規定するDTDを開発することなく,拡張部分に対応するモジュールの追加によって対応できる.
ISO(国際標準化機構)は,HTMLを国家規格(NationalStandard)として採用したいとする参加国(NationalBody)の要求,ISO内部での文書交換様式としてHTMLを使いたいとする要求等に対処するため,W3CのHTML勧告の追認作業を進めてきた.その結果,HTML4.0のサブセットがISO/IEC15445として承認され,それは国内ではJISX4156として制定されている.
HTMLのこれらのバージョンを,表1に整理する.
表1 HTMLのバージョンアップ
HTMLバージョン勧告・規格番号公表/改正
------------------------------------------------------------------------------
HTML2.0IETFRFC18661995-11
HTML3.2W3CREC-html321997-01-14
HTML4.0W3CREC-html401997-12-18/1998-04-24
ISO/IEC154452000-05
JISX41562000-12/2005-03
HTML4.01W3CREC-html4011999-12-24
XHTML1.0W3CREC-xhtml12000-01-26/2002-08-01
XHTML1.1W3CWD-xhtml112000-01-05
4.XML
HTMLの大量普及の結果,そのスコープを越えた利用が行われ,HTMLでは記述できない,または記述しにくい文書がクローブアップされることとなり,HTMLと同様の手軽さでSGMLと同様の文書記述を行いたいというユーザ要求が強まってきた.この要求に応えることを目的としてW3Cが開発した記述言語がXML(ExtensibleMarkupLanguage,拡張可能なマーク付け言語)である.
HTMLがSGMLで記述された文書型であるのに対して,XMLはSGML(ISO8879/Cor.2まで含める)のサブセットに位置付けられる.つまりXMLは,HTMLでは扱えない文書をもサポートでき,これまでのHTML処理系と同様に,DTDが与えられなくても処理可能としている.W3Cは1996年末に最初のXMLドラフトを発表すると共にその更新を続け,1998年2月にその勧告を制定した.その後は,幾つものXML関連規定の開発を行っている.
W3CにおいてXMLは,次のドラフトを経てXML1.0(SecondEdition)の公表に至った.
-http:
//www.w3.org/TR/WD-xml-961114
-http:
//www.w3.org/TR/WD-xml-lang-970331
(この版のハードコピー版は,XMLソースに対してDSSSLによってスタイル指定され,Jadeによってレンダリングされ-印刷されていた.)
-http:
//www.w3.org/TR/WD-xml-lang-970630
-http:
//www.w3.org/TR/WD-xml-970807
-http:
//www.w3.org/TR/WD-xml-971117
-http:
//www.w3.org/TR/PR-xml-971208
-http:
//www.w3.org/TR/1998/REC-xml-19980210
-http:
//www.w3.org/TR/2000/REC-xml-20001006(SecondEdition)
96年11月版は,公表直後にBostonで開催されたGCAのSGMLConferenceで配布され,参加していた国内の関係者達(村田,小町,他)によって直ちにかつ独立に翻訳されて,それぞれのWeb等で国内に紹介された.
XMLに関する国内専門家の活動を効率化するため,日本規格協会の情報技術標準化研究センター(INSTAC)で既に活動を行っていた"マルチメディア/ハイパーメディア調査研究委員会"は,その中にWG4/XML-SWGを組織して,国内の専門家達に参加をお願いし,XMLの標準情報(TR)化作業を開始した.
標準情報(TR)は,1996年8月に制定された標準情報(TR)制度実施要綱[6]に基づく制度であり,JIS化に至る前段階における技術標準等の状況を積極的に公表することによって,オープンな議論を推進し,関係者間の幅広い意見を集めるものである.
ISOでもIECでもないW3Cの勧告を国内規定として承認するためには,まさに時機を得た制度であった.XMLのTRX0008:
1998を皮切りとして[注1],その後,6.に示すとおりW3CのXML関連規定が次々とTR化された.
注1:
TRX0008:
1998の前には,DVD論理フォーマット,フォント情報処理用語,Java言語規定,規格文書用DTDなどが,TRとして公表されている.
4.1XMLの標準情報(TR)
(1)勧告案
WG4/XML-SWGは,XMLの各版に対して詳細レビューを行うと共に,97年3月版(WD)と97年12月の勧告案(PR)とに対して翻訳作業を行い,これらの活動の結果明らかになった問題点をその都度W3Cに対してフィードバックしてきた.
W3Cが1997年12月版を公表した後,XMLのTRに対する国内の業界要求が高まり,最終的な勧告(REC)を待ってからTR化するより,この段階でひとまずTR化する方が適切と判断して,97年12月版の翻訳をTR原案として1998年2月に当時の通産省工技院に提出した[7].これは98年3月の通産省の審議委員会で承認され,TRX0008:
1998拡張可能なマーク付け言語(XML)として,98年5月に公表された[注2].
注2:
この当時のTRの開発,承認,公表・発行の早さに注目されたい.
(2)勧告
W3Cでは,97年12月版に対するコメントへの回答が98年2月10日に公開され,それを反映して変更を加えたW3Cの勧告"ExtensibleMarkupLanguage(XML)1.0"が98年2月に発行された.
INSTACは,98年4月に"高速Webにおける標準化に関する調査研究委員会"を設立し,その作業グループ(WG3)のXML特別作業グループ(XML-SWG)が,TRX0008:
1998のメンテナンスを担当して,W3C勧告のXML1.0の翻訳作業を開始した.その翻訳原案は,99年2月までのW3C正誤表の内容を反映して,TRX0008:
1998の改正案として同年2月末に工業技術院に提出された[8].これは,TRX0008:
1999拡張可能なマーク付け言語(XML)1.0として,99年5月に公表された.
翻訳における訳語選定に際しては,SGMLを規定しているJISX4151との整合を配慮した.しかしその後にJISとして出版されたSGML関連規格において,適切な理由に基づいてJISX4151の訳語を変更している用語については,なるべく新しいSGML関連JISの訳語を採用している.
W3Cの規定は,必ずしもJIS又はTRの様式には整合していないため,多少の変更が必要になる.しかしTRの読者が原規定を参照する際の便を考慮すると,clauseの構成はなるべく原規定のそれを保存することが望まれる.そこで,ごくわずかな修正(clause番号の変更なし)だけを施して,TR原案とした.この翻訳規定の構成は,JISX4151の構成における反省に基づき,その後の文書関連TR/JISの構成に引き継がれている.
4.2XMLのJIS
INSTACに2001年4月に設立された"次世代コンテンツの標準化に関する調査研究委員会"の作業グループ(WG2)は,TRX0008の公表等によってXMLが国内に充分な利用者を獲得し,この規定内容に関するコンセンサスが得られたと判断して,そのJIS化作業に着手した.
2001年6月には,W3CからXML1.0の2ndEditionが公表されたため,それをJIS化対象の原規定とし,できるだけ新しいW3C正誤表の内容を盛り込むことを目標とした.このJIS原案(HTML版)は,2002年2月に経済産業省に提出された[9].省内の都合によって,同年3月の審議にはかけられず,2002年6月の審議によって承認された.
経済産業省はWebによるJISの電子公開をめざして,2002年4月からJIS原案のMSWordフォーマットによる提出を要求した(この論旨の展開は,XML関係者の注目を集めた.).その結果,このJIS原案(HTML版)は,2月に提出済みであったにもかかわらず,5月になってJISテンプレートに従ったWordフォーマットへの書き換えを求められることになり,JISX4159拡張可能なマーク付け言語(XML)は2002年10月に制定・発行された.
その後,W3CがXML1.0の3rdEditionを公表したことに伴い,JISX4159の改正作業が行われ,改正原案は2004年12月に日本工業標準調査会標準部会の情報技術専門委員会での審議を受けて承認された.これは2005年3月に発行されている.(この頃から,JISの承認,公表・発行の手続きに時間がかかるようになってきている.)
W3Cは,W3C文書の内容を,どんな目的のためにもどんな媒体でも,報酬又は使用料なしに[注3],使用,複写及び配布することを許可しているが,それは,使用する文書又はその一部のすべての複写物が次を含む場合に制限されている.
(a)W3C文書(原規定)へのリンク又はURI.
(b)原著者の既存の著作権表示.それがない場合は,次の形式の表示."Copyright,WorldWideWebConsortium,(MassachusettsInstituteofTechnology,InstitutNationaldeRechercheenInformatiqueetenAutomatique,KeioUniversity).AllRightsReserved.http:
//www.w3.org/Consortium/Legal/"(ハイパテキストが望ましいが,テキスト表現も可.)
(c)W3C文書(原規定)の状態
TRX0008は,この要求に従った内容で発行されたが,XML1.0のJIS化に関して,W3Cはさらに,勧告のまえがきの記載内容をJISのまえがきに含めることを要求し,原案委員会のWG2メンバとW3C担当者との打合わせがもたれ,具体的な様式が決められた.この様式は,その後のW3C勧告に対応するJISに継承されている.
注3:
日本規格協会が発行するTR,JIS等は有料で提供される.これは,W3Cが要求する"どんな目的のためにもどんな媒体でも,報酬又は使用料なしに"の要求を満たせないため,W3C勧告に対応するTR,JIS等の料金とは,それらに含まれる解説の料金であるとの解釈が採用されている.
5.XML日本語プロファイル
5.1標準情報(TR)
XMLは,符号化文字集合としてJISX0221及びUnicode2.0を採用しており,これは日本語文字をすべて含む.文字符号化スキームとしてはUTF-8及びUTF-16を推奨し,これらの実装を義務付けている.既存の文字符号化スキームも,Unicode2.0の文字だけを扱う限りオプションとしてすべて許容している.
しかし,XMLの勧告では,日本語文字の交換に広く使われてきた既存の文字符号化スキームはほとんど説明されてなく,オプションの一つとして許容されているに過ぎない.SMTP及びHTTPなどのプロトコル並びに情報交換用ファイルで,どの文字符号化スキームを用いるかについても,特に定められてはいない.
既存の文字符号化スキームとJISX0221及びUnicode2.0との対応も不明確である.相互に異なるいくつかの変換表が用いられており,複数のXMLプロセサが異なる結果を出力する場合がある.
これらの問題点を明確にするため,TRX0008:
1998はその解説の中に,"3.日本語プロファイル"を設けて,全角英数字及び半角片仮名,情報交換用ファイル中のXML文書,HTTPによるXML文書の配送,メールによるXML文書の配送などに関する記述を含めた.
TRX0008:
1998を改正してTRX0008:
1999の原案を作成する際,原案委員会である"高速Webにおける標準化に関する調査研究委員会"の作業グループ(WG3/XML-SWG)はこの問題の重要性を再確認して,この日本語プロファイルを独立した標準情報(TR)とすることにした.TR原案は99年2月に提出され[8],TRX0015XML日本語プロファイルとして1999年5月に公表された.
5.2W3CNote
XML文書の中で日本語を使う利用者は,必ずしも国内の利用者に限定されるわけではない.そこで原案委員会のWG3/XML-SWGは,TRX0015を英訳し,W3Cに対してNoteとして提案を行った[10].規格協会も当時の工業技術院もW3Cのメンバではなかったため,W3Cへの提案は,XMLSWGの主要メンバおよび議論に参加したW3Cメンバが属している次の組織によって行われた.
Submittingorganizations:
Xerox
Panasonic
Toshiba
GLOCOM
AcademiaSinica
AlisTechnologies
SunMicrosystems
Submission要求は99年12月に送付され,ACRepからのConfirmを受けて,この英訳は,XMLJapaneseProfile,W3CNote22-12-1999として公表された.
5.3TRの改正
W3CにNoteとして提案するための議論の中で,TRX0015:
1999の内容に対して部分的修正が施された.W3CNoteとTRとの一致を図るため,この修正を反映したTRX0015の改正原案が,INSTACの"次世代コンテンツの標準化に関する調査研究委員会"によって作成され,02年2月に経済産業省に提出された[9].これは,2002年6月に公表されている.
6.XML関連規定の標準情報(TR)化
TRX0008:
1998の公表の後,関連する多くのW3C勧告がINSTACにおける幾つかの委員会で翻訳され,TR原案として通産省/経済産業省に提出されて,承認を受けた後,次に示すTRとして公表された[11].この活動は2002年度末までにaccessibilityとsecurityを除くW3Cの主要な勧告をTRとして公表することを目標として行われた.その後,これらのTRの幾つかは,部分的修正を加えてJISとして制定・発行されている.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 言语 规定 议论 今后 展望