9.1 構造化ドキュメント

LaTeX マークアップに対する小規模な変更のほとんどは、 マークアップから表現方法を切り離すためとメンテナンス性の向上の両方を 狙ってなされてきたものです。 1998 年からこのかた、まさにこの目的の もとに数多くの変更が行われました; それ以前は、変更はありましたが あまり体系的なやりかたではなく、既存の内容を更新する必要はない と考えられていました。その結果、高度に構造化され、意味論的には LaTeX の上に読み出されることになるような、LaTeX で実装された マークアップ言語になってしまいました。とはいえ、基本的なTeXLaTeX によるマークアップが使われていなければ、実際のドキュメントソース でLaTeX が使われている証拠となるのはマークアップの構文法くらいです。

この副作用のせいで、例えばLaTeXLaTeX2HTML のような、ドキュメント を操作するための標準の ``エンジン'' を使えるにも関わらず、実際の 変換のほとんどは Python に特化して作られてしまいました。 LaTeX ドキュメントクラスとLaTeX2HTML サポートは、いずれもこの ドキュメントのために設計された特殊なマークアップを完全に実装 しています。

高度にカスタマイズされたマークアップが、ドキュメントを処理するための 深遠なる機構と組み合さってしまうと、こんな疑問が出てきます: もっと簡単にできないの? あるいは、もっとましにならないの? コミュニティとのたくさんの議論を重ねた結果、我々は 近代的な構造化ドキュメント生成システムの追求にも時間を費やす価値が あるという結論に達しました。

この議論の場には、二つの現実的な競合案: 標準化汎用マークアップ言語 (Standard General Markup Language, SGML) と拡張可能なマークアップ 言語 (Extensible Markup Language, XML) が挙がっています。 これらの標準には、いずれも長所と短所があり、多くの長所を共有しています。

SGML はほとんどのドキュメント作者、とりわけ普通のテキストエディタ を利用している人たちをそそらせるような長所を持っています。 また、コンテンツのモデルを定義できるという別の機能もあります。 完成度が実証されている多くの高品質なツールを利用できますが、 そのほとんどはフリーではありません; またこれらのツールでは、 可搬性がいまだに問題になっています。

XML には、多数の発展中のツールを使えるという利点があります。 残念ながら、XML の標準自体の多くがまだ発展中なので、ツールも 当分はそれに追従しなければならないでしょう。つまり、基本 XML 1.0 勧告 を超えた仕様を利用するような安定したツールセットを短い期間で開発 するのは不可能です。 最も重要な関連標準仕様をのいくつかをサポートするような広範な種類の 高品質ツールが利用できると自信を持っていえるのははまだ先の話です。 多くのツールはフリーのようであり、ツール間の可搬性はまだ明らかでは ないようです。

XML から SGML システムへの変換が、トランスレータにとって有望であることも 判明しました。トランスレータの負荷を軽減するためにどれだけのことを 行わねばならないかはそのうち判明し、スキーマや使われている特定の技術に 対してインパクトを与えることになるかもしれません。

将来はドキュメントを XML に移行することになっていて、ドキュメントを 現在の形式から変換して、最終的なバージョンに近いものにするツールを開発 しているところです。開発は必要な情報が変換後のドキュメントに入るという 程度まで進んでいます。基礎的な XML 形式を HTML 形式に表現するような XSLT スタイルシートの開発も始まりましたが、成果はまだ荒削りの状態です。

作業にかける十分な時間がないため、変換にどれくらいかかるかははっきり していませんが、変換によってもたらされうる利益はかなり早いペースで 現実的なものになりつつあります。

ご意見やご指摘をお寄せになりたい方は、 このドキュメントについて... をご覧ください。