XMLandXSLT

Tab2XMLの説明

はじめに

名簿の仕事が来ました。 クライアントからエクセルのデーターとプリントアウトしたものが渡されました。 エクセルデーターを開くとプリントアウトにはない「練習場所」「部員数」などがありました クライアントの指示は、「もう少し大きくて見やすいフォントにすること」でした。

最初に考えたのは、エクセルから列ごとにコピーして編集ソフトに張り込むことでした。 力業(チカラワザ!)ですけどやって出来ないことはありません。 使い慣れないエクセルですが、作業を初めて一時間で飽きてしまいました。

そこで、ひらめいたのがXML化でした。 「以前作成したTAG2XMLを使って自動的にXML文章にさせ、そのXML文章のタグ要素をテキストではき出す」この一連の作業を考えました。

私の環境はMAC.OSX、それもUNIXコマンドで変換させるという環境でしたので、手っ取り早く誰でも使えるようにCGIに作り替えてサーバー上に置くことにしました。

元の変換ソフトはそれなりに何となく無事に動いていたので半日あまりでCGI化に成功しました。

そんな訳で仕上がったのがTab2XmlとXtag2strです。 Tab2Xmlはタブ区切りされたテキストをXMLに自動変換するCGIを使ったツールです。
下記使い方などを参照の上お使い下さい。

使い方

  • エクセルなどを使って作成した名簿などを用意し開きます。
  • 最初の行は2ケのセルが必要です。下図の←※を見て下さい
    nisi.jpg
  • 次の行には事業所名や代表者姓などの見出しが入ります。
  • 3行目からはそれぞれの項目データーが入ります 普通に作成すればこのように成るはずです
  • データーを確認後タブ区切りでテキスト保存します
  • タブ区切りテキストをエディタで開いた画面が下記です
    &ref(): File not found: "tab.jpg" at page "Tab2Xmlの説明";
  • タブは分かりやすいように赤で表示されています
  • これを全て指示してコピーします(通常ですと、Macの場合はコマンド+a、winの場合はCtrl+a)
  • 次に下記からインターネットへ接続して大きなテキストエリアへペーストします
  • 返信用メールアドレスを入力します これはXML変換したものをメールであなたへ添付書類を送るためのアドレスです。
  • 変換するボタンを押します
  • エラー表示がなく、完了画面がでたら無事変換されました。
  • 変換されたXMLデーターは添付書類であなたへ送られてくる筈です。

XML変換へのリンク先

TabTextをXML変換


注意事項と制約事項

  • ShiftJISコードですと文字化けするので内部ではEUCコードで動いています
    ですから添付ファイルはEUCとなっていますのでご注意下さい。もしShift_JISに変更した場合下記のようにエンコード情報を書き換える必要があります。
    <?xml version="1.0" encoding="EUC-JP"?>
    これを
    <?xml version="1.0" encoding="Shift_JIS"?>のように
  • 変換文字数は10000文字(日本語で5000文字)までです
  • 見出し部に全角文字の記号英数字を使用すると、XML制約上エラーとなります。(通常にXMLとして帰ってきますが・・・)。例えば6年生やAクラス・FAXなどの見出し部は使わないようにして下さい。
    もし使うならFAX・Aクラスなどの半角+カナとか六年生のようにします。
    WellFormatでなければ他のソフトでの読み込みが出来ない場合があります。

XMLを組版する

  • XSLTを使う
    スタイルシートによって希望の書式で組版できます。
    名刺に使うなら名刺用スタイルシート、名簿リストに使うなら名簿用スタイルシート、HTMLにするならHTMLスタイルシート、組版に使うなら組版用スタイルシート等を使って希望の書式で出力が可能です。
    当社では今のところHTMLスタイルシートは開発済み、組版用スタイルシートは試験運用中です。
    ご連絡頂ければソースをおわけします
  • InDesignを使う
    InDesignではXMLを読み込むことができます。
    タグをスタイルにマップすることで組版が出来るようになりました。
    この方法は長文には向いていますが、リスト表形式には向いていません。
    詳しくはInDesignのヘルプをご覧下さい
  • 簡単な文字列変換ソフトを使う
    Perlで開発したXML中のタグ要素を抽出してくるものを使います。
    例えば氏名の列、郵便番号の列などを指示すると全て連続して抽出してテキスト出力します。
    このテキストをイラレやクォークやInDesignにコピペして使います。
    この方法はリスト表形式に向いています
    Tag2Strの説明ページに掲載しました。Xtag2strのCGIを使えば、XML文章のタグ要素を全て抽出することが出来ます。

セキュリティ

  • XMLのデーターは当サーバー上に保存されます。アクセス毎に保存されているディレクトリ(ホルダー)の中の全てのXMLファイルを調べ、2日以上過ぎているデーターは削除するようにしています。
  • 他人にアクセスされないように、メールアドレスとメールに添付されたXMLのファイル名(10桁の数字)が一致しないと抽出&表示ができないようになっています。 個人情報保護ポリシーもご覧下さい。
    もし、心配であれば本ソフトは使わないで下さい。


    Counter: 902, today: 1, yesterday: 0

添付ファイル: filetag.jpg 413件 [詳細] filenisi.jpg 640件 [詳細]

トップ   差分 バックアップ リロード   一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2005-06-05 (日) 15:15:58 (4523d)