XML統合スレッド
CSVファイルのスレが立ってたのでこれも立てます。
DOM,SAX,XSLT,スキーマ,DTD,XHTML,soxなどXML関連の事は全部ここでどうぞ。
関連スレ
CSVファイルのスレ
http://pc2.2ch.net/test/read.cgi/db/1057136328/ X・・・エクスタシー
M・・・マゾ
L・・・ロリータ Flash×XMLでSVGの事か?とか一瞬思ったが全然違うな
フラって、SVG扱えるんだろうか〜 xmldbはスキーマがしょっちゅう変化して
かつ古いデータも串刺しで検索しなくては
いけなくてdbを止めてはいけない時に便利
ビュー作るくらいならxmldbの方が早い
かつ、扱うxmlをわざわざマッピングする
必要も無いしな
データが階層構造をもっていてその出現順番も
重要で、入れ子構造を許容しなくてはいけない
ときなんてRDBでどうしたらよいのかわからん。
頑張って正規化してもすぐに構造なんて変化するし。
もうxmldbなしでは仕事なんて取れない。
と器用貧乏な印刷会社社員は思う訳です。
RDBって使い勝手がわるすぎ。
やすくて速いけど。 すみません。質問です。
RDB のカラムを XML の構造で見る際、XML では使えない文字を
エンコードする規約があるようですが、これを行ってくれる
フリーのライブラリ等は無いものでしょうか? ちなみに Java を使っています。
特定の製品内で行っているものはあるようなのですが…
ttp://www.ianywhere.com/developer/product_manuals/sqlanywhere/0902/ja/html/dbugja9/00000531.htm
自作するにしても、「XML 名として有効ではない名前」って、簡単に
判断できるものなのでしょうか…XML で「使える文字」はもの凄いテーブルがありましたが。 >>275
SGMLに慣れてる印刷会社の人にとっては良いかもしれませんね >>275
XMLDBは、文章管理には向いている様ですね。
よく、そういった記事をみかけます。
今後、一般企業内でも文書管理が統合されていくと使う機会があるのかもしれません。
が、最近のRDBは、XML列が使える様ですので、
その辺との住み分けがどうなるのか、興味がある所です。
安いならRDBのXML列でいいじゃん、
と、思う訳です。 >>279
現実の問題・要件としては、データ量が増えたとき、XML DBにはまだ信頼がおけない。
バックアップその他の運用に関しても実績はRDBMSの足元にも及ばない。
最近ではRDBMSでもXPathとかで検索できる。=>ならRDBMSでいいじゃん。
うちの会社ではこういう判断が下されることが多いです。 フリーのネイティブXMLDBで一番いいのってどれ? すいません、XPath の contains で大文字小文字を区別しない
方法って有りますでしょうか?
使ってるのは msxml なんですが、string-compare なんてのは
ありましたが、contains 代わりに使えるものはなさそうなんで・・・・
よろしくおねがいします。 >>280
今XMLがらみで使ってるRDBはどれ?
メジャーなRDBのXML対応機能の一覧(○△×の簡単な表)が
載ってるサイトがあったら教えてほしい。 >>283
いまごろレスがあるとは。対応表は知らない。申し訳ない。
使ってるRDBは、やっぱオラクルです。一応ネイティブに取り込めるけど、
単なるテキストとして扱って処理を行なうこともしばしば。
ケースバイケースですが。 >>284
ありがとう。
http://www.atmarkit.co.jp/fxml/tanpatsu/30xmldbcatalog2/table.html
この表を見ると、2003年の時点ではOrableが先行しているように見えるけど、
その一年くらい前に、Oracleの営業(大勢)と話したときは、
あれもだめこれもだめ全部お前が実装しろ、ってな感じで
険悪な雰囲気になった記憶がある。
(全然関係ない話だけど、うちみたいなちっちゃな会社相手に
まだ何にも固まってない段階で、
ぞろぞろ営業が出てきて応対してくれるのを見て、
こりゃお値段も立派になるわいとへんに納得してしまった。
基幹系で使ってたんで一種の顧客サービスなんだろか?)
MSでもIBMでもなくOracleを選んだってのは、
既存の運用がOracleだったから以上の理由はあるのかな? 拡張子 XML って、Windows のエクスプローラではなにか
特殊な扱いしてます?エクスプローラの関連付けを
削除しても、あいかわらず XML ファイルは IE で
開かれるみたいなんですが。
もしかして拡張子 XML の場合は特別扱いで
DTD とかスキーマとかを見て使用するアプリケーションを
選択する仕組みが存在する?
Windows 限定の話でスマンガ。 ShellExView で調べてみたらどうやら普通の関連付けとは別に
.xml と .xmlfile の処理は MSOXEV.DLL がふっくしているっぽい。
でもこれって Microsoft InfoPath の DLL みたいなんだけど
俺 InfoPath なんてインストールしてないよ。
しかもどこをフックしてるかと思えば単なるアイコンハンドラだし。 あと Autoruns で見ると MSOXMLMF.DLL もフックしてるみたいだな。
Microsoft Office XML MIME Filter ってことなので
XML 形式で吐き出した Office 文書を開くときに適切な
Office アプリに引き継ぐためのものみたいだ。 ううむ、
HKEY_CLASSES_ROOT\.xml
→HKEY_CLASSES_ROOT\xmlfile
から先、複雑すぎてわからん・・・・ xml:lang の指定は、指定した要素の中に含まれるリテラル
だけでなくその下にぶら下げられている全ての要素にも
(特に改めて指定しなおさない限り)有効ですか?
また、ルートノードで xml:lang の指定が無いときには
XML プロセッサはデフォルトの言語を想定するのでしょうか? >>163
私は独学でやってるけど、私と同じような人いるんだね。
少し気持ちが楽になった。 XMLの勉強を始めたばかりの初心者です。
練習と実用をかねて、データベースのテーブル定義を管理するプログラムを作ろうと思っています。
XMLの書式としては、次のように考えておりますが、こんなものでよろしいでしょうか。
なにか、ご意見等あれば頂きたく思います。
<?xml version='1.0' encoding="UTF-8" ?>
<Table Definition>
<Table id="1">
<Name>Table1</Name>
<Explanation></Explanation>
<Field id="1">
<name>Field1</name>
<Type>integer</Type>
<PrimaryKey>true</PrimaryKey>>
<IndexKey>true</IndexKey>>
<Size></Size>
<Explanation></Explanation>>
</Field>
</Table>
</Table Definition>
Table Definition みたいな要素名は認められない。
TableDefinition にする。
何カ所かある >> は余計。 > でいい。
必須じゃないけど DTD/RELAX NG/XSD いずれかでスキーマがあればいい。
文字コードの大文字小文字は区別されないので utf-8 でもいい。
空要素は <Explanation /> みたいに書いてもいい。 >>293
レスありがとうございます。
要素に空白が認められないのは、先ほど身をもって知りました。
「>>」は入力補完が変な風に働いて...。
書き込む前に見直せよ自分orz。
>DTD/RELAX NG/XSD いずれかでスキーマがあればいい。
えと、調べてみます。 >>294
DBマガジンでちょうどXML Schema やってるよ
まぁ他の記事が必要ないかもしれないけれど・・・
まだ7回目だし、興味あったらバックナンバーから読んでみるとイイかも
RDBMSでXML使うのって
流行に乗るという以外になんか意義あります? アプリケーション間連携とかに便利。
お使いのDBMSが特定のアプリのみサポートするなら無用です。 基本となるキーは固定だが、管理したい項目がちょろちょろ変わりやがる場合・・・
<チラシの裏>
途中からこんなDBのお守りをやらされているが、フィールド名と内容が全く一致してなく
全てCHARで大きく取っておき、何でも入るようにしてあるというステキ仕様。
正直、作った奴の頭の中身を疑う。
</チラシの裏> はじめまして。
XMLから複数のDTDを参照するにはどうすればいいでしょうか?
1つの時は
<!DOCTYPE Test SYSTEM "test.dtd">
のようにしていました。
外部パラメータ実体だかそんなのを使うような気がするけどよくわかんない。
DTDはできるかぎり避けて通っている・・・w
<!DOCTYPE Test [
<!ENTITY % ex1 SYSTEM "test-ex1.dtd">
%ex1;
<!ENTITY % ex2 SYSTEM "test-ex2.dtd">
%ex2;
]>
かな〜り自信ない OpenSourceのXMLデータベースはいくつかあるが、みんな使っているのか? eXist使って遊んでるけどたまに変な挙動してくれる。
ウェブアプリとの親和性は良いんだけどデータベースとしてはまだまだ発展途上な感じ。
でも最近そんな調べてないんでわからんけどeXistが一番開発が活発な気がする。
eXistで質問があるのですが、クライアントからのXquery文はどこに渡されるのでしょうか?
私としては、exist.jar中のxqueryフォルダのXQuery.classにあると予想しているのですが、
どうぞご教授の程、宜しくお願いします。 まぁ結局は>>298の言うようにtexthostの暫定zhaxの方が利口だと思うわ。
みんなPCはトネフスな感じなんだろ? Xprioriを使ってる方に質問があります。
Xpriori本体でXSLT変換を行った場合
<xsl:element name="xxx">
<xsl:attribute name="yyy">
<xsl:value-of select="zzz">
</xsl:attribute>
</xsl:element> すいません。途中で投稿してしまいました。
<xsl:element name="xxx">
<xsl:attribute name="yyy">
<xsl:value-of select="zzz">
</xsl:attribute>
</xsl:element>
上記のような変換を行おうとすると必ず以下のようなエラーがおきます
また続けて投稿します。以下のようなエラーです
javax.servlet.ServletException: <Error>
<Name> java.lang.Exception </Name>
<Message>
<![CDATA[
Error during xslt: org.apache.xml.utils.WrappedRuntimeException: org/apache/xalan/serialize/SerializerToText
どうやら<xsl:attribute>の間にxslt命令をはさむだけでエラーがおきているようです。<xsl:text>なども同様のエラーでした。
もうお手上げです。。 <xsl:value-of select="zzz">
↓
<xsl:value-of select="zzz"/> <xsl:value-of select="zzz">
↓
<xsl:value-of select="zzz"></xsl:value-of>
/がなかったりしたのは書き込みミスです。
んで、311,312の方法の両方がダメなんです。
ほかの表記法や技も思いつかないし。鬱。
やりたい事にもよるけど属性値テンプレートで対処は出来ないの? <xxx yyy="zzz"></xxx>
<xsl:element name="xxx">
<xsl:attribute name="yyy">zzz</xsl:attribute>
</xsl:element>
xsl使わなければエラーならないの? >314,315
属性地テンプレートで対処できました!
くだらんことでお騒がせしました。感謝。 XMLとデータベースってどういう関係があるの?
XMLはHTMLに毛が生えたようなものと思ってたんですが、それがどうdatabase/SQLと関連あるわけ?
意味わかんね
あと、XML Masterの試験てむずいの?MCAのDatabase の試験にしようか迷ってます >>317
構造化されたデータをぶち込むのがデータベースだけど、XML も構造化されたデータだから
データベースにぶち込める。XML を効率的にデータベースにぶち込もうとしているのが XML
データベース。
また、決められた手続きでデータを取り出せるのがデータベースであり、XML も決められた
クエリー言語でデータを取り出せるので、それ自体がデータベース。実際は取り出すだけじゃ
意味無いので、データベースを更新する方法も当然存在している。 >>317
RDBはリレーショナルデータで、XMLは階層型データ。データ階層自体に意味がある場合は
XMLの方が素直かもしれない。たとえば部品票なんかはXMLの方がいいと思う。
XMLデータベースについてはhttp://www.xmldb.jp/の入門記事でも見ればいいんじゃないかな?
普通、XMLDBに問合せるときにはSQLじゃなくてXQueryを使うけど、最近はOracleでもDB2でも
SQL ServerでもXMLDB機能とXQueryをサポートしてるから、DB回りの仕事をしてるのなら知っと
いて損はないと思うよ。
今月のDBマガジンからXMLマスタのDBなんちゃらの対策講座も始まるみたいだし。 そして時は動き出す…のか?
てかXMLめんどくせぇ。リレーションもめんどくさいから構造組み合わせられないものか。 XMLDBで今一番シェアがあるのってなんだ?
Ygdrasillとかいうのは昔すこしだけいじったことあるぞ。あとeXelonなんちゃら。
Xindiceなんてまだあるのかな?
色々使った中では、Berkley XML DB が一番俺の好みに合った。 xindice
Version 1.1 (May 9 2007)
Version 1.1b4 (April 8 2004)
3年ぶりじゃねーか! xindiceコマンドデフォルトでヘルプでなくなってるな。
あんま昔の仕様は覚えちゃいないが・・・ xindiceは全然バージョンがあがらないので見捨てました・・・
個人的にオススメはeXistですが、こちらも最近バージョンがあがってないみたい。 2個質問があります。
知識不足ゆえ、表現が怪しい部分がありますが
その辺はお察し頂けると助かります。
環境 oracle 9i
1.xml定義書(?)みたいな物とDBを使い、
DBの値をxmlファイルで出力する方法はあるか。
例えば、定義ファイルがこんな感じのイメージで
<group>
<name>
<sex></sex>
<age></age>
</name>
</group>
これに従ってDBのデータを検索し、新しくxmlファイル吐き出す。
<group valeu="1">
<name value="Mr.A">
<sex>man</sex>
<age>20</age>
</name>
<name value="Mr.B">
(中略)
</group>
<group value="2">
(以下略)
2.方法が存在する場合、具体例が知りたい。
イメージでは、xml定義書とDBを利用し、
うまい具合例の様に吐いてくれる関数があるのではないかと
思っています。
調べてみると、dbms_xmldomだの何だのと出てきたのですが
いまいち使い方がわからず、こちらの欲しい具体例も
発見できずで止まってしまってどうしようもなくなり
助けを求めている次第です。
英語板の住民なんです。全くスレチなんですが
ここ2年程、自称桜井恵三なる人物が英語板を荒らしまくり
困っています。
桜井恵三なる人物は2002年までXML関係の会社を
経営し、各地でXMLの講演していたと自身のサイトに書いてあります。
ここの住民さんでこの人物を既知の方がいらしたら
どうぞ英語板の「じじい」とスレタイが入ったスレに
桜井恵三について書き込んでください。
巨大なXMLを扱うことがあると思う。
ファイルサイズの考慮なんだけど、想定外のファイルサイズで、迷惑かけまくって
あぽ〜ん、というプログラムを書いてしまいがち。
Windows系だと単発ファイルサイズが、
(1)4GB以上(でかい運用だと200GB超なんてのが出てくる
(2)ほにゃらら
と分けられると思うけれど、ほにゃららをサイズでロジックわけするとして
お行儀のよい切れ目ってどこなんだろうか。もちろん、複数あってもいいと思うけれど。
>>331
でかいXMLってのは大抵コレクションなので、適当な塊で分割
・1ファイル1アイテム
・1ファイルnアイテム、nは適当に範囲を持たせておく
・キーの頭文字や日付などでまとめる
とかかな それってSAXで必要な部分だけ取り出したらだめなん? 質問です。
xmlがDTDどおりに記述されているかどうかのチェックツールを探しています。
現在はEpicEditorの機能を使ってチェックしていますが、動作が非常に重く
チェックに膨大な時間がかかります。
調べてみたところXMLSpyが良さそうですが、高価すぎて購入できそうにありません。
なにかフリーのツールで良いものはありますか?
また以前公開されていたXMLSpyのフリー版を持っていらっしゃるかたはいますか? >>336
レスありがとうございました。
明日早速試してみます。また報告します。 XML Notepad 2007でXMLファイル読み込んだら、
埋め込まれてた?xA;が本当の改行に変換されて無くなってたorz ここでもエスケープシーケンスされたorz。


これでどうかな? フリーのネイティブXMLデータベースのソフトって
Xpriori
eXist
サイバーラクセオン
xindice
以外になんかありますか? XML文書をネイティブXMLデータベースのソフトに
格納して検索にかかる時間を調べようと思っています。
そこである程度の数のXML文書を格納する必要があるのですが
(500ファイル、100kbyte)は最低でも。
どこか、そういったものがダウンロード出来るサイトは無いでしょうか?
ttp://www.de.c.dendai.ac.jp/res/exist/exist.htm
↑ もうしわけないですが、先頭にhをつけてください。
例えばここで三つほどXML文書がダウンロード出来ます。 >>343
単なるXMLファイルならRSSいっぱい提供してる所探せばいいんじゃね?
@ITで21*3 >>344
とりあえず、@itで63ファイル落とせました。
他のサイトでRSS配信してるとこ探してみます。
トンクス >>345
あとはmavenのリポジトリ逝ってみな とりあえず、ファイルを集めて格納したんですが
eXist
Xpriori
は普通に格納→検索って出来ました。
ですが、Cyber Luxeonというソフトを使ってみたのですが
ファイルをひとつひとつクエリーで検索する方法しか
DXE操作マニュアルと、codeZineの記事に書いてありませんでした。
このネイティブXMLデータベースのソフトは
ファイルをひとつひとつでしか検索に対応してないのでしょうか?
詳しい方、すみませんが、よろしくお願いします。
>>343
バインダドキュメント使ってみてください。
>>347
ありがとうございます!!
バインダファイルを作ったら複数のファイルから検索できました msxml 4.0 以上で
MTやTypePadASPの出力するxhtmlをxpath
で記事を抽出したいんですが
xpathでうまく抽出できません。
はまりそうなポイントってありますか?
たとえば名前空間とか
そもそもそんなことできんからDOMでアクセスしろとか
どなたか教えてください。
あるServletのURLから情報をPOST XMLでリクエストしないといけない
のですが、これは何を使って、どうやって送ればいいですか?
初心者ていうか何も知らないので、分かりやすく説明していただけますか? 何を使いたいか、どうやって送りたいかによる
スレ違いなので他でやってくれ 最近XMLを使い始めたんですけど
皆さんデータの中身で属性と要素ってどう使い分けています?
私は、原則は属性を使って入れ子が生じるものと複数存在する
データについては要素を使っています。
XML DBの情報ってこのスレですか?
つーか、かなり過疎ってますね…
みんなXML DBは使ってない? こんな感じで作ってるんですけど
意味分類の階層って深さで名前を変えた方がいーですか?
- <類語辞典>
- <階層 意味分類="魚">
- <階層 意味分類="海の魚">
- <単語>
<単語名 言語="日本語">鮭</単語名>
<品詞>名詞</品詞>
</単語>
- <単語>
<単語名 言語="日本語">マグロ</単語名>
<品詞>名詞</品詞>
</単語>
- <単語>
<単語名 言語="日本語">鯖</単語名>
<品詞>名詞</品詞>
</単語>
</階層>
</階層>
<階層 意味分類="ほ乳類" />
<階層 意味分類="爬虫類" />
</類語辞典> ORDB(オブジェクトリレーショナルDB)と
XMLDBの違いって何?
格納できるデータの構造というかモデルとかの違い?
それによって現実世界の情報格納に向き不向きがあったりする? >>359
階層の深さが固定なら変えた方がいいかもね。 DTDについて質問です
<!ELEMENT 学生 (学生|学科,名前)>
はDTDの書式として正しいかという初歩的な問題なのですが
<!ELEMENT 学生 (学生|学科),名前)> が自分では正しいのではないかと思うのですが
これでいいのでしょうか? どなたか教えていただけないでしょうか。 >>362
とっくに自己解決してるだろうけど、BNFを引用するとこう:
ttp://www.w3.org/TR/REC-xml/#NT-elementdecl
[45] elementdecl ::= '<!ELEMENT' S Name S contentspec S? '>' [VC: Unique Element Type Declaration]
[46] contentspec ::= 'EMPTY' | 'ANY' | Mixed | children
[47] children ::= (choice | seq) ('?' | '*' | '+')?
[48] cp ::= (Name | choice | seq) ('?' | '*' | '+')?
[49] choice ::= '(' S? cp ( S? '|' S? cp )+ S? ')' [VC: Proper Group/PE Nesting]
[50] seq ::= '(' S? cp ( S? ',' S? cp )* S? ')' [VC: Proper Group/PE Nesting]
[49]と[50]を見ると、選択や列挙のまとまりごとに括弧が必要なことが分かる。
「(学生|学科|名前)」や「(学生,学科,名前)」は可だけど
「(学生|学科,名前)」は不可で、「((学生|学科),名前)」とする必要がある。 池田電機(姫路パワハラ関係の登場人物紹介)
小川明利(自己を正当化するためには他人を貶してまで嘘をつくパワハラ課長。キチガイ。口臭対策はしてるがまだ臭い。古屋の犬一号。)
児島(無修正エロDVDのコピー販売を社内でしてた人。社外秘資料と個人情報の流出源となった)
古屋孝一(パワハラ。口が臭い。会社を代表する精神異常者。キチガイ。ネチネチしてる。幼い頃食うものに困ってゴキブリまで食ったと某社員にカミングアウト)
内藤(異様に威張ってる。事務室でタバコを吸う。上司には態度がコロっと変わる。セクハラ疑惑あり。口癖は「シネ」)
児島の妻
福井章子(古屋、小川の不倫相手。不倫関係を利用し社内で権勢を誇る。淫乱尻軽女)
北川(児島の顧客)
中村(児島の顧客)
新免(古屋の腰巾着。中年同好会会長。仕事中糞つまらんオナニーネタを語る40過ぎのおっちゃん。古屋と共通してキモオタ系) これからはXMLが世の中を支配しそうな気がするんです。
RDBは縦割り行政的な気がして思想的に古い感じで習得する気になりません。
メールなんかも、今は平文でいろいろやり取りしているけど、やがてXMLで構文化されたフォーマットが主になりそうな気がします。
コンピュータが処理するには良いけど
人が読み書きするにはめんどくさがる人が多そう
そこを補うようなツールが出て来るんだろうけどさ
SGMLが難しすぎて使ってる人あんま居ないのと同じように ここだけ10年前のスレですか、とでも言いたくなる内容だ 誰かXMLマスタープロフェッショナル勉強してる人いないの?
スレ立ってないし