X



構造化テキスト
0001名無しさん@お腹いっぱい。
垢版 |
2005/08/24(水) 00:02:40
構造化テキスト文書のフォーマットを調べたら山ほど出てきました。
正直一個一個比較調査は辛いので、これをこういう風に使っていて非常に良い等の情報がありましたら教えてください(ぺこり

Smart ASCII 系
--------------
setextについて
  http://www.age.ne.jp/x/sf/SETEXT/

reStructuredText
  http://docutils.sourceforge.net/rst.html

dW : XML : XMLの論考 reStructuredText
  http://www-6.ibm.com/jp/developerworks/xml/030411/j_x-matters24.html

plain2
  http://shika.aist-nara.ac.jp/products/plain2/plain2-j.html

RFC2233-JP
  http://rfc-jp.nic.ad.jp/rfc-jp/RFC2223-JP.txt

Daring Fireball: Markdown
  http://daringfireball.net/projects/markdown/
0002名無しさん@お腹いっぱい。
垢版 |
2005/08/24(水) 00:03:57
Grutatxt
  http://www.triptico.com/software/grutatxt.html

EtText: Documentation: Contents
  http://ettext.taint.org/doc/
  
Stx2any
  http://www.sange.fi/~atehwa/cgi-bin/piki.cgi/stx2any

Almost Free Text
  http://www.maplefish.com/todd/aft.html

AsciiDoc
  http://www.methods.co.nz/asciidoc/

Almost Plain Text
  http://www.xmlmind.com/aptconvert.html

atx, the true structured text format
  http://www.aaronsw.com/2002/atx/
0006名無しさん@お腹いっぱい。
垢版 |
2005/08/24(水) 00:44:07
>>4
TeX(というかLaTeX?)は明示マークアップ系だと思いますが、
専用スレが存在しているので引き合いに出す程度が無難かなーと思います。

pdf 化の過程で LaTeX に一回落とす処理系は割と多そうなので、ほっといても関連しますので。
0009名無しさん@お腹いっぱい。
垢版 |
2005/08/24(水) 19:07:00
>>7
人が真面目に立てているのに取り合えずで片付けるのは失礼じゃないですか?
単発系のスレでこれだけのリンクをはって単発質問として発言した場合のことを少しでも想像して発言してますか?
脳髄反射な削除発言は自治じゃなくて自治厨だと思います。

>>8
踊れるなら初めから自分で(ry

で、板違いだというならどの板に立てればいいのでしょうか。
ソフトでもあるし、UNIX 由来のTeX, roff と一緒に語られることもあるし、Wiki や Blog の記法としてWeb系の板で語られることもあるし。
最終的にUNIX板にしたのはGoogleで各ツール名で検索したら Unix/Linux の2板が多かったからです。
何らかの妥当な根拠を持って他の板に誘導してください。
0011名無しさん@お腹いっぱい。
垢版 |
2005/08/24(水) 20:05:45
>>9
そういうのにいちいち反応してたらきりないですよ。

で。

Linux板にDocBookスレがあるけど、いまいち伸びてない。
他にメジャーは構造化テキストとなると TeX くらい?
HTMLは「構造」なのか、と言われると微妙だし。

という現状で、総合スレを普通に伸ばそうと思ったら、
1 の方向付けが鍵なのは確か。

専用スレのないフォーマット全般を扱うつもりなのか、
各フォーマットの比較みたいなことをやるのか。
0012名無しさん@お腹いっぱい。
垢版 |
2005/08/24(水) 20:22:25
Wiki記法とか、PODやらRDも立派な構造化テキストだろう。
個人的には、smart ascii 系がdiffしたり、cvsしたりするのに便利なので好き。

まぁ、unix板でいいんじゃないの。diffだのcvsだのgrepだのできて
喜ぶ連中がunix板以外にたくさんいるとは思えないし。
00174
垢版 |
2005/08/24(水) 22:05:41
>>6
了解
>>15
あっち見てないのでここの方が嬉しい
0018名無しさん@お腹いっぱい。
垢版 |
2005/08/26(金) 04:56:28
>>11
> 専用スレのないフォーマット全般を扱うつもりなのか、
> 各フォーマットの比較みたいなことをやるのか。
正直どっちもやりたい(^^;
そんなに盛り上がらないだろうから話題を制限してもね。。。

>>12
WORD 等の文書は素材として使おうとするとすげーめんどくさいです。
sed とか awk とか perl とかでプログラマブルに加工できるのはすんげー魅力的です。

>>16
同意です。
明示的なマークアップはソフトウェアの処理に向いているのでiff(interchange file format)としては良いのですが、
人にはやさしくありません。。。
0019名無しさん@お腹いっぱい。
垢版 |
2005/08/26(金) 20:21:30
>>18
> 明示的なマークアップはソフトウェアの処理に向いているのでiff(interchange file format)としては良いのですが、
> 人にはやさしくありません。。。

確かに。
そこでWikiのような簡易記法が出てくるんだろうね。
0020名無しさん@お腹いっぱい。
垢版 |
2005/08/28(日) 18:33:27
Texi はここには入らんの?
0021名無しさん@お腹いっぱい。
垢版 |
2005/08/28(日) 19:51:31
Wiki のような smart ascii 系も、明示的なマークアップでしょ
読み手としては HTML/XML 系より読みやすいけど、書き手としては至極面倒。
なにより覚えにくい

入りやすさという意味では、HTMLみたいに特殊記号使う方がいいだろうね
マークアップしてるかしてないかが明確
0023名無しさん@お腹いっぱい。
垢版 |
2005/08/29(月) 00:33:55
>>21
wikiはたしかに方言が多く統一感も無くて混乱するし、HTTPの制限からUIがダメダメで
書きにくいと感じていたけど、howmとかを使い込んで考えがかわったよ。

ていうか、マークアップしてるかしてないか明確なものがhtml/xml/texで、
その点に注目して明示的マークアップ系とsmart ascii系を分類したのじゃないのか。
smart asciiが明示的マークアップと一緒と思うのはどういう点で同一と感じるのさ?
0026名無しさん@お腹いっぱい。
垢版 |
2005/08/29(月) 06:19:30
>>24
一般的にはそうだね。>>23の前半でwikiの話をしていたので、>>24ではそれが
念頭にあった。wikiはHTMLにしかしないから。そう断っておくべきでした。
0028名無しさん@お腹いっぱい。
垢版 |
2005/08/29(月) 12:58:22
Smart Ascii系と明示マークアップ系だと、書く量と文書の表現力がだいぶ違わないか?
構文にオプションや属性を指定する節なんかを定義する事はできるだろうが、
Smart Ascii系でそういうのってあんまり使われてないよねぇ?
0029名無しさん@お腹いっぱい。
垢版 |
2005/08/29(月) 14:15:40
=head1 POD

perlのB<POD>はどうよ。

=head2 書き易さ

Wikiと同じくらい。覚え易さもWikiと同じくらい。

=head2 汎用性

man、html、texinfo、TeXなんかに変換するのは楽だけど
YAMLのような汎用性は無い。

=cut
0030名無しさん@お腹いっぱい。
垢版 |
2005/08/29(月) 14:50:26
YAML最高!!
0031名無しさん@お腹いっぱい。
垢版 |
2005/08/30(火) 09:21:00
テキストファイルとしてメモ帳クラスのアプリでも編集することを前提とした
構造化テキストのフォーマットとしては、Wikiスタイルが今のとこベスト?
003231
垢版 |
2005/08/30(火) 09:21:44
あー、構造化テキストとは言わないな・・・
すまん忘れてくれ
0033名無しさん@お腹いっぱい。
垢版 |
2005/08/30(火) 10:25:35
smartdoc 派なオレがきましたよっと。

ttp://www.xmlsmartdoc.org/

メリット
. xml なので、多い日も安心
. 数式を書くのが楽(TeX互換)
. 日本語OK
. tex, html, plain text変換

デメリット
. xmlなので、そのままでは読みにくいかも
. xmlなので、タグ書き面倒(HTMLと大差ないレベル)
. 便利に使い込もうと思うと、java, make(or ant) などの知識必須
. 凝ったPDFを出力しようと思ったら、それなりにTeXの知識がいる

TeXに慣れてるひと(書き貯めたスタイルファイルを無駄にしたくないとか、
数式はTeXじゃなきゃ書けないとか)が将来の文書ハンドリングの利便性に
不安を感じたときにオススメ
0034名無しさん@お腹いっぱい。
垢版 |
2005/08/30(火) 11:20:04
SmartDoc は一時期使ってみたけど、いまいちだった

・閉じタグ必須で入力がHTMLの倍は面倒
・表現力が低い。パラグラフと箇条書きだけの文書なら使えるかもしれない
・一個の記述が複数のHTML記述に対応するとかの便利さもない
・図のサポートがいまいち。

やっぱり、はじめからLaTeXで書いた方が綺麗だし何より早いと思う

ま−でも、こういう自分言語って作る方は楽しいんだろうね
0035名無しさん@お腹いっぱい。
垢版 |
2005/08/30(火) 12:16:48
同じくsmartdoc派な俺も来ましたよ。
いままで書く所無かったんだよ。
俺の感想はだいたい>>33-34と似たようなものだな。
 ・レイアウトを凝る必要が無い。
 ・テキストが多い。
というのに向いてそう。
0040名無しさん@お腹いっぱい。
垢版 |
2005/09/02(金) 00:57:32
Docutils

ttp://docutils.sourceforge.net/

Purpose
The purpose of the Docutils project is to create a set of tools for
processing plaintext documentation into useful formats, such as
HTML, XML, and LaTeX. Support for the following sources has been implemented:

だそうな。
lighttpdのページを見てて発見した。
reStructuredText の機能を含むが、wiki markupやらRFC822な
メールファイルにも対応してるそうだ。

Pythonなのが俺的に微妙だけど、ちょっくら試してみる。
004132
垢版 |
2005/09/02(金) 01:43:24
>>33
俺は最初からSmarDocファイルで文書のレイアウトをするのはあきらめてるから。
細かいレイアウトをしたい時は生成されたLaTeXファイルを直接編集してdiffをとっとく。
sdoc文書を編集した時も、たいていはpatchで何とかなる。

...という一連の作業をMakefileで自動化しているので、なかなか快適で離れられない。
まぁデメリットに関しては >>33 の言う通りかと思う。とくにインライン数式が面倒すぎ。

ともかく、sdocにあまり文書のレイアウト情報は入れない方が精神的にも楽。
0044名無しさん@お腹いっぱい。
垢版 |
2005/09/21(水) 05:24:16
表現力は低くても、テキストファイルとして自然に読み下せる記法が欲しいな。
Wiki のフォーマットだと、「変換前のファイル」という風味が強すぎるんで。
0051名無しさん@お腹いっぱい。
垢版 |
2005/10/10(月) 00:00:05
結局メジャーどころのマークアップ言語が一通り挙がったところで終わったな。このスレ。
こんなの情報整理スレでやってりゃ良かったんだよ。
0055名無しさん@お腹いっぱい。
垢版 |
2006/01/02(月) 18:35:52
ttp://www.pault.com/pault/pxml/xmlalternatives.html
ますます、増えてないか。。。
マークアップのデファクトは DocBook な気がするけど、Smart ASCII のデファクトは決まらないのかなあ。。。
006159
垢版 |
2006/06/20(火) 01:29:50
コメントサンクス

>自然な感が弱い。
自然な感じだと、reStructuredText使うのが素直でしょうね……アレには敵わん。

ただ、あれだと後戻りが多くてパースするのが大変な気がするけど……どうなのかね?
レスを投稿する


ニューススポーツなんでも実況