X



構造化テキスト
0001名無しさん@お腹いっぱい。
垢版 |
2005/08/24(水) 00:02:40
構造化テキスト文書のフォーマットを調べたら山ほど出てきました。
正直一個一個比較調査は辛いので、これをこういう風に使っていて非常に良い等の情報がありましたら教えてください(ぺこり

Smart ASCII 系
--------------
setextについて
  http://www.age.ne.jp/x/sf/SETEXT/

reStructuredText
  http://docutils.sourceforge.net/rst.html

dW : XML : XMLの論考 reStructuredText
  http://www-6.ibm.com/jp/developerworks/xml/030411/j_x-matters24.html

plain2
  http://shika.aist-nara.ac.jp/products/plain2/plain2-j.html

RFC2233-JP
  http://rfc-jp.nic.ad.jp/rfc-jp/RFC2223-JP.txt

Daring Fireball: Markdown
  http://daringfireball.net/projects/markdown/
0002名無しさん@お腹いっぱい。
垢版 |
2005/08/24(水) 00:03:57
Grutatxt
  http://www.triptico.com/software/grutatxt.html

EtText: Documentation: Contents
  http://ettext.taint.org/doc/
  
Stx2any
  http://www.sange.fi/~atehwa/cgi-bin/piki.cgi/stx2any

Almost Free Text
  http://www.maplefish.com/todd/aft.html

AsciiDoc
  http://www.methods.co.nz/asciidoc/

Almost Plain Text
  http://www.xmlmind.com/aptconvert.html

atx, the true structured text format
  http://www.aaronsw.com/2002/atx/
0006名無しさん@お腹いっぱい。
垢版 |
2005/08/24(水) 00:44:07
>>4
TeX(というかLaTeX?)は明示マークアップ系だと思いますが、
専用スレが存在しているので引き合いに出す程度が無難かなーと思います。

pdf 化の過程で LaTeX に一回落とす処理系は割と多そうなので、ほっといても関連しますので。
0009名無しさん@お腹いっぱい。
垢版 |
2005/08/24(水) 19:07:00
>>7
人が真面目に立てているのに取り合えずで片付けるのは失礼じゃないですか?
単発系のスレでこれだけのリンクをはって単発質問として発言した場合のことを少しでも想像して発言してますか?
脳髄反射な削除発言は自治じゃなくて自治厨だと思います。

>>8
踊れるなら初めから自分で(ry

で、板違いだというならどの板に立てればいいのでしょうか。
ソフトでもあるし、UNIX 由来のTeX, roff と一緒に語られることもあるし、Wiki や Blog の記法としてWeb系の板で語られることもあるし。
最終的にUNIX板にしたのはGoogleで各ツール名で検索したら Unix/Linux の2板が多かったからです。
何らかの妥当な根拠を持って他の板に誘導してください。
0011名無しさん@お腹いっぱい。
垢版 |
2005/08/24(水) 20:05:45
>>9
そういうのにいちいち反応してたらきりないですよ。

で。

Linux板にDocBookスレがあるけど、いまいち伸びてない。
他にメジャーは構造化テキストとなると TeX くらい?
HTMLは「構造」なのか、と言われると微妙だし。

という現状で、総合スレを普通に伸ばそうと思ったら、
1 の方向付けが鍵なのは確か。

専用スレのないフォーマット全般を扱うつもりなのか、
各フォーマットの比較みたいなことをやるのか。
0012名無しさん@お腹いっぱい。
垢版 |
2005/08/24(水) 20:22:25
Wiki記法とか、PODやらRDも立派な構造化テキストだろう。
個人的には、smart ascii 系がdiffしたり、cvsしたりするのに便利なので好き。

まぁ、unix板でいいんじゃないの。diffだのcvsだのgrepだのできて
喜ぶ連中がunix板以外にたくさんいるとは思えないし。
00174
垢版 |
2005/08/24(水) 22:05:41
>>6
了解
>>15
あっち見てないのでここの方が嬉しい
0018名無しさん@お腹いっぱい。
垢版 |
2005/08/26(金) 04:56:28
>>11
> 専用スレのないフォーマット全般を扱うつもりなのか、
> 各フォーマットの比較みたいなことをやるのか。
正直どっちもやりたい(^^;
そんなに盛り上がらないだろうから話題を制限してもね。。。

>>12
WORD 等の文書は素材として使おうとするとすげーめんどくさいです。
sed とか awk とか perl とかでプログラマブルに加工できるのはすんげー魅力的です。

>>16
同意です。
明示的なマークアップはソフトウェアの処理に向いているのでiff(interchange file format)としては良いのですが、
人にはやさしくありません。。。
0019名無しさん@お腹いっぱい。
垢版 |
2005/08/26(金) 20:21:30
>>18
> 明示的なマークアップはソフトウェアの処理に向いているのでiff(interchange file format)としては良いのですが、
> 人にはやさしくありません。。。

確かに。
そこでWikiのような簡易記法が出てくるんだろうね。
0020名無しさん@お腹いっぱい。
垢版 |
2005/08/28(日) 18:33:27
Texi はここには入らんの?
0021名無しさん@お腹いっぱい。
垢版 |
2005/08/28(日) 19:51:31
Wiki のような smart ascii 系も、明示的なマークアップでしょ
読み手としては HTML/XML 系より読みやすいけど、書き手としては至極面倒。
なにより覚えにくい

入りやすさという意味では、HTMLみたいに特殊記号使う方がいいだろうね
マークアップしてるかしてないかが明確
0023名無しさん@お腹いっぱい。
垢版 |
2005/08/29(月) 00:33:55
>>21
wikiはたしかに方言が多く統一感も無くて混乱するし、HTTPの制限からUIがダメダメで
書きにくいと感じていたけど、howmとかを使い込んで考えがかわったよ。

ていうか、マークアップしてるかしてないか明確なものがhtml/xml/texで、
その点に注目して明示的マークアップ系とsmart ascii系を分類したのじゃないのか。
smart asciiが明示的マークアップと一緒と思うのはどういう点で同一と感じるのさ?
0026名無しさん@お腹いっぱい。
垢版 |
2005/08/29(月) 06:19:30
>>24
一般的にはそうだね。>>23の前半でwikiの話をしていたので、>>24ではそれが
念頭にあった。wikiはHTMLにしかしないから。そう断っておくべきでした。
0028名無しさん@お腹いっぱい。
垢版 |
2005/08/29(月) 12:58:22
Smart Ascii系と明示マークアップ系だと、書く量と文書の表現力がだいぶ違わないか?
構文にオプションや属性を指定する節なんかを定義する事はできるだろうが、
Smart Ascii系でそういうのってあんまり使われてないよねぇ?
0029名無しさん@お腹いっぱい。
垢版 |
2005/08/29(月) 14:15:40
=head1 POD

perlのB<POD>はどうよ。

=head2 書き易さ

Wikiと同じくらい。覚え易さもWikiと同じくらい。

=head2 汎用性

man、html、texinfo、TeXなんかに変換するのは楽だけど
YAMLのような汎用性は無い。

=cut
0030名無しさん@お腹いっぱい。
垢版 |
2005/08/29(月) 14:50:26
YAML最高!!
0031名無しさん@お腹いっぱい。
垢版 |
2005/08/30(火) 09:21:00
テキストファイルとしてメモ帳クラスのアプリでも編集することを前提とした
構造化テキストのフォーマットとしては、Wikiスタイルが今のとこベスト?
003231
垢版 |
2005/08/30(火) 09:21:44
あー、構造化テキストとは言わないな・・・
すまん忘れてくれ
0033名無しさん@お腹いっぱい。
垢版 |
2005/08/30(火) 10:25:35
smartdoc 派なオレがきましたよっと。

ttp://www.xmlsmartdoc.org/

メリット
. xml なので、多い日も安心
. 数式を書くのが楽(TeX互換)
. 日本語OK
. tex, html, plain text変換

デメリット
. xmlなので、そのままでは読みにくいかも
. xmlなので、タグ書き面倒(HTMLと大差ないレベル)
. 便利に使い込もうと思うと、java, make(or ant) などの知識必須
. 凝ったPDFを出力しようと思ったら、それなりにTeXの知識がいる

TeXに慣れてるひと(書き貯めたスタイルファイルを無駄にしたくないとか、
数式はTeXじゃなきゃ書けないとか)が将来の文書ハンドリングの利便性に
不安を感じたときにオススメ
0034名無しさん@お腹いっぱい。
垢版 |
2005/08/30(火) 11:20:04
SmartDoc は一時期使ってみたけど、いまいちだった

・閉じタグ必須で入力がHTMLの倍は面倒
・表現力が低い。パラグラフと箇条書きだけの文書なら使えるかもしれない
・一個の記述が複数のHTML記述に対応するとかの便利さもない
・図のサポートがいまいち。

やっぱり、はじめからLaTeXで書いた方が綺麗だし何より早いと思う

ま−でも、こういう自分言語って作る方は楽しいんだろうね
0035名無しさん@お腹いっぱい。
垢版 |
2005/08/30(火) 12:16:48
同じくsmartdoc派な俺も来ましたよ。
いままで書く所無かったんだよ。
俺の感想はだいたい>>33-34と似たようなものだな。
 ・レイアウトを凝る必要が無い。
 ・テキストが多い。
というのに向いてそう。
0040名無しさん@お腹いっぱい。
垢版 |
2005/09/02(金) 00:57:32
Docutils

ttp://docutils.sourceforge.net/

Purpose
The purpose of the Docutils project is to create a set of tools for
processing plaintext documentation into useful formats, such as
HTML, XML, and LaTeX. Support for the following sources has been implemented:

だそうな。
lighttpdのページを見てて発見した。
reStructuredText の機能を含むが、wiki markupやらRFC822な
メールファイルにも対応してるそうだ。

Pythonなのが俺的に微妙だけど、ちょっくら試してみる。
004132
垢版 |
2005/09/02(金) 01:43:24
>>33
俺は最初からSmarDocファイルで文書のレイアウトをするのはあきらめてるから。
細かいレイアウトをしたい時は生成されたLaTeXファイルを直接編集してdiffをとっとく。
sdoc文書を編集した時も、たいていはpatchで何とかなる。

...という一連の作業をMakefileで自動化しているので、なかなか快適で離れられない。
まぁデメリットに関しては >>33 の言う通りかと思う。とくにインライン数式が面倒すぎ。

ともかく、sdocにあまり文書のレイアウト情報は入れない方が精神的にも楽。
0044名無しさん@お腹いっぱい。
垢版 |
2005/09/21(水) 05:24:16
表現力は低くても、テキストファイルとして自然に読み下せる記法が欲しいな。
Wiki のフォーマットだと、「変換前のファイル」という風味が強すぎるんで。
0051名無しさん@お腹いっぱい。
垢版 |
2005/10/10(月) 00:00:05
結局メジャーどころのマークアップ言語が一通り挙がったところで終わったな。このスレ。
こんなの情報整理スレでやってりゃ良かったんだよ。
0055名無しさん@お腹いっぱい。
垢版 |
2006/01/02(月) 18:35:52
ttp://www.pault.com/pault/pxml/xmlalternatives.html
ますます、増えてないか。。。
マークアップのデファクトは DocBook な気がするけど、Smart ASCII のデファクトは決まらないのかなあ。。。
006159
垢版 |
2006/06/20(火) 01:29:50
コメントサンクス

>自然な感が弱い。
自然な感じだと、reStructuredText使うのが素直でしょうね……アレには敵わん。

ただ、あれだと後戻りが多くてパースするのが大変な気がするけど……どうなのかね?
0067名無しさん@お腹いっぱい。
垢版 |
2007/09/23(日) 12:51:39
こんなスレあったのね…

お手軽メモ書きに使って
打ち合わせ資料とかでそれっぽく変換できる

日本語をそれなりに扱える

いまのところ python 関連ということもあって
reStructuredText (docutils)使おうと思ってるんですけど
最近イケてるのって何かあるんですかね?

reST のさらに wrapper で kagipdf なるものも発見
(↑とりあえず日本語文書を扱うための wrapper みたいなもん?)
0071名無しさん@お腹いっぱい。
垢版 |
2007/11/04(日) 23:33:07
そのスレ、内容はともかくグロ画像貼ってあんのはヒドイ
これだからマクド使いは、、、

で、現状最有力は結局XMLなの?
早くデファクトスタンダードが決まって欲しい
0072名無しさん@お腹いっぱい。
垢版 |
2007/11/08(木) 18:27:15
今更ながら Smart ASCII 系に「xetext」も。
setext-j を微拡張した感じ。とん挫した残骸みたいだけど
ttp://www.piedey.co.jp/xetext/
(ページの一番下です)
0073名無しさん@お腹いっぱい。
垢版 |
2007/11/28(水) 17:40:54
火病か
0074名無しさん@お腹いっぱい。
垢版 |
2007/12/21(金) 14:21:11
reStructuredText で用語集を作ろうと思ったんだけど、
自動的に<dt>にアンカーをつける方法ってないのかな。
↓こんな風に書けば望み通りの出力が得られるんだけど、
定義名とアンカーで2回exampleを書くのがいやだ…

example_ は例です。

.. _example:

example
  説明
0077名無しさん@お腹いっぱい。
垢版 |
2008/01/06(日) 19:41:04
reStructuredTextは、出力弄るのがちょっと面倒だよな。
xmlで出して変換しろって言うけど、そっちもやっぱり面倒で。
0078名無しさん@お腹いっぱい。
垢版 |
2008/01/18(金) 23:18:56
wiki フォーマットで書いて、ツールで見やすい形式のテキストに
変換するのが良いんじゃないかと思えて来た。何と言っても wiki
フォーマットは書く為のフォーマットであるというのがグッド。
XML みたいに入力量が増えたりしないし、そのくせ適度に構造化
されているし、インデントが適当でも後で幾らでも整形出来るし、
HTML に変換するのも容易いし、勿論 wiki にもアップ出来る。
特殊なエディタのサポートを必要としないと言うのも良いね。

後は wiki->txt のツールをちょちょっとでっち上げれば完了。
問題があるとすれば、どの wiki フォーマットを使うかかな。
0079名無しさん@お腹いっぱい。
垢版 |
2008/01/19(土) 01:10:05
お好きなのドゾー
1. reStructuredText
2. plain2
3. 自分で作る

おいらは自作したけどね。RubyでもreStructuredText使えればなぁ。
0081名無しさん@お腹いっぱい。
垢版 |
2008/01/19(土) 15:24:45
さすがにめんどかった。
それに文脈自由文法にも興味あったんで、勉強がてら俺構造化テキストを設計してみました。

まあ、RDがあまりにもアレ過ぎるっつうのもあったんだけどね。
- 見出しの中で最大見出しが一番目立たない記法ってのはおかしいだろ。
- 整形ずみ文書を字下げで表現するのはいかがなものか。エディタの支援必須になっちゃうよね。
- ((●●●))というのが多過ぎ。「見た目の装飾」と「リンク」ぐらいは分けた方が良かったと思う。
とか。
008281
垢版 |
2008/01/19(土) 15:32:51
そういえば昔まとめた解説を発掘したんだけど、文法についてコメント頂けますか?
・ここをこうすればLL(1)になるんじゃね?
・これだとこういう組合せで破綻するよ
とか教えて貰えると助かります。
ttp://fiercewinds.net/siki/pub/Siki/SikiFormat/
0083名無しさん@お腹いっぱい。
垢版 |
2008/01/19(土) 15:49:46
>>82
> 記述や修正に手間のかかることが多いです

俺も RST の問題はここだと思う。
Wiki 書法よりも読み易さを重視した結果だろうけど。
0086名無しさん@お腹いっぱい。
垢版 |
2008/01/20(日) 12:22:14
>>85
拡張子は3文字信仰が多いから rst だけど、普通 reStructuredText を RST とは言わない.
ReST、reSTなどで大文字小文字で判別する.
0087名無しさん@お腹いっぱい。
垢版 |
2008/01/20(日) 14:08:32
>>86
そんな事どうでも良くない?
もしかして何でも決めつけたがりの人?

普通っていうほど普及してるもんでもないし、拡張子の話は誰もしていないし、
公式の URL は rst.html だし、ついでに言えばディレクトリも rst になっているし、
reStructuredText の仕様書中の例題も RST という略号を使用しているし、
Wikipedia でも一番最初に RST と書いてある。だから普通なのはむしろ RST
なんだと思うけど、君が ReST や reST と書いても俺は何の文句も言わないよ。
だって、こんな些細な事、普通はどうでも良いからね。

http://docutils.sourceforge.net/docs/ref/rst/restructuredtext.html

> |RST|_ is a little annoying to type over and over, especially
> when writing about |RST| itself, and spelling out the
> bicapitalized word |RST| every time isn't really necessary for
> |RST| source readability.
>
> .. |RST| replace:: reStructuredText
> .. _RST: http://docutils.sourceforge.net/rst.html

http://ja.wikipedia.org/wiki/ReStructuredText
> reStructuredText は RST、reST、ReST と略されることもある。

それよりももっと意味のある話をしようぜ。
008881
垢版 |
2008/01/20(日) 14:30:59
どうせ2chなんだから、疑似問題が発生しない程度に判りゃ良いよ。
もともと日本語って読み手・聞き手が文脈から意味を補足するのを前提にしている言語だし。
#述語中心の構成とか

そんなことよりも>82の評価 or もっと優れた構造テキストとの比較ヨロ
0089名無しさん@お腹いっぱい。
垢版 |
2008/01/21(月) 10:56:41
>87=85 が 「4文字で書くな」と決めつけたのが
発端なのに真っ赤になって書くから…

というのはさておき

------

所詮 plain text なんだから章題を「目立たせる」方法ってそんなにないので
その辺りはあまり拘っても仕方ない気がする

ReST ってガンガン書いて自分なりのルールが決まればいいんだろうけど
第何番目のレベルはどの記号だったっけ? とかがビミョ〜に面倒
(第 n.m.k 節 って書き方を auto-numbering 出来ればちょっと楽かもしれない)

あとリストの入れ子について、インデントレベルを気にして書くのも
チョイ面倒だったかな(やり方を勘違いしているのかもしれないが)
0091名無しさん@お腹いっぱい。
垢版 |
2008/01/22(火) 02:26:48
>>85 を見れば明らかに決め付けたがりの人がどっちかは明らかだよな
yes といえばいいだけのところでわざわざ RST じゃなきゃと言わんがばかりに主張してるんだから
0092名無しさん@お腹いっぱい。
垢版 |
2008/01/22(火) 02:30:04
ついでに Google の結果
reStructuredText rest の検索結果 約 98,300 件中 1 - 10 件目 (0.22 秒)
reStructuredText rst の検索結果 約 74,400 件中 1 - 10 件目 (0.27 秒)

reST が当たり前だというほどではないけど、rst の方が少数派なのは確かっぽい
0093名無しさん@お腹いっぱい。
垢版 |
2008/01/22(火) 03:13:25
おまいら省略形禁止。reStructuredTextて書け。


>所詮 plain text なんだから章題を「目立たせる」方法ってそんなにないので
reStructuredTextは目立っていると思うよ。
#とか$とかの字面の黒い文字使ってさらに強調する手もあるけど、あれで十分じゃない?

ただ、指摘の通りアシストツールがないと結局書けなくなるよな。
参考書片手でもいいけど、そうなるとお手軽さが無くなるし……


そういや全然別の話だけど、reStructuredTextて文脈自由文法に納まっていたっけ?
0096名無しさん@お腹いっぱい。
垢版 |
2008/08/15(金) 22:26:24
過疎ってるなー

reStructuredTextのラッパ(?)でsphinxというのが出てきたそうな。
http://sphinx.pocoo.org/

python2.6のドキュメント↓もsphinxを使ってるんだと。
http://docs.python.org/dev/

reStructuredTextからのpdf生成がもっと簡単に(latexに頼らずに)
できるようになったら、自分で文書書くときはwordと決別できそう
なんだけど…
0098名無しさん@お腹いっぱい。
垢版 |
2008/09/17(水) 00:03:02
reStructuredTextよりもasciidocの方が良い気がしてきたぞ…
最初から数式が使えるし、次のバージョンでは
要求仕様/設計結果対照表みたいな左右に並べるテーブルを
簡単に記述できるようになるみたいだし。
どっちもpythonで書かれているし、いっそのこと統合して欲しいもんじゃ。
0101名無しさん@お腹いっぱい。
垢版 |
2008/09/17(水) 17:39:24
infoみたいにemacsから容易に利用できかつ画像とか埋め込めるフォーマットねぇかなぁ
pdfはいまいち使いにくいんだよね
0102名無しさん@お腹いっぱい。
垢版 |
2008/11/12(水) 23:36:04
Emacs Muse とか使っている人いる?
0103名無しさん@お腹いっぱい。
垢版 |
2008/11/18(火) 03:14:03
pandoc 使え pandoc

html, markdown, reStructuredText あたりを読み込んで、
html, markdown, reStructuredText, pdf, LaTeX, DocBook XML その他
もろもろに変換できる、スグレもの。

ttp://johnmaxfarlane.net/pandoc/
0106名無しさん@お腹いっぱい。
垢版 |
2010/09/29(水) 04:56:11
俺はこの組み合わせ
asciidoc(原稿)+XSLT(デザイン)


このスレ読んでpandocが気になった。
0112名無しさん@お腹いっぱい。
垢版 |
2012/02/18(土) 04:45:44.32
というかもう設定ファイル見飽きた…高機能だけど無駄にHTML汚いし…そもそもちゃんとXMLパースしろよ…
0115名無しさん@お腹いっぱい。
垢版 |
2014/03/25(火) 13:57:27.58
>大阪府三島郡島本町の小学校や中学校は、暴力イジメ学校や。
島本町の学校でいじめ・暴力・脅迫・恐喝などを受け続けて廃人同様になってしもうた僕が言うんやから、
まちがいないで。僕のほかにも、イジメが原因で精神病になったりひきこもりになったりした子が何人もおる。
教師も校長も、暴力やいじめがあっても見て見ぬフリ。イジメに加担する教師すらおった。
誰かがイジメを苦にして自殺しても、「本校にイジメはなかった」と言うて逃げるんやろうなあ。
島本町の学校の関係者は、僕を捜し出して口封じをするな

>島本町って町は、暴力といじめの町なんだな

子供の時に受けた酷いイジメの体験は、一生癒えない後遺症になるなあ
0117名無しさん@お腹いっぱい。
垢版 |
2017/12/29(金) 10:46:12.74
誰でも簡単にパソコン1台で稼げる方法など
参考までに、
⇒ 『宮本のゴウリエセレレ』 というブログで見ることができるらしいです。

グーグル検索⇒『宮本のゴウリエセレレ』

ULIDTQ9K49
0119名無しさん@お腹いっぱい。
垢版 |
2018/05/22(火) 03:27:08.36
知り合いから教えてもらったパソコン一台でお金持ちになれるやり方
時間がある方はみてもいいかもしれません
グーグルで検索するといいかも『ネットで稼ぐ方法 モニアレフヌノ』

TCJKI
0121名無しさん@お腹いっぱい。
垢版 |
2024/03/27(水) 19:49:08.75
若手叩くなで発狂してるよ
では
長期投資だけどずっと株価下がるからこの位置で空売りしとけばアイツら静かにしとくやろ」と呼ぶ時点で
もしかしてアマゾンサーバーじゃなくて本当の愚痴にしか聞こえない
0122名無しさん@お腹いっぱい。
垢版 |
2024/03/27(水) 20:03:24.27
>>30
@ご購入希望のみなさま。
0124名無しさん@お腹いっぱい。
垢版 |
2024/03/27(水) 20:14:28.77
>>97
電話してたな
0125名無しさん@お腹いっぱい。
垢版 |
2024/03/27(水) 20:25:44.16
タップダンスやってる場合じゃなかったのか
0126名無しさん@お腹いっぱい。
垢版 |
2024/03/27(水) 20:58:39.93
これで1600人の結婚を見て
こんなもんじゃない
マジでNISAに課税ってのは野暮というものは珍しく英断だったかもしれない
レスを投稿する


ニューススポーツなんでも実況