1つにしてくれればPGが苦労することはなくて
、ミンナうれしいはずなのに。
探検
文字コードの種類は何故複数あるのでしょうか?
NGNG
181デフォルトの名無しさん
2009/03/03(火) 22:09:24 U+1B000がKATAKANA LETTER ARCHAIC E(片仮名「衣」由来のア行の「エ」)になってた。
名前がORIGINAL E(元々の「エ」)からARCHAIC E(古代の「エ」)に変更されてた。
平仮名ヤ行の「え」と違ってBMP外になってしまうけどしょうがないか。
Historic KanaというブロックでU+1B000から256文字分予約されたけど今後変体仮名とか重要な昔の仮名をU+1B001以降にも追加していくつもりなのかな?
名前がORIGINAL E(元々の「エ」)からARCHAIC E(古代の「エ」)に変更されてた。
平仮名ヤ行の「え」と違ってBMP外になってしまうけどしょうがないか。
Historic KanaというブロックでU+1B000から256文字分予約されたけど今後変体仮名とか重要な昔の仮名をU+1B001以降にも追加していくつもりなのかな?
182デフォルトの名無しさん
2009/03/04(水) 00:21:44 256で足りるのw?
そこら辺の文字はよく知らないけど512から1024くらいあってもいいような。
そこら辺の文字はよく知らないけど512から1024くらいあってもいいような。
183デフォルトの名無しさん
2009/03/04(水) 00:29:59 変体かなは良く分からないけど、ここのページを見る限り、平仮名だけでも軽く600以上ありそう。
ttp://www10.plala.or.jp/koin/koinhentaigana.html
ttp://www10.plala.or.jp/koin/koinhentaigana.html
184デフォルトの名無しさん
2009/03/04(水) 12:43:59 住基仮名だけなら256で足りるがな。
185デフォルトの名無しさん
2009/03/05(木) 07:38:01 1バイト目に文字種を表すもんだけいれて後は可変でよろしくやればいいと思った
最低2バイト〜な感じで
最低2バイト〜な感じで
186デフォルトの名無しさん
2009/03/05(木) 17:50:02 欧米人にはそれが理解できんのですよ。
たとえば、”うまれつき目の見えないひと” を想像してみてください。
その人に「海は青い」という事を、いったいどうやって教えればいいのか。
そのひとには、赤も青も黄色も無いんです。色という概念が全く無いんです。
だから理解不可能です。
3次元の世界で生活している我々が4次元の世界を理解できないのと同じく
1文字1バイト圏で生活している欧米人には、1文字が2バイト、3バイトになるのが
理解できんのです。ヤツらにとってマルチバイト文化は4次元の世界なのです。
たとえば、”うまれつき目の見えないひと” を想像してみてください。
その人に「海は青い」という事を、いったいどうやって教えればいいのか。
そのひとには、赤も青も黄色も無いんです。色という概念が全く無いんです。
だから理解不可能です。
3次元の世界で生活している我々が4次元の世界を理解できないのと同じく
1文字1バイト圏で生活している欧米人には、1文字が2バイト、3バイトになるのが
理解できんのです。ヤツらにとってマルチバイト文化は4次元の世界なのです。
187デフォルトの名無しさん
2009/03/05(木) 18:06:53 物理的に無理なのと一緒にされても。
188デフォルトの名無しさん
2009/03/05(木) 19:19:15 文字コード総合の次スレはここでござるな? しからば過去スレを貼り。
【UTF8】文字コード変換【SJIS】
http://pc5.2ch.net/test/read.cgi/tech/1063177450/
文字コード統一スレ 1文字目
http://pc8.2ch.net/test/read.cgi/tech/1109171258/
文字コード総合スレ part2
http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3
http://pc11.2ch.net/test/read.cgi/tech/1180250376/
【UTF8】文字コード変換【SJIS】
http://pc5.2ch.net/test/read.cgi/tech/1063177450/
文字コード統一スレ 1文字目
http://pc8.2ch.net/test/read.cgi/tech/1109171258/
文字コード総合スレ part2
http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3
http://pc11.2ch.net/test/read.cgi/tech/1180250376/
189デフォルトの名無しさん
2009/03/05(木) 20:24:38 >>185
いきなり可変でよろしくやってるのがUTF-8です。
いきなり可変でよろしくやってるのがUTF-8です。
190デフォルトの名無しさん
2009/03/05(木) 21:44:14191デフォルトの名無しさん
2009/03/07(土) 02:01:46 変体でも「あ」なら「あ」なのだから、「あ」に対して異体字セレクタの対応を決めればいいだけなんじゃね?
256種類まで対応できるんだから、多分足りるでしょ。
足りなきゃ、異体字セレクタの方を増やせばいい。
256種類まで対応できるんだから、多分足りるでしょ。
足りなきゃ、異体字セレクタの方を増やせばいい。
192デフォルトの名無しさん
2009/03/07(土) 14:29:53 U+E0100〜U+E01EFは漢字専用じゃなかったっけ?
193デフォルトの名無しさん
2009/03/07(土) 15:36:34 それよりアラビア文字みたいに前後の文字で字形を変えるのを
サポートする必要があるんじゃないか
サポートする必要があるんじゃないか
194デフォルトの名無しさん
2009/03/07(土) 19:27:11 ・縦書き
・前後の状況で字形を変える必要がある
・異体字セレクタに対応が必要
それなんてモンゴル文字?
・前後の状況で字形を変える必要がある
・異体字セレクタに対応が必要
それなんてモンゴル文字?
195デフォルトの名無しさん
2009/03/07(土) 22:28:59 草書を標準化するところから始めないと…
196デフォルトの名無しさん
2009/03/08(日) 11:10:41 アラビア文字がまさに草書の電子化
197デフォルトの名無しさん
2009/03/09(月) 02:11:40 文字コード総合スレ part5
http://pc11.2ch.net/test/read.cgi/tech/1236529563/l50
作ってきた。
即死回避に、だれか頼む。
あと、テンプレがまだ(40行)残ってるので。現在連投規制(5回)で書き込めないのを何とかしないといけない。
http://pc11.2ch.net/test/read.cgi/tech/1236529563/l50
作ってきた。
即死回避に、だれか頼む。
あと、テンプレがまだ(40行)残ってるので。現在連投規制(5回)で書き込めないのを何とかしないといけない。
198デフォルトの名無しさん
2009/03/09(月) 02:23:53 ●かえ
199デフォルトの名無しさん
2009/03/09(月) 02:36:52 ●持ってない
取り合えず見切り発車してくれ。
取り合えず見切り発車してくれ。
200デフォルトの名無しさん
2009/03/09(月) 22:10:13201デフォルトの名無しさん
2009/03/23(月) 19:29:17202デフォルトの名無しさん
2009/08/11(火) 15:28:27 ∧_∧
( ・∀・ )つ
( つ /
| (⌒)どどど・・・
. し' 三
∧_∧
⊂( ・∀・ )
. ヽ ⊂ )
(⌒) |どどどどど・・・・・
三 `J
メ\,_ ,メ゙\、
.メ′ .゙゙アhr _,zl||y,_ .゙∨
.″ .y!^⌒ ¨\ .,,,,,,__
.,yr=¬z .l| ◎ 《 . ゙゙̄^へu,
,メ″,z厂◎ l| ¥ il! ゙ミ
il「 ミy ..,ilト ゙ミy_ ア ,メ .∨
.ll′ 干=冖″ ,,,yyyyy. l| / ̄ ̄ ̄ ̄ ̄
.l| ,,,yvr=冖''''|リ|||》巛》ミ冖'li厂.l| .,l! < 薄型?!!!
.l! 《vvvr=冖¨ ̄ .゙干l! .,メ′ \_____
.l| .l| .,,yrrvy_ ,,,,,,_ .《yrl″
\_ ,l|.,yzl^^゙゙^冖《《||7厂`゙リu_ .l|
.゙\、 .r《l厂 .¨゙冖=vu,フhrト
( ・∀・ )つ
( つ /
| (⌒)どどど・・・
. し' 三
∧_∧
⊂( ・∀・ )
. ヽ ⊂ )
(⌒) |どどどどど・・・・・
三 `J
メ\,_ ,メ゙\、
.メ′ .゙゙アhr _,zl||y,_ .゙∨
.″ .y!^⌒ ¨\ .,,,,,,__
.,yr=¬z .l| ◎ 《 . ゙゙̄^へu,
,メ″,z厂◎ l| ¥ il! ゙ミ
il「 ミy ..,ilト ゙ミy_ ア ,メ .∨
.ll′ 干=冖″ ,,,yyyyy. l| / ̄ ̄ ̄ ̄ ̄
.l| ,,,yvr=冖''''|リ|||》巛》ミ冖'li厂.l| .,l! < 薄型?!!!
.l! 《vvvr=冖¨ ̄ .゙干l! .,メ′ \_____
.l| .l| .,,yrrvy_ ,,,,,,_ .《yrl″
\_ ,l|.,yzl^^゙゙^冖《《||7厂`゙リu_ .l|
.゙\、 .r《l厂 .¨゙冖=vu,フhrト
203デフォルトの名無しさん
2009/12/12(土) 15:53:19 >>1
日本が世界を統一できなかったから
日本が世界を統一できなかったから
204デフォルトの名無しさん
2009/12/12(土) 18:36:49205デフォルトの名無しさん
2010/04/08(木) 01:34:54 もし、織田信長が生きていたら、日本が世界を支配するとか、テレビってマジ、アホだな。
あそこに出てた専門家も恥ずかしくないんだろうか?
(ひょっとして自称専門家かな)
あそこに出てた専門家も恥ずかしくないんだろうか?
(ひょっとして自称専門家かな)
206デフォルトの名無しさん
2010/06/27(日) 00:46:08 UTF8最強
ASCIIとの互換性は伊達じゃない。
ASCIIとの互換性は伊達じゃない。
207デフォルトの名無しさん
2010/06/27(日) 00:57:46 もし、織田信長が生きていたら、日本が世界を支配
208デフォルトの名無しさん
2010/06/30(水) 13:16:56 立ってないことろを見ると、ここが「文字コード総合スレ」の後継スレでつか?
209デフォルトの名無しさん
2010/06/30(水) 13:28:51 立てるか。
テンプレ面倒過ぎるな。1 だけでいい?
テンプレ面倒過ぎるな。1 だけでいい?
210デフォルトの名無しさん
2010/06/30(水) 23:13:43 VSネタまだやるなら分けてほしいな
211デフォルトの名無しさん
2010/07/02(金) 17:37:12 結局争点はなんだったのだろう?
212デフォルトの名無しさん
2010/07/02(金) 23:59:40213デフォルトの名無しさん
2010/07/03(土) 00:50:32 >>211
もおたが飲み仲間なのか、それとも憎いかでしょう。
もおたが飲み仲間なのか、それとも憎いかでしょう。
214デフォルトの名無しさん
2010/07/03(土) 11:01:09 それじゃ、争点を洗い出すスレが別に要る?それともここがそれ?
215デフォルトの名無しさん
2010/07/03(土) 11:02:48 >>214
もういらないだろ。
もういらないだろ。
216デフォルトの名無しさん
2010/07/03(土) 11:55:19 文字コードのスレは何故複数あるのでしょうか?
217デフォルトの名無しさん
2010/07/03(土) 11:57:49 コードもスレも統合出来ないお馬鹿さんたちwww
218デフォルトの名無しさん
2010/07/03(土) 12:18:09 馬鹿が来たぞー
219デフォルトの名無しさん
2010/07/03(土) 12:41:21 >>211
争点は、UTF8はUTF16やUTF32よりも優れている。
特にASCIIとの互換性に優れており、
既存のソフト・・・多くはASCIIやEUC-JPなどの
ASCII互換用として作られているソフトや
そこで使われているライブラリの互換性がよく
ほとんど修正無しに動く。
UTF16やUTF32だと修正のコストが膨大になる。
ということ。
争点は、UTF8はUTF16やUTF32よりも優れている。
特にASCIIとの互換性に優れており、
既存のソフト・・・多くはASCIIやEUC-JPなどの
ASCII互換用として作られているソフトや
そこで使われているライブラリの互換性がよく
ほとんど修正無しに動く。
UTF16やUTF32だと修正のコストが膨大になる。
ということ。
220デフォルトの名無しさん
2010/07/03(土) 12:52:08 wchar_tとロケールとファイルシステム(fopen)がごっちゃになってた気がするんだが。
221デフォルトの名無しさん
2010/07/03(土) 13:01:26 全部charをwchar_tに置き換えるだけでOKとかいう
能天気やろうもいたしな。
それが全ソースコード修正&再テストという
意味だというのを気づいていない。
その膨大さに気づいていないから、
置き換えるだけにコストがかかるというんですか?
なんてことを平気でいえてしまう。
能天気やろうもいたしな。
それが全ソースコード修正&再テストという
意味だというのを気づいていない。
その膨大さに気づいていないから、
置き換えるだけにコストがかかるというんですか?
なんてことを平気でいえてしまう。
222デフォルトの名無しさん
2010/07/03(土) 13:06:11223デフォルトの名無しさん
2010/07/03(土) 13:07:21224デフォルトの名無しさん
2010/07/03(土) 13:07:38 >>221
置き換えずにそのまま使うのにコストがかかるんですか?というのと同レベルの話。
置き換えずにそのまま使うのにコストがかかるんですか?というのと同レベルの話。
225デフォルトの名無しさん
2010/07/03(土) 13:08:47226デフォルトの名無しさん
2010/07/03(土) 13:10:12227デフォルトの名無しさん
2010/07/03(土) 13:17:19 この話は続ける必要はない。落ちたスレで既に話は終わっていたのだから。
999 名前:デフォルトの名無しさん [sage]: 2010/06/26(土) 22:19:28
>>972
>UTF-8にすると何もかも上手くいくよ派は、何を言いたいのかよくわからん
そんな奴いたか? wchar_tにすれば何もかもうまくいくよ派は居たけど。
---
UTF-8にすると何もかも上手くいくよ派がいないのなら、
>>212が争点にしてたことは、元々誰も否定してなかったことだし、
>>219が争点にしてたことは、元々誰も言っていなかったこと。
wchar_tにすることが全てを解決する方法じゃないのは自明。
結論は既に出ていた。
999 名前:デフォルトの名無しさん [sage]: 2010/06/26(土) 22:19:28
>>972
>UTF-8にすると何もかも上手くいくよ派は、何を言いたいのかよくわからん
そんな奴いたか? wchar_tにすれば何もかもうまくいくよ派は居たけど。
---
UTF-8にすると何もかも上手くいくよ派がいないのなら、
>>212が争点にしてたことは、元々誰も否定してなかったことだし、
>>219が争点にしてたことは、元々誰も言っていなかったこと。
wchar_tにすることが全てを解決する方法じゃないのは自明。
結論は既に出ていた。
228デフォルトの名無しさん
2010/07/03(土) 13:25:04229デフォルトの名無しさん
2010/07/03(土) 13:30:08 じゃあここは「文字コード総合スレ」がなぜ立たないのか、立てた場合のテンプレの話のスレにする?
230デフォルトの名無しさん
2010/07/03(土) 13:38:28 なにもなければ放置されるだけのスレの埋め草としてちょうどいいな。
231デフォルトの名無しさん
2010/07/03(土) 14:35:47232デフォルトの名無しさん
2010/07/03(土) 14:58:57 さっさと次スレ立てろよボケ
233デフォルトの名無しさん
2010/07/03(土) 15:13:49234デフォルトの名無しさん
2010/07/03(土) 15:21:57 >>233
意味が分からん。2chに書いてあったか書いてなかったかと、Unixのロケールがどう関係するんだ?
意味が分からん。2chに書いてあったか書いてなかったかと、Unixのロケールがどう関係するんだ?
235デフォルトの名無しさん
2010/07/03(土) 15:24:04 情報の受け手側に理解する能力がなければ書かれてても気付かないってことだろう
236デフォルトの名無しさん
2010/07/03(土) 15:26:22237デフォルトの名無しさん
2010/07/03(土) 15:28:13知らないことは誰だってあるけど、いいやんとか言って違いも調べず思考停止するやつは向上心もう少し持とうぜ
238デフォルトの名無しさん
2010/07/03(土) 15:43:18 >>236
・fopenの話が出たことと、wchar_tにすれば何もかもうまくいくという人がいたことは関係がない
・fopenが出てくる前から、どうせ泥試合だった
・どっちにせよ、fopenでそのままutf8渡して(文字化けすらしないという意味で)うまくいくのはロケールもutf8のときのみ
と認識しているが。
・fopenの話が出たことと、wchar_tにすれば何もかもうまくいくという人がいたことは関係がない
・fopenが出てくる前から、どうせ泥試合だった
・どっちにせよ、fopenでそのままutf8渡して(文字化けすらしないという意味で)うまくいくのはロケールもutf8のときのみ
と認識しているが。
239デフォルトの名無しさん
2010/07/03(土) 16:01:26 > ・どっちにせよ、fopenでそのままutf8渡して(文字化けすらしないという意味で)うまくいくのはロケールもutf8のときのみ
> と認識しているが。
ロケール間違ったまま使っていることなんてしょっちゅうあるが?
日本語化しないままOS使えるだろ。
文字がちゃんと表示されないだけで
> と認識しているが。
ロケール間違ったまま使っていることなんてしょっちゅうあるが?
日本語化しないままOS使えるだろ。
文字がちゃんと表示されないだけで
240デフォルトの名無しさん
2010/07/03(土) 17:02:38 Linuxのext2,ext3でSJIS,EUC-JP,UTF-8のファイル名混在は時々ある。
LinuxでもCD-ROM,vfat,ntfs,smbfsをマウントできて、その時に文字コードを指定しないと痛い目にあう。
LinuxでもCD-ROM,vfat,ntfs,smbfsをマウントできて、その時に文字コードを指定しないと痛い目にあう。
241デフォルトの名無しさん
2010/07/03(土) 17:47:51242デフォルトの名無しさん
2010/07/03(土) 18:27:39 LANG=Cでもきちんと表示できなかったらだめだって言い切っちゃうの?
243デフォルトの名無しさん
2010/07/03(土) 19:37:56 >>242
それは日本語使えるロケールじゃないだろ。
それは日本語使えるロケールじゃないだろ。
244デフォルトの名無しさん
2010/07/03(土) 19:41:28 つか、例えば仕様書に「ロケールはja_JP.eucjp」って明記してあっても、
utf8で書いてもなんにも問題はないからutf8で書いて、
utf8なら問題なくfopen使えるからutf8でfopen使って、
結果、表示が文字化けしていても、utf8なら問題なく読めるから問題ないって言いきるつもりなのか?
内部的にはutf8使ってもいいけど、必要に応じて変換しないとダメなんじゃないの。
utf8で書いてもなんにも問題はないからutf8で書いて、
utf8なら問題なくfopen使えるからutf8でfopen使って、
結果、表示が文字化けしていても、utf8なら問題なく読めるから問題ないって言いきるつもりなのか?
内部的にはutf8使ってもいいけど、必要に応じて変換しないとダメなんじゃないの。
245デフォルトの名無しさん
2010/07/03(土) 19:44:47246デフォルトの名無しさん
2010/07/03(土) 19:52:48 「日本語が使える」の定義が知りたい。
247デフォルトの名無しさん
2010/07/03(土) 20:34:28248デフォルトの名無しさん
2010/07/03(土) 20:38:42 >>238
>・どっちにせよ、fopenでそのままutf8渡して(文字化けすらしないという意味で)うまくいくのはロケールもutf8のときのみ
>と認識しているが。
それはそうだけど、fopenの機能としてはちゃんと動作するよね。
wchar_tの渡した場合、fopenが正しく機能しない・・・というか渡せない つまりfopenでは動作しない
どちらもうまく動いてないといえるけど、その動かない箇所のレイヤーが違うんだよね。
それを同じ土俵で較べ合ってもしょうがないと思うんだが。
>・どっちにせよ、fopenでそのままutf8渡して(文字化けすらしないという意味で)うまくいくのはロケールもutf8のときのみ
>と認識しているが。
それはそうだけど、fopenの機能としてはちゃんと動作するよね。
wchar_tの渡した場合、fopenが正しく機能しない・・・というか渡せない つまりfopenでは動作しない
どちらもうまく動いてないといえるけど、その動かない箇所のレイヤーが違うんだよね。
それを同じ土俵で較べ合ってもしょうがないと思うんだが。
249デフォルトの名無しさん
2010/07/03(土) 20:52:48250デフォルトの名無しさん
2010/07/03(土) 20:59:31 > 2. wchar_tでもcharでも意図した通りの結果にしたければ、一旦ロケールに合わせて変換しないといけないという点で同じ
意図したとおりの結果にするには表示するときにデータを整えれば良いだけの話。
それはfopenには関係ない話。
意図したとおりの結果にするには表示するときにデータを整えれば良いだけの話。
それはfopenには関係ない話。
251デフォルトの名無しさん
2010/07/03(土) 21:01:10 >>247
> ロケールがEUC-JPなのにファイルをUTF8で書き込むのは正常動作って言えるのか?
普通にロケールがEUC-JPだけど、
UTF-8のファイルを読み書きしたり
データベースがUTF-8だったりするけど?
何を言いたいのかさっぱりわからん。
> ロケールがEUC-JPなのにファイルをUTF8で書き込むのは正常動作って言えるのか?
普通にロケールがEUC-JPだけど、
UTF-8のファイルを読み書きしたり
データベースがUTF-8だったりするけど?
何を言いたいのかさっぱりわからん。
252デフォルトの名無しさん
2010/07/03(土) 21:03:28 fopen(3)はNULLを返さなければ、open(2)は-1を返さなければ正常。
253デフォルトの名無しさん
2010/07/03(土) 21:26:40 内部的にはutf8使う香具師なんているのか
254デフォルトの名無しさん
2010/07/03(土) 21:28:50 なぜ内部にこだわる?
255デフォルトの名無しさん
2010/07/03(土) 21:29:09256デフォルトの名無しさん
2010/07/03(土) 21:36:31 GTKは糞
257デフォルトの名無しさん
2010/07/03(土) 21:47:40 wchar_tが2バイト4バイト、エンディアンの違いを考えると、
gtkの内部utf-8はマルチプラットフォームって意味では合理的だと思うが。
gtkの内部utf-8はマルチプラットフォームって意味では合理的だと思うが。
258デフォルトの名無しさん
2010/07/03(土) 22:45:00 >>249
>1. 意図した通りの結果にならないのなら、どこで失敗しても五十歩百歩
結果で見ればそうだけど、ここはプログラム板。
システムで採用されているロケールの文字を使う限り文字化けはしないわけでしょ。
ASCIIでもShift_JISでもUTF-8でも。
それらに対してprintfはそのまんま使える汎用性がある。
wchar_tの場合は、そこまで汎用性が持たせられない。というかそこまで汎用的に
使える標準関数が整備されていない。
その違いによる(プラットフォーム間の移植などで)発生するコストをどう捉えるかの
問題じゃないの?
>1. 意図した通りの結果にならないのなら、どこで失敗しても五十歩百歩
結果で見ればそうだけど、ここはプログラム板。
システムで採用されているロケールの文字を使う限り文字化けはしないわけでしょ。
ASCIIでもShift_JISでもUTF-8でも。
それらに対してprintfはそのまんま使える汎用性がある。
wchar_tの場合は、そこまで汎用性が持たせられない。というかそこまで汎用的に
使える標準関数が整備されていない。
その違いによる(プラットフォーム間の移植などで)発生するコストをどう捉えるかの
問題じゃないの?
259デフォルトの名無しさん
2010/07/03(土) 23:17:42 ばかっ。
wchar_tとか不用意に持ち出すと今度はCSI vs UCS Normalizationで不毛な戦火の拡大が……
wchar_tとか不用意に持ち出すと今度はCSI vs UCS Normalizationで不毛な戦火の拡大が……
260デフォルトの名無しさん
2010/07/03(土) 23:33:30 >>250
eucjpロケールの環境で、ファイル名も全部eucjpで保存されてるのに、どっかの誰かがお構いなしにutf8で書いて文字化けしたら、
その人のためにわざわざlsをeucjpとutf8混在しててもちゃんと使えるように書き換えろって言うの?
> 結果で見ればそうだけど、ここはプログラム板。
関係がない。どこの板でも、表示上文字化けするかしないかは重要な基準。
eucjpロケールの環境で、ファイル名も全部eucjpで保存されてるのに、どっかの誰かがお構いなしにutf8で書いて文字化けしたら、
その人のためにわざわざlsをeucjpとutf8混在しててもちゃんと使えるように書き換えろって言うの?
> 結果で見ればそうだけど、ここはプログラム板。
関係がない。どこの板でも、表示上文字化けするかしないかは重要な基準。
261247
2010/07/03(土) 23:36:12262デフォルトの名無しさん
2010/07/03(土) 23:37:59263デフォルトの名無しさん
2010/07/03(土) 23:38:59264デフォルトの名無しさん
2010/07/03(土) 23:41:19265デフォルトの名無しさん
2010/07/03(土) 23:42:31 意図した通りってなんだよ。
ファイル名が「テスト」だとしてEUC-JPで書き込んだ場合と
UTF-8で書き込んだ場合、文字コードが違うのだから
それをあらわすバイナリ列も違う。
だから違うファイル名として扱うのが意図した動作だが?
逆に言えば、fopenはバイナリ列しか見ておらず
それがEUC-JPかUTF-8なのかは気にしていない。
わざわざ文字コードを変換する機能を入れるのが意図した動作だと?
ファイル名が「テスト」だとしてEUC-JPで書き込んだ場合と
UTF-8で書き込んだ場合、文字コードが違うのだから
それをあらわすバイナリ列も違う。
だから違うファイル名として扱うのが意図した動作だが?
逆に言えば、fopenはバイナリ列しか見ておらず
それがEUC-JPかUTF-8なのかは気にしていない。
わざわざ文字コードを変換する機能を入れるのが意図した動作だと?
266デフォルトの名無しさん
2010/07/03(土) 23:46:45 >>265
そしたら、君は何のためにファイル名に非ASCII文字を使うの?
そしたら、君は何のためにファイル名に非ASCII文字を使うの?
267デフォルトの名無しさん
2010/07/03(土) 23:50:03 酷い流れだ。もう結論これでいい?
表示上文字化けしないようにファイル作りたかったら、文字コード変換しろ。
表示上文字化けしてもバイナリ列が保存されていればどうでもいいなら、utf8使っても構わん。
表示上文字化けしないようにファイル作りたかったら、文字コード変換しろ。
表示上文字化けしてもバイナリ列が保存されていればどうでもいいなら、utf8使っても構わん。
268デフォルトの名無しさん
2010/07/03(土) 23:52:27269デフォルトの名無しさん
2010/07/03(土) 23:55:05 >>268
何使ってもいいけど、そんなキーボードで入力しにくいファイル名使って何がしたいの?
何使ってもいいけど、そんなキーボードで入力しにくいファイル名使って何がしたいの?
270デフォルトの名無しさん
2010/07/03(土) 23:55:48 >>268
じゃあ、Windowsじゃutf8でfopenは残念なことになるって思っていい?
じゃあ、Windowsじゃutf8でfopenは残念なことになるって思っていい?
271デフォルトの名無しさん
2010/07/04(日) 00:05:25 >>270
cygwin
cygwin
272デフォルトの名無しさん
2010/07/04(日) 00:12:23 >>269
確かにウムラウトとか入力しずらいね。
確かにウムラウトとか入力しずらいね。
273デフォルトの名無しさん
2010/07/04(日) 00:17:36 >>270
はい。残念なことになっています。
fopenはワイド文字を扱う場合は、_wfopenを使うようにと
一時期は使えない関数とされ、今は一応使えるようになりましたが、
標準を満たしていない独自の引数をとるようになりました。
もはや互換性の無い別物です。
はい。残念なことになっています。
fopenはワイド文字を扱う場合は、_wfopenを使うようにと
一時期は使えない関数とされ、今は一応使えるようになりましたが、
標準を満たしていない独自の引数をとるようになりました。
もはや互換性の無い別物です。
274デフォルトの名無しさん
2010/07/04(日) 00:33:55 >>272
うん。表示に拘らないのなら、半角英数だけで事足りる。ドットくらいは使うかもしれんが。
実際、人が読む必要がないキャッシュファイルやら一時ファイルはそういう風な名付け方になってることが多い気がする。
うん。表示に拘らないのなら、半角英数だけで事足りる。ドットくらいは使うかもしれんが。
実際、人が読む必要がないキャッシュファイルやら一時ファイルはそういう風な名付け方になってることが多い気がする。
275デフォルトの名無しさん
2010/07/04(日) 00:34:16 WindowsでfopenでUNICODE文字列のファイル名って開けるのか?
276デフォルトの名無しさん
2010/07/04(日) 00:36:42 http://www.game-create.com/archives/320
>
> よく使う標準関数の UNICODE 対応表を作ってみました。
>
> Windows では UNICODE 対応時と UNICODE 未対応時で
> 呼び出す関数を振り分ける必要がありますが、 _t で始まる
> 標準関数を使っておくことで、コンパイル時に自動的に関数を振り分けることができます。
あー、これは残念だw
>
> よく使う標準関数の UNICODE 対応表を作ってみました。
>
> Windows では UNICODE 対応時と UNICODE 未対応時で
> 呼び出す関数を振り分ける必要がありますが、 _t で始まる
> 標準関数を使っておくことで、コンパイル時に自動的に関数を振り分けることができます。
あー、これは残念だw
277デフォルトの名無しさん
2010/07/04(日) 00:41:32278デフォルトの名無しさん
2010/07/04(日) 00:52:11 >>275
言葉自体が曖昧。
まず、Windowsは内部ではファイル名をutf-16で管理してる。
そして、fopenは実装依存。とりあえずVC++のfopenで、日本語ロケールでの使用を想定する。
つまりfopenはcp932(sjisのMS拡張と思ってよし)でエンコードされたchar*をとって、内部でutf-16に変換してる。
そういう意味で、全ファイル名がUNICODE文字列であって、fopenではcp932を経由してUNICODE文字列のファイル名を開ける、と言える。
あるいは、cp932入れるべきところに強引にUNICODE文字列をねじこんで、
それをWindowsが内部でcp932のつもりでutf-16に変換したもの、という意味なら。
まず、それがファイル名として妥当なものになるのか(つまり、そんなファイル作れない。ないものは読めない)というのがひとつ。
次に、UNICODE文字列とはutf8か16か32か(あるいは7か...)。
16,32ならNULを含むことになって作れないだろうなぁ。
8なら、sjisのバックスラッシュ問題にコンパイラが対応してるか、ユーザが小細工してるか。
それによって別の文字になるので調整しないといけないが、うまくすれば読める。
言葉自体が曖昧。
まず、Windowsは内部ではファイル名をutf-16で管理してる。
そして、fopenは実装依存。とりあえずVC++のfopenで、日本語ロケールでの使用を想定する。
つまりfopenはcp932(sjisのMS拡張と思ってよし)でエンコードされたchar*をとって、内部でutf-16に変換してる。
そういう意味で、全ファイル名がUNICODE文字列であって、fopenではcp932を経由してUNICODE文字列のファイル名を開ける、と言える。
あるいは、cp932入れるべきところに強引にUNICODE文字列をねじこんで、
それをWindowsが内部でcp932のつもりでutf-16に変換したもの、という意味なら。
まず、それがファイル名として妥当なものになるのか(つまり、そんなファイル作れない。ないものは読めない)というのがひとつ。
次に、UNICODE文字列とはutf8か16か32か(あるいは7か...)。
16,32ならNULを含むことになって作れないだろうなぁ。
8なら、sjisのバックスラッシュ問題にコンパイラが対応してるか、ユーザが小細工してるか。
それによって別の文字になるので調整しないといけないが、うまくすれば読める。
279デフォルトの名無しさん
2010/07/04(日) 00:52:15 >>270
CP_UTF8ってのがあるよ。
CP_UTF8ってのがあるよ。
280デフォルトの名無しさん
2010/07/04(日) 01:02:09281デフォルトの名無しさん
2010/07/04(日) 01:09:25 WindowsではfopenにASCII非互換のSJISなどを
認めてしまったため、ASCII互換のものならなんでも受け付けられる
なんて変更は出来なかった。
そのためUNICODEに対応するには、fopenではない
別の関数を使うしかない。それが_wfopen(MS独自関数)ただし
これはUNICODE(UTF-16)限定のためWin9xでは動かない。
そのために_tfopenというマクロが作られた。これを使っていると
define定数でfopen、_wfopenどちらを使うか自動的に変更できる。
これは関数だけではなく、文字列も一緒で、L”文字列"なんて書き方をすると
自動的に変換してくれるがなんか_Tマクロとか_TEXTマクロとかいろいろあって
誰か、きれいにまとめて書いてくれ。
めちゃくちゃすぎてわからん。あぁ、fopenだけでUTF-8で
もEUC-JPにもなんにでも対応できるLinux楽だよ。
認めてしまったため、ASCII互換のものならなんでも受け付けられる
なんて変更は出来なかった。
そのためUNICODEに対応するには、fopenではない
別の関数を使うしかない。それが_wfopen(MS独自関数)ただし
これはUNICODE(UTF-16)限定のためWin9xでは動かない。
そのために_tfopenというマクロが作られた。これを使っていると
define定数でfopen、_wfopenどちらを使うか自動的に変更できる。
これは関数だけではなく、文字列も一緒で、L”文字列"なんて書き方をすると
自動的に変換してくれるがなんか_Tマクロとか_TEXTマクロとかいろいろあって
誰か、きれいにまとめて書いてくれ。
めちゃくちゃすぎてわからん。あぁ、fopenだけでUTF-8で
もEUC-JPにもなんにでも対応できるLinux楽だよ。
レスを投稿する
ニュース
- 中国側が首相答弁の撤回要求、日本側拒否 [夜のけいちゃん★]
- 債券・円・株「トリプル安」に…長期金利1.755%まで上昇、円は対ユーロで史上最安値 [蚤の市★]
- 日本行き空路49万件キャンセル 中国自粛呼びかけ 日本行きチケット予約の約32%に相当 ★5 [ぐれ★]
- 映画「鬼滅の刃」の興行収入急減、日本行き航空券大量キャンセル…中国メディア報道 [蚤の市★]
- 【音楽】Perfume・あ~ちゃんの結婚相手「一般男性」は吉田カバンの社長・吉田幸裕氏(41) 高身長で山本耕史似 [Ailuropoda melanoleuca★]
- 【大分】佐賀関で大規模火災、170棟以上が延焼中 70代男性1人と連絡取れず [ぐれ★]
- フランス「G7に習近平主席を呼びたい」ドイツ「良い考えだ」 高市さん...? [237216734]
- 麻生太郎氏、高市政権と距離を置きはじめる(´・ω・`) [399259198]
- 【悲報】中国営業に熱心な日本人タレントたち、中国のイベントが続々と中止に… まだ予定中のアイドルとか歌手とかたくさんいるけど [452836546]
- 自閉症が「んなっしょい」と連呼するお🏡
- 【悲報】高市効果で「1ドル=160円」が相場へwwwwwwwwwwwwwwwwwwwwwwwwwwwww 止まらぬ高市円安💥💥 [871926377]
- 【悲報】SP500今日も暴落で完全に世界恐慌。高市恐慌として全世界で語り継がれそう [686538148]
