前スレ
C++相談室 part157
https://mevius.5ch.net/test/read.cgi/tech/1628474251/
探検
C++相談室 part158
■ このスレッドは過去ログ倉庫に格納されています
2021/11/15(月) 18:49:18.44ID:I69rZ/Of
2デフォルトの名無しさん
2021/11/15(月) 19:34:54.43ID:Vm/7t1d8 前スレが在るのに後ろスレが無い。
2021/11/15(月) 19:54:16.81ID:ebGnmMes
2021/11/15(月) 22:07:48.56ID:Rt8JG1Np
Windows10でrecursive_directory_iterator使うと全角ファイル名が化けまくるんだけど
これwstringバージョンないよね
使い物にならないってこと?
これwstringバージョンないよね
使い物にならないってこと?
5ハノン ◆QZaw55cn4c
2021/11/15(月) 22:13:18.15ID:a976/UsH >>4
Windows でファイルシステムを操作するなら、もう utf16/W 系を陽に使うしかないのでは
https://mevius.5ch.net/test/read.cgi/tech/1434079972/53
Windows でファイルシステムを操作するなら、もう utf16/W 系を陽に使うしかないのでは
https://mevius.5ch.net/test/read.cgi/tech/1434079972/53
6デフォルトの名無しさん
2021/11/15(月) 23:03:16.81ID:Vm/7t1d8 江添さんもRustに行ってしまわれたか。
2021/11/15(月) 23:22:01.05ID:7YmnbmLD
なんにも確認してないがrecursive_directory_iteratorはpath扱うだけのはずで
wstring云々いいだすのがもう怪しい
wstring云々いいだすのがもう怪しい
2021/11/15(月) 23:27:59.81ID:Rt8JG1Np
だからそう言ってるんだけど
2021/11/15(月) 23:35:44.25ID:ebGnmMes
アメ公は多言語のことはあまり考えてないからな
2021/11/16(火) 10:04:00.19ID:5D9mKY7b
wstringなら解決すると思ってる時点で頭可笑しい
2021/11/16(火) 10:09:17.13ID:1zCm/6d5
全世界の文字集めたらWORDじゃ足りないことくらいアメ公でなければすぐわかりそうだが
2021/11/16(火) 11:21:28.45ID:ZG22qfv2
>>11
でも、ハングル文字は、28文字しかないのに 5000ポイントも使っていたり、
元々文字じゃなかった絵文字を勝手に文字の様に扱ったりして行って
肥大化しただけで、世界の文字自体はそんなに多くない。
ユニコードの文字の扱い方に問題が有るんだと思う。
でも、ハングル文字は、28文字しかないのに 5000ポイントも使っていたり、
元々文字じゃなかった絵文字を勝手に文字の様に扱ったりして行って
肥大化しただけで、世界の文字自体はそんなに多くない。
ユニコードの文字の扱い方に問題が有るんだと思う。
2021/11/16(火) 11:32:32.20ID:ZG22qfv2
>>12
ハングルは、子音、母音、パッチムは、それぞれ20〜30程度しかないが、
それを組み合わせて1文字に組み立てられているらしくて、組み合わせ爆発で、
1万1000文字を越える。
全ての組み合わせが使われているわけではない。
また、実際に使用される文字は2500文字ほどらしい。
表意文字である漢字は、どうしようもないが、単なる表音文字に過ぎない
ハングルに、Unicodeは、1万1000ポイント以上を割り当ててしまってる。
しかし、漢字も滅多に使わない文字を含めても1万5000文字くらいで、
アラビア文字も28文字くらいしかないそうだから、世界で使われている
本当の文字は、恐らく、4万文字もあれば足りるはず。
ユニコードが16BITで表しきれない以上に厄介なのは、UTF8で表現した時に、
50文字しかないひらがなまで 3バイトになっていること。
カタカナまであわせても100程度しかないのに。
さすがに、アメリカ人の傲慢さを感じざるを得ない。
こんな文字コードを一生使い続けると考えるとうんざりするので、
多分、これが終わりではないだろう。
むしろ、これで終わりにしてはならない。
ハングルは、子音、母音、パッチムは、それぞれ20〜30程度しかないが、
それを組み合わせて1文字に組み立てられているらしくて、組み合わせ爆発で、
1万1000文字を越える。
全ての組み合わせが使われているわけではない。
また、実際に使用される文字は2500文字ほどらしい。
表意文字である漢字は、どうしようもないが、単なる表音文字に過ぎない
ハングルに、Unicodeは、1万1000ポイント以上を割り当ててしまってる。
しかし、漢字も滅多に使わない文字を含めても1万5000文字くらいで、
アラビア文字も28文字くらいしかないそうだから、世界で使われている
本当の文字は、恐らく、4万文字もあれば足りるはず。
ユニコードが16BITで表しきれない以上に厄介なのは、UTF8で表現した時に、
50文字しかないひらがなまで 3バイトになっていること。
カタカナまであわせても100程度しかないのに。
さすがに、アメリカ人の傲慢さを感じざるを得ない。
こんな文字コードを一生使い続けると考えるとうんざりするので、
多分、これが終わりではないだろう。
むしろ、これで終わりにしてはならない。
2021/11/16(火) 11:40:54.61ID:ZG22qfv2
[追加]
ユニコードの文字数が多い点に関して:
・16BITで表現できない文字の大部分は絵文字。
・数学記号などは数学を扱う時に必須なのに、重要な数学記号が沢山不足している。
つまり、非常に使用頻度が高い記号が含まれてない。
・逆にどうでもいいような変な遊びの記号などが大量に入っている。
別にそれはグラフィックで書けばいいのに。
数学記号などは文書の中でも使えるし、学問的にも昔から良く使われているのに
なぜかユニコードには含まれてないものが沢山ある。
それに、呼び方や起源は同じでても、数学的には異なる意味を持つコードが1つに
割り当てられていたり、πが四角く表示されて、数学では絶対に使わないグリフ
になってしまっていたりする。
基礎的な数学まで知らないばかが考えたとしか思えないし、それが
何十年間も改善されてない。
ユニコードは欠陥コード。
ユニコードの文字数が多い点に関して:
・16BITで表現できない文字の大部分は絵文字。
・数学記号などは数学を扱う時に必須なのに、重要な数学記号が沢山不足している。
つまり、非常に使用頻度が高い記号が含まれてない。
・逆にどうでもいいような変な遊びの記号などが大量に入っている。
別にそれはグラフィックで書けばいいのに。
数学記号などは文書の中でも使えるし、学問的にも昔から良く使われているのに
なぜかユニコードには含まれてないものが沢山ある。
それに、呼び方や起源は同じでても、数学的には異なる意味を持つコードが1つに
割り当てられていたり、πが四角く表示されて、数学では絶対に使わないグリフ
になってしまっていたりする。
基礎的な数学まで知らないばかが考えたとしか思えないし、それが
何十年間も改善されてない。
ユニコードは欠陥コード。
2021/11/16(火) 11:45:03.78ID:ZG22qfv2
>>14
円周率の意味での「パイ」(PI)は、数学では必ず小文字で、かつ、丸みを帯びた
おなじみの記号を使い、決して、門構えのようなπは使わないし、
数学の本では見た事が無い。しかし、ユニコードではそれが標準になっており、
誰が使うのという感じがする。
もう一つは、φの記号。物理学で、磁束を表すのは、くるっと回るφ。
数学の空集合のファイは、ドーナツに棒を貫通させたようなグリフ。
しかし、ユニコードでは両者の区別が訳が分からないことになっていて、
困る。
あとは、⇔の記号が、横方向はあるが、縦方向が無いらしいこと。
これは最悪。
円周率の意味での「パイ」(PI)は、数学では必ず小文字で、かつ、丸みを帯びた
おなじみの記号を使い、決して、門構えのようなπは使わないし、
数学の本では見た事が無い。しかし、ユニコードではそれが標準になっており、
誰が使うのという感じがする。
もう一つは、φの記号。物理学で、磁束を表すのは、くるっと回るφ。
数学の空集合のファイは、ドーナツに棒を貫通させたようなグリフ。
しかし、ユニコードでは両者の区別が訳が分からないことになっていて、
困る。
あとは、⇔の記号が、横方向はあるが、縦方向が無いらしいこと。
これは最悪。
2021/11/16(火) 12:42:55.75ID:c8tWUMdh
空集合記号とギリシャ文字のファイを混同してるような無知に文句つけられてUnicodeも大変だな
17デフォルトの名無しさん
2021/11/16(火) 13:52:17.07ID:5D9mKY7b TeX
2021/11/16(火) 14:00:17.37ID:5D9mKY7b
ΦφФфΦɸØø∅⌀
Φ
Φ
Φ
φ
φ
φ
ϕ
ϕ
Φ
Φ
Φ
φ
φ
φ
ϕ
ϕ
2021/11/16(火) 14:03:02.78ID:5D9mKY7b
20はちみつ餃子 ◆8X2XSCHEME
2021/11/16(火) 15:34:16.32ID:aaOD7qrs そもそもが世界中の言語の発展は場当たり的な習慣の積み重ねを何千・何万年と続けてきてグダグダなんだから
それをどうがんばって整理しようとしたところでグダグダなんだわ。
元からグダグダだったのが Unicode のグダグダさとしても表れてきただけ。
言語ごと作り直しでもしない限り綺麗な符号体系にならないんで、
グダグダさと折り合いをつけてつきあっていくしかしょうがない。
それをどうがんばって整理しようとしたところでグダグダなんだわ。
元からグダグダだったのが Unicode のグダグダさとしても表れてきただけ。
言語ごと作り直しでもしない限り綺麗な符号体系にならないんで、
グダグダさと折り合いをつけてつきあっていくしかしょうがない。
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- ネット殺到「高市総理の責任」「完全に高市リスク」「負けるな」中国が水産物輸入停止→流石に総理批判の声も「どう責任取る?」 ★7 [樽悶★]
- 「二枚舌は許されない」中国外務省 高市総理の発言を批判… [BFU★]
- 【速報】公然わいせつの疑いで逮捕・送検・略式起訴のAぇ! group 草間リチャード敬太メンバー 脱退を発表 「心の病の療養」に専念 [Ailuropoda melanoleuca★]
- 中国国際航空が日本便を減便へ、春節休みも SNSでは投稿相次ぐ [七波羅探題★]
- ネット殺到「高市総理の責任」「完全に高市リスク」「負けるな」中国が水産物輸入停止→流石に総理批判の声も「どう責任取る?」 ★8 [樽悶★]
- 風呂場で若い女性死亡 全身にあざ、交際相手が通報―警視庁 [蚤の市★]
- 【悲報】高市有事、中国から追加の報復措置が来る模様 [834922174]
- 恐ろしい😈のちゅちょちゅちょ・ちぇびるのお🏡
- PRESIDENTオンライン「習近平は明らかに焦り始めている…高市首相が中国をぎゃふんと言わせるための4つの切り返し」 [399259198]
- 【悲報】立憲岡田「間違った答弁をした高市総理に問題がある」→愛国者ブチギレ炎上 [834922174]
- 【高市悲報】日本政府、またウソがバレる。中国「撮影してたのは日本メディア」 [834922174]
- 【高市悲報】中国→日本の貨物便、死ぬほど運賃が上昇してる模様。。今後大幅値上げラッシュ来るぞ [467637843]
