X



文字コードの種類は何故複数あるのでしょうか?
0278デフォルトの名無しさん
垢版 |
2010/07/04(日) 00:52:11
>>275
言葉自体が曖昧。
まず、Windowsは内部ではファイル名をutf-16で管理してる。
そして、fopenは実装依存。とりあえずVC++のfopenで、日本語ロケールでの使用を想定する。
つまりfopenはcp932(sjisのMS拡張と思ってよし)でエンコードされたchar*をとって、内部でutf-16に変換してる。

そういう意味で、全ファイル名がUNICODE文字列であって、fopenではcp932を経由してUNICODE文字列のファイル名を開ける、と言える。

あるいは、cp932入れるべきところに強引にUNICODE文字列をねじこんで、
それをWindowsが内部でcp932のつもりでutf-16に変換したもの、という意味なら。

まず、それがファイル名として妥当なものになるのか(つまり、そんなファイル作れない。ないものは読めない)というのがひとつ。
次に、UNICODE文字列とはutf8か16か32か(あるいは7か...)。
16,32ならNULを含むことになって作れないだろうなぁ。
8なら、sjisのバックスラッシュ問題にコンパイラが対応してるか、ユーザが小細工してるか。
それによって別の文字になるので調整しないといけないが、うまくすれば読める。
0281デフォルトの名無しさん
垢版 |
2010/07/04(日) 01:09:25
WindowsではfopenにASCII非互換のSJISなどを
認めてしまったため、ASCII互換のものならなんでも受け付けられる
なんて変更は出来なかった。

そのためUNICODEに対応するには、fopenではない
別の関数を使うしかない。それが_wfopen(MS独自関数)ただし
これはUNICODE(UTF-16)限定のためWin9xでは動かない。
そのために_tfopenというマクロが作られた。これを使っていると
define定数でfopen、_wfopenどちらを使うか自動的に変更できる。

これは関数だけではなく、文字列も一緒で、L”文字列"なんて書き方をすると
自動的に変換してくれるがなんか_Tマクロとか_TEXTマクロとかいろいろあって
誰か、きれいにまとめて書いてくれ。

めちゃくちゃすぎてわからん。あぁ、fopenだけでUTF-8で
もEUC-JPにもなんにでも対応できるLinux楽だよ。
0283デフォルトの名無しさん
垢版 |
2010/07/04(日) 07:56:21
_Tマクロとか_TEXTマクロとかWindowsのマクロの種類は何故複数あるのでしょうか?
0300デフォルトの名無しさん
垢版 |
2010/07/30(金) 20:17:12
>>299
ここも隔離スレっぽいよ。
0301デフォルトの名無しさん
垢版 |
2010/08/05(木) 08:30:33
コードの種類は何故複数あるのでしょうか?
ストレートとクロスの見分けが付きません。
0305デフォルトの名無しさん
垢版 |
2010/08/10(火) 12:56:48
>>302
イカリソース
0306デフォルトの名無しさん
垢版 |
2010/09/12(日) 08:49:08
>>302
カゴメ
0309デフォルトの名無しさん
垢版 |
2010/09/13(月) 07:34:49
ソースの種類は何故複数あるのでしょうか?
ソースを買ってくるように頼まれてソイソースを買ってきたら怒られました。
0310デフォルトの名無しさん
垢版 |
2010/09/13(月) 16:04:42
そりゃ醤油はソースとは認められないからな。
次はちゃんとソースを買ってくるんだぞ。
0311デフォルトの名無しさん
垢版 |
2010/09/13(月) 16:38:52
>>283 自分用メモ
WindowsSDKレベルではではTCHARとTEXTか__TEXTのみ有効
その他はCランタイムのもので混用すべきではない
0316デフォルトの名無しさん
垢版 |
2010/09/14(火) 07:45:04
それは言語機能でMSは関係ないな
もっともMS以外ではワイド文字がUTF-16とは限らないけど
0317デフォルトの名無しさん
垢版 |
2010/09/25(土) 17:10:40
もっとも、 <windows.h>の中のどこかのヘッダで以下のような旨の記述があり、
「_UNICODEとUNICODEのどちらか一方は定義してあるけど、もう片方は定義されていない」
という状況を排除しているので、_TとTEXTを混在させても問題ない。
#ifdef UNICODE
#ifndef _UNICODE
#define _UNICODE
#endif
#endif

#ifdef _UNICODE
#ifndef UNICODE
#define UNICODE
#endif
#endif
0318デフォルトの名無しさん
垢版 |
2010/10/09(土) 19:23:25
>>302
どろソース
0319デフォルトの名無しさん
垢版 |
2011/01/16(日) 14:27:02
そーすね
0320デフォルトの名無しさん
垢版 |
2011/04/15(金) 13:28:40.29
>>302
オリバー
0325森& ◆vjMeDi2lEM
垢版 |
2011/06/24(金) 00:06:15.57
森鴎外の「鴎」は正しくは「鷗」である。
草なぎ剛
草g剛

北朝鮮に文字コードは割り振られているのか?

マイクロソフトは、南朝鮮の町工場に北の象形文字をOSに実装してくれと
懇願されたが拒否したらしいが。直接北から要求しなかった。
北は南と文字が異なっているのか。

unicodeに北文字あったか?存在するなら規格票、文献を提示してくれ。

0326uy ◆hi.ht/Isu2
垢版 |
2011/06/29(水) 06:19:43.43
>マイクロソフトは、南朝鮮の町工場に北の象形文字をOSに実装してくれと
>懇願されたが拒否したらしいが。直接北から要求しなかった。
>北は南と文字が異なっているのか。


日本語勉強しろよゴミカスが

マジでゴミなんだな
0327デフォルトの名無しさん
垢版 |
2011/10/25(火) 22:25:08.62
      ∩___∩
      | ノ      ヽ
     /  ●   ● |
     |    ( _●_)  ミ
    彡、   丶 ノ  、`
   / __/ ⌒`\/⌒/
   (___)  .  /  ( )
    |   ⌒`\//⌒
    入_ へ  \_ へ  \_
 @三三三三 (____)三(____)三三)
0328デフォルトの名無しさん
垢版 |
2011/10/25(火) 22:39:19.15
>>325
金正日を意味する特殊な文字が追加されてるらしいんだな。漢字で言うと「朕」みたいなもんだろ。
0333デフォルトの名無しさん
垢版 |
2011/10/30(日) 10:23:28.18
     ∧_∧
 ピュー (  ^^ ) <これからも山崎を応援して下さいね(^^)。
  =〔~∪ ̄ ̄〕
  = ◎――◎                      山崎渉
0334デフォルトの名無しさん
垢版 |
2011/12/13(火) 16:57:33.87
__∧_∧_
 |(  ^^ )| <寝るぽ(^^)
 |\⌒⌒⌒\
 \ |⌒⌒⌒~|         山崎渉
0339デフォルトの名無しさん
垢版 |
2012/01/04(水) 11:38:46.62
IVSは同一字形でも包摂しない、という原則じゃなかったっけ?というか同一字形かどうか
わからないから、だったかも。そもそもIVSで区別されているのはグリフであって文字ではないわけで。
0340デフォルトの名無しさん
垢版 |
2012/07/25(水) 17:25:52.49
0341デフォルトの名無しさん
垢版 |
2012/08/22(水) 23:46:05.05
>>322
・文字集合はIBMホストコードに合わせてあって
・符号の順序はJIS順になっていて
・1978年版、1983年版、1990年版をそつなくこなし
・JISの水準外の文字はJISの区点内にも区点外のどちらにもある
とどめに
・半角カタカナと一緒に使える
ってことだな
0342デフォルトの名無しさん
垢版 |
2012/10/07(日) 12:14:01.29
0343デフォルトの名無しさん
垢版 |
2012/11/29(木) 11:16:09.54
空揚げ
0346デフォルトの名無しさん
垢版 |
2012/12/01(土) 00:25:34.28
>>345
0348デフォルトの名無しさん
垢版 |
2014/08/29(金) 20:54:32.09ID:IGXHweHY
★2ch勢いランキングサイトリスト★

☆ +ニュース板
・ 2NN
・ 2chTimes
☆ +ニュース板新着
・ 2NN新着
・ Headline BBY
・ Unker
☆ ニュース板他
・ Desktop2ch
・ 記者別一覧
・ スレッドランキング
☆ 全板
・ 全板縦断勢いランキング
・ 2勢
・ READ2CH
・ i-ikioi

※ 要サイト名検索
0350デフォルトの名無しさん
垢版 |
2014/11/19(水) 16:18:55.03ID:JZ2oYyd9
ㄘんㄘんㄟ⁰ㄋㄟ⁰ㄋㄜㄝㄋ
0351デフォルトの名無しさん
垢版 |
2014/11/19(水) 18:54:03.45ID:g6yRyndh
だいたい1バイトのアスキーコードを、2バイトにして日本語を
表示できるようにしたり、それをさらに、3バイトとか4バイトに
増やすとか、チマチマそんなことしてきたから、いろんな文字コード
作られてワケワカメになったんだろ。
もうこの際、全ての言語や記号など全部表せるように、
文字コードは1文字16バイトくらいにして、
全ての文書にこのコードを使う事を強制すればいい。
16バイトもあれば、困ることは無いだろう。
0353デフォルトの名無しさん
垢版 |
2014/11/20(木) 00:22:16.17ID:8wQd6afC
>>351
これ、釣りなのかな。
0354デフォルトの名無しさん
垢版 |
2014/11/20(木) 10:27:23.90ID:EmAWw9wC
(。☉౪ ⊙。)
(。◕ฺˇε ˇ◕ฺ。)
(。◕ิ_◕ิ。)
(。◕ˇдˇ​◕。)
(。◕ˇ_ˇ◕。)
(。╹ω╹。)
(。╹ω╹。)
(。≖ิ‿≖ิ);
(。•́︿•̀。)
(。ó .̫ ò。)
(。´ސު`。)
色々あるんやね
0357デフォルトの名無しさん
垢版 |
2016/03/29(火) 09:28:41.71ID:/c8bAcK4
サッカーブッシュ日本代表日程ぷあたん(しゅっちょうまいくろ教育長交代)春文執行40代売上差額シュガーチョコ
https://www.youtube.com/watch?v=NDq1QoJY0nY宇ドナルドアナリストパワーストーンコーチングとしまえん
サッカーブッシュ日本代表日程古本屋よしたけしゅっちょうちょこしゅがー
ディーラー税務署天才開発者死亡詰みヨミドクターマイクロサービス不足
サッカーブッシュ日本代表日程ぷあたんシフト光金さかい強制バイト人権侵害問題
春分資源執行ニューヨーク低原価ぼったステーキソルトレイク福岡横浜新橋奴隷課金パチシフト強制バイト問題新潟米センター生残
コスメ24チャリティー隠れ40代生活保護プレイボーイバイトレードいたりあん接待問題
マスコミKARDローンケーオーサービス不足婚活パーティー寄付金執行原発ビジネス
FBIチャイニーズタイホテル売上事務所ガチャ決算ガチャキャンペーン(販売報道陣過激派組織向携帯最新情報提供終了
校長発言細心注意ノートン産廃エラー(著作権クレーム中国反応融資高額教育費)(中国捕鯨団体40代社員サッカーコメント
高額入学金ヤフウ新橋大学ヤフウ新橋理事長FX経費 おじや50代資産ガリバズフィード40代エリート
0358デフォルトの名無しさん
垢版 |
2016/08/29(月) 19:33:30.09ID:sf9PpAXO
1978年
JIS C 6226が成立。

1981年
当用漢字表が廃止されて常用漢字表が告示される。
それまでの1850字に95字が追加され1945字になる。
その95字が全てJIS第一水準。一体何があったのか。
0359358
垢版 |
2016/08/29(月) 19:39:42.82ID:sf9PpAXO
ここで勝手に憶測。
1.
78JISが成立した時点で、文部省が通産省に圧力をかけて、将来の常用漢字に
入れたくない字を無理やり第2水準に追いやった。

2.
常用漢字表を作る際に、第2水準の字を加える事を第2水準であるという理由で拒否。
何としてでもなるべく字を増やしたくないという口実にJISが利用された。
0360358
垢版 |
2016/08/29(月) 21:29:18.35ID:sf9PpAXO
2010年11月30日
常用漢字表改定
196字追加、5字削除、2136字となる。
1881年とは時代が違う社会が違う、という事か、JIS第2水準の字も多く追加された。
第3、第4水準の字すら入っている。
もしJISの83改定がなければ殆ど第2水準で済んでいた。
0361358
垢版 |
2016/09/02(金) 16:08:22.98ID:YK1p9+vc
文部科学省の常用漢字表にはJISコードが記載されていない。まさに縦割り行政だ。
常用漢字の通し番号も無い。
一般的にはこれで困る人はいない。だがそれでいいのか。
法律の如き、あるいは数学の如き厳密さを求めると、常用漢字表の字とJIS規格票の字が
同じ字であるとは見なせない。
民間の漢和辞典にはJISコードの記載があるが、その厳密な根拠はどこにも無いという事になる。
国が率先して論理的思考を実践してほしい。
0362デフォルトの名無しさん
垢版 |
2016/12/07(水) 00:05:59.62ID:34HNZ6/r
意味もなく Age。
JIS漢字にしても、まるぶん漢字にしても、日常生活に結構影響が出ている。
同級生のパパ、議員やっていたんだが、該当する漢字がなくて、全部当て字で済ましている。
姓の歴史を見ればわかる通り、明治の初めに姓が法制化された。
漢字が書けないことが多くて、近所(?、1泊で往復できるぐらいの距離)のエライ坊さんのところに行って漢字を教えてもらった。
これが、同音の文字を崩して、別の意味を持たせた。
地名も同様なものがある。
社名も、鉄を使わない(金を失う)ではなく、旧字を使うとロコがある。

Toron コードでは大体そろっていたはずなんだけど、見ていないからわからない。
0364デフォルトの名無しさん
垢版 |
2016/12/11(日) 14:59:51.79ID:pm6ghExK
>>1
マイナーな文字コードは徹底的に無視して、淘汰すればいい
「サポートしなければならない」という糞みたいな固定観念を
捨てることが大事。
0365デフォルトの名無しさん
垢版 |
2016/12/24(土) 00:11:12.03ID:tCnPOkaj
漢字コードは浮動小数点数コードにしとけばよかったんだよな
0368デフォルトの名無しさん
垢版 |
2017/02/09(木) 16:30:11.04ID:8bYRq8V4
最初5bitから始まった話とかロッキングシフトの話とかからの話から始まると思ったら、ここまで出てこないのは何なの?
0369デフォルトの名無しさん
垢版 |
2017/08/29(火) 22:15:11.99ID:MJTdI4fF
ローマ字で日本語の長音を表現するのにサーカムフレックスまたはマクロンの付いた
アルファベットが有ると便利。というか必要。
しかしこれが長い間JISに採用されなかった。
ローマ字主義者と反対派の血みどろの戦いが繰り広げられ、ローマ字主義者が
負け続けたのだろうか。
0370デフォルトの名無しさん
垢版 |
2018/01/08(月) 11:02:55.15ID:szpKYJOz
ユニコードですら絵文字で大混乱してるからな
0371デフォルトの名無しさん
垢版 |
2018/01/08(月) 12:10:38.61ID:g3wGVkXu
明らかに文字化けって判るような壊れ方ならまだいいけど

送信側が↑↑↑で送信してるのに
受信側で↓↓↓って表示されてたり

って普通にあるからなー
0377デフォルトの名無しさん
垢版 |
2018/01/28(日) 15:12:12.86ID:Erw8GBm0
>>368
おお、同志よ。

たぶん、文字コードに詳しく無い人が多いからだろうね。
ここにいる人達はあまり詳しい人がいないみたい。
俺も詳しく無いけど。

混迷期の読み物を興味深く読むのは面白い。
レスを投稿する


ニューススポーツなんでも実況