Windows NTは初代からUnicodeがネイティブの文字コードです。cp932ではありません。
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。
■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
文字コード総合スレ Part10 http://mevius.2ch.net/test/read.cgi/tech/1444822140/
文字コード総合スレ Part11 https://mevius.5ch.net/test/read.cgi/tech/1516629503/
文字コード総合スレ Part12 https://mevius.5ch.net/test/read.cgi/tech/1544931495/
文字コード総合スレ part13
https://mevius.5ch.net/test/read.cgi/tech/1593777227/
探検
文字コード総合スレ part14
■ このスレッドは過去ログ倉庫に格納されています
2023/03/03(金) 15:46:58.08ID:yKqwMGHT
564デフォルトの名無しさん
2024/02/20(火) 00:03:22.85ID:HesmWnzZ そりゃそうだろうよ
565デフォルトの名無しさん
2024/02/20(火) 08:17:36.44ID:72vUKQN+ >>563
え? 某OS上の某キーボードの中の人だったが、逆向きにしたぞ
UIは基本的に左右が逆
あと、括弧や不等号を入力すると逆向きになったりする
おかげで一時期頭がアラビア語脳だった
しかし、日本も戦争に負けなければ「右から左に文字を書く文化圏」なんて
他人事じゃなかったはず
アメ公のせいじゃけんのう。くやしいのう
え? 某OS上の某キーボードの中の人だったが、逆向きにしたぞ
UIは基本的に左右が逆
あと、括弧や不等号を入力すると逆向きになったりする
おかげで一時期頭がアラビア語脳だった
しかし、日本も戦争に負けなければ「右から左に文字を書く文化圏」なんて
他人事じゃなかったはず
アメ公のせいじゃけんのう。くやしいのう
566デフォルトの名無しさん
2024/02/21(水) 00:09:55.88ID:Tatd9Vu2 あれ、でも実はそうかな?
念の為、競合の某大手のもチェック.... OK,、仲間発見。
焦るじゃないか。いい加減なこと言うんじゃない
念の為、競合の某大手のもチェック.... OK,、仲間発見。
焦るじゃないか。いい加減なこと言うんじゃない
567デフォルトの名無しさん
2024/02/21(水) 00:24:01.03ID:Tatd9Vu2 ああ、OSによってはリターンキーのデザインとかキーボードの言語でなく
UIの言語で決めていたのもあったような気がするな
くそっ、俺にとって今はどうでもいい事なのに気になるじゃないかw
UIの言語で決めていたのもあったような気がするな
くそっ、俺にとって今はどうでもいい事なのに気になるじゃないかw
568デフォルトの名無しさん
2024/02/23(金) 13:32:00.44ID:y/vtB73j569デフォルトの名無しさん
2024/02/23(金) 14:11:14.91ID:zZg+pKnE 文字は右から左だけど、数字は左から右だったような
日本語で表現すると「すーまりいはータッリ30ンリソガ」みたいな感じ
日本語で表現すると「すーまりいはータッリ30ンリソガ」みたいな感じ
570デフォルトの名無しさん
2024/02/23(金) 14:21:21.57ID:7PfXlp3P 数字をリトルエンディアンで表記していると考えると自然。
571デフォルトの名無しさん
2024/02/23(金) 23:20:37.86ID:ZR6D6MGM 日本語は中国語と同様に元々縦書きで右から左に行が移る言語なので、横書きした場合は右から左に書いていた。1行の長さが1文字になったみたいな感覚だ。だから戦前戦中は横書きというと右から左に書いてあるのが多い。
これが左から右の英語と同じようにした理由は戦後英語から翻訳した文を下に書く時に見易いから。
これが左から右の英語と同じようにした理由は戦後英語から翻訳した文を下に書く時に見易いから。
572デフォルトの名無しさん
2024/02/23(金) 23:36:24.87ID:BOi6B7hI 左から右の横書きは戦後ではなくそれよりもずっと前からだよ
あくまで右から左がなくなったのが戦後というだけの話
あくまで右から左がなくなったのが戦後というだけの話
573デフォルトの名無しさん
2024/02/24(土) 21:11:27.48ID:hGTo+fc5574デフォルトの名無しさん
2024/02/25(日) 21:12:56.55ID:Cch9zGyp575デフォルトの名無しさん
2024/02/25(日) 23:52:14.62ID:IA0XC+Pj >>574
アラビア文字のおハナシ
アラビア文字のおハナシ
576デフォルトの名無しさん
2024/02/27(火) 11:38:12.52ID:EbapOQdH >>575
もちろんそうですが何か? というか右->左の言語一般かな。ヘブライとかも
難しいのは言語の境界で、例えば「ガソリン30はいりまーす」だとして、
「ガソリン」が英語、「30はいりまーす」が日本語(右->左)だと思えば
「すーまりいは30ガソリン」となるが、「ガソリン30」で区切れると判断してしまうと
「すーまりいはガソリン30」と、違う結果になってしまう
あるあるだよね〜
もちろんそうですが何か? というか右->左の言語一般かな。ヘブライとかも
難しいのは言語の境界で、例えば「ガソリン30はいりまーす」だとして、
「ガソリン」が英語、「30はいりまーす」が日本語(右->左)だと思えば
「すーまりいは30ガソリン」となるが、「ガソリン30」で区切れると判断してしまうと
「すーまりいはガソリン30」と、違う結果になってしまう
あるあるだよね〜
577デフォルトの名無しさん
2024/02/27(火) 14:32:58.93ID:0J04Un9A 縦日
に本
書語
けな
ら
に本
書語
けな
ら
578デフォルトの名無しさん
2024/02/28(水) 01:29:44.98ID:anWSvM2g MS-IMEのせいで丸印が、漢数字の零(ゼロ)に置き換わってしまった。
日本マイクロソフトは常に中国人に日本語を担当させているから、取り返しのつかない事態になってしまった。
日本マイクロソフトは常に中国人に日本語を担当させているから、取り返しのつかない事態になってしまった。
579デフォルトの名無しさん
2024/02/28(水) 15:41:15.50ID:lyPNcJHE 嘘も百回言えば真実となるってやつか
580デフォルトの名無しさん
2024/02/28(水) 19:33:10.15ID:anWSvM2g 漢数字はフォントによっては真円じゃないからな。
潰れた丸印だと何これと思う未来がみえる。
潰れた丸印だと何これと思う未来がみえる。
581デフォルトの名無しさん
2024/03/05(火) 01:45:14.40ID:7S/8Mxza 区切り文字としてHorizontal Tabは使われているが
Vertical TabはTSV形式でも使われていないよね
他にも0x1C-0x1FのFS GS RS USも区切り文字として想定されているのに使われていない
Vertical TabはTSV形式でも使われていないよね
他にも0x1C-0x1FのFS GS RS USも区切り文字として想定されているのに使われていない
582デフォルトの名無しさん
2024/03/05(火) 18:49:24.75ID:AgmV2Z5M oO0◯○。゜❍〇⁰
583デフォルトの名無しさん
2024/03/07(木) 05:14:15.03ID:bENjjFCg UTF-8で記号がたくさん登録されてしまったのも問題だよな
ハイフンのような横棒は種類がたくさんあって、文字フォントの見た目では区別できなようなものもある。
ハイフンのような横棒は種類がたくさんあって、文字フォントの見た目では区別できなようなものもある。
584デフォルトの名無しさん
2024/03/07(木) 16:55:28.90ID:vq4kvo+w それよりもはるかに深刻なのはスペースに見える文字がたくさんあって
スペースを取り除くプログラムを書くのが不可能に近い
スペースを取り除くプログラムを書くのが不可能に近い
585デフォルトの名無しさん
2024/03/07(木) 17:41:11.51ID:Km2D9ufH \s \p{Zs}以外は知りませんではダメ?
586デフォルトの名無しさん
2024/03/08(金) 17:23:14.35ID:LipF0GJv >>584
近いだけで不可能ではないので大丈夫
近いだけで不可能ではないので大丈夫
587デフォルトの名無しさん
2024/03/09(土) 19:20:37.58ID:xWVzZbl0 Unicodeの正規表現でいける?
588デフォルトの名無しさん
2024/03/09(土) 20:38:58.52ID:v2bDUg3+ 正規表現じゃ無理に近い
素直にブラックリストです
素直にブラックリストです
589デフォルトの名無しさん
2024/03/09(土) 21:24:45.91ID:HJGXBhOf >>587
正規表現はASCII文字くらしか想定していないが、UTF-8のASCII文字限定であれば問題ない。
正規表現はASCII文字くらしか想定していないが、UTF-8のASCII文字限定であれば問題ない。
590デフォルトの名無しさん
2024/03/09(土) 23:16:58.67ID:fHpY/2ik UnicodeProperty「...
591デフォルトの名無しさん
2024/03/10(日) 02:07:22.30ID:XyA7TYUn まだこんなレベルが複数いるとはな
585はなんだとおもってるんだろうか
585はなんだとおもってるんだろうか
592デフォルトの名無しさん
2024/03/15(金) 23:58:29.83ID:AJ1aqVjx FS GS RS USを区切り文字にしている形式はあるんだろうか
593デフォルトの名無しさん
2024/03/16(土) 12:13:18.07ID:YNOid1to 文字列の16進コードでも正規表現できればわかりやすくなる
何語でもよくなる
何語でもよくなる
594デフォルトの名無しさん
2024/03/16(土) 13:00:35.09ID:g4+az/43 わかりやすいか?
595デフォルトの名無しさん
2024/03/22(金) 23:58:21.79ID:3jp6lodI Unicodeのコードポイントが7FFFFFFFではなく10FFFFまでになったのはUTF-16で表せるのが10FFFFまでだから?
596デフォルトの名無しさん
2024/03/23(土) 00:18:21.28ID:2nTsjVrr597デフォルトの名無しさん
2024/03/23(土) 01:10:47.92ID:IkaEn615 >>596
UTF-8 で表現可能な上限が 0x7fffffff だな。
UCS-4 すなわち UTF-32 だと 0xffffffff
UCS-2 だと 0xffff
UTF-16 の上限に合わせているというの合ってる。
UTF-8 で表現可能な上限が 0x7fffffff だな。
UCS-4 すなわち UTF-32 だと 0xffffffff
UCS-2 だと 0xffff
UTF-16 の上限に合わせているというの合ってる。
598デフォルトの名無しさん
2024/03/23(土) 02:34:19.03ID:Wb02QQTi 微妙にかみあってなくて笑う
599デフォルトの名無しさん
2024/03/23(土) 07:47:34.76ID:RuIB3JhE 仮にUTF-8のビットパターンで1バイト目に11111111を使っていいとしたら
その後は10******が8バイト続くことになり48bitまで表現できることになるね
その後は10******が8バイト続くことになり48bitまで表現できることになるね
600デフォルトの名無しさん
2024/03/23(土) 09:10:32.39ID:mSx3lxAx >>593
マルチバイト文字に [] が使えなくて | で書かなきゃならんから少し面倒にはなるな。
マルチバイト文字に [] が使えなくて | で書かなきゃならんから少し面倒にはなるな。
601デフォルトの名無しさん
2024/03/23(土) 11:39:26.85ID:IkaEn615 >>599
未定義なので定義次第。6バイトの次が7バイトや8バイトは限らないので10バイトとか定義すればそのまま64ビットをカバーすることできるし、拡張の余地は残してある。
未定義なので定義次第。6バイトの次が7バイトや8バイトは限らないので10バイトとか定義すればそのまま64ビットをカバーすることできるし、拡張の余地は残してある。
602デフォルトの名無しさん
2024/03/24(日) 09:08:35.50ID:BJcMo4Na >>595
当初UCS-4は最上位ビットをエスケープなどの用途に使い
それを除いた7FFFFFFFまで使用可能にする計画だったはず
しかしUnicodeの上限が10FFFFと決まったためにUCS-4もそれに合わせて10FFFFになったのでは
当初UCS-4は最上位ビットをエスケープなどの用途に使い
それを除いた7FFFFFFFまで使用可能にする計画だったはず
しかしUnicodeの上限が10FFFFと決まったためにUCS-4もそれに合わせて10FFFFになったのでは
603デフォルトの名無しさん
2024/03/30(土) 15:01:07.51ID:7t7x8zZ+ C: \のようにディレクトリの区切りが円マークなのは文字化けの結果なんだよね
C:\のようにバックスラッシュが本来の文字なのに
円マークの方が見慣れていてバックスラッシュだと違和感を感じてしまう
なぜディレクトリ区切りにスラッシュではなくバックスラッシュを採用したんだろうか
C:\のようにバックスラッシュが本来の文字なのに
円マークの方が見慣れていてバックスラッシュだと違和感を感じてしまう
なぜディレクトリ区切りにスラッシュではなくバックスラッシュを採用したんだろうか
604603
2024/03/30(土) 15:05:16.11ID:7t7x8zZ+ 603の1行目でC:の後に0xA5を入れたらバックスラッシュになってしまった・・・
605デフォルトの名無しさん
2024/03/30(土) 15:07:21.72ID:NUhOM3sH 別に文字化けでもないでしょ
バクスラなのはオプションがスラッシュだから
バクスラなのはオプションがスラッシュだから
606デフォルトの名無しさん
2024/03/30(土) 15:16:04.30ID:bmf5qOAu Win32のファイル関連APIはスラッシュでOK
NT APIを直接使う時にはスラッシュはNG
GUIコントロール、ダイアログなどで独自処理してる箇所はスラッシュの考慮漏れ多数
NT APIを直接使う時にはスラッシュはNG
GUIコントロール、ダイアログなどで独自処理してる箇所はスラッシュの考慮漏れ多数
607デフォルトの名無しさん
2024/03/30(土) 16:10:17.92ID:OZirNnMs Windows のRuby では、/ も使う。
C:/Users/Owner/Documents/a.txt
WSL2, Linux なら、/mnt/c/ とか
/mnt/c/Users/Owner/Documents/a.txt
C:/Users/Owner/Documents/a.txt
WSL2, Linux なら、/mnt/c/ とか
/mnt/c/Users/Owner/Documents/a.txt
608デフォルトの名無しさん
2024/03/31(日) 00:46:19.56ID:/gud7Tc3 C:\Users\Owner/Documents/a.txt なんてのが OK な処理系もあるな
609デフォルトの名無しさん
2024/03/31(日) 01:53:54.19ID:x9YjQ3QN 処理系というかDOS/WindowsならOSがそうなってる
610デフォルトの名無しさん
2024/03/31(日) 06:08:53.00ID:PaHOJUqO >>603
UNIXの真似したかったんだけど同じにしたくなかったんじゃね?
UNIXの真似したかったんだけど同じにしたくなかったんじゃね?
611デフォルトの名無しさん
2024/03/31(日) 07:10:21.54ID:I5DgQFHY ゼロは、〇とか0とか0もいいけど、ぼくはΘが僕はスキです。
612デフォルトの名無しさん
2024/03/31(日) 07:11:47.66ID:I5DgQFHY ディレクトリ区切り は、> が、ボクは、好き❦❤♥
613デフォルトの名無しさん
2024/03/31(日) 07:25:21.69ID:SDQUovF1 もともとDOSはCP/Mの互換OSでディレクトリは無かった。で新バージョンで UNIX 等を真似てディレクトリを導入しようとしたんだけど、その時点で / はオプションの導入記号として使用済みだったので仕方なく \ を使った。単なる歴史的経緯。
614デフォルトの名無しさん
2024/03/31(日) 14:18:23.86ID:iuJTPy3O DOSはSWITCHARをコマンドでオプションの記号を/から-に変えられたようだが
Windowsにも同じ機能はあるんだろうか?
Windowsにも同じ機能はあるんだろうか?
615デフォルトの名無しさん
2024/03/31(日) 16:22:56.09ID:SDQUovF1 >>614
config.sys に書くやつなので同じのはないな。
一方で windows の内部API は \ だけじゃなくて / もディレクトリ区切りとして受け付けるというか、むしろ内部的には / に統一なのでDOS互換の目的以外でオプションに / を使う意味はない。
config.sys に書くやつなので同じのはないな。
一方で windows の内部API は \ だけじゃなくて / もディレクトリ区切りとして受け付けるというか、むしろ内部的には / に統一なのでDOS互換の目的以外でオプションに / を使う意味はない。
616デフォルトの名無しさん
2024/04/02(火) 21:41:53.85ID:bdVNxKJc Windowsのパス区切り文字は、なぜ逆スラッシュになったのか?
https://ascii.jp/elem/000/001/763/1763591/
https://ascii.jp/elem/000/001/763/1763591/
617デフォルトの名無しさん
2024/04/03(水) 09:15:12.66ID:vt2yN74v 2018年の記事でこのネタを扱って「この事実が開発者の間に広く知られるようになったのはここ数年ぐらいのこと」と書いちゃうの
筆者さんのお年頃を感じるわ
筆者さんのお年頃を感じるわ
618デフォルトの名無しさん
2024/04/03(水) 15:47:23.50ID:jDA8lqcs Windowsは長いパスを想定していないなど、いまさらどうにもならない部分はたくさんあるからなあ。
619デフォルトの名無しさん
2024/04/03(水) 15:47:57.80ID:jDA8lqcs 正確には長いシステム文字列だけど
620デフォルトの名無しさん
2024/04/05(金) 09:39:34.21ID:OAeRR9uw621デフォルトの名無しさん
2024/04/06(土) 02:00:07.31ID:q9eV9Q7I システムそのもののことを書いたんだけどな
622デフォルトの名無しさん
2024/04/06(土) 02:00:42.72ID:q9eV9Q7I Windowsそのものは互換性の維持から変えられない
623デフォルトの名無しさん
2024/04/06(土) 06:49:25.04ID:bcbhwFp/ いい加減消えろよ荒らしかなんかなのか?
624デフォルトの名無しさん
2024/04/08(月) 00:02:59.85ID:q+W5fVX8 Windowsだと日本語のパスを普通に扱うから、UTF-8のストレージからコピーしたものなどは、キャラクタセットの問題で同じファイルと認識されないことがある。
625デフォルトの名無しさん
2024/04/08(月) 00:06:46.79ID:gUGErxP/ robocopyコマンドなどは日本語の濁点文字を変換できないので、Macなどから持ってきたファイル、フォルダなどをWindowsは正確に置き換えられず、新しい別のファイルだと判断してしまう。
626デフォルトの名無しさん
2024/04/08(月) 06:23:54.81ID:/usqsKAh Unicodeの正規化の問題はマカーでもMacが変だとおもってるから
zipとかを客に要求されたときは気を使ってる
俺はスクリプトでアーカイバ書いた
zipとかを客に要求されたときは気を使ってる
俺はスクリプトでアーカイバ書いた
627デフォルトの名無しさん
2024/04/09(火) 20:36:20.01ID:rPao90Ac UTF-8は同じ記号を二重に定義したりと迷惑極まりない
628デフォルトの名無しさん
2024/04/09(火) 20:39:38.16ID:rPao90Ac 日本語のフォルダ名、日本語のファイル名、半角スペースが入っているパスなどは、やはりキャラクタセットの問題、区切り文字と誤認識したりと日本語を使う弊害があるから、MacユーザーはWindowsでも問題ない名前にしてくれないと無用なトラブルを起こす。
629デフォルトの名無しさん
2024/04/09(火) 21:34:31.96ID:iMz8mL7D >>628
そんなこと言うとマックユーザーは濁点や半濁点が禁止になるぞ?!
そんなこと言うとマックユーザーは濁点や半濁点が禁止になるぞ?!
630デフォルトの名無しさん
2024/04/09(火) 21:45:35.69ID:UYF51JOY631デフォルトの名無しさん
2024/04/09(火) 22:14:36.89ID:alsgPFRw 昔は句点にしったかはいなかったのに時代かな
632デフォルトの名無しさん
2024/04/10(水) 01:10:50.60ID:o/CaXglC 句読点話とか昔から議論があって、国とマスコミが合わせている話を最近の話だと思っているのは、ネットの捏造話題に振り回されすぎだw
633デフォルトの名無しさん
2024/04/10(水) 17:32:28.51ID:+KIbNPCo 大文字と小文字の使い分けで問題が出るので
634デフォルトの名無しさん
2024/04/15(月) 15:11:19.52ID:PE3M1YJ/ 改行コードは、LF CR LF+CR どれが間違えなのか統一しろっつうの
635デフォルトの名無しさん
2024/04/15(月) 20:58:18.76ID:QxQntH9/ >>634
その前提が間違っています
その前提が間違っています
636デフォルトの名無しさん
2024/04/16(火) 01:11:44.84ID:FS4GZ/y6 >>634
迷ったときはとにかくBOMなしUTF-8でLFにしろ
迷ったときはとにかくBOMなしUTF-8でLFにしろ
637デフォルトの名無しさん
2024/04/17(水) 05:36:29.22ID:w7jXmCDp >>636
Windowsの知識がないのか?
Windowsの知識がないのか?
638デフォルトの名無しさん
2024/04/17(水) 05:37:28.83ID:w7jXmCDp WindowsはBOM付きじゃないとUTF-16だとみなすことが多い。
639デフォルトの名無しさん
2024/04/17(水) 06:30:22.24ID:SUsXTeqI640デフォルトの名無しさん
2024/04/17(水) 18:58:24.59ID:Pzbg3t/L641デフォルトの名無しさん
2024/04/17(水) 23:38:18.72ID:knPCS6jH Windows なら BOM 無し CRLF UTF8 ではないかと思う
どっちみちアプリ専用なら決め打ちだろうしな
自動判別が必要なものなんてテキストエディタくらいだろう
どっちみちアプリ専用なら決め打ちだろうしな
自動判別が必要なものなんてテキストエディタくらいだろう
642デフォルトの名無しさん
2024/04/18(木) 00:01:39.47ID:oEM4PXys 結局ネット互換性で文字コードは統一の方向に向かっている感じ。昔はOSごとにバラバラでも問題は大きくなかったんだが最近はそうも行かなくなって、ネット交換性のないアプリとかは時代遅れになっているし、開発もOS独立が主流。
今の所ネットでは、サーバーは Linux が圧倒的なシェアを持ってて、クライアントはスマフォ、特に android がシェア1位なのでやっぱり linux なのでその文字コードに全体が引き寄せられてる。
今の所ネットでは、サーバーは Linux が圧倒的なシェアを持ってて、クライアントはスマフォ、特に android がシェア1位なのでやっぱり linux なのでその文字コードに全体が引き寄せられてる。
643デフォルトの名無しさん
2024/04/19(金) 16:15:59.26ID:B7MqzRwb 横サイズ×縦サイズのように大きさを書くときには
U+D7の乗算記号を使うべきなんだろうがアルファベットのxで書かれていることが多いよね
乗算記号はキーボードから直接入力できないからこうなってしまったのか
キーボードから直接入力できる*も乗算記号の代わりとして使えるはずだがこの表記もあまり見かけない
U+D7の乗算記号を使うべきなんだろうがアルファベットのxで書かれていることが多いよね
乗算記号はキーボードから直接入力できないからこうなってしまったのか
キーボードから直接入力できる*も乗算記号の代わりとして使えるはずだがこの表記もあまり見かけない
644デフォルトの名無しさん
2024/04/19(金) 17:54:47.14ID:8xyh5QpX ×とхとxとXとХと✕と✖の違いがわからない
645デフォルトの名無しさん
2024/04/19(金) 19:46:17.55ID:jRDwWt4b646デフォルトの名無しさん
2024/04/20(土) 02:13:39.00ID:5uh2yve4 かける での変換、Shift キーとの同時押 下が面倒で x で代用するのかもしれんな
647デフォルトの名無しさん
2024/04/20(土) 02:18:34.42ID:TAp2l9om >>646
もともとユニコードとか日本語とか実装される前の時代というか、コンピュターができる前のタイプライターの時代に乗算記号を x で代用する文化ができた。それが今に引き継がれてるだけ。
もともとユニコードとか日本語とか実装される前の時代というか、コンピュターができる前のタイプライターの時代に乗算記号を x で代用する文化ができた。それが今に引き継がれてるだけ。
648デフォルトの名無しさん
2024/04/20(土) 10:09:45.86ID:V9YAL+TF そもそも乗算記号は世界共通じゃないのよ
×じゃなくて・使う地域がある
除算記号も:使う地域がある
×じゃなくて・使う地域がある
除算記号も:使う地域がある
649デフォルトの名無しさん
2024/04/20(土) 14:38:04.06ID:nh5GJjX6 桁区切りや小数点が違うのは、国際化ライブラリで変換してくれるのがあるよね
数学の演算記号もカバーしてたりするんだろうか
数学の演算記号もカバーしてたりするんだろうか
650デフォルトの名無しさん
2024/04/20(土) 17:24:22.41ID:V9YAL+TF コンピュータ言語だと*と/で代用してるからね
世界共通じゃないのと普通の文章であまり出てこないのでASCIIコードに入らなかったんだと思う
数学だと乗算記号は省略されるし除算も分数表記になるし
世界共通じゃないのと普通の文章であまり出てこないのでASCIIコードに入らなかったんだと思う
数学だと乗算記号は省略されるし除算も分数表記になるし
651デフォルトの名無しさん
2024/04/20(土) 17:33:35.97ID:TAp2l9om >>650
そんなこと言ってると APL 投げつけられるぞ?
そんなこと言ってると APL 投げつけられるぞ?
652デフォルトの名無しさん
2024/04/20(土) 19:53:23.39ID:75CIwP38 セル内文字 ⇒ Unicodeは
excel関数として存在する。
かつ
UnicodeをUTF-8に変換
のロジックもネット上にあり
然るに、
EXCELセル内文字⇒UTF-8に変換
は、excel関数になくても、
vbaで自作可能❢ なハズです。
なので、EXCELセル内文字⇒UTF-8に変換
するVBAを開発するぞーーー。てか開発させよっーーーと
by 🤡の呟き
excel関数として存在する。
かつ
UnicodeをUTF-8に変換
のロジックもネット上にあり
然るに、
EXCELセル内文字⇒UTF-8に変換
は、excel関数になくても、
vbaで自作可能❢ なハズです。
なので、EXCELセル内文字⇒UTF-8に変換
するVBAを開発するぞーーー。てか開発させよっーーーと
by 🤡の呟き
653652
2024/04/20(土) 20:58:38.32ID:75CIwP38 っていうかさ、UTF8 TO UNICODEを開発するぞ
UTF8の16進数のやつをUNICODEの16進数に変換
するやつを開発トスル。すると、UNICHAR関数
(EXCEL関数)で、漢字が表示されるハズ
スゲーー完璧なプラン(計画) ✌
以下はその為の備忘録ぢゃ
─────────────────
unicode「304A」をUTF-8に変換
1 「304A」を2進数に変えます。
2 それが0800〜FFFF⇒
先頭から4, 6, 6ビットに分ける
3 それらの先頭に、E0,80,80を足す。
即ち 例「お」Unicode ⇒ UTF-8 は
304A ⇒ 0011 0000 0100 1010 ∴
304A ⇒ 0011 000001 001010 ∴
304A ⇒ 03 01 0A ∵16進数
これにE0,80,80を足す
304A ⇒ E3 81 8A ∵16進数
即ち例「お」UTF-8 ⇒ Unicode
E3 81 8A ⇒ 03 01 0A ∵E0,80,80を引く
03 01 0A ⇒ 304A ∵🤔
🤔のロジックを検討中
UTF8の16進数のやつをUNICODEの16進数に変換
するやつを開発トスル。すると、UNICHAR関数
(EXCEL関数)で、漢字が表示されるハズ
スゲーー完璧なプラン(計画) ✌
以下はその為の備忘録ぢゃ
─────────────────
unicode「304A」をUTF-8に変換
1 「304A」を2進数に変えます。
2 それが0800〜FFFF⇒
先頭から4, 6, 6ビットに分ける
3 それらの先頭に、E0,80,80を足す。
即ち 例「お」Unicode ⇒ UTF-8 は
304A ⇒ 0011 0000 0100 1010 ∴
304A ⇒ 0011 000001 001010 ∴
304A ⇒ 03 01 0A ∵16進数
これにE0,80,80を足す
304A ⇒ E3 81 8A ∵16進数
即ち例「お」UTF-8 ⇒ Unicode
E3 81 8A ⇒ 03 01 0A ∵E0,80,80を引く
03 01 0A ⇒ 304A ∵🤔
🤔のロジックを検討中
654デフォルトの名無しさん
2024/04/20(土) 21:23:20.18ID:TAp2l9om bit shift とか知ってる?
bit and とか bit or とかは?
bit and とか bit or とかは?
655デフォルトの名無しさん
2024/04/21(日) 01:26:18.38ID:MS9R2kFy bit shift等なんとなくわかる
で、何となく、どうにかなりそう。
x = x*2 '''xが128未満で左シフト
x = x\2 '''右シフト
x = x+192 '''xが64未満ならbit orかな
bit and はちょっと難しい
by 🤡
で、何となく、どうにかなりそう。
x = x*2 '''xが128未満で左シフト
x = x\2 '''右シフト
x = x+192 '''xが64未満ならbit orかな
bit and はちょっと難しい
by 🤡
656653
2024/04/21(日) 01:48:31.65ID:MS9R2kFy 例 UTF-8でE3 81 8Aを、文字表示
E3 81 8A ⇒ 03 01 0A ∵E0,80,80を引く
03 01 0A ⇒ 30 4A ∵🤔思考中
30 4A ⇒ 「お」∵Unichar関数を借用
🤔のロジックを関数UtfStrとする。
プロシジャー名はUtfStrとする。
Sub 図形_Click()
'「お」と表示されるハズ、多分
Msgbox UtfStr(&hE3h,&h81,&h8A)
End Sub
Function UtfStr(a1,a2,a3) as string
b1 = a1 - 224 '''&hE0 を引く
b2 = a2 - 128 '''&h80 を引く
b3 = a3 - 128 '''&h80 を引く
c=256*(16*b1+b2\4)+64*(b2 mod 4)+b3
UtfStr=WorksheetFunction.Unichar(c)
End Function
by 🤡机上済でも未テスト∴bugあるかも
E3 81 8A ⇒ 03 01 0A ∵E0,80,80を引く
03 01 0A ⇒ 30 4A ∵🤔思考中
30 4A ⇒ 「お」∵Unichar関数を借用
🤔のロジックを関数UtfStrとする。
プロシジャー名はUtfStrとする。
Sub 図形_Click()
'「お」と表示されるハズ、多分
Msgbox UtfStr(&hE3h,&h81,&h8A)
End Sub
Function UtfStr(a1,a2,a3) as string
b1 = a1 - 224 '''&hE0 を引く
b2 = a2 - 128 '''&h80 を引く
b3 = a3 - 128 '''&h80 を引く
c=256*(16*b1+b2\4)+64*(b2 mod 4)+b3
UtfStr=WorksheetFunction.Unichar(c)
End Function
by 🤡机上済でも未テスト∴bugあるかも
657656レビュー自作自演
2024/04/21(日) 06:35:47.14ID:MS9R2kFy 👤 cの計算式内の16*b1は左2BITシフト?
🤡 yes
b1 = a1 - 224 後の処理だから、
数式16*b1は、16*(a1 - 224)と同値だし
数式16*b1は、意訳で、左2BITシフトだ
🥳a1が224未満(モチ、a1がE0未満)で
バグる気がするぅーーー
早くテストしてバグって混乱するとヨイ
🤡UTF8で 00 00 00 〜 DF FF FF
でバグるか? んーーーー
🤡 yes
b1 = a1 - 224 後の処理だから、
数式16*b1は、16*(a1 - 224)と同値だし
数式16*b1は、意訳で、左2BITシフトだ
🥳a1が224未満(モチ、a1がE0未満)で
バグる気がするぅーーー
早くテストしてバグって混乱するとヨイ
🤡UTF8で 00 00 00 〜 DF FF FF
でバグるか? んーーーー
658657 とにかく早速テスト篇
2024/04/21(日) 08:23:58.98ID:MS9R2kFy 出演者
🥳バカテスター 🤡プロマネ(元プログラマ) 👤宇宙人のランベルト星人
🥳プロマネが作った>>656のVBAをRunしたらエラーでRunしない。バグ発見∴嬉しいデス
ちゃーーーーんとテストしてる証だぁ
🤡 &hE3h は、&hE3 だった。てかそんなの報告せず
修正してテストしろーーーちゅーーーの
🥳 で、修正してテストしたら上手くいっちゃった
ちゃんと、「お」とメッセージボックスに表示された
🤡 だろ\(^o^)/ ま、たった一文字だけど
今後は更にコード改造して、UTF8のをEXCELに表示させるぜ
🥳 たったの一文字で、それも「お」だけしかテストしてないぢゃーーー
🤡 最初の一歩はこんなもんだ。てかうっせーーー
🥳バカテスター 🤡プロマネ(元プログラマ) 👤宇宙人のランベルト星人
🥳プロマネが作った>>656のVBAをRunしたらエラーでRunしない。バグ発見∴嬉しいデス
ちゃーーーーんとテストしてる証だぁ
🤡 &hE3h は、&hE3 だった。てかそんなの報告せず
修正してテストしろーーーちゅーーーの
🥳 で、修正してテストしたら上手くいっちゃった
ちゃんと、「お」とメッセージボックスに表示された
🤡 だろ\(^o^)/ ま、たった一文字だけど
今後は更にコード改造して、UTF8のをEXCELに表示させるぜ
🥳 たったの一文字で、それも「お」だけしかテストしてないぢゃーーー
🤡 最初の一歩はこんなもんだ。てかうっせーーー
659658の続きてかプロマネの呟き
2024/04/21(日) 08:39:06.15ID:MS9R2kFy 🤡 Function UtfStr(a1,a2,a3) as string
だけど、引数a1,a2,a3 の型はどうしようかな?
未指定で上手くいっちゃったみたいたけど、
なんか、やーーーだな
修正前 (a1,a2,a3)
修正後案1 (a1 as byte,a2 as byte,a3 as byte)
修正後案2 (a1 as integer,a2 as integer,a3 as byte)
修正後案3 (a1 as long,a2 as long,a3 as long)
修正後案4 (a1 as double,a2 as double,a3 as double)
どれにしようかな? てかどれでもいいぽいけど
常識的には案1かな? てか案3もいいな。
てか、案4が個人的には好きだけど非常識だろし
案2にするなら、ヤッパ案3だし、んーーー
🥳 (a1 as byte,a2 as double,a3 as long)
はどう❓。なんでも上手くいくなら上手くいきそうぢゃーーーん
🤡非常識なヤツ。てか案3にしよっと
だけど、引数a1,a2,a3 の型はどうしようかな?
未指定で上手くいっちゃったみたいたけど、
なんか、やーーーだな
修正前 (a1,a2,a3)
修正後案1 (a1 as byte,a2 as byte,a3 as byte)
修正後案2 (a1 as integer,a2 as integer,a3 as byte)
修正後案3 (a1 as long,a2 as long,a3 as long)
修正後案4 (a1 as double,a2 as double,a3 as double)
どれにしようかな? てかどれでもいいぽいけど
常識的には案1かな? てか案3もいいな。
てか、案4が個人的には好きだけど非常識だろし
案2にするなら、ヤッパ案3だし、んーーー
🥳 (a1 as byte,a2 as double,a3 as long)
はどう❓。なんでも上手くいくなら上手くいきそうぢゃーーーん
🤡非常識なヤツ。てか案3にしよっと
660659についてランベルト星人感想
2024/04/21(日) 10:51:04.07ID:MS9R2kFy 👤 UTF8かつカテゴリ3BYTEなら、
そのロジックで、バッチリだろうが・・・
🤡 オレッちの開発の、秘伝の数式
c=256*(16*b1+b2\4)+64*(b2 mod 4)+b3
は、モチロンバッチリだよな ✌
👤 で、EXCEL VBAで実装するのか❓んーーー
🤡 モチロンだ。ってか連れないな。なんで
👤 その程度の数式なら、VBAは不要でさ、
EXCEL関数だけで、イケる気もする。
VBAを走らせなくても、UTF8コード値の入力
と同時に、文字(漢字等)が表示されるぜ
🤡 なるほど。入力と同時文字表示は、いいな
VBAでの実装は保留とし、EXCEL関数での
実装を検討とする
そのロジックで、バッチリだろうが・・・
🤡 オレッちの開発の、秘伝の数式
c=256*(16*b1+b2\4)+64*(b2 mod 4)+b3
は、モチロンバッチリだよな ✌
👤 で、EXCEL VBAで実装するのか❓んーーー
🤡 モチロンだ。ってか連れないな。なんで
👤 その程度の数式なら、VBAは不要でさ、
EXCEL関数だけで、イケる気もする。
VBAを走らせなくても、UTF8コード値の入力
と同時に、文字(漢字等)が表示されるぜ
🤡 なるほど。入力と同時文字表示は、いいな
VBAでの実装は保留とし、EXCEL関数での
実装を検討とする
661660
2024/04/21(日) 11:05:36.10ID:MS9R2kFy 👤 商を求めれるExcel関数は、QUOTIENT
且つ、余りは、Excel関数は、MODだ
且つ、EXCEL関数には、HEX2DECも存在
且つ、EXCEL関数には、UNICHARが存在
🤡 上手くやれば、EXCEL関数に、
UTF8CHARがなくても、UTF8CHARって感じの処理は可能な様な気がする
🥳 どうせ一文字だけだろ。まだまだぢゃーん。
🤡 最初の一歩は、慌ててはいけない。
「恋は焦らず」なんて題名の曲があるだろ
てか、文字連結はEXCEL関数てか&できるし
数十文字位の改造も、楽勝と思うよん。
🥳 ちぇっ、つまんないの。楽勝なのかよ
てか、カテゴリ3BYTE以外はバグぢゃない?
🤡 可能性は高いけど、カテゴリ3BYTE専用だ
🥳 なんか狡いのーーーー
🤡 これで良いのだ。
且つ、余りは、Excel関数は、MODだ
且つ、EXCEL関数には、HEX2DECも存在
且つ、EXCEL関数には、UNICHARが存在
🤡 上手くやれば、EXCEL関数に、
UTF8CHARがなくても、UTF8CHARって感じの処理は可能な様な気がする
🥳 どうせ一文字だけだろ。まだまだぢゃーん。
🤡 最初の一歩は、慌ててはいけない。
「恋は焦らず」なんて題名の曲があるだろ
てか、文字連結はEXCEL関数てか&できるし
数十文字位の改造も、楽勝と思うよん。
🥳 ちぇっ、つまんないの。楽勝なのかよ
てか、カテゴリ3BYTE以外はバグぢゃない?
🤡 可能性は高いけど、カテゴリ3BYTE専用だ
🥳 なんか狡いのーーーー
🤡 これで良いのだ。
662661
2024/04/21(日) 11:12:44.58ID:MS9R2kFy 🤡てかカテゴリ3って何❓
👤地球のネットによると漢字の様な感じだ。てか
オレの霊感ではほぼ大部分の全角文字の気がする
なお、霊的な直感なので、違っても怒るなよ
🥳ランベルト星人って地球人より無限大頭がヨイのに
霊感とか直感なのかよ。
てかさ、漢字は全角だし、ネットで漢字とか記載されてるけど
ポクのヤマ感だと全角文字の、ことだろ。てかなんで
カテゴリ3byteなんだろう。全角って2byteって気もする
🤡んーーオマエのヤマ感より宇宙人の霊感が正しい気がする、霊感的に
👤地球のネットによると漢字の様な感じだ。てか
オレの霊感ではほぼ大部分の全角文字の気がする
なお、霊的な直感なので、違っても怒るなよ
🥳ランベルト星人って地球人より無限大頭がヨイのに
霊感とか直感なのかよ。
てかさ、漢字は全角だし、ネットで漢字とか記載されてるけど
ポクのヤマ感だと全角文字の、ことだろ。てかなんで
カテゴリ3byteなんだろう。全角って2byteって気もする
🤡んーーオマエのヤマ感より宇宙人の霊感が正しい気がする、霊感的に
663662
2024/04/21(日) 11:20:51.43ID:MS9R2kFy 👤 ーーー、いやま、半角のカナ記号も
UTF8では3byteだし、半角でもカナはカテゴリ3
だ。半角英数はASCiiだからカテゴリ3ぢゃないと思う
てか、地球のUTF8訳わからん。
てか、EXCEL関数でもVBAでもどっちでも良いのでドンドン実装しちゃいなさーーーーい
🥳ドンドンしちゃいなさーーーーい
UTF8では3byteだし、半角でもカナはカテゴリ3
だ。半角英数はASCiiだからカテゴリ3ぢゃないと思う
てか、地球のUTF8訳わからん。
てか、EXCEL関数でもVBAでもどっちでも良いのでドンドン実装しちゃいなさーーーーい
🥳ドンドンしちゃいなさーーーーい
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 橋下徹氏 外務省幹部の訪中受け「口だけ番長」へ痛烈指摘 「喧嘩は日本の完敗…なんとかっこ悪い日本か」 [冬月記者★]
- 国内ホテル、既にキャンセルも 訪日客関連業界、事態見守る ★3 [蚤の市★]
- 習政権、高市首相への態度硬化 台湾有事発言で連日非難 中国 ★11 [ぐれ★]
- 【外国人問題】小野田紀美担当相「不法就労や不法滞在は許さない」 [シャチ★]
- 【野球】井端監督 大谷翔平、山本由伸らのWBCへの参加 「1日も早く返事ほしい」「待っててといっても、国内組が遅くなってしまう」★3 [冬月記者★]
- 経団連会長、日中は建設的対話を 経済3団体が高市首相と初会談も日中関係は話題に登らず… [BFU★]
- 中国「高市が頭を下げて謝罪しない限り、絶対に許さない」 [329329848]
- 今猛烈に食べたいもの挙げてけwwwwwwww
- 橋下徹「口だけ番長の日本が中国に喧嘩負け。なんとカッコ悪い日本か!」高市にバチーン!✴ [153490809]
- 【高市早苗】習近平激怒か [115996789]
- 🏡
- 今猛烈に食べたいもの挙げてけwwwwwwww
