Windows NTは初代からUnicodeがネイティブの文字コードです。cp932ではありません。
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。
■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
文字コード総合スレ Part10 http://mevius.2ch.net/test/read.cgi/tech/1444822140/
文字コード総合スレ Part11 https://mevius.5ch.net/test/read.cgi/tech/1516629503/
文字コード総合スレ Part12 https://mevius.5ch.net/test/read.cgi/tech/1544931495/
文字コード総合スレ part13
https://mevius.5ch.net/test/read.cgi/tech/1593777227/
探検
文字コード総合スレ part14
■ このスレッドは過去ログ倉庫に格納されています
2023/03/03(金) 15:46:58.08ID:yKqwMGHT
607デフォルトの名無しさん
2024/03/30(土) 16:10:17.92ID:OZirNnMs Windows のRuby では、/ も使う。
C:/Users/Owner/Documents/a.txt
WSL2, Linux なら、/mnt/c/ とか
/mnt/c/Users/Owner/Documents/a.txt
C:/Users/Owner/Documents/a.txt
WSL2, Linux なら、/mnt/c/ とか
/mnt/c/Users/Owner/Documents/a.txt
608デフォルトの名無しさん
2024/03/31(日) 00:46:19.56ID:/gud7Tc3 C:\Users\Owner/Documents/a.txt なんてのが OK な処理系もあるな
609デフォルトの名無しさん
2024/03/31(日) 01:53:54.19ID:x9YjQ3QN 処理系というかDOS/WindowsならOSがそうなってる
610デフォルトの名無しさん
2024/03/31(日) 06:08:53.00ID:PaHOJUqO >>603
UNIXの真似したかったんだけど同じにしたくなかったんじゃね?
UNIXの真似したかったんだけど同じにしたくなかったんじゃね?
611デフォルトの名無しさん
2024/03/31(日) 07:10:21.54ID:I5DgQFHY ゼロは、〇とか0とか0もいいけど、ぼくはΘが僕はスキです。
612デフォルトの名無しさん
2024/03/31(日) 07:11:47.66ID:I5DgQFHY ディレクトリ区切り は、> が、ボクは、好き❦❤♥
613デフォルトの名無しさん
2024/03/31(日) 07:25:21.69ID:SDQUovF1 もともとDOSはCP/Mの互換OSでディレクトリは無かった。で新バージョンで UNIX 等を真似てディレクトリを導入しようとしたんだけど、その時点で / はオプションの導入記号として使用済みだったので仕方なく \ を使った。単なる歴史的経緯。
614デフォルトの名無しさん
2024/03/31(日) 14:18:23.86ID:iuJTPy3O DOSはSWITCHARをコマンドでオプションの記号を/から-に変えられたようだが
Windowsにも同じ機能はあるんだろうか?
Windowsにも同じ機能はあるんだろうか?
615デフォルトの名無しさん
2024/03/31(日) 16:22:56.09ID:SDQUovF1 >>614
config.sys に書くやつなので同じのはないな。
一方で windows の内部API は \ だけじゃなくて / もディレクトリ区切りとして受け付けるというか、むしろ内部的には / に統一なのでDOS互換の目的以外でオプションに / を使う意味はない。
config.sys に書くやつなので同じのはないな。
一方で windows の内部API は \ だけじゃなくて / もディレクトリ区切りとして受け付けるというか、むしろ内部的には / に統一なのでDOS互換の目的以外でオプションに / を使う意味はない。
616デフォルトの名無しさん
2024/04/02(火) 21:41:53.85ID:bdVNxKJc Windowsのパス区切り文字は、なぜ逆スラッシュになったのか?
https://ascii.jp/elem/000/001/763/1763591/
https://ascii.jp/elem/000/001/763/1763591/
617デフォルトの名無しさん
2024/04/03(水) 09:15:12.66ID:vt2yN74v 2018年の記事でこのネタを扱って「この事実が開発者の間に広く知られるようになったのはここ数年ぐらいのこと」と書いちゃうの
筆者さんのお年頃を感じるわ
筆者さんのお年頃を感じるわ
618デフォルトの名無しさん
2024/04/03(水) 15:47:23.50ID:jDA8lqcs Windowsは長いパスを想定していないなど、いまさらどうにもならない部分はたくさんあるからなあ。
619デフォルトの名無しさん
2024/04/03(水) 15:47:57.80ID:jDA8lqcs 正確には長いシステム文字列だけど
620デフォルトの名無しさん
2024/04/05(金) 09:39:34.21ID:OAeRR9uw621デフォルトの名無しさん
2024/04/06(土) 02:00:07.31ID:q9eV9Q7I システムそのもののことを書いたんだけどな
622デフォルトの名無しさん
2024/04/06(土) 02:00:42.72ID:q9eV9Q7I Windowsそのものは互換性の維持から変えられない
623デフォルトの名無しさん
2024/04/06(土) 06:49:25.04ID:bcbhwFp/ いい加減消えろよ荒らしかなんかなのか?
624デフォルトの名無しさん
2024/04/08(月) 00:02:59.85ID:q+W5fVX8 Windowsだと日本語のパスを普通に扱うから、UTF-8のストレージからコピーしたものなどは、キャラクタセットの問題で同じファイルと認識されないことがある。
625デフォルトの名無しさん
2024/04/08(月) 00:06:46.79ID:gUGErxP/ robocopyコマンドなどは日本語の濁点文字を変換できないので、Macなどから持ってきたファイル、フォルダなどをWindowsは正確に置き換えられず、新しい別のファイルだと判断してしまう。
626デフォルトの名無しさん
2024/04/08(月) 06:23:54.81ID:/usqsKAh Unicodeの正規化の問題はマカーでもMacが変だとおもってるから
zipとかを客に要求されたときは気を使ってる
俺はスクリプトでアーカイバ書いた
zipとかを客に要求されたときは気を使ってる
俺はスクリプトでアーカイバ書いた
627デフォルトの名無しさん
2024/04/09(火) 20:36:20.01ID:rPao90Ac UTF-8は同じ記号を二重に定義したりと迷惑極まりない
628デフォルトの名無しさん
2024/04/09(火) 20:39:38.16ID:rPao90Ac 日本語のフォルダ名、日本語のファイル名、半角スペースが入っているパスなどは、やはりキャラクタセットの問題、区切り文字と誤認識したりと日本語を使う弊害があるから、MacユーザーはWindowsでも問題ない名前にしてくれないと無用なトラブルを起こす。
629デフォルトの名無しさん
2024/04/09(火) 21:34:31.96ID:iMz8mL7D >>628
そんなこと言うとマックユーザーは濁点や半濁点が禁止になるぞ?!
そんなこと言うとマックユーザーは濁点や半濁点が禁止になるぞ?!
630デフォルトの名無しさん
2024/04/09(火) 21:45:35.69ID:UYF51JOY631デフォルトの名無しさん
2024/04/09(火) 22:14:36.89ID:alsgPFRw 昔は句点にしったかはいなかったのに時代かな
632デフォルトの名無しさん
2024/04/10(水) 01:10:50.60ID:o/CaXglC 句読点話とか昔から議論があって、国とマスコミが合わせている話を最近の話だと思っているのは、ネットの捏造話題に振り回されすぎだw
633デフォルトの名無しさん
2024/04/10(水) 17:32:28.51ID:+KIbNPCo 大文字と小文字の使い分けで問題が出るので
634デフォルトの名無しさん
2024/04/15(月) 15:11:19.52ID:PE3M1YJ/ 改行コードは、LF CR LF+CR どれが間違えなのか統一しろっつうの
635デフォルトの名無しさん
2024/04/15(月) 20:58:18.76ID:QxQntH9/ >>634
その前提が間違っています
その前提が間違っています
636デフォルトの名無しさん
2024/04/16(火) 01:11:44.84ID:FS4GZ/y6 >>634
迷ったときはとにかくBOMなしUTF-8でLFにしろ
迷ったときはとにかくBOMなしUTF-8でLFにしろ
637デフォルトの名無しさん
2024/04/17(水) 05:36:29.22ID:w7jXmCDp >>636
Windowsの知識がないのか?
Windowsの知識がないのか?
638デフォルトの名無しさん
2024/04/17(水) 05:37:28.83ID:w7jXmCDp WindowsはBOM付きじゃないとUTF-16だとみなすことが多い。
639デフォルトの名無しさん
2024/04/17(水) 06:30:22.24ID:SUsXTeqI640デフォルトの名無しさん
2024/04/17(水) 18:58:24.59ID:Pzbg3t/L641デフォルトの名無しさん
2024/04/17(水) 23:38:18.72ID:knPCS6jH Windows なら BOM 無し CRLF UTF8 ではないかと思う
どっちみちアプリ専用なら決め打ちだろうしな
自動判別が必要なものなんてテキストエディタくらいだろう
どっちみちアプリ専用なら決め打ちだろうしな
自動判別が必要なものなんてテキストエディタくらいだろう
642デフォルトの名無しさん
2024/04/18(木) 00:01:39.47ID:oEM4PXys 結局ネット互換性で文字コードは統一の方向に向かっている感じ。昔はOSごとにバラバラでも問題は大きくなかったんだが最近はそうも行かなくなって、ネット交換性のないアプリとかは時代遅れになっているし、開発もOS独立が主流。
今の所ネットでは、サーバーは Linux が圧倒的なシェアを持ってて、クライアントはスマフォ、特に android がシェア1位なのでやっぱり linux なのでその文字コードに全体が引き寄せられてる。
今の所ネットでは、サーバーは Linux が圧倒的なシェアを持ってて、クライアントはスマフォ、特に android がシェア1位なのでやっぱり linux なのでその文字コードに全体が引き寄せられてる。
643デフォルトの名無しさん
2024/04/19(金) 16:15:59.26ID:B7MqzRwb 横サイズ×縦サイズのように大きさを書くときには
U+D7の乗算記号を使うべきなんだろうがアルファベットのxで書かれていることが多いよね
乗算記号はキーボードから直接入力できないからこうなってしまったのか
キーボードから直接入力できる*も乗算記号の代わりとして使えるはずだがこの表記もあまり見かけない
U+D7の乗算記号を使うべきなんだろうがアルファベットのxで書かれていることが多いよね
乗算記号はキーボードから直接入力できないからこうなってしまったのか
キーボードから直接入力できる*も乗算記号の代わりとして使えるはずだがこの表記もあまり見かけない
644デフォルトの名無しさん
2024/04/19(金) 17:54:47.14ID:8xyh5QpX ×とхとxとXとХと✕と✖の違いがわからない
645デフォルトの名無しさん
2024/04/19(金) 19:46:17.55ID:jRDwWt4b646デフォルトの名無しさん
2024/04/20(土) 02:13:39.00ID:5uh2yve4 かける での変換、Shift キーとの同時押 下が面倒で x で代用するのかもしれんな
647デフォルトの名無しさん
2024/04/20(土) 02:18:34.42ID:TAp2l9om >>646
もともとユニコードとか日本語とか実装される前の時代というか、コンピュターができる前のタイプライターの時代に乗算記号を x で代用する文化ができた。それが今に引き継がれてるだけ。
もともとユニコードとか日本語とか実装される前の時代というか、コンピュターができる前のタイプライターの時代に乗算記号を x で代用する文化ができた。それが今に引き継がれてるだけ。
648デフォルトの名無しさん
2024/04/20(土) 10:09:45.86ID:V9YAL+TF そもそも乗算記号は世界共通じゃないのよ
×じゃなくて・使う地域がある
除算記号も:使う地域がある
×じゃなくて・使う地域がある
除算記号も:使う地域がある
649デフォルトの名無しさん
2024/04/20(土) 14:38:04.06ID:nh5GJjX6 桁区切りや小数点が違うのは、国際化ライブラリで変換してくれるのがあるよね
数学の演算記号もカバーしてたりするんだろうか
数学の演算記号もカバーしてたりするんだろうか
650デフォルトの名無しさん
2024/04/20(土) 17:24:22.41ID:V9YAL+TF コンピュータ言語だと*と/で代用してるからね
世界共通じゃないのと普通の文章であまり出てこないのでASCIIコードに入らなかったんだと思う
数学だと乗算記号は省略されるし除算も分数表記になるし
世界共通じゃないのと普通の文章であまり出てこないのでASCIIコードに入らなかったんだと思う
数学だと乗算記号は省略されるし除算も分数表記になるし
651デフォルトの名無しさん
2024/04/20(土) 17:33:35.97ID:TAp2l9om >>650
そんなこと言ってると APL 投げつけられるぞ?
そんなこと言ってると APL 投げつけられるぞ?
652デフォルトの名無しさん
2024/04/20(土) 19:53:23.39ID:75CIwP38 セル内文字 ⇒ Unicodeは
excel関数として存在する。
かつ
UnicodeをUTF-8に変換
のロジックもネット上にあり
然るに、
EXCELセル内文字⇒UTF-8に変換
は、excel関数になくても、
vbaで自作可能❢ なハズです。
なので、EXCELセル内文字⇒UTF-8に変換
するVBAを開発するぞーーー。てか開発させよっーーーと
by 🤡の呟き
excel関数として存在する。
かつ
UnicodeをUTF-8に変換
のロジックもネット上にあり
然るに、
EXCELセル内文字⇒UTF-8に変換
は、excel関数になくても、
vbaで自作可能❢ なハズです。
なので、EXCELセル内文字⇒UTF-8に変換
するVBAを開発するぞーーー。てか開発させよっーーーと
by 🤡の呟き
653652
2024/04/20(土) 20:58:38.32ID:75CIwP38 っていうかさ、UTF8 TO UNICODEを開発するぞ
UTF8の16進数のやつをUNICODEの16進数に変換
するやつを開発トスル。すると、UNICHAR関数
(EXCEL関数)で、漢字が表示されるハズ
スゲーー完璧なプラン(計画) ✌
以下はその為の備忘録ぢゃ
─────────────────
unicode「304A」をUTF-8に変換
1 「304A」を2進数に変えます。
2 それが0800〜FFFF⇒
先頭から4, 6, 6ビットに分ける
3 それらの先頭に、E0,80,80を足す。
即ち 例「お」Unicode ⇒ UTF-8 は
304A ⇒ 0011 0000 0100 1010 ∴
304A ⇒ 0011 000001 001010 ∴
304A ⇒ 03 01 0A ∵16進数
これにE0,80,80を足す
304A ⇒ E3 81 8A ∵16進数
即ち例「お」UTF-8 ⇒ Unicode
E3 81 8A ⇒ 03 01 0A ∵E0,80,80を引く
03 01 0A ⇒ 304A ∵🤔
🤔のロジックを検討中
UTF8の16進数のやつをUNICODEの16進数に変換
するやつを開発トスル。すると、UNICHAR関数
(EXCEL関数)で、漢字が表示されるハズ
スゲーー完璧なプラン(計画) ✌
以下はその為の備忘録ぢゃ
─────────────────
unicode「304A」をUTF-8に変換
1 「304A」を2進数に変えます。
2 それが0800〜FFFF⇒
先頭から4, 6, 6ビットに分ける
3 それらの先頭に、E0,80,80を足す。
即ち 例「お」Unicode ⇒ UTF-8 は
304A ⇒ 0011 0000 0100 1010 ∴
304A ⇒ 0011 000001 001010 ∴
304A ⇒ 03 01 0A ∵16進数
これにE0,80,80を足す
304A ⇒ E3 81 8A ∵16進数
即ち例「お」UTF-8 ⇒ Unicode
E3 81 8A ⇒ 03 01 0A ∵E0,80,80を引く
03 01 0A ⇒ 304A ∵🤔
🤔のロジックを検討中
654デフォルトの名無しさん
2024/04/20(土) 21:23:20.18ID:TAp2l9om bit shift とか知ってる?
bit and とか bit or とかは?
bit and とか bit or とかは?
655デフォルトの名無しさん
2024/04/21(日) 01:26:18.38ID:MS9R2kFy bit shift等なんとなくわかる
で、何となく、どうにかなりそう。
x = x*2 '''xが128未満で左シフト
x = x\2 '''右シフト
x = x+192 '''xが64未満ならbit orかな
bit and はちょっと難しい
by 🤡
で、何となく、どうにかなりそう。
x = x*2 '''xが128未満で左シフト
x = x\2 '''右シフト
x = x+192 '''xが64未満ならbit orかな
bit and はちょっと難しい
by 🤡
656653
2024/04/21(日) 01:48:31.65ID:MS9R2kFy 例 UTF-8でE3 81 8Aを、文字表示
E3 81 8A ⇒ 03 01 0A ∵E0,80,80を引く
03 01 0A ⇒ 30 4A ∵🤔思考中
30 4A ⇒ 「お」∵Unichar関数を借用
🤔のロジックを関数UtfStrとする。
プロシジャー名はUtfStrとする。
Sub 図形_Click()
'「お」と表示されるハズ、多分
Msgbox UtfStr(&hE3h,&h81,&h8A)
End Sub
Function UtfStr(a1,a2,a3) as string
b1 = a1 - 224 '''&hE0 を引く
b2 = a2 - 128 '''&h80 を引く
b3 = a3 - 128 '''&h80 を引く
c=256*(16*b1+b2\4)+64*(b2 mod 4)+b3
UtfStr=WorksheetFunction.Unichar(c)
End Function
by 🤡机上済でも未テスト∴bugあるかも
E3 81 8A ⇒ 03 01 0A ∵E0,80,80を引く
03 01 0A ⇒ 30 4A ∵🤔思考中
30 4A ⇒ 「お」∵Unichar関数を借用
🤔のロジックを関数UtfStrとする。
プロシジャー名はUtfStrとする。
Sub 図形_Click()
'「お」と表示されるハズ、多分
Msgbox UtfStr(&hE3h,&h81,&h8A)
End Sub
Function UtfStr(a1,a2,a3) as string
b1 = a1 - 224 '''&hE0 を引く
b2 = a2 - 128 '''&h80 を引く
b3 = a3 - 128 '''&h80 を引く
c=256*(16*b1+b2\4)+64*(b2 mod 4)+b3
UtfStr=WorksheetFunction.Unichar(c)
End Function
by 🤡机上済でも未テスト∴bugあるかも
657656レビュー自作自演
2024/04/21(日) 06:35:47.14ID:MS9R2kFy 👤 cの計算式内の16*b1は左2BITシフト?
🤡 yes
b1 = a1 - 224 後の処理だから、
数式16*b1は、16*(a1 - 224)と同値だし
数式16*b1は、意訳で、左2BITシフトだ
🥳a1が224未満(モチ、a1がE0未満)で
バグる気がするぅーーー
早くテストしてバグって混乱するとヨイ
🤡UTF8で 00 00 00 〜 DF FF FF
でバグるか? んーーーー
🤡 yes
b1 = a1 - 224 後の処理だから、
数式16*b1は、16*(a1 - 224)と同値だし
数式16*b1は、意訳で、左2BITシフトだ
🥳a1が224未満(モチ、a1がE0未満)で
バグる気がするぅーーー
早くテストしてバグって混乱するとヨイ
🤡UTF8で 00 00 00 〜 DF FF FF
でバグるか? んーーーー
658657 とにかく早速テスト篇
2024/04/21(日) 08:23:58.98ID:MS9R2kFy 出演者
🥳バカテスター 🤡プロマネ(元プログラマ) 👤宇宙人のランベルト星人
🥳プロマネが作った>>656のVBAをRunしたらエラーでRunしない。バグ発見∴嬉しいデス
ちゃーーーーんとテストしてる証だぁ
🤡 &hE3h は、&hE3 だった。てかそんなの報告せず
修正してテストしろーーーちゅーーーの
🥳 で、修正してテストしたら上手くいっちゃった
ちゃんと、「お」とメッセージボックスに表示された
🤡 だろ\(^o^)/ ま、たった一文字だけど
今後は更にコード改造して、UTF8のをEXCELに表示させるぜ
🥳 たったの一文字で、それも「お」だけしかテストしてないぢゃーーー
🤡 最初の一歩はこんなもんだ。てかうっせーーー
🥳バカテスター 🤡プロマネ(元プログラマ) 👤宇宙人のランベルト星人
🥳プロマネが作った>>656のVBAをRunしたらエラーでRunしない。バグ発見∴嬉しいデス
ちゃーーーーんとテストしてる証だぁ
🤡 &hE3h は、&hE3 だった。てかそんなの報告せず
修正してテストしろーーーちゅーーーの
🥳 で、修正してテストしたら上手くいっちゃった
ちゃんと、「お」とメッセージボックスに表示された
🤡 だろ\(^o^)/ ま、たった一文字だけど
今後は更にコード改造して、UTF8のをEXCELに表示させるぜ
🥳 たったの一文字で、それも「お」だけしかテストしてないぢゃーーー
🤡 最初の一歩はこんなもんだ。てかうっせーーー
659658の続きてかプロマネの呟き
2024/04/21(日) 08:39:06.15ID:MS9R2kFy 🤡 Function UtfStr(a1,a2,a3) as string
だけど、引数a1,a2,a3 の型はどうしようかな?
未指定で上手くいっちゃったみたいたけど、
なんか、やーーーだな
修正前 (a1,a2,a3)
修正後案1 (a1 as byte,a2 as byte,a3 as byte)
修正後案2 (a1 as integer,a2 as integer,a3 as byte)
修正後案3 (a1 as long,a2 as long,a3 as long)
修正後案4 (a1 as double,a2 as double,a3 as double)
どれにしようかな? てかどれでもいいぽいけど
常識的には案1かな? てか案3もいいな。
てか、案4が個人的には好きだけど非常識だろし
案2にするなら、ヤッパ案3だし、んーーー
🥳 (a1 as byte,a2 as double,a3 as long)
はどう❓。なんでも上手くいくなら上手くいきそうぢゃーーーん
🤡非常識なヤツ。てか案3にしよっと
だけど、引数a1,a2,a3 の型はどうしようかな?
未指定で上手くいっちゃったみたいたけど、
なんか、やーーーだな
修正前 (a1,a2,a3)
修正後案1 (a1 as byte,a2 as byte,a3 as byte)
修正後案2 (a1 as integer,a2 as integer,a3 as byte)
修正後案3 (a1 as long,a2 as long,a3 as long)
修正後案4 (a1 as double,a2 as double,a3 as double)
どれにしようかな? てかどれでもいいぽいけど
常識的には案1かな? てか案3もいいな。
てか、案4が個人的には好きだけど非常識だろし
案2にするなら、ヤッパ案3だし、んーーー
🥳 (a1 as byte,a2 as double,a3 as long)
はどう❓。なんでも上手くいくなら上手くいきそうぢゃーーーん
🤡非常識なヤツ。てか案3にしよっと
660659についてランベルト星人感想
2024/04/21(日) 10:51:04.07ID:MS9R2kFy 👤 UTF8かつカテゴリ3BYTEなら、
そのロジックで、バッチリだろうが・・・
🤡 オレッちの開発の、秘伝の数式
c=256*(16*b1+b2\4)+64*(b2 mod 4)+b3
は、モチロンバッチリだよな ✌
👤 で、EXCEL VBAで実装するのか❓んーーー
🤡 モチロンだ。ってか連れないな。なんで
👤 その程度の数式なら、VBAは不要でさ、
EXCEL関数だけで、イケる気もする。
VBAを走らせなくても、UTF8コード値の入力
と同時に、文字(漢字等)が表示されるぜ
🤡 なるほど。入力と同時文字表示は、いいな
VBAでの実装は保留とし、EXCEL関数での
実装を検討とする
そのロジックで、バッチリだろうが・・・
🤡 オレッちの開発の、秘伝の数式
c=256*(16*b1+b2\4)+64*(b2 mod 4)+b3
は、モチロンバッチリだよな ✌
👤 で、EXCEL VBAで実装するのか❓んーーー
🤡 モチロンだ。ってか連れないな。なんで
👤 その程度の数式なら、VBAは不要でさ、
EXCEL関数だけで、イケる気もする。
VBAを走らせなくても、UTF8コード値の入力
と同時に、文字(漢字等)が表示されるぜ
🤡 なるほど。入力と同時文字表示は、いいな
VBAでの実装は保留とし、EXCEL関数での
実装を検討とする
661660
2024/04/21(日) 11:05:36.10ID:MS9R2kFy 👤 商を求めれるExcel関数は、QUOTIENT
且つ、余りは、Excel関数は、MODだ
且つ、EXCEL関数には、HEX2DECも存在
且つ、EXCEL関数には、UNICHARが存在
🤡 上手くやれば、EXCEL関数に、
UTF8CHARがなくても、UTF8CHARって感じの処理は可能な様な気がする
🥳 どうせ一文字だけだろ。まだまだぢゃーん。
🤡 最初の一歩は、慌ててはいけない。
「恋は焦らず」なんて題名の曲があるだろ
てか、文字連結はEXCEL関数てか&できるし
数十文字位の改造も、楽勝と思うよん。
🥳 ちぇっ、つまんないの。楽勝なのかよ
てか、カテゴリ3BYTE以外はバグぢゃない?
🤡 可能性は高いけど、カテゴリ3BYTE専用だ
🥳 なんか狡いのーーーー
🤡 これで良いのだ。
且つ、余りは、Excel関数は、MODだ
且つ、EXCEL関数には、HEX2DECも存在
且つ、EXCEL関数には、UNICHARが存在
🤡 上手くやれば、EXCEL関数に、
UTF8CHARがなくても、UTF8CHARって感じの処理は可能な様な気がする
🥳 どうせ一文字だけだろ。まだまだぢゃーん。
🤡 最初の一歩は、慌ててはいけない。
「恋は焦らず」なんて題名の曲があるだろ
てか、文字連結はEXCEL関数てか&できるし
数十文字位の改造も、楽勝と思うよん。
🥳 ちぇっ、つまんないの。楽勝なのかよ
てか、カテゴリ3BYTE以外はバグぢゃない?
🤡 可能性は高いけど、カテゴリ3BYTE専用だ
🥳 なんか狡いのーーーー
🤡 これで良いのだ。
662661
2024/04/21(日) 11:12:44.58ID:MS9R2kFy 🤡てかカテゴリ3って何❓
👤地球のネットによると漢字の様な感じだ。てか
オレの霊感ではほぼ大部分の全角文字の気がする
なお、霊的な直感なので、違っても怒るなよ
🥳ランベルト星人って地球人より無限大頭がヨイのに
霊感とか直感なのかよ。
てかさ、漢字は全角だし、ネットで漢字とか記載されてるけど
ポクのヤマ感だと全角文字の、ことだろ。てかなんで
カテゴリ3byteなんだろう。全角って2byteって気もする
🤡んーーオマエのヤマ感より宇宙人の霊感が正しい気がする、霊感的に
👤地球のネットによると漢字の様な感じだ。てか
オレの霊感ではほぼ大部分の全角文字の気がする
なお、霊的な直感なので、違っても怒るなよ
🥳ランベルト星人って地球人より無限大頭がヨイのに
霊感とか直感なのかよ。
てかさ、漢字は全角だし、ネットで漢字とか記載されてるけど
ポクのヤマ感だと全角文字の、ことだろ。てかなんで
カテゴリ3byteなんだろう。全角って2byteって気もする
🤡んーーオマエのヤマ感より宇宙人の霊感が正しい気がする、霊感的に
663662
2024/04/21(日) 11:20:51.43ID:MS9R2kFy 👤 ーーー、いやま、半角のカナ記号も
UTF8では3byteだし、半角でもカナはカテゴリ3
だ。半角英数はASCiiだからカテゴリ3ぢゃないと思う
てか、地球のUTF8訳わからん。
てか、EXCEL関数でもVBAでもどっちでも良いのでドンドン実装しちゃいなさーーーーい
🥳ドンドンしちゃいなさーーーーい
UTF8では3byteだし、半角でもカナはカテゴリ3
だ。半角英数はASCiiだからカテゴリ3ぢゃないと思う
てか、地球のUTF8訳わからん。
てか、EXCEL関数でもVBAでもどっちでも良いのでドンドン実装しちゃいなさーーーーい
🥳ドンドンしちゃいなさーーーーい
664プロマネ ノーコードで完成報告
2024/04/21(日) 12:46:15.51ID:MS9R2kFy665664よ。何が完成だの巻
2024/04/21(日) 13:30:07.84ID:MS9R2kFy 🥳ていうかさ、664よ。何が完成だ❢
S社のスマホの連絡帳で
vcfエクスポートしたら、
ファイルcontacts.vcfがエクスポートされ
それをウインドウズパソコンに
移動させて、
contacts.vcfを開いたら文字化けた。
電話番号は半角数字の為かバッチリだが
氏名(妙・名) など、文字化けで読めん。
ちなみに、メモ帳で開いたら
=E9=8A=80=E8=A1=8C という感じで表示
ま、UTF8ぽいけど、なんだこれ👿
「=E9=8A=80=E8=A1=8C」 ぢゃなくて
「銀行」を出力しろっつうの
※補足 E9 8A 80 は銀でE8 A1 8Cは行
ていうかさ、
「=E9=8A=80=E8=A1=8C」とセル入力で
「銀行」をセルに出力する
EXCEL VBA できればノーコードで
EXCEL 関数で、
「=E9=8A=80=E8=A1=8C」とセル入力で
「銀行」をセルに出力する
やつ作れーー
by 🥳バカテスターだが、ご尤もな主張
S社のスマホの連絡帳で
vcfエクスポートしたら、
ファイルcontacts.vcfがエクスポートされ
それをウインドウズパソコンに
移動させて、
contacts.vcfを開いたら文字化けた。
電話番号は半角数字の為かバッチリだが
氏名(妙・名) など、文字化けで読めん。
ちなみに、メモ帳で開いたら
=E9=8A=80=E8=A1=8C という感じで表示
ま、UTF8ぽいけど、なんだこれ👿
「=E9=8A=80=E8=A1=8C」 ぢゃなくて
「銀行」を出力しろっつうの
※補足 E9 8A 80 は銀でE8 A1 8Cは行
ていうかさ、
「=E9=8A=80=E8=A1=8C」とセル入力で
「銀行」をセルに出力する
EXCEL VBA できればノーコードで
EXCEL 関数で、
「=E9=8A=80=E8=A1=8C」とセル入力で
「銀行」をセルに出力する
やつ作れーー
by 🥳バカテスターだが、ご尤もな主張
666プロマネてか自作自演
2024/04/21(日) 13:39:02.51ID:MS9R2kFy >>665 うっせいなーーてか、あのロジックは
Excel関数で絶対参照はやらずに、相対参照のみで構築した
リロケータブルって感じロジックだから、
ロジックの改造は用意だ。でも
ヒマな時につくる。
イコールがでリミッターって感じだな。
ま、尤もな主張は認める。てかノーコードは修正が楽ちん
ただし、ロジックは、VBAで設計するのがいいり
実装はそのVBAを参考にヒトがEXCEL関数に手作業で実装だ。
🥳てか、どうでもいいから、早くつくってよ
CONTACT.VCF あれ文字化けだよな❓
🤡おれも、それは、文字化けだと思う。
Excel関数で絶対参照はやらずに、相対参照のみで構築した
リロケータブルって感じロジックだから、
ロジックの改造は用意だ。でも
ヒマな時につくる。
イコールがでリミッターって感じだな。
ま、尤もな主張は認める。てかノーコードは修正が楽ちん
ただし、ロジックは、VBAで設計するのがいいり
実装はそのVBAを参考にヒトがEXCEL関数に手作業で実装だ。
🥳てか、どうでもいいから、早くつくってよ
CONTACT.VCF あれ文字化けだよな❓
🤡おれも、それは、文字化けだと思う。
667デフォルトの名無しさん
2024/04/21(日) 13:57:13.06ID:otjfab/5 悪いけどなにひとつ面白くないよ
当人だけがユーモアセンスあると思いこんでる中高年フリーランス(お察しください)か何かか
NGNAMEしようにもご丁寧に毎回名前欄かえてくれてるみたいだしなあ
いつまで続けるつもりなの?
当人だけがユーモアセンスあると思いこんでる中高年フリーランス(お察しください)か何かか
NGNAMEしようにもご丁寧に毎回名前欄かえてくれてるみたいだしなあ
いつまで続けるつもりなの?
668ランベルト星人
2024/04/21(日) 16:51:27.41ID:MS9R2kFy なんやかんやで、読者さんがいる。という訳で
ノーコード(といってもexcel関数で概略)
セル★に「:=E9=8A=80」入力
注 先頭には「:」を入れる事
セル☆はMID(★,3,2) でそこは「E9」表示
セル□はMID(★,6,2) でそこは「8A」表示
セル○はMID(★,9,2) でそこは「80」表示
セル🟦はHEX2DEC(☆)で 233 となる
セル🟫はHEX2DEC(□)で 138 となる
セル🟪はHEX2DEC(○)で 128 となる
セル⭐は以下の数式でUNICODEにさせる
256*(16*(🟦-224)+INT((🟫-128)/4))
+64*(MOD((🟫-128),4))
+(🟪-128)
で ⭐は37504 となる
セル🌟はUNICHAR(⭐)で「銀」と表示
by 👤 これがランベルト星人のノーコードでのロジックだ(注 概略)
ノーコード(といってもexcel関数で概略)
セル★に「:=E9=8A=80」入力
注 先頭には「:」を入れる事
セル☆はMID(★,3,2) でそこは「E9」表示
セル□はMID(★,6,2) でそこは「8A」表示
セル○はMID(★,9,2) でそこは「80」表示
セル🟦はHEX2DEC(☆)で 233 となる
セル🟫はHEX2DEC(□)で 138 となる
セル🟪はHEX2DEC(○)で 128 となる
セル⭐は以下の数式でUNICODEにさせる
256*(16*(🟦-224)+INT((🟫-128)/4))
+64*(MOD((🟫-128),4))
+(🟪-128)
で ⭐は37504 となる
セル🌟はUNICHAR(⭐)で「銀」と表示
by 👤 これがランベルト星人のノーコードでのロジックだ(注 概略)
669668の補足
2024/04/21(日) 16:56:31.18ID:MS9R2kFy ⭐の37054はunicodeだけど十進数のunicode 単なる補足でした
さてと、一段落したから、次回は暫くかも。気が向いたら
また投稿するね。てか、文字化けvcfの漢字が表示されたので
嬉しくなって投稿しちゃいましたーーーでは、バイバイ👋
さてと、一段落したから、次回は暫くかも。気が向いたら
また投稿するね。てか、文字化けvcfの漢字が表示されたので
嬉しくなって投稿しちゃいましたーーーでは、バイバイ👋
670668の補足
2024/04/21(日) 18:33:10.13ID:MS9R2kFy 🥳 今イロイロ、連絡帳のcontact.vcfのを半手作業で
その668のロジックで、文字表示してみたんだけど・・・
30点不合格って感じですね。入力と同時に文字が表示されるのは
素晴らしいけど、でも
🙆 漢字(全角)なら、まず正しく表示
❌ 半角英数字は、⭐が異常な値(例えば負数)になり
はUNICHAR(⭐)で エラーで、#VALUEと表示ですな
EXCEL関数でやるのは、困難と判断する。
🤡ま、氏名とか住所の項目に全角文字だけなら上手くいきそ
でも、その様な項目に半角文字が混ざるとダメか、
これは、ヤッパバグだな。(;´д`)トホホ…
例
5チャンネル なら○と思われるが
5チャンネル は、5のUTF8は&H35で&hE0未満故に🙅
∴ >>657の指摘が的中かよ。
バカテスター、なかなかやるな
てか、(;´д`)トホホ…
その668のロジックで、文字表示してみたんだけど・・・
30点不合格って感じですね。入力と同時に文字が表示されるのは
素晴らしいけど、でも
🙆 漢字(全角)なら、まず正しく表示
❌ 半角英数字は、⭐が異常な値(例えば負数)になり
はUNICHAR(⭐)で エラーで、#VALUEと表示ですな
EXCEL関数でやるのは、困難と判断する。
🤡ま、氏名とか住所の項目に全角文字だけなら上手くいきそ
でも、その様な項目に半角文字が混ざるとダメか、
これは、ヤッパバグだな。(;´д`)トホホ…
例
5チャンネル なら○と思われるが
5チャンネル は、5のUTF8は&H35で&hE0未満故に🙅
∴ >>657の指摘が的中かよ。
バカテスター、なかなかやるな
てか、(;´д`)トホホ…
671デフォルトの名無しさん
2024/04/21(日) 21:29:10.71ID:o+cJ3WcJ 何これ最近流行りのスクリプト?
672デフォルトの名無しさん
2024/04/21(日) 22:29:13.79ID:MS9R2kFy スクリプト? いやexcel関数で⭐とかは任意のセルの意味
ちなみに、全角漢字+半角数字混在のcontact.vcf
のUTF8らしき、文字化けで読めないのは、ドウニカ、なった
ちなみに、全角漢字+半角数字混在のcontact.vcf
のUTF8らしき、文字化けで読めないのは、ドウニカ、なった
673デフォルトの名無しさん
2024/04/21(日) 22:51:17.48ID:ZC2cYJ3v >>636
UTF8なんて欠陥規格は使用禁止にすべきだな。殆どの文字がUnicodeの原形が分からないほど
いじくりまわされたコードにされてしまい非常に分かりにくいし、大部分の文字がUTF16より
バイト数が多くなってしまうから。単にASCIIがUTF8でも同じコードで同じバイト数で表せるという
理由だけのために、ASCIIに未練がある老害が欠陥規格を押し付けている。英語のまともな文章すら
書けないASCIIなんてもはやゴミ同然なのに、変化を受けいられないのは頑迷固陋すぎる。
UTF8なんて欠陥規格は使用禁止にすべきだな。殆どの文字がUnicodeの原形が分からないほど
いじくりまわされたコードにされてしまい非常に分かりにくいし、大部分の文字がUTF16より
バイト数が多くなってしまうから。単にASCIIがUTF8でも同じコードで同じバイト数で表せるという
理由だけのために、ASCIIに未練がある老害が欠陥規格を押し付けている。英語のまともな文章すら
書けないASCIIなんてもはやゴミ同然なのに、変化を受けいられないのは頑迷固陋すぎる。
674デフォルトの名無しさん
2024/04/21(日) 22:51:46.82ID:ZC2cYJ3v ASCIIからの訣別を促進するため、プログラム言語の予約語や演算子、HTMLのタグなどに
ASCIIにない文字をどんどん採用すれば良い。老害もASCII外の文字を強制的に使わせられれば、
奇怪な変換をしない素直なコードが合理的で優れていることを思い知らされるだろう。
ASCIIにない文字をどんどん採用すれば良い。老害もASCII外の文字を強制的に使わせられれば、
奇怪な変換をしない素直なコードが合理的で優れていることを思い知らされるだろう。
675デフォルトの名無しさん
2024/04/22(月) 06:39:46.57ID:K/eQNJGk よくわかるけど、よくわからないから、
絵文字も、ASCのも、全角漢字も、半角数字も、半角カナ
なんでも、4byteのコードであるUTF32 にしろーーー
ASCとかUTF8とかUNICODEとかEDなんとかは、今すぐ廃止しろー
てか、UTF32ってなんでも4BYTE/文字 なの❓
だとしたら、UTF32だけでいいんぢゃなーーい。
UTF8 UTF16 UNICODEも今すぐ廃止しろーーーーーー
絵文字も、ASCのも、全角漢字も、半角数字も、半角カナ
なんでも、4byteのコードであるUTF32 にしろーーー
ASCとかUTF8とかUNICODEとかEDなんとかは、今すぐ廃止しろー
てか、UTF32ってなんでも4BYTE/文字 なの❓
だとしたら、UTF32だけでいいんぢゃなーーい。
UTF8 UTF16 UNICODEも今すぐ廃止しろーーーーーー
676デフォルトの名無しさん
2024/04/22(月) 06:44:03.13ID:K/eQNJGk ていうか、UTF8は、名前をかえろーーーーー
UTF8は、UTF8兼UTF16兼UTF24兼UTF32 という名称にしろ
てか、UTF8は なんちゃってUTF8 がいい。
by 🥳
UTF8は、UTF8兼UTF16兼UTF24兼UTF32 という名称にしろ
てか、UTF8は なんちゃってUTF8 がいい。
by 🥳
677デフォルトの名無しさん
2024/04/22(月) 06:55:50.72ID:K/eQNJGk そうだ。ASCIIは、廃止しろーーーーーー老害だーーー
だけど、ASCIIアート廃止は、反対だーーーーー
てか、やっぱりEBCDIC IBMが1963年に定めた8ビットの文字コード
にしろーーー。老害も、超賛成すると思う
しかも、8ビットだから、EBCDICこそ、UTF8という名前にして
今のUTF8は、モピロン、なんちゃってUTF8に改名しなさーーい
ていうか、EBCDICなら、老害も賛成するんぢゃなーーーい❓
てか、5CHってサイコー、絵文字も、お絵描きも
化けない ぽぃ
だけど、ASCIIアート廃止は、反対だーーーーー
てか、やっぱりEBCDIC IBMが1963年に定めた8ビットの文字コード
にしろーーー。老害も、超賛成すると思う
しかも、8ビットだから、EBCDICこそ、UTF8という名前にして
今のUTF8は、モピロン、なんちゃってUTF8に改名しなさーーい
ていうか、EBCDICなら、老害も賛成するんぢゃなーーーい❓
てか、5CHってサイコー、絵文字も、お絵描きも
化けない ぽぃ
678備忘録but厳密さは低い
2024/04/22(月) 09:17:14.56ID:K/eQNJGk n文字目の最初のが、E0以上は
n文字目は、UTF8カテゴリ3byte
n文字目の最初のが、E0未満は
n文字目は、UTF8カテゴリ1byte∴ASC
n文字目は、UTF8カテゴリ3byte
n文字目の最初のが、E0未満は
n文字目は、UTF8カテゴリ1byte∴ASC
679単なるロジックの自主練習
2024/04/22(月) 09:31:13.54ID:K/eQNJGk 「赤」という文字の色は、黒だけど
「赤」という文字の文字コードは、「黒」の文字コードと異なる
当たり前ではある。 さて、
000000000011111111
123456789012345678
「UTF8 PRINTABLE:=30」という感じの文章があるとする
これは、18文字だと思うだろ?!
でも、どうやら1文字だ。なぜかって
意訳すると、その18文字は「0」という1文字だ
ちなみに、0x30はUTF8でもASCiiでも「0」という1文字
だったかな。 by 👤地球人の文章には呆れる┐( ∵ )┌
てか、UTF8よりASCIIアートがこれから主流だーーーー✌
「赤」という文字の文字コードは、「黒」の文字コードと異なる
当たり前ではある。 さて、
000000000011111111
123456789012345678
「UTF8 PRINTABLE:=30」という感じの文章があるとする
これは、18文字だと思うだろ?!
でも、どうやら1文字だ。なぜかって
意訳すると、その18文字は「0」という1文字だ
ちなみに、0x30はUTF8でもASCiiでも「0」という1文字
だったかな。 by 👤地球人の文章には呆れる┐( ∵ )┌
てか、UTF8よりASCIIアートがこれから主流だーーーー✌
680678よ。4byte文字をサポートしろ
2024/04/22(月) 10:01:00.58ID:K/eQNJGk >>678 なにこの、厳密性の低いロジック
やっぱりこれからは、>>679様のご主張の通り
絵文字1⃣💃🤡とか、ASCIIアート的な文字だ。
ASCIIアート的なのは、ASCII4文字がいいな。
4文字熟語というか、4文字ASCIIだ。ていうかさ
お前の書き込んだ
n文字目の最初のが、E0以上は
n文字目は、UTF8カテゴリ3byte
は、ラフすぎる
n文字目の最初のがE0以上F0未満⇒n文字目は3byte文字
n文字目の最初のがF0以上⇒n文字目は4byte文字
だぜ。
おそらく、4byteのは絵文字💃🤡1⃣とかだから、
絵文字もバッチリな変換ロジックとなるぜ、
1byte〜3byte文字の様な、asciiとか全角漢字なんて
もうこんなの文字ですらないもんねー。廃止しろー
で、絵文字とasciiアートだけでよろしいーーーー✌
やっぱりこれからは、>>679様のご主張の通り
絵文字1⃣💃🤡とか、ASCIIアート的な文字だ。
ASCIIアート的なのは、ASCII4文字がいいな。
4文字熟語というか、4文字ASCIIだ。ていうかさ
お前の書き込んだ
n文字目の最初のが、E0以上は
n文字目は、UTF8カテゴリ3byte
は、ラフすぎる
n文字目の最初のがE0以上F0未満⇒n文字目は3byte文字
n文字目の最初のがF0以上⇒n文字目は4byte文字
だぜ。
おそらく、4byteのは絵文字💃🤡1⃣とかだから、
絵文字もバッチリな変換ロジックとなるぜ、
1byte〜3byte文字の様な、asciiとか全角漢字なんて
もうこんなの文字ですらないもんねー。廃止しろー
で、絵文字とasciiアートだけでよろしいーーーー✌
681文字化け
2024/04/22(月) 10:06:31.97ID:K/eQNJGk 5chの書込で絵文字1⃣って書き込むと
お絵描きのようには表示されません、
バグってるぅーーーーと思う
by🥳発達障害テスター
お絵描きのようには表示されません、
バグってるぅーーーーと思う
by🥳発達障害テスター
682備忘録but厳密さは低い
2024/04/22(月) 14:05:18.79ID:K/eQNJGk >>678 680 UTF8は、
F0-F7は4バイト、F8-FBは5バイト、FC-FDは6バイト らしっす。
F0-F7は4バイト、F8-FBは5バイト、FC-FDは6バイト らしっす。
6830682の続き
2024/04/22(月) 16:14:40.14ID:K/eQNJGk 👤 でUTF8は、FE-FFは何バイトだ。その調子なら7バイトか?
地球の書では、それは最大6バイトだから
6以下なのに7バイトというランベルト星にも存在しない値か❓
🤡第1バイト目は、UTF8は、第1バイト目は、FE-FFは、UTF8でない
との旨がネット記載されてる。意味は通じない文章だ
👤んーー地球人は理解できん。てか一応地球の論理学的には
UTF8でないと仮定で、UTF8でない ∵自明 @
UTF8であると仮定で、UTF8でない ∵背理法?A
@でもAでもUTF8でない だな。
もし、UTF8なのに第1文字バイト目がFEまたはFF⇒
そもそも、変換プログラムがバグってるか、
そもそも、UTF8ですらない。
というのだろう
念のため、ASCIIコードでFE FFのASCIIコードが
存在するような体系があるか調査しておけ
🤡めんどくせー、3バイト文字と、みなして変換して
変換エラーになるだろうから、それでお茶濁すのが
実現的なオレッちのやり方。ぢゃーバイバイ👋👋👋
地球の書では、それは最大6バイトだから
6以下なのに7バイトというランベルト星にも存在しない値か❓
🤡第1バイト目は、UTF8は、第1バイト目は、FE-FFは、UTF8でない
との旨がネット記載されてる。意味は通じない文章だ
👤んーー地球人は理解できん。てか一応地球の論理学的には
UTF8でないと仮定で、UTF8でない ∵自明 @
UTF8であると仮定で、UTF8でない ∵背理法?A
@でもAでもUTF8でない だな。
もし、UTF8なのに第1文字バイト目がFEまたはFF⇒
そもそも、変換プログラムがバグってるか、
そもそも、UTF8ですらない。
というのだろう
念のため、ASCIIコードでFE FFのASCIIコードが
存在するような体系があるか調査しておけ
🤡めんどくせー、3バイト文字と、みなして変換して
変換エラーになるだろうから、それでお茶濁すのが
実現的なオレッちのやり方。ぢゃーバイバイ👋👋👋
684683の続き
2024/04/22(月) 16:24:58.60ID:K/eQNJGk 🤡てか、ASCii 127は存在する。16進数に翻訳すると
ASCii FF は存在すると言うことになる。
👤 んーやはり思ったとおりだ、FFがある、でなんて文字だ
🤡 文字をパンチ穴空けて消しちゃうという機能のようだ
👤 紙に穴🕳を空けて、文字を消すってことなのか❓
🤡 多分そうだ、モピロンUTF8もその機能を継承すべきだよな。
👤 モピロンた。🕳を、空けて文字を消すのだ。てか
地球人は頭が変だ。
ASCii FF は存在すると言うことになる。
👤 んーやはり思ったとおりだ、FFがある、でなんて文字だ
🤡 文字をパンチ穴空けて消しちゃうという機能のようだ
👤 紙に穴🕳を空けて、文字を消すってことなのか❓
🤡 多分そうだ、モピロンUTF8もその機能を継承すべきだよな。
👤 モピロンた。🕳を、空けて文字を消すのだ。てか
地球人は頭が変だ。
685発達障害テスター
2024/04/22(月) 16:30:05.52ID:K/eQNJGk 🥳 えー、ウッソーーー
バイナリファイルにFF FF FF FF FF FF ・・・・・・
で、メモ帳でUTF8でそのファイルを開くと
んーーーきっと🕳🕳🕳🕳🕳が表示されてさ、
それを印刷すると、プリンタが紙を🕳穴だらけにしてくれるか
早くテストしてみようーーーーよ。
👤🤡 オマエはもっと頭が変だ。
バイナリファイルにFF FF FF FF FF FF ・・・・・・
で、メモ帳でUTF8でそのファイルを開くと
んーーーきっと🕳🕳🕳🕳🕳が表示されてさ、
それを印刷すると、プリンタが紙を🕳穴だらけにしてくれるか
早くテストしてみようーーーーよ。
👤🤡 オマエはもっと頭が変だ。
686備忘録but厳密さは低い
2024/04/22(月) 17:34:03.27ID:K/eQNJGk てか😅
1111 1111 = 255 = FF
0111 1111 = 127 = 7F だFFと7Fは違うといというか、カテゴリー何バイトにするのか
はやく、設計決めろーーちゅーーーの
1111 1111 = 255 = FF
0111 1111 = 127 = 7F だFFと7Fは違うといというか、カテゴリー何バイトにするのか
はやく、設計決めろーーちゅーーーの
687備忘録but厳密さは低い
2024/04/22(月) 18:16:52.29ID:K/eQNJGk 🤡突然ですが、下記要領でテストやれ
バイナリエディタぽぃツールで16進で
31 32 33 34 35 7F FF 31 32 33 34 35
のファイルを作成。それを
メモ帳でUTF8で開く
尚フォントはいつものヤツとする
🥳の予想:12345🕳?????? と表示され
そして、🕳と表示のとこは、絶対
穴が開き壊れちゃいますぅーーーーー
👤の霊感:12345 か 12345(del) って感じ
🤡答え
12345・12345 と表示された
ただし、・は UNICODE 30FB ではなく
なんと、・は UNICODE F8F3 だ
F8F3というUNICODE は、
ネットで調べたが、意味がわからん∴謎
バイナリエディタぽぃツールで16進で
31 32 33 34 35 7F FF 31 32 33 34 35
のファイルを作成。それを
メモ帳でUTF8で開く
尚フォントはいつものヤツとする
🥳の予想:12345🕳?????? と表示され
そして、🕳と表示のとこは、絶対
穴が開き壊れちゃいますぅーーーーー
👤の霊感:12345 か 12345(del) って感じ
🤡答え
12345・12345 と表示された
ただし、・は UNICODE 30FB ではなく
なんと、・は UNICODE F8F3 だ
F8F3というUNICODE は、
ネットで調べたが、意味がわからん∴謎
688プロマネの憶測
2024/04/22(月) 18:25:11.98ID:K/eQNJGk 🤡 ちなみに、・はメモ帳からexcelにコピペし
DEC2HEX(UNICODE(⭐))というEXCEL関数したら
F8F3 と表示された
ってことは、
utf8の 7F FF ⇔ unicodeの F8 F3
との変換をメモ帳は内部でやっていると
憶測される。
BY 🤡の憶測の的中率は6.66‥%
DEC2HEX(UNICODE(⭐))というEXCEL関数したら
F8F3 と表示された
ってことは、
utf8の 7F FF ⇔ unicodeの F8 F3
との変換をメモ帳は内部でやっていると
憶測される。
BY 🤡の憶測の的中率は6.66‥%
689デフォルトの名無しさん
2024/04/22(月) 18:39:14.77ID:K/eQNJGk てかUnicodeの範囲外かつ、UTF8の範囲外としても、
一応UTF8を変換してはくれてる。
というか。地球の書、主語を意図的曖昧にして解りづらくしてるんとちゃう❓
一応UTF8を変換してはくれてる。
というか。地球の書、主語を意図的曖昧にして解りづらくしてるんとちゃう❓
690686
2024/04/22(月) 18:40:22.96ID:K/eQNJGk てかカテゴリー何バイトにするのか はやく、設計決めろーーちゅーーーの
691プロマネ(との設定)
2024/04/22(月) 21:01:36.75ID:K/eQNJGk >>668 ランベルト星人よ。それはカテゴリー3の場合の数式だな
オマエのは、地球のネットの文学作品を読んで作ったような数式だ。
ていうか、これが秘伝の数式だ
UTF8 = 14897152+ UNICODE ∵カテゴリー3
但し、UNICODE UTF8一覧表をみて、霊感で閃いた数式なので
これが間違ってても怒らないでね
by 🤡プロマネ
🥳プロマネやるーーーー。中学一年生の数学レベルぢゃーーん
ランベルトって宇宙人、厨房よりバカなの❓
👤うっせー。なんか数式一発なんて狡い。
🥳あ、負け惜しみだーーーー
🤡いや、まだテストしてない。それに霊感だ。
😅カテゴリー何バイトにするのかは、後回しで
その数式で上手くいくか、早くテストしろー でカテゴリー3専用だろ
🤡ちなみに、
UTF8 = ASCii ∵カテゴリー1 だ
😅はやくカテゴリーを計算するのをつくれーーーー
オマエのは、地球のネットの文学作品を読んで作ったような数式だ。
ていうか、これが秘伝の数式だ
UTF8 = 14897152+ UNICODE ∵カテゴリー3
但し、UNICODE UTF8一覧表をみて、霊感で閃いた数式なので
これが間違ってても怒らないでね
by 🤡プロマネ
🥳プロマネやるーーーー。中学一年生の数学レベルぢゃーーん
ランベルトって宇宙人、厨房よりバカなの❓
👤うっせー。なんか数式一発なんて狡い。
🥳あ、負け惜しみだーーーー
🤡いや、まだテストしてない。それに霊感だ。
😅カテゴリー何バイトにするのかは、後回しで
その数式で上手くいくか、早くテストしろー でカテゴリー3専用だろ
🤡ちなみに、
UTF8 = ASCii ∵カテゴリー1 だ
😅はやくカテゴリーを計算するのをつくれーーーー
692カテゴリーを仮計算 仮 仮
2024/04/23(火) 06:31:34.43ID:4WFWNNQf 先頭文字 カテゴリ
─── ──
00-7F ⇒ 1
C2-DF ⇒ 2
E0-EF ⇒ 3
F0-F7 ⇒ 4
F8-FB ⇒ 5
FC-FD ⇒ 6
上記以外 んーーー暫定カテゴリー1?
─── ──
00-7F ⇒ 1
C2-DF ⇒ 2
E0-EF ⇒ 3
F0-F7 ⇒ 4
F8-FB ⇒ 5
FC-FD ⇒ 6
上記以外 んーーー暫定カテゴリー1?
693デフォルトの名無しさん
2024/04/23(火) 07:48:18.49ID:1Q5bRy/V694ランベルト星人
2024/04/23(火) 08:45:19.27ID:4WFWNNQf 👤
コラ、プロマネよ。チミの数式一発のやつ
カテゴリ3バイトのでも、99%超の確率でダメだ。
霊感どころか、直感もないダメ数式ですよーーー
やはり、カテゴリ3のほぼ99%以上(霊感では100%)について
下記の、超秘伝の数式でバッチリなのぢゃ
🟦1byte目のUTF8の10進数 トスル 且つ
🟫2byte目の それだ トスル 且つ
🟪3byte目の ぢゃ トスル
スルト、
⭐ = 256*(16*(🟦-224)+INT((🟫-128)/4))
+64*(MOD((🟫-128),4))
+(🟪-128)
というランベルト星の秘伝の数式により
⭐には地球人が発明したUTF8の10進数をゲットぢゃ
なお、霊感では、多分全てのカテゴリー3の文字で成立のありがたい数式ぢゃ
🥳 プロマネダメぢゃーーーーん。霊感に頼るからだよん
てかランベルト、やるぢゃーーん。霊感バッチリぢゃーーん、
👤 いや、霊感というか地球の書をやっと理解して後は、ま霊感ぢゃ
コラ、プロマネよ。チミの数式一発のやつ
カテゴリ3バイトのでも、99%超の確率でダメだ。
霊感どころか、直感もないダメ数式ですよーーー
やはり、カテゴリ3のほぼ99%以上(霊感では100%)について
下記の、超秘伝の数式でバッチリなのぢゃ
🟦1byte目のUTF8の10進数 トスル 且つ
🟫2byte目の それだ トスル 且つ
🟪3byte目の ぢゃ トスル
スルト、
⭐ = 256*(16*(🟦-224)+INT((🟫-128)/4))
+64*(MOD((🟫-128),4))
+(🟪-128)
というランベルト星の秘伝の数式により
⭐には地球人が発明したUTF8の10進数をゲットぢゃ
なお、霊感では、多分全てのカテゴリー3の文字で成立のありがたい数式ぢゃ
🥳 プロマネダメぢゃーーーーん。霊感に頼るからだよん
てかランベルト、やるぢゃーーん。霊感バッチリぢゃーーん、
👤 いや、霊感というか地球の書をやっと理解して後は、ま霊感ぢゃ
695発達障害テスター
2024/04/23(火) 10:55:15.34ID:4WFWNNQf 🥳 UnicodeとUTF8をまったく別のものていうか、
UnicodeでUTF32の亜種のような気がする
👤 ┐(‘〜`;)┌
UnicodeでUTF32の亜種のような気がする
👤 ┐(‘〜`;)┌
696デフォルトの名無しさん
2024/04/23(火) 13:13:02.11ID:veCrNLlk よく使う言葉を漢字1文字に割り当てるルールがあればよい
ウクライナ→浮など
同じ漢字の場合の勝ち負けルールも決めておく
ウクライナ→浮など
同じ漢字の場合の勝ち負けルールも決めておく
697ランベルト星人
2024/04/23(火) 16:35:40.45ID:4WFWNNQf 2byte専用縛りのUTF to UNICODE の変換数式だ
【カテゴリ2専用 普通にテスト済】
セル★に「:=C2=AE」と入力
注 先頭には「:」を入れる事
セル☆はMID(★,3,2) でそこは「C2」表示
セル□はMID(★,6,2) でそこは「AE」表示
セル🟦はHEX2DEC(☆)で 194 となる
セル🟫はHEX2DEC(□)で 174 となる
セル⭐は以下の数式でUNICODEにさせる
⭐=64*(🟦-192)+(🟫-128)
で ⭐は 174 となった
セル🌟はUNICHAR(⭐)で「®」と表示
なお、ある ンゴ文字 を連結で
表示が逆(右から左)に表示されたり、
右詰めに表示されたりしたが
キニシナイとする。エクセルでの表示だし
とにかく、下記数式は、バッチリ
⭐=64*(🟦-192)+(🟫-128) ∵2byte専用
BY 👤まずまずなので嬉しくて投稿しちゃった
🥳ランベルトって子供みたーーーーい
【カテゴリ2専用 普通にテスト済】
セル★に「:=C2=AE」と入力
注 先頭には「:」を入れる事
セル☆はMID(★,3,2) でそこは「C2」表示
セル□はMID(★,6,2) でそこは「AE」表示
セル🟦はHEX2DEC(☆)で 194 となる
セル🟫はHEX2DEC(□)で 174 となる
セル⭐は以下の数式でUNICODEにさせる
⭐=64*(🟦-192)+(🟫-128)
で ⭐は 174 となった
セル🌟はUNICHAR(⭐)で「®」と表示
なお、ある ンゴ文字 を連結で
表示が逆(右から左)に表示されたり、
右詰めに表示されたりしたが
キニシナイとする。エクセルでの表示だし
とにかく、下記数式は、バッチリ
⭐=64*(🟦-192)+(🟫-128) ∵2byte専用
BY 👤まずまずなので嬉しくて投稿しちゃった
🥳ランベルトって子供みたーーーーい
698697訂正
2024/04/23(火) 16:42:46.35ID:4WFWNNQf ❌ンゴ文字 ⭕ンコ文字 に訂正
699デフォルトの名無しさん
2024/04/23(火) 17:41:40.24ID:gmQp6YI4 >>674
プログラム言語の予約語や演算子、HTMLのタグなどには
制御文字を使えばその文字がコマンドの一部なのかデータなのかどうか
判別しやすくなるのにそんな使われ方にはならなかったね。
0x1B(ESC)はそのために存在する文字なのに。
プログラム言語の予約語や演算子、HTMLのタグなどには
制御文字を使えばその文字がコマンドの一部なのかデータなのかどうか
判別しやすくなるのにそんな使われ方にはならなかったね。
0x1B(ESC)はそのために存在する文字なのに。
7000692の改訂∴朝令暮改
2024/04/23(火) 20:49:00.69ID:4WFWNNQf 【修正前】
UTF8文字 カテゴリ
─── ──
00-7F ⇒ 1
C2-DF ⇒ 2
E0-EF ⇒ 3
F0-F7 ⇒ 4
F8-FB ⇒ 5
FC-FD ⇒ 6
上記以外 んーーー暫定カテゴリー1?
【朝令暮改 改訂】
UTF8文字 カテゴリ
─── ──
00〜7F ⇒ 1
C2 80〜DF BF ⇒ 2
E0 80 80 〜 EF BF BF ⇒ 3
F0 80 80 80 〜 F4 BF BF BF ⇒ 4
F800000000〜FBFFFFFFFF
⇒ 5なの? 不正なの? 地球人の書イミフ
FC0000000000〜FDFFFFFFFFFF
⇒ 6なの? 不正なの? 地球人の書イミフ
上記以外 ヘンなのはカテゴリーは1でいいやーーーーー
by 👤地球の書を更に完璧に理解したぜ
🥳宇宙人、更に病状悪化。治療不可だな
UTF8文字 カテゴリ
─── ──
00-7F ⇒ 1
C2-DF ⇒ 2
E0-EF ⇒ 3
F0-F7 ⇒ 4
F8-FB ⇒ 5
FC-FD ⇒ 6
上記以外 んーーー暫定カテゴリー1?
【朝令暮改 改訂】
UTF8文字 カテゴリ
─── ──
00〜7F ⇒ 1
C2 80〜DF BF ⇒ 2
E0 80 80 〜 EF BF BF ⇒ 3
F0 80 80 80 〜 F4 BF BF BF ⇒ 4
F800000000〜FBFFFFFFFF
⇒ 5なの? 不正なの? 地球人の書イミフ
FC0000000000〜FDFFFFFFFFFF
⇒ 6なの? 不正なの? 地球人の書イミフ
上記以外 ヘンなのはカテゴリーは1でいいやーーーーー
by 👤地球の書を更に完璧に理解したぜ
🥳宇宙人、更に病状悪化。治療不可だな
701デフォルトの名無しさん
2024/04/23(火) 20:54:53.10ID:4WFWNNQf LPRINT CHR$ (27); 賛成
702デフォルトの名無しさん
2024/04/23(火) 21:24:18.36ID:6TsV+qCl >>693
ここでのUnicodeはUnicode表に載っているコード値という意味ね。
UTF8はU+100以上の文字がUnicode表とは似ても似つかぬコードに変形されてしまうので不可。
UTF16はU+10000以上の文字が変形されるのはあまり好ましくないが、結果のサロゲートペア
U+D800〜DBFFとU+DC00〜DFFFもUnicode表に載っているのでまあ可。
ここでのUnicodeはUnicode表に載っているコード値という意味ね。
UTF8はU+100以上の文字がUnicode表とは似ても似つかぬコードに変形されてしまうので不可。
UTF16はU+10000以上の文字が変形されるのはあまり好ましくないが、結果のサロゲートペア
U+D800〜DBFFとU+DC00〜DFFFもUnicode表に載っているのでまあ可。
703デフォルトの名無しさん
2024/04/23(火) 21:43:55.95ID:4WFWNNQf >>700 自己スレ 朝令暮改を更に改訂 今度こそ最終案
【超々最終案】
とにかくカテゴリー、キーメタ。
UTF8の先頭 カテゴリ
─── ──
00〜7F ⇒ 1
C0〜DF ⇒ 2
80〜EF ⇒ 3
F0〜F8 ⇒ 4
上記以外 ⇒んー悩む。0だけど1かな
by👤地球の書 更に超完璧に超理解したぜ
🥳 どの案でも、いいぢゃーーーーん。
【超々最終案】
とにかくカテゴリー、キーメタ。
UTF8の先頭 カテゴリ
─── ──
00〜7F ⇒ 1
C0〜DF ⇒ 2
80〜EF ⇒ 3
F0〜F8 ⇒ 4
上記以外 ⇒んー悩む。0だけど1かな
by👤地球の書 更に超完璧に超理解したぜ
🥳 どの案でも、いいぢゃーーーーん。
704デフォルトの名無しさん
2024/04/23(火) 22:45:52.70ID:2WXqZgLp >>702
似てもに似つかぬとか言い出すのはお前が16進数とか使ってるから。2進数使えば解決。そのままだということが分かる。
似てもに似つかぬとか言い出すのはお前が16進数とか使ってるから。2進数使えば解決。そのままだということが分かる。
705発達障害テスター
2024/04/24(水) 05:32:39.83ID:s8r+XPAL 🥳 モピロン、ASCiiもUTF8も、なんでも、
文字がASCiiなら、同じだ。ちがうのはunicodeだけ
「A」は、ASCもUTF8も、1BYTEだけど、
UNICODEは、1BYTEぢゃないもんねー。2バイトかな。
1と2は、違う値ですよーーーーーーーー。BY🥳
文字がASCiiなら、同じだ。ちがうのはunicodeだけ
「A」は、ASCもUTF8も、1BYTEだけど、
UNICODEは、1BYTEぢゃないもんねー。2バイトかな。
1と2は、違う値ですよーーーーーーーー。BY🥳
706プロマネ
2024/04/24(水) 05:39:16.75ID:s8r+XPAL■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 習政権、高市首相への態度硬化 台湾有事発言で連日非難 中国 ★11 [ぐれ★]
- 国内ホテル、既にキャンセルも 訪日客関連業界、事態見守る ★3 [蚤の市★]
- 日本損失1.7兆円に修正 中国渡航自粛の影響試算 [蚤の市★]
- 「どうしようもない」 ため息つくアジアの玄関口 中国の訪日自粛で−福岡市 [蚤の市★]
- 「アベノミクス」で投資対象と化したマンション ローンの低金利続き「年収の12倍」借りる20代出現 [蚤の市★]
- 食品の高騰対策、政府が交付金の「特別枠」検討 原則全ての自治体で [蚤の市★]
- 【超絶悲報】日本政府「高市さんの答弁撤回はない。政権として弱腰と映る姿勢は見せられない」これもう立憲岡田の議員辞職しかないだろ [519511584]
- 【実況】博衣こよりのえちえち朝こよ🧪
- 台湾「高市さんが台湾人の悲願を叶えてくれた!」これじゃ高市さん発言撤回できないぢゃん😰 [523957489]
- 高市周辺、さすがに焦り始めるww「小さな火種が火事になりかけている。早く鎮火しなくてはいけない」 [271912485]
- 【超悲報】中国への武力行使、世論調査で「賛成」「どちらかといえば賛成」48.8% 「反対」「どちらかといえば反対」の44.2%を上回る [314039747]
- 中国「高市が頭を下げて謝罪しない限り、絶対に許さない」 [329329848]
