Windows NTは初代からUnicodeがネイティブの文字コードです。cp932ではありません。
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。
■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
文字コード総合スレ Part10 http://mevius.2ch.net/test/read.cgi/tech/1444822140/
文字コード総合スレ Part11 https://mevius.5ch.net/test/read.cgi/tech/1516629503/
文字コード総合スレ Part12 https://mevius.5ch.net/test/read.cgi/tech/1544931495/
文字コード総合スレ part13
https://mevius.5ch.net/test/read.cgi/tech/1593777227/
文字コード総合スレ part14
■ このスレッドは過去ログ倉庫に格納されています
2023/03/03(金) 15:46:58.08ID:yKqwMGHT
758= 継続の記号∵RFC2045?
2024/04/29(月) 08:06:07.54ID:V3l6c++H elseif 🟦<240 then '3byte
if 128≦🟫≦191 and
128≦🟪≦191 then
then '
⭐ =256*(16*(🟦-224)
+INT((🟫-128)/4))
+64*(MOD((🟫-128),4))
+(🟪-128)
UNICHAR(⭐)を表示
n=n+3
else
「👻」を表示
n=n+1 ' ∵1byte文字トミナス
end if
elseif 🟦<248 THEN
if 128≦🟫≦191 and
128≦🟪≦191 and
128≦🟩≦191 then
then '4byte
⭐=65536*(4*(🟦-240)
+INT((🟫-128)/16))
+256*(16*MOD((🟫-128),16)
+INT(((🟪-128)/4)))
+(64*MOD((🟪-128),4)
+(🟩-128))
UNICHAR(⭐)を表示
n=n+4
else
「👻」を表示
n=n+1 ' ∵1byte文字トミナス
end if
if 128≦🟫≦191 and
128≦🟪≦191 then
then '
⭐ =256*(16*(🟦-224)
+INT((🟫-128)/4))
+64*(MOD((🟫-128),4))
+(🟪-128)
UNICHAR(⭐)を表示
n=n+3
else
「👻」を表示
n=n+1 ' ∵1byte文字トミナス
end if
elseif 🟦<248 THEN
if 128≦🟫≦191 and
128≦🟪≦191 and
128≦🟩≦191 then
then '4byte
⭐=65536*(4*(🟦-240)
+INT((🟫-128)/16))
+256*(16*MOD((🟫-128),16)
+INT(((🟪-128)/4)))
+(64*MOD((🟪-128),4)
+(🟩-128))
UNICHAR(⭐)を表示
n=n+4
else
「👻」を表示
n=n+1 ' ∵1byte文字トミナス
end if
759=
2024/04/29(月) 08:07:48.87ID:V3l6c++H else '5,6byte
「👻」を表示
n=n+1 ' ∵1byte文字トミナス
end if
end repeat
msgbox"やったね∵処理完了\(^o^)/"
「👻」を表示
n=n+1 ' ∵1byte文字トミナス
end if
end repeat
msgbox"やったね∵処理完了\(^o^)/"
760=は最後が=なら継続ぢゃないアル
2024/04/29(月) 08:12:06.24ID:V3l6c++H こらーーー
if 🟦<128 then 'ascii は、
if 0=🟦 then 'null
'何もしない
elseif 0<🟦<128 then 'ascii
ぢゃなーーーーい
てか先頭=は関数とみなすです。∵excel
継続から最後に=ですよ。
で最後は改行CrLf ですよ∵RFC2045?
BY 🤡
意味わかんない けどスゴくてヤバイ
BY 🥳
if 🟦<128 then 'ascii は、
if 0=🟦 then 'null
'何もしない
elseif 0<🟦<128 then 'ascii
ぢゃなーーーーい
てか先頭=は関数とみなすです。∵excel
継続から最後に=ですよ。
で最後は改行CrLf ですよ∵RFC2045?
BY 🤡
意味わかんない けどスゴくてヤバイ
BY 🥳
761memopad man
2024/04/29(月) 14:12:05.17ID:V3l6c++H ❌ if 🟦<128 then 'ascii
🙆 if 0=🟦 then 'null2space
⭐=32
unichar(⭐)
n=n+1
elseif 0<🟦<128 then 'ascii
∴ Me is MemoPadMan.✌
∴ Me is All ®ight. ∵Me is 💯
🤡🥳👤®一同 boo boo voo boo booooooooooo.
🙆 if 0=🟦 then 'null2space
⭐=32
unichar(⭐)
n=n+1
elseif 0<🟦<128 then 'ascii
∴ Me is MemoPadMan.✌
∴ Me is All ®ight. ∵Me is 💯
🤡🥳👤®一同 boo boo voo boo booooooooooo.
762プロマネ
2024/04/29(月) 14:22:42.15ID:V3l6c++H if 0=🟦 ってけしからんコードだ
変数は左、定数は右、これが社会人の定式デス
∴ if 🟦 = 0 と記述しなさーーい
by 🤡プロマネの役
定数が左。変数は右。地球人にはアリエナイ
極一部の古代ギリシャ文字とかンゴ文字は知らんけど
定数が左。変数は右 代入演算子ではナイ と
地球人でも解る記述だ。モピロン、素晴らしい
by 👤ランベルト星人
🟦=0 でも 0=🟦でも、論理式なら
どっちも真偽値は同じ。
ポクはモピロン天才数学者より天才だ
by 🥳発達障害テスタ
変数は左、定数は右、これが社会人の定式デス
∴ if 🟦 = 0 と記述しなさーーい
by 🤡プロマネの役
定数が左。変数は右。地球人にはアリエナイ
極一部の古代ギリシャ文字とかンゴ文字は知らんけど
定数が左。変数は右 代入演算子ではナイ と
地球人でも解る記述だ。モピロン、素晴らしい
by 👤ランベルト星人
🟦=0 でも 0=🟦でも、論理式なら
どっちも真偽値は同じ。
ポクはモピロン天才数学者より天才だ
by 🥳発達障害テスタ
763JAVA星人現る
2024/04/29(月) 17:31:13.46ID:V3l6c++H ☕ポクはサンマイ🟤🟤システ🟤のジャバ星人だ。宜しくね。
>>757 のソースコードもどき。地球人らしいコードですね。
⭐=64*(🟦-192)+(🟫-128) ∧ ⭐=0を満たす整数解
1つでよいので、解いてみろーーー
by ☕ポクはJAVA星人
何か、宇宙人。自称だろうけど、沢山やってきた。
なんか、ヤバイ。地球が征服されちゃうの❓
はやく、宇宙人に征服してほしいです。地球のオトコに呆きたところよUFO
by 🥳
ピンクレディーのUFOのその歌詞は、
❌ 地球の男に飽きたところよ
⭕ 地球の男に呆きたところよ
なんちゃってーーーーーー
BY 🤡 今日はエイプリルフールぢゃなかった。失言しちゃった
>>757 のソースコードもどき。地球人らしいコードですね。
⭐=64*(🟦-192)+(🟫-128) ∧ ⭐=0を満たす整数解
1つでよいので、解いてみろーーー
by ☕ポクはJAVA星人
何か、宇宙人。自称だろうけど、沢山やってきた。
なんか、ヤバイ。地球が征服されちゃうの❓
はやく、宇宙人に征服してほしいです。地球のオトコに呆きたところよUFO
by 🥳
ピンクレディーのUFOのその歌詞は、
❌ 地球の男に飽きたところよ
⭕ 地球の男に呆きたところよ
なんちゃってーーーーーー
BY 🤡 今日はエイプリルフールぢゃなかった。失言しちゃった
764ランベルト星人
2024/04/29(月) 17:38:44.32ID:V3l6c++H 👤 誰だ。ジャバ星人か何か知らんが、お前は絵文字一文字で☕
でよい。www ゲラゲラ てかプロマネ、地球を防衛したなら
プロマネが解けよ。てかオレは瞬時に解ったけど
🤡 プロマネってポクのことかな。地球人をバカにするなーー
ていうか
⭐=64*(🟦-192)+(🟫-128) ∧ ⭐=0を満たす整数解
1つでよいなら厨房でも、解けるぜ、こらテスター解けよ
オレッちの解っちゃった。1つなら楽勝
てか、🟦は192(0xC0)を代入して、あとは、匕・ミ・ッ
でよい。www ゲラゲラ てかプロマネ、地球を防衛したなら
プロマネが解けよ。てかオレは瞬時に解ったけど
🤡 プロマネってポクのことかな。地球人をバカにするなーー
ていうか
⭐=64*(🟦-192)+(🟫-128) ∧ ⭐=0を満たす整数解
1つでよいなら厨房でも、解けるぜ、こらテスター解けよ
オレッちの解っちゃった。1つなら楽勝
てか、🟦は192(0xC0)を代入して、あとは、匕・ミ・ッ
765地球人ならバカテスターでも解けます
2024/04/29(月) 17:51:54.65ID:V3l6c++H 🥳 数学大好き。てかランベルト星人とかプロマネ
解けないからポクに聞いてるんだな。
無理しやがって、教えて、アゲルと、
数式 ⭐=64*(🟦-192)+(🟫-128) ───1⃣
1⃣の🟦に192を代入 ─── 2⃣
1⃣の⭐に0を代入とする。すると、
1⃣は、0=64✕(192-192)+(🟫-128) ───1⃣💨
1⃣💨をfor🟫やると、
🟫=128 ───3⃣
以上1⃣3⃣より、求めるべき整数解の一つは、
(🟦、🟫)=(192、128)
ヤッターー 解けたーーー\(^o^)/
👤 んで、それでどうしたのかな
☕ 地球人って・・・
👤 オレは地球人基準で数学パワーが∞
☕ そりゃ地球人が無限人でも宇宙人から見れば
数学パワーはマイナス無限大だし当然だろ
🥳 よくわかんないけど、地球人を侵略してくれて
ホントうにありがとう
解けないからポクに聞いてるんだな。
無理しやがって、教えて、アゲルと、
数式 ⭐=64*(🟦-192)+(🟫-128) ───1⃣
1⃣の🟦に192を代入 ─── 2⃣
1⃣の⭐に0を代入とする。すると、
1⃣は、0=64✕(192-192)+(🟫-128) ───1⃣💨
1⃣💨をfor🟫やると、
🟫=128 ───3⃣
以上1⃣3⃣より、求めるべき整数解の一つは、
(🟦、🟫)=(192、128)
ヤッターー 解けたーーー\(^o^)/
👤 んで、それでどうしたのかな
☕ 地球人って・・・
👤 オレは地球人基準で数学パワーが∞
☕ そりゃ地球人が無限人でも宇宙人から見れば
数学パワーはマイナス無限大だし当然だろ
🥳 よくわかんないけど、地球人を侵略してくれて
ホントうにありがとう
766デフォルトの名無しさん
2024/04/29(月) 17:57:13.31ID:V3l6c++H ランベルトは、
⭐=64*(🟦-192)+(🟫-128)=0 の解の一つ
(🟦、🟫)=(192、128)を解いたな
数式⭐が、ビット演算に変えても
(🟦、🟫)=(192、128)なら⭐はゼロになりそうだ
by 🤡地球人代表 自称プロマネ(の役)
⭐=64*(🟦-192)+(🟫-128)=0 の解の一つ
(🟦、🟫)=(192、128)を解いたな
数式⭐が、ビット演算に変えても
(🟦、🟫)=(192、128)なら⭐はゼロになりそうだ
by 🤡地球人代表 自称プロマネ(の役)
767ランベルト星人
2024/04/29(月) 19:42:39.90ID:V3l6c++H elseif 🟦<224 then '2byte
if 128≦🟫≦191 then
⭐=64*(🟦-192)+(🟫-128)
UNICHAR(⭐)を表示
n=n+2
で、当ロジックは🟦≧192のときに実行される。
故に実質
if 192≦🟦<224 then '2byte
if 128≦🟫≦191 then
⭐=64*(🟦-192)+(🟫-128)
UNICHAR(⭐)を表示
n=n+2
と同じだ。さてと、一人でソースレビューするか
by 👤
地球人ぢゃナイオレも参加させろ。そのレビュー
by ☕ジャバ星人
if 128≦🟫≦191 then
⭐=64*(🟦-192)+(🟫-128)
UNICHAR(⭐)を表示
n=n+2
で、当ロジックは🟦≧192のときに実行される。
故に実質
if 192≦🟦<224 then '2byte
if 128≦🟫≦191 then
⭐=64*(🟦-192)+(🟫-128)
UNICHAR(⭐)を表示
n=n+2
と同じだ。さてと、一人でソースレビューするか
by 👤
地球人ぢゃナイオレも参加させろ。そのレビュー
by ☕ジャバ星人
768デフォルトの名無しさん
2024/04/29(月) 19:43:33.42ID:VwlqwQ1k CSVやTSVでセル内改行ができない問題は
行の区切りを改行文字ではなくRSやVTにすれば解決しそうだがその方法で問題あるだろうか
行の区切りを改行文字ではなくRSやVTにすれば解決しそうだがその方法で問題あるだろうか
769デフォルトの名無しさん
2024/04/30(火) 05:42:00.58ID:6q3HkpC/ そういえば、エクセルの、ある一つ、一つの、ひとつの、
セル内で文字列[xxxxyyyy]を改行は、
オペレーション的には
xxxx [ALT]+[改行] yyyy だったような。
地球の書によると、Lf(ASCIIコード10 スナワチ0x0a)だ。
CSVでセル内改行不能問題は、知らん。失礼m(_ _)m
ちな、ンゴ文字をセル内に入れる、文字の表示方向が
逆になったりする事が、よくある。
それは、バグでなく仕様の可能性、かと憶測する。
なお、数字を入れると、右詰めになり、
先頭が=だと関数とみなされることは、多い、
文字化けの要因のひとつ。該当セルを標準でなく文字列に
設定するのもひとつの手段、かな?。
試行錯誤して作成してる、😅
セル内で文字列[xxxxyyyy]を改行は、
オペレーション的には
xxxx [ALT]+[改行] yyyy だったような。
地球の書によると、Lf(ASCIIコード10 スナワチ0x0a)だ。
CSVでセル内改行不能問題は、知らん。失礼m(_ _)m
ちな、ンゴ文字をセル内に入れる、文字の表示方向が
逆になったりする事が、よくある。
それは、バグでなく仕様の可能性、かと憶測する。
なお、数字を入れると、右詰めになり、
先頭が=だと関数とみなされることは、多い、
文字化けの要因のひとつ。該当セルを標準でなく文字列に
設定するのもひとつの手段、かな?。
試行錯誤して作成してる、😅
770ランベルト星人とプロマネ
2024/04/30(火) 09:07:48.91ID:6q3HkpC/ 👤 PRINTABLE:=C0=80 で👻と表示、ヤバ。バグなのか?
☕ ま、いいんぢゃなーーい
🤡 SONYさんのスマホのCNTACTS.VCFはヌル文字なんて入力不可
また、半角数字は123なら =31=32=33 と出力だ
2バイトには変換しないので、
そんな不正なコードは出力しませんよーーー
だから、ASCiiは、=C0=B8 なんて出力しません
☕ レビューやーめたーーーー
☕ ま、いいんぢゃなーーい
🤡 SONYさんのスマホのCNTACTS.VCFはヌル文字なんて入力不可
また、半角数字は123なら =31=32=33 と出力だ
2バイトには変換しないので、
そんな不正なコードは出力しませんよーーー
だから、ASCiiは、=C0=B8 なんて出力しません
☕ レビューやーめたーーーー
771ランベルト星人の呟き
2024/04/30(火) 10:09:05.00ID:6q3HkpC/ ある文字が、UTF8で絶対に絶対に絶対に2BYTE文字の場合、
その下限てか上限は、=C2=80 だ
てか、UTF8で0xC280はなんて文字なんだろうか
🤡知らん。けど、変な文字だろ
電話帳にそんなコードは入力しないからどうでもよいので
🥳ポクのスマホの連絡帳てか電話帳の氏名に
絵文字入れても、バッチリ。ツールバッチリ
絵文字とASCII文字だけバッチリなら
他の文字は使用しないから、ツール問題なし
てか、絵文字以外かつASCii以外の文字の
入力を禁止しろーーーー
漢字は入力禁止
🤡ちゃんと日本語も難読もSONYさんのcontacts.vcfは
RCF2045守ってるのでバッチリ
👤てか、守らなくても、ワリとヘッチャラだよな
🥳絵文字バッチリだから、ヘッチャラ
その下限てか上限は、=C2=80 だ
てか、UTF8で0xC280はなんて文字なんだろうか
🤡知らん。けど、変な文字だろ
電話帳にそんなコードは入力しないからどうでもよいので
🥳ポクのスマホの連絡帳てか電話帳の氏名に
絵文字入れても、バッチリ。ツールバッチリ
絵文字とASCII文字だけバッチリなら
他の文字は使用しないから、ツール問題なし
てか、絵文字以外かつASCii以外の文字の
入力を禁止しろーーーー
漢字は入力禁止
🤡ちゃんと日本語も難読もSONYさんのcontacts.vcfは
RCF2045守ってるのでバッチリ
👤てか、守らなくても、ワリとヘッチャラだよな
🥳絵文字バッチリだから、ヘッチャラ
772デフォルトの名無しさん
2024/04/30(火) 10:23:58.61ID:6q3HkpC/ ランベルトとかいう、宇宙人の落ちこぼれが
UTF8 C280 つまりU+0080がどんな文字が
疑問に思ってるようだ。
どうやら、極めて怪しい制御コードのような
霊感を感じる。それのお絵描きしておく
BY ☕ジャバ星人でしたーーーー
UTF8 C280 つまりU+0080がどんな文字が
疑問に思ってるようだ。
どうやら、極めて怪しい制御コードのような
霊感を感じる。それのお絵描きしておく
BY ☕ジャバ星人でしたーーーー
773デフォルトの名無しさん
2024/04/30(火) 10:39:20.69ID:6q3HkpC/ xxx ❓❓❓ PAD だろ xxxはとPADとは全く違う by 👤
xxxは未知だから、PADとかいのでもいいんぢゃない by 🤡
xとPは違う文字である。この2人目がヤバイ by 🥳
xxxは未知だから、PADとかいのでもいいんぢゃない by 🤡
xとPは違う文字である。この2人目がヤバイ by 🥳
774バカテスター
2024/04/30(火) 11:12:57.08ID:6q3HkpC/ 🥳 それは、Padding Character というヤツ
モチロン、非表示の文字らしいです。
だから、Spaceで、表示すべきです。
xxx とか PAD と表示してるサイトが
多々見受けられる。バグですね。ーー
BY 🥳発達障害が更に悪化中
モチロン、非表示の文字らしいです。
だから、Spaceで、表示すべきです。
xxx とか PAD と表示してるサイトが
多々見受けられる。バグですね。ーー
BY 🥳発達障害が更に悪化中
775ランベルト星人等
2024/04/30(火) 11:20:15.08ID:6q3HkpC/ ちぇっ、👻表示させたかな。by 👤
そんな文字はスマホに入力できないので、
そんな文字をデコードしたのはcontacts.vcfに存在しないので
リリース済のは、修正しませーーーん by 🤡
え、リリース済❓👤
デヘヘ🤡
そんな文字はスマホに入力できないので、
そんな文字をデコードしたのはcontacts.vcfに存在しないので
リリース済のは、修正しませーーーん by 🤡
え、リリース済❓👤
デヘヘ🤡
776JAVA星人
2024/04/30(火) 15:27:13.93ID:6q3HkpC/ オレッちがソースレビューさせれば、以下のようにするのになあ
elseif 🟦<192then 'なんちゃってascii
「👻」を表示
n=n+1
elseif 🟦<224 then '2byte
は、
elseif 🟦<192then 'なんちゃってascii
「👻」を表示
n=n+1
elseif 🟦<194then 'なんちゃって2byte
「👻」を表示
n=n+1で容認、n=n+2が理想
elseif 🟦<224 then '2byte
by ☕ポクはJAVA星人
elseif 🟦<192then 'なんちゃってascii
「👻」を表示
n=n+1
elseif 🟦<224 then '2byte
は、
elseif 🟦<192then 'なんちゃってascii
「👻」を表示
n=n+1
elseif 🟦<194then 'なんちゃって2byte
「👻」を表示
n=n+1で容認、n=n+2が理想
elseif 🟦<224 then '2byte
by ☕ポクはJAVA星人
777ランベルト星人
2024/04/30(火) 15:35:57.73ID:6q3HkpC/ 緊急PGメンテかよ。ま、
elseif 🟦<192then 'なんちゃってascii
「👻」を表示
n=n+1
elseif 🟦<224 then '2byte
は、
elseif 🟦<194then 'なんちゃってUTF8
「👻」を表示
n=n+1
elseif 🟦<224 then '2byte
で再リリースを検討する。ま、理想は☕星人の通りだが
インパクトがわからん。
てかさ、なんちゃってUTF8なんてS⭕NYのCONTACTS.VCFに
出力はされないから、ね。
BY 👤
モピロン、再リリースは何時でもOK
BY 🤡
バグっていいぢゃーーん
BY 🥳
🤡 PGバグでも運用上はバグぢゃないもんねーーー
elseif 🟦<192then 'なんちゃってascii
「👻」を表示
n=n+1
elseif 🟦<224 then '2byte
は、
elseif 🟦<194then 'なんちゃってUTF8
「👻」を表示
n=n+1
elseif 🟦<224 then '2byte
で再リリースを検討する。ま、理想は☕星人の通りだが
インパクトがわからん。
てかさ、なんちゃってUTF8なんてS⭕NYのCONTACTS.VCFに
出力はされないから、ね。
BY 👤
モピロン、再リリースは何時でもOK
BY 🤡
バグっていいぢゃーーん
BY 🥳
🤡 PGバグでも運用上はバグぢゃないもんねーーー
778バカテスター
2024/04/30(火) 15:46:58.40ID:6q3HkpC/ >>777 の緊急PG修正ってコメント除けば
一文字修正するだけぢゃーーーん
❌ elseif 🟦<192then 'なんちゃってascii
⭕ elseif 🟦<194then 'なんちゃってUTF8
192を194にするだけ。1秒で修正するぢゃーーーん
プロマネとか自称宇宙人ってバカなの❓
BY 🥳超バカテスターに成りすましてみたー
一文字修正するだけぢゃーーーん
❌ elseif 🟦<192then 'なんちゃってascii
⭕ elseif 🟦<194then 'なんちゃってUTF8
192を194にするだけ。1秒で修正するぢゃーーーん
プロマネとか自称宇宙人ってバカなの❓
BY 🥳超バカテスターに成りすましてみたー
779ランベルト星人
2024/04/30(火) 16:26:39.63ID:6q3HkpC/ 👤再リリース完了 🤡Good job ☕ま、やらかすと思ったわ
👤UTF8では、最初の1バイト目が1100 が2byte なんて地球の書に釣られた
☕そっか、かつてのオレを思い出した
👤んー❓
☕2BYTE⇒1100 xxxx xxxx xxxx は真か偽だな。
👤地球人には無理だろ。偏差値パワーが有限だからな地球人は
☕オレはかつて地球人だった。オマエも地球人に格下げ寸前だったな
🤡C0 00 〜 C0 7F は、UTF8 ではなんちゃって2BYTEって
地球の書に記載した方がいいか?
👤☕ それは正解だが、反例らしき忖度に満ちた地球の書に
記載しても、何だな。そもそも、地球人は🐴🦌だ。
🥳ちぇ、地球人をバカしたバッドエンディングなの❓
この文学作品したヒトってバカっかぢゃなーーーい
😅AUAUアウアウ
👤UTF8では、最初の1バイト目が1100 が2byte なんて地球の書に釣られた
☕そっか、かつてのオレを思い出した
👤んー❓
☕2BYTE⇒1100 xxxx xxxx xxxx は真か偽だな。
👤地球人には無理だろ。偏差値パワーが有限だからな地球人は
☕オレはかつて地球人だった。オマエも地球人に格下げ寸前だったな
🤡C0 00 〜 C0 7F は、UTF8 ではなんちゃって2BYTEって
地球の書に記載した方がいいか?
👤☕ それは正解だが、反例らしき忖度に満ちた地球の書に
記載しても、何だな。そもそも、地球人は🐴🦌だ。
🥳ちぇ、地球人をバカしたバッドエンディングなの❓
この文学作品したヒトってバカっかぢゃなーーーい
😅AUAUアウアウ
780あっいけね
2024/04/30(火) 16:29:13.91ID:6q3HkpC/ >>779
❌C0 00 〜 C0 7F は、UTF8 ではなんちゃって2BYTE
⭕C0 00 〜 C2 7F は、UTF8 ではなんちゃって2BYTE
だった。他にもたくさん、ミスってそう。( ・ั﹏・ั)
❌C0 00 〜 C0 7F は、UTF8 ではなんちゃって2BYTE
⭕C0 00 〜 C2 7F は、UTF8 ではなんちゃって2BYTE
だった。他にもたくさん、ミスってそう。( ・ั﹏・ั)
781編集後記
2024/04/30(火) 18:21:22.96ID:6q3HkpC/ 👤プロマネよ。あのさ、ナンデ、UTF8文字列→UNICODE文字列 なんてプログラミングをオレにさせたんだ?
🤡それがさ、6年前の春は、その当時で古いスマホの電話帳
を、その当時で新しいスマホに、vcfファイル経由でコピーしたことに遡る。
👤6年前時点の古いスマホなら、android4.x新しいのなら、android8頃か
🤡んー、多分yes
🥳バージョンが古いから、vcfファイルも、モピロン、文字化けだよね。
🤡いや、vcfを当時のパソコンで開くとちゃんと氏名等の漢字は読める。平文だ
その頃はwin8.1のヤツを使用してた。
👤vcfは漢字も平文で読めたのか
🤡yes その当時は。
👤でutf8→unicodeと関係あるんだ
🤡その当時は関係はなし、で、
そして、機種変更した。2年前だ。
・・・・
👤vcfが2年前の機種のときに文字化けか
🤡文字化けと思ったが、デコードだな
1文字漢字がascii9文字に化学変化、後はわかるだろ
🥳グーグルので共有でいいぢゃーーーん。
個人情報はグ⚪グルのサーバに保管だね
🤡でも、とにかくPRINTABLE: のをエンコツール自作に至ったわけ
🤡それがさ、6年前の春は、その当時で古いスマホの電話帳
を、その当時で新しいスマホに、vcfファイル経由でコピーしたことに遡る。
👤6年前時点の古いスマホなら、android4.x新しいのなら、android8頃か
🤡んー、多分yes
🥳バージョンが古いから、vcfファイルも、モピロン、文字化けだよね。
🤡いや、vcfを当時のパソコンで開くとちゃんと氏名等の漢字は読める。平文だ
その頃はwin8.1のヤツを使用してた。
👤vcfは漢字も平文で読めたのか
🤡yes その当時は。
👤でutf8→unicodeと関係あるんだ
🤡その当時は関係はなし、で、
そして、機種変更した。2年前だ。
・・・・
👤vcfが2年前の機種のときに文字化けか
🤡文字化けと思ったが、デコードだな
1文字漢字がascii9文字に化学変化、後はわかるだろ
🥳グーグルので共有でいいぢゃーーーん。
個人情報はグ⚪グルのサーバに保管だね
🤡でも、とにかくPRINTABLE: のをエンコツール自作に至ったわけ
782デフォルトの名無しさん
2024/05/01(水) 00:33:47.56ID:T3vg4v9s >>768
>CSVやTSVで、セル内改行ができない問題は
Ruby ではクォート文字で囲めば、
行区切り文字・列区切り文字・クォート文字も、データ内に入れられる
require 'csv'
input = <<"EOT"
"a""a","b,b",あ
"c
c","d\nd"
EOT
p input_ary = CSV.parse( input ) # 2次元配列
#=> [ ["a\"a", "b,b", "あ"], ["c\nc", "d\nd"] ]
# 2次元配列を、CSV 文字列に変換する
csv_str = input_ary.map( &:to_csv ).join
puts csv_str
"a""a","b,b",あ
"c
c","d
d"
>CSVやTSVで、セル内改行ができない問題は
Ruby ではクォート文字で囲めば、
行区切り文字・列区切り文字・クォート文字も、データ内に入れられる
require 'csv'
input = <<"EOT"
"a""a","b,b",あ
"c
c","d\nd"
EOT
p input_ary = CSV.parse( input ) # 2次元配列
#=> [ ["a\"a", "b,b", "あ"], ["c\nc", "d\nd"] ]
# 2次元配列を、CSV 文字列に変換する
csv_str = input_ary.map( &:to_csv ).join
puts csv_str
"a""a","b,b",あ
"c
c","d
d"
783デフォルトの名無しさん
2024/05/01(水) 05:45:14.27ID:ksHbXVNI ん、微妙に話しズレるが、新たなるプロジェクト思いついた
・VBAでcontacts.csvをバイナリで読み込ませる
・CR LF などそれが2バイトでも全てLF1byteに変換する
・それをセルの んー例えばC3セルに表示
・C3セルの一つだけのセルに、contacts.vcfが表示される
・とにかく、vcfのエンコードツールをvbaで開発する
by 🤡
それより、プロマネ、プリンタかってーーー
ネットプリントめんどくせー
by 🥳👤
プロジェクトは延期ーー 🤡
・VBAでcontacts.csvをバイナリで読み込ませる
・CR LF などそれが2バイトでも全てLF1byteに変換する
・それをセルの んー例えばC3セルに表示
・C3セルの一つだけのセルに、contacts.vcfが表示される
・とにかく、vcfのエンコードツールをvbaで開発する
by 🤡
それより、プロマネ、プリンタかってーーー
ネットプリントめんどくせー
by 🥳👤
プロジェクトは延期ーー 🤡
784ジャバ星人の呟き
2024/05/01(水) 20:43:19.84ID:ksHbXVNI ☕
2BYTE⇒1100 xxxx xxxx xxxx の最小値って地球人よ知ってるか❓
16進で、xC000 だぜ。もし、xC280にしたいならさ、
それを簡易に表現できるパワーが必要だろ。
やたら、言い訳した内容を補足に入れてもよ。
そんなの、理解できねーーーってワケ
by ☕
でさ、なんで自称宇宙人のチミはジャバ星人って自称してるの
by 👤ランベルト星人
んーーー by☕
ま、ウスウス知ってるけど、JAVAってIBMが開発した言語❓
それとも ・・マイクロソフト ❓
BY 👤
マイクロソフトもIBMもライバルだ ぢゃーバイバイ
BY ☕
2BYTE⇒1100 xxxx xxxx xxxx の最小値って地球人よ知ってるか❓
16進で、xC000 だぜ。もし、xC280にしたいならさ、
それを簡易に表現できるパワーが必要だろ。
やたら、言い訳した内容を補足に入れてもよ。
そんなの、理解できねーーーってワケ
by ☕
でさ、なんで自称宇宙人のチミはジャバ星人って自称してるの
by 👤ランベルト星人
んーーー by☕
ま、ウスウス知ってるけど、JAVAってIBMが開発した言語❓
それとも ・・マイクロソフト ❓
BY 👤
マイクロソフトもIBMもライバルだ ぢゃーバイバイ
BY ☕
785プロマネの呟き
2024/05/01(水) 21:00:20.23ID:ksHbXVNI ジャバ星人(サンマイクロシステ⚪星人)と、ランベルト星人の
やり取り、意味深だな。
てかさ、ISO/IEC 10646 [ISO.10646] に
UTF8toUNICODE の極めて具体的なアルゴリズムが
英文で記載されてる。
モピロン、ランベルト星人やジャバ星人が開発したのは
その通りに作ってるハズだろ。
地球人の規格か概ね上位互換だ てかそれキニシナイ BY 👤
今の規格でも何か怪しい てかもぅゴリゴリだせを BY ☕
あのさ、ジャバ星人は地球からスピンアウトしたら BY 初登場のミラクル星人
やり取り、意味深だな。
てかさ、ISO/IEC 10646 [ISO.10646] に
UTF8toUNICODE の極めて具体的なアルゴリズムが
英文で記載されてる。
モピロン、ランベルト星人やジャバ星人が開発したのは
その通りに作ってるハズだろ。
地球人の規格か概ね上位互換だ てかそれキニシナイ BY 👤
今の規格でも何か怪しい てかもぅゴリゴリだせを BY ☕
あのさ、ジャバ星人は地球からスピンアウトしたら BY 初登場のミラクル星人
786ジャバ星人
2024/05/02(木) 14:20:08.07ID:cxxyFm3G オラ、いや、ミラクル星人にはナイショだけどよ、
ランベルトとかいう宇宙人の、自称秘伝の数式
⭐=64*(🟦-192)+(🟫-128) ※UTF8で2byte専用
で⭐が127以下になる全ての🟦、🟫の非負整数解って
ま、地球人でも厨房程度の低知能で解けるだろ。
見え貼ってビット積とか使って規格書記載してるから
数式の連立方程式すら失念し、重複するだってワケ
地球人って、地球🌏の中ぢゃ、知能はマシだが、
この宇宙の中ぢゃ、もう恥ずかしくて、宇宙旅行なんて出来ないだろ
by ☕
てか、あの規格書、あれが21bitとか記載してるぞ、
20bit + 1文字だよな。地球人ってバカなのか? by 👤
いやいや、地球の数学では、
2^21 = 2^20 + 1なんぢゃねーーー ゲラゲラ by ☕
矛盾許容の数学を構築したランベルト星の数学ですら
アリエネー。てか、isoなんとかってジョークサイトだよな
by 👤
ゲラゲラゲラゲラゲラゲラ論理積以前だろスピンアウト正解 by ☕
ランベルトとかいう宇宙人の、自称秘伝の数式
⭐=64*(🟦-192)+(🟫-128) ※UTF8で2byte専用
で⭐が127以下になる全ての🟦、🟫の非負整数解って
ま、地球人でも厨房程度の低知能で解けるだろ。
見え貼ってビット積とか使って規格書記載してるから
数式の連立方程式すら失念し、重複するだってワケ
地球人って、地球🌏の中ぢゃ、知能はマシだが、
この宇宙の中ぢゃ、もう恥ずかしくて、宇宙旅行なんて出来ないだろ
by ☕
てか、あの規格書、あれが21bitとか記載してるぞ、
20bit + 1文字だよな。地球人ってバカなのか? by 👤
いやいや、地球の数学では、
2^21 = 2^20 + 1なんぢゃねーーー ゲラゲラ by ☕
矛盾許容の数学を構築したランベルト星の数学ですら
アリエネー。てか、isoなんとかってジョークサイトだよな
by 👤
ゲラゲラゲラゲラゲラゲラ論理積以前だろスピンアウト正解 by ☕
787正常ぽぃ地球人とランベルト星人but自作自演
2024/05/03(金) 06:35:56.34ID:00No5FFk >>783 でさ、
🤡
> CR LF などが2バイトも全てLF1byteに変換
の記述って、🦩ダチョウ (無駄に長いの意)な表現だよな
👤地球人は知能はバカの一つ覚え。無限個ある欠陥だらけの
文章の、2、3点を修正して、今度は完璧だなんて思い込む
🤡てか、「あのCrLfをLfにする」の何処がダチョウな表現なんだ❓
👤正解は「Crを無視する」だろ
🤡オマエも地球人並みの知能だな。無限大の知能ってウソぢゃーーん
👤そもそも、Cr単独で改行なんてのは、アリエナイ前提だ
モチロン、Lf単独で改行は、Unixとか比較的近年UTF8で
地球で、主流だろ
🤡んー❓ 厳密すればするぼど、やはりダチョウ🦩になる
👤ところで、ゲーデルの不完全性定理ってどう思う
🤡あの辺りは数学ではナゾの密林だ。てか
証明できん事を証明しましたーーー。をアリガタッてるのか
👤知らんが、あの規格書も、6〜7年前から更新ストップだろ
🤡更新すればする程、矛盾にみちた内容になってるかも
👤もはや、矛盾してるかすら解かんないとちゃう?
🤡ノーコメントとする。てかランベルトよ、
「Crを無視する」というロジックは、1行目で真かつ
k行目で真と仮定してk+1行目が真を証明が必要だ
👤てかよ、kは整数かつ1以上が必要だろ
🤡どちらかというと十分で微かにダチョウだよ
👤んーー、kは整数かつ2以上が必要 といえば十分か
🤡話しが長いな。てかゲーデル不完全性定理と関係ありそ
👤それ以前に我が星、ランベルト星の数学・論理学は矛盾許容だ
🤡それ、完全性定理ぢゃねーーー?
👤どっちでもok ∵矛盾許容
🥳ポクも宇宙人に産まれ変わりたいデーース
🤡
> CR LF などが2バイトも全てLF1byteに変換
の記述って、🦩ダチョウ (無駄に長いの意)な表現だよな
👤地球人は知能はバカの一つ覚え。無限個ある欠陥だらけの
文章の、2、3点を修正して、今度は完璧だなんて思い込む
🤡てか、「あのCrLfをLfにする」の何処がダチョウな表現なんだ❓
👤正解は「Crを無視する」だろ
🤡オマエも地球人並みの知能だな。無限大の知能ってウソぢゃーーん
👤そもそも、Cr単独で改行なんてのは、アリエナイ前提だ
モチロン、Lf単独で改行は、Unixとか比較的近年UTF8で
地球で、主流だろ
🤡んー❓ 厳密すればするぼど、やはりダチョウ🦩になる
👤ところで、ゲーデルの不完全性定理ってどう思う
🤡あの辺りは数学ではナゾの密林だ。てか
証明できん事を証明しましたーーー。をアリガタッてるのか
👤知らんが、あの規格書も、6〜7年前から更新ストップだろ
🤡更新すればする程、矛盾にみちた内容になってるかも
👤もはや、矛盾してるかすら解かんないとちゃう?
🤡ノーコメントとする。てかランベルトよ、
「Crを無視する」というロジックは、1行目で真かつ
k行目で真と仮定してk+1行目が真を証明が必要だ
👤てかよ、kは整数かつ1以上が必要だろ
🤡どちらかというと十分で微かにダチョウだよ
👤んーー、kは整数かつ2以上が必要 といえば十分か
🤡話しが長いな。てかゲーデル不完全性定理と関係ありそ
👤それ以前に我が星、ランベルト星の数学・論理学は矛盾許容だ
🤡それ、完全性定理ぢゃねーーー?
👤どっちでもok ∵矛盾許容
🥳ポクも宇宙人に産まれ変わりたいデーース
788デフォルトの名無しさん
2024/05/04(土) 01:03:55.27ID:Lsoig7U/ VTも使うTSV形式はこんな感じか。
行末のCRLFは無くても問題ないが
あった方がテキストエディタで開いた時に見やすくなる
セルA1␉セルB1␉セルC1␋␍␊
セルA2␉セルB2␉セルC2␋␍␊
ASCIIが想定していたUSやRSの使い方はこんな所だろうか
セルA1␟セルB1␟セルC1␞␍␊
セルA2␟セルB2␟セルC2␞␍␊
行末のCRLFは無くても問題ないが
あった方がテキストエディタで開いた時に見やすくなる
セルA1␉セルB1␉セルC1␋␍␊
セルA2␉セルB2␉セルC2␋␍␊
ASCIIが想定していたUSやRSの使い方はこんな所だろうか
セルA1␟セルB1␟セルC1␞␍␊
セルA2␟セルB2␟セルC2␞␍␊
789デフォルトの名無しさん
2024/05/04(土) 08:00:55.56ID:XF0U8juk 🥳 てかプロマネさ、エクセルに
CSVの文章貼り付けるときどうしてる?
🤡 んー「,」の半角は
tab に置換えてから、コピペ
🥳 「123,ABC」を「123tabABC」
てやって、A1セルに貼付けても
A1セルに「123tabABC」って表示されたよ
ウッソ付きーーーー!
👤 地球人って・・・
🤡 地球人でも、かなり、・・・・
👤 こんな文章を、書き込む奴も・・・・なのか?
🤡 ノーコメントとする。
CSVの文章貼り付けるときどうしてる?
🤡 んー「,」の半角は
tab に置換えてから、コピペ
🥳 「123,ABC」を「123tabABC」
てやって、A1セルに貼付けても
A1セルに「123tabABC」って表示されたよ
ウッソ付きーーーー!
👤 地球人って・・・
🤡 地球人でも、かなり、・・・・
👤 こんな文章を、書き込む奴も・・・・なのか?
🤡 ノーコメントとする。
790デフォルトの名無しさん
2024/05/04(土) 13:09:03.98ID:tY3IcCX2 一日一回無料で使える脱衣AI見つけたbb
https://mao.5ch.net/test/read.cgi/gymnastics/1240746278/217
https://mao.5ch.net/test/read.cgi/gymnastics/1240746278/217
791デフォルトの名無しさん
2024/05/04(土) 16:13:25.74ID:Lsoig7U/ セルの列やセルの行を区切るのに制御文字を使えれば
セル内に,や”を入れたり改行することもできるんだよね
セル内に,や”を入れたり改行することもできるんだよね
792単なる呟き
2024/05/04(土) 18:46:03.94ID:XF0U8juk 🤡 多分、タブの制御コードは、␉ って感じだ
🥳 タブはHTなの?、ポクは英語バッチリ [Tab]ぢゃーーーん
キーボードにHTなんてマークのキーは見つからん
👤 キーボードの[Tab]にマジックでHTって記入しちゃえー!
🥳 タブはHTなの?、ポクは英語バッチリ [Tab]ぢゃーーーん
キーボードにHTなんてマークのキーは見つからん
👤 キーボードの[Tab]にマジックでHTって記入しちゃえー!
793デフォルトの名無しさん
2024/05/05(日) 00:28:15.77ID:DTqCPhPD 垂直タブはキャレット記法で^Kだけど
PC-98のDOSで↑キーを押すと^Kが入力されたのを思い出した
他には→キーを押すと^Lが入力されたと思う
PC-98のDOSで↑キーを押すと^Kが入力されたのを思い出した
他には→キーを押すと^Lが入力されたと思う
794デフォルトの名無しさん
2024/05/05(日) 14:18:12.85ID:ufyV/oQQ >>787 の自称宇宙人の👤が
「Cr単独で改行アリエナイ∴Cr無視」とか言ってますが
ヘンですね。
というか、'xxxxx␍yyyyy'は、ポクの
メモ帳で開いたら
xxxxx
yyyyy
でちゃんと改行されて表示ですよ。
改行がCr単独なんてアリエナイ なんて
勝手な前提しちゃいけません。レッテル論法禁止🚫🈲🙅
by 🤡
👤 give up てか今日はバィバィ。さよならーーー
「Cr単独で改行アリエナイ∴Cr無視」とか言ってますが
ヘンですね。
というか、'xxxxx␍yyyyy'は、ポクの
メモ帳で開いたら
xxxxx
yyyyy
でちゃんと改行されて表示ですよ。
改行がCr単独なんてアリエナイ なんて
勝手な前提しちゃいけません。レッテル論法禁止🚫🈲🙅
by 🤡
👤 give up てか今日はバィバィ。さよならーーー
795デフォルトの名無しさん
2024/05/05(日) 20:09:04.88ID:DTqCPhPD GUIでCR,LF,HT,BS,DEL以外の制御文字を
ソースコードなどに手動で入力して使う事がほとんど無いのは
キーボードに専用のキーが無いからなのかね?
CUIではCtrlとアルファベットキーの組み合わせで入力できたけど
GUIではショートカットキーとして使われていて制御文字は入力できないし
C1制御文字に至ってはさらに馴染みがない。
制御文字をもっと活用すればエスケープ文字が図形文字のために
その文字を表示するために特別な入力をする必要も無くなるのに。
ソースコードなどに手動で入力して使う事がほとんど無いのは
キーボードに専用のキーが無いからなのかね?
CUIではCtrlとアルファベットキーの組み合わせで入力できたけど
GUIではショートカットキーとして使われていて制御文字は入力できないし
C1制御文字に至ってはさらに馴染みがない。
制御文字をもっと活用すればエスケープ文字が図形文字のために
その文字を表示するために特別な入力をする必要も無くなるのに。
796デフォルトの名無しさん
2024/05/05(日) 21:28:31.49ID:GQlpZ+4B >>795
制御文字のほとんどが機種依存だから。
制御文字のほとんどが機種依存だから。
797デフォルトの名無しさん
2024/05/06(月) 04:24:56.29ID:w6EM8fRb >>794
CR 単独は、古いMac だけ
CR 単独は、古いMac だけ
798デフォルトの名無しさん
2024/05/06(月) 09:46:14.51ID:endGOe+7 >>797
OS9, AppleII, commodore
OS9, AppleII, commodore
799デフォルトの名無しさん
2024/06/01(土) 00:05:13.54ID:7lxL4C6A IPAmj明朝のIVSって、2017年ので止まってるの?
800デフォルトの名無しさん
2024/06/01(土) 11:39:25.67ID:7lxL4C6A あたらしめのIVSを使おうと思ったらグリフがないくさいので
801デフォルトの名無しさん
2024/06/02(日) 01:04:43.33ID:rO+GNz4V >>799 は正解くさいので違うフォントを使うことにした。
802デフォルトの名無しさん
2024/06/02(日) 11:08:06.07ID:EnNBM925 「IPAmj明朝は、IVD 2017-12-12 Moji_Johoコレクションに準拠してIVSを実装してあります」と説明されているとおりで、他のIVSに対応する目的のものではないから、更新が止まってるとかではないような
803デフォルトの名無しさん
2024/06/03(月) 14:37:57.00ID:UCbPeCZM >>802
Moji_Johoコレクションは数年おきにアップデートされている
「IVD 2017-12-12 Moji_Johoコレクションに準拠」という説明は、同時に「2017-12-12版以降
には対応しない」という意味でもあるのかなと思っている
Moji_Johoコレクションは数年おきにアップデートされている
「IVD 2017-12-12 Moji_Johoコレクションに準拠」という説明は、同時に「2017-12-12版以降
には対応しない」という意味でもあるのかなと思っている
804デフォルトの名無しさん
2024/06/03(月) 15:58:23.74ID:YdsWYYn6 PowerPointでShift+Enterを押すと垂直タブを入力できるようだけど
他のソフトでも垂直タブがShift+TabやShift+Enterで入力できるのが標準になっていたら
垂直タブはもっと広く普及していただろうか
他のソフトでも垂直タブがShift+TabやShift+Enterで入力できるのが標準になっていたら
垂直タブはもっと広く普及していただろうか
805デフォルトの名無しさん
2024/06/04(火) 15:13:07.31ID:uznUZQwV CSVとTSVを比べるとTSVの方がテキストエディターで開いたときに見やすいから便利だと思うんだけどCSVにはどんな利点がある?
806デフォルトの名無しさん
2024/06/04(火) 16:24:20.35ID:QS4SGGEb 文字コードの話じゃねーじゃん
807デフォルトの名無しさん
2024/06/04(火) 17:03:57.21ID:8TlGJtZv808デフォルトの名無しさん
2024/06/04(火) 17:15:26.05ID:8TlGJtZv >>805
CSV の利点は制御文字(cc)ではなく表示文字を使っている点。TAB はccなので表示系によっては見た目で区別できない場合がある。典型的にはスペースと見間違える(1文字TABはスペースと同じアキになる可能性
常にTABとスペースが正確に区別できる環境ならTSVの方がだんぜん便利だと思うが TAB は普通の文字じゃないことも文字コード設計として念頭においておくべき
あと unicode にはスペース類似文字もカンマに似た文字も多過ぎるので、どのみち見た目で区別は駄目という話はある、酷い話だ。
CSV の利点は制御文字(cc)ではなく表示文字を使っている点。TAB はccなので表示系によっては見た目で区別できない場合がある。典型的にはスペースと見間違える(1文字TABはスペースと同じアキになる可能性
常にTABとスペースが正確に区別できる環境ならTSVの方がだんぜん便利だと思うが TAB は普通の文字じゃないことも文字コード設計として念頭においておくべき
あと unicode にはスペース類似文字もカンマに似た文字も多過ぎるので、どのみち見た目で区別は駄目という話はある、酷い話だ。
809デフォルトの名無しさん
2024/06/04(火) 17:46:25.88ID:1kTV4q2T すげーな
職場でもあんま話通じない人なのかな
職場でもあんま話通じない人なのかな
810デフォルトの名無しさん
2024/06/04(火) 22:21:43.51ID:GNPHSdGp 「慶応」も「コンクリート」も漢字1文字で 〜Unicode標準に新しいブロックが提案中
手書きでしばしば用いられる「部首+カナ」スタイルの略式漢字
https://forest.watch.impress.co.jp/docs/serial/yajiuma/1597030.html
手書きでしばしば用いられる「部首+カナ」スタイルの略式漢字
https://forest.watch.impress.co.jp/docs/serial/yajiuma/1597030.html
811デフォルトの名無しさん
2024/06/04(火) 23:02:09.29ID:k5yNkVnV >>810
そういうのは合字といって昔からある
そういうのは合字といって昔からある
812デフォルトの名無しさん
2024/06/04(火) 23:04:13.30ID:k5yNkVnV UTF-8は日本語だと明確に指示していないと、漢字が中国の漢字が入り込んでしまう。
813デフォルトの名無しさん
2024/06/04(火) 23:06:31.80ID:k5yNkVnV UTF-8で記号がたくさん追加定義されて、MS-IMEがめちゃくちゃだから、変な記号を使う日本人が激増した。
814デフォルトの名無しさん
2024/06/04(火) 23:12:43.53ID:A0JJZg9T 変体仮名で限界
用例を見たが、それ以上の歴史的重要資料が大量にあって
デジタル化の必要性があるとは到底思えない
英字アルファベットも代表的なカリグラフィーを収めて終了
unicode標準は局所的な特定小集団のおもちゃじゃない
用例を見たが、それ以上の歴史的重要資料が大量にあって
デジタル化の必要性があるとは到底思えない
英字アルファベットも代表的なカリグラフィーを収めて終了
unicode標準は局所的な特定小集団のおもちゃじゃない
815デフォルトの名無しさん
2024/06/05(水) 07:49:52.75ID:Ex4xeIUM816デフォルトの名無しさん
2024/06/05(水) 09:34:19.11ID:TjOdfiQ/ UnicodeData.txtをあたらないと何を表してるのかさっぱり分からん絵文字よりは
まだその手の略字のほうが有意義な気はする
まだその手の略字のほうが有意義な気はする
817デフォルトの名無しさん
2024/06/05(水) 10:21:36.77ID:xv3Pbp+3 >>808
Firefoxだと表示できない文字は□の中に16進コードが書かれた文字が表示されるから
同じようにテキストエディターでも制御文字と空白に見える文字は空白を表示する代わりに
16進のコードが表示されれば分かりやすくなるね
Firefoxだと表示できない文字は□の中に16進コードが書かれた文字が表示されるから
同じようにテキストエディターでも制御文字と空白に見える文字は空白を表示する代わりに
16進のコードが表示されれば分かりやすくなるね
818デフォルトの名無しさん
2024/06/05(水) 13:38:49.33ID:XaSaDlvd819デフォルトの名無しさん
2024/06/05(水) 15:08:16.04ID:lcx/EjsX820デフォルトの名無しさん
2024/06/06(木) 09:50:50.05ID:GV7aCOF9 >>818
それを全国の市町村の役所でやって既成事実化できずただただ氾濫して手に負えなくなったんよ
それを全国の市町村の役所でやって既成事実化できずただただ氾濫して手に負えなくなったんよ
821デフォルトの名無しさん
2024/06/06(木) 10:38:50.99ID:qz5pj6nB 役所は文系ばかりなのでとんでもないことを平気でやらかす
822デフォルトの名無しさん
2024/06/06(木) 10:46:53.59ID:qz5pj6nB823デフォルトの名無しさん
2024/06/06(木) 16:26:25.10ID:nRDHkFIj unicodeだと同じ文字に見えても違うコードポイントの文字が多いから
テキストエディタにもコードポイントを表示する機能と
バイナリではどう記録されているのか表示する機能が欲しい
バイナリエディタでは折り返しが16バイト毎の固定で文章入力しにくいから
折り返しを16バイト毎ではなく0x0D0Aにできるバイナリエディタのような感じかな
テキストエディタにもコードポイントを表示する機能と
バイナリではどう記録されているのか表示する機能が欲しい
バイナリエディタでは折り返しが16バイト毎の固定で文章入力しにくいから
折り返しを16バイト毎ではなく0x0D0Aにできるバイナリエディタのような感じかな
824デフォルトの名無しさん
2024/06/07(金) 00:30:00.98ID:KQ6L7vRD 絵文字とか異体字セレクタとかもあるし、とりえあえず文字(グラフィームってやつ?)の
境界を見つけるのが面倒だよね
文字境界を探すライブラリとか、今ってそこら辺もちゃんと動く感じ?
境界を見つけるのが面倒だよね
文字境界を探すライブラリとか、今ってそこら辺もちゃんと動く感じ?
825デフォルトの名無しさん
2024/06/07(金) 02:08:04.46ID:4C4NoraV >>823
サクラエディタにそんな機能があるな
サクラエディタにそんな機能があるな
826デフォルトの名無しさん
2024/06/07(金) 20:02:28.27ID:f1gRwXGz Ruby では、
https://qiita.com/QUANON/items/2539feed89cee2290664
couple = '👨👩'
p couple.length #=> 3
# \X Unicode 結合文字シーケンス (eXtended grapheme cluster) (?>\P{M}\p{M}*)
p couple.scan(/\X/).length #=> 1
# \u{0308} はウムラウト
p euml = "e\u{0308}" # "ë"。"〜"で囲む
p /\X/.match(euml) #=> #<MatchData "ë"> ウムラウト有り
p $&.codepoints #=> [101, 776]
# \w 単語構成文字 [a-zA-Z0-9_]
# \W 非単語構成文字 [^a-zA-Z0-9_]
p /\w/.match(euml) #=> #<MatchData "e"> ウムラウト無し
p $&.codepoints #=> [101]
p couple.chars #=> ["👨", "", "👩"]
p couple.grapheme_clusters #=> ["👨👩"] 書記素クラスタ
# U+200D は、Zero Width Joiner (ZWJ: ゼロ幅接合子)
couple.each_char { |chr| puts(format('U+%04X', chr.ord)) }
# U+1F468, U+200D, U+1F469
(euml + couple).each_grapheme_cluster { |chr| puts(format('U+%04X', chr.ord)) }
# U+0065, U+1F468
# つまり先頭文字である、'e👨' だけになる
https://qiita.com/QUANON/items/2539feed89cee2290664
couple = '👨👩'
p couple.length #=> 3
# \X Unicode 結合文字シーケンス (eXtended grapheme cluster) (?>\P{M}\p{M}*)
p couple.scan(/\X/).length #=> 1
# \u{0308} はウムラウト
p euml = "e\u{0308}" # "ë"。"〜"で囲む
p /\X/.match(euml) #=> #<MatchData "ë"> ウムラウト有り
p $&.codepoints #=> [101, 776]
# \w 単語構成文字 [a-zA-Z0-9_]
# \W 非単語構成文字 [^a-zA-Z0-9_]
p /\w/.match(euml) #=> #<MatchData "e"> ウムラウト無し
p $&.codepoints #=> [101]
p couple.chars #=> ["👨", "", "👩"]
p couple.grapheme_clusters #=> ["👨👩"] 書記素クラスタ
# U+200D は、Zero Width Joiner (ZWJ: ゼロ幅接合子)
couple.each_char { |chr| puts(format('U+%04X', chr.ord)) }
# U+1F468, U+200D, U+1F469
(euml + couple).each_grapheme_cluster { |chr| puts(format('U+%04X', chr.ord)) }
# U+0065, U+1F468
# つまり先頭文字である、'e👨' だけになる
827デフォルトの名無しさん
2024/06/07(金) 21:53:54.62ID:8MnTJRoZ Macなんて日本語でも英語のUTF-8と決めつけるから、SJISですらうまく打てない。
828デフォルトの名無しさん
2024/06/07(金) 22:04:15.54ID:8MnTJRoZ829デフォルトの名無しさん
2024/06/07(金) 22:06:42.14ID:NZ6fOaVt JavaScriptの識別子に中黒が使えるようになった
https://nanto.asablo.jp/blog/2024/06/07/9690975
JavaScriptの識別子(変数名、関数名、プロパティ名など)の2文字目以降に中黒「・」(U+30FB KATAKANA MIDDLE DOT)が使えるようになりました。以下のコードはChrome 124では構文エラーになりますが、Chrome 125では問題なく実行できます。
const シン・ゴジラ = 2016;
中黒が使えるようになったのは、JavaScript(ECMAScript)の仕様が変わったからではありません。変わったのはUnicodeの仕様のほうです。Unicode 15.1.0(2023年9月)においてOther_ID_Continueプロパティ(を持つ文字の集まり)に中黒が追加されました。
https://nanto.asablo.jp/blog/2024/06/07/9690975
JavaScriptの識別子(変数名、関数名、プロパティ名など)の2文字目以降に中黒「・」(U+30FB KATAKANA MIDDLE DOT)が使えるようになりました。以下のコードはChrome 124では構文エラーになりますが、Chrome 125では問題なく実行できます。
const シン・ゴジラ = 2016;
中黒が使えるようになったのは、JavaScript(ECMAScript)の仕様が変わったからではありません。変わったのはUnicodeの仕様のほうです。Unicode 15.1.0(2023年9月)においてOther_ID_Continueプロパティ(を持つ文字の集まり)に中黒が追加されました。
830デフォルトの名無しさん
2024/06/07(金) 22:34:26.74ID:8MnTJRoZ >>829
表記の揺れの原因になりやすい記号
表記の揺れの原因になりやすい記号
831デフォルトの名無しさん
2024/06/07(金) 23:59:44.50ID:2VgcMGPt832デフォルトの名無しさん
2024/06/08(土) 01:05:00.06ID:mxKAN8QR >>831
中国人/台湾人の辞書や文字コード表に記載されているかどうか。はしご高は台湾漢字由来だったか
日本の異字体はIVS使うことにしたので最近は登録申請すらほとんどしてないけど、中華人民共和国は今もがんがん本体に追加要請してる
中国人/台湾人の辞書や文字コード表に記載されているかどうか。はしご高は台湾漢字由来だったか
日本の異字体はIVS使うことにしたので最近は登録申請すらほとんどしてないけど、中華人民共和国は今もがんがん本体に追加要請してる
833デフォルトの名無しさん
2024/06/08(土) 01:39:00.68ID:h1Q0ar53 >>832
「異体字」を「異字体」と間違っている時点で説得力なしw
「異体字」を「異字体」と間違っている時点で説得力なしw
834デフォルトの名無しさん
2024/06/08(土) 10:12:44.74ID:mxKAN8QR >>833
この場合は「異−字体」であってるんだよ。「異体−字」は個々の文字を指す。
この場合は「異−字体」であってるんだよ。「異体−字」は個々の文字を指す。
835デフォルトの名無しさん
2024/06/08(土) 13:27:19.23ID:QJis2zSF そういえば、斉藤なんかの「さい」の異体字はすごい数あるな
もともと難しい字で、戸籍登録の際の書き間違いが原因らしいけど
もともと難しい字で、戸籍登録の際の書き間違いが原因らしいけど
836デフォルトの名無しさん
2024/06/08(土) 21:42:22.14ID:b6OQAhB4 異体字と異字体
https://www.ytv.co.jp/announce/kotoba/back/2001-2100/2036.html#:~:text=%E3%81%AE%E8%A9%B12038%E3%80%8C-,%E7%95%B0%E4%BD%93%E5%AD%97%E3%81%A8%E7%95%B0%E5%AD%97%E4%BD%93,-%E3%80%8D%0A%0A%E6%96%B0%E8%81%9E%E7%94%A8%E8%AA%9E
https://www.ytv.co.jp/announce/kotoba/back/2001-2100/2036.html#:~:text=%E3%81%AE%E8%A9%B12038%E3%80%8C-,%E7%95%B0%E4%BD%93%E5%AD%97%E3%81%A8%E7%95%B0%E5%AD%97%E4%BD%93,-%E3%80%8D%0A%0A%E6%96%B0%E8%81%9E%E7%94%A8%E8%AA%9E
837デフォルトの名無しさん
2024/06/15(土) 21:59:47.39ID:1hp9WHhR すげーのを引っ張りだしたなw
838デフォルトの名無しさん
2024/06/17(月) 09:21:34.95ID:TtAe0wMx CJK統合漢字拡張もいつの間にかI(アイ)まで来てるのかあ
どこまで行くんでしょう
どこまで行くんでしょう
839デフォルトの名無しさん
2024/06/17(月) 18:15:03.85ID:BtZF1kb5840デフォルトの名無しさん
2024/06/17(月) 23:07:05.19ID:4L+665Jw841デフォルトの名無しさん
2024/06/18(火) 00:34:22.90ID:4d4deoVm842デフォルトの名無しさん
2024/06/18(火) 02:46:10.52ID:7l1MdKKx >>841
漢字の話をしているだぞ?
漢字は意味が違ったけど同じになったもの、新しい漢字を作るときに位置が違ったもの、わざと創作した存在しない漢字などがあり、字体違いだけでなく書体違いもあり、あなたのこだわりは漢字そのものをわかっていない。
漢字の話をしているだぞ?
漢字は意味が違ったけど同じになったもの、新しい漢字を作るときに位置が違ったもの、わざと創作した存在しない漢字などがあり、字体違いだけでなく書体違いもあり、あなたのこだわりは漢字そのものをわかっていない。
843デフォルトの名無しさん
2024/06/18(火) 02:47:11.32ID:7l1MdKKx >>841
「異字体」というのは中国語
「異字体」というのは中国語
844デフォルトの名無しさん
2024/06/18(火) 03:01:03.27ID:4d4deoVm 「漢字Aと漢字Bは〇〇の関係にある」
この〇〇には異体や異字体は入るが、異体字や異体文字は入らない。異体字は字体の関係性ではなく個々の文字を指す用語。
「異なる字体」と言いたい場合は「異体/異字体」を使用する。
「字体」とは文字の骨格となる構成を言う。「字形」や「書体」とは違う概念
この〇〇には異体や異字体は入るが、異体字や異体文字は入らない。異体字は字体の関係性ではなく個々の文字を指す用語。
「異なる字体」と言いたい場合は「異体/異字体」を使用する。
「字体」とは文字の骨格となる構成を言う。「字形」や「書体」とは違う概念
845デフォルトの名無しさん
2024/06/18(火) 05:09:10.23ID:7l1MdKKx ○
〇
〇
846デフォルトの名無しさん
2024/06/18(火) 05:09:59.04ID:7l1MdKKx >>844
漢数字のゼロを丸印だと思っている方に言われたくない
漢数字のゼロを丸印だと思っている方に言われたくない
847デフォルトの名無しさん
2024/06/18(火) 07:20:08.45ID:4d4deoVm >>846
すまん。アンドロイドで「まるまる」で変換しただけで思ってるとか無関係。
すまん。アンドロイドで「まるまる」で変換しただけで思ってるとか無関係。
848デフォルトの名無しさん
2024/06/18(火) 07:55:46.38ID:7l1MdKKx Google日本語入力を使った方がいい
849デフォルトの名無しさん
2024/06/18(火) 09:14:05.74ID:4d4deoVm >>848
俺の使ってる google 日本語入力だと「まるまる」の候補は〇〇、丸々、丸丸、円円 (カナやローマ字以外だと)4つだけだな。
この謎の漢数字の〇〇って「ひとふたまるまる」とかの軍隊時間呼称とか用なんだろうか? でも「人蓋〇〇」とかになるな
俺の使ってる google 日本語入力だと「まるまる」の候補は〇〇、丸々、丸丸、円円 (カナやローマ字以外だと)4つだけだな。
この謎の漢数字の〇〇って「ひとふたまるまる」とかの軍隊時間呼称とか用なんだろうか? でも「人蓋〇〇」とかになるな
850デフォルトの名無しさん
2024/06/18(火) 10:39:53.14ID:7l1MdKKx 中国が日本語を担当しているせいで、日本人が「まる」と入力したときに零だと勘違いしているだけだ。
大日本帝国の末期の用語みたいになっている。
大日本帝国の末期の用語みたいになっている。
851デフォルトの名無しさん
2024/06/18(火) 10:41:16.55ID:7l1MdKKx 変換候補に出てくる文字の説明がちゃんと出てくるものを使わないと
852デフォルトの名無しさん
2024/06/18(火) 15:04:55.87ID:J2T1cvE/ 梵
853デフォルトの名無しさん
2024/06/18(火) 16:01:02.14ID:xFwnxcwf 悩
854デフォルトの名無しさん
2024/06/23(日) 18:00:29.64ID:AwO4Mznw 異体字セレクタって、無闇に使うと問題あったりしますか?
例えば対応してないシステムやアプリ上で使うと何か問題が発生するとか
例えば対応してないシステムやアプリ上で使うと何か問題が発生するとか
855デフォルトの名無しさん
2024/06/23(日) 19:08:28.54ID:E6KcLbxg 検索する時にはまりそう
856デフォルトの名無しさん
2024/06/23(日) 19:53:42.52ID:kgoIYSsb857デフォルトの名無しさん
2024/06/27(木) 04:51:42.68ID:mbmQwdn4 見た目が似ている横棒がUTF-8でたくさん定義されてしまって面倒なことになった。
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 日本行き空路49万件キャンセル 中国自粛呼びかけ 日本行きチケット予約の約32%に相当 ★4 [ぐれ★]
- 【音楽】Perfume・あ~ちゃんの結婚相手「一般男性」は吉田カバンの社長・吉田幸裕氏(41) 高身長で山本耕史似 [Ailuropoda melanoleuca★]
- 中国の局長は「両手をポケット」で対峙 宣伝戦で国民に示す ★3 [蚤の市★]
- 【大分】佐賀関で大規模火災、170棟以上が延焼中 70代男性1人と連絡取れず [ぐれ★]
- 【サッカー】U-17日本代表、激闘PK戦制す 北朝鮮撃破で6大会ぶり8強入り U17W杯 [久太郎★]
- 「クマはなるべく山に返す努力を」「クマと戦争は間違っている」動物保護活動家の主張 棲み分けと学習放獣でクマ被害なくなるのか?★7 [ぐれ★]
- とらせん IPあり
- 巨専】
- こいせん 全レス転載禁止
- 侍ジャパンシリーズ2025「日本vs韓国」その12
- 【DAZN】ワールドカップ欧州予選総合 ★5
- 【ATP】テニス総合実況スレ2025 Part 211【WTA】
- 【悲報】大分市佐賀関の火事、20軒→170軒に延焼🔥 [481941988]
- アンケート調査で「高市発言は問題なし」 93.5%wwwwwwwwwwwwwwwwwwwwwwwww [279254606]
- 肴は炙った〰イカでいい〰って歌あるじゃん?
- 自閉症が「んなっしょい」と連呼するお🏡
- 日本人の海外旅行したきのマナーよくなったのはいつから
- へそグリグリ
