X



文字コード総合スレ part14
0001デフォルトの名無しさん
垢版 |
2023/03/03(金) 15:46:58.08ID:yKqwMGHT
Windows NTは初代からUnicodeがネイティブの文字コードです。cp932ではありません。
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。

■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
 (スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
 (隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
文字コード総合スレ Part10 http://mevius.2ch.net/test/read.cgi/tech/1444822140/
文字コード総合スレ Part11 https://mevius.5ch.net/test/read.cgi/tech/1516629503/
文字コード総合スレ Part12 https://mevius.5ch.net/test/read.cgi/tech/1544931495/
文字コード総合スレ part13
https://mevius.5ch.net/test/read.cgi/tech/1593777227/
0748デフォルトの名無しさん
垢版 |
2024/04/28(日) 08:53:39.45ID:rkFAlLnQ
>>732
別に制御文字がコード上限とかを表す意味ではないから
C0やC1がなぜ存在するのか、もう昔話なんだなあ
0749プロマネ(の役)の呟き
垢版 |
2024/04/28(日) 15:59:34.49ID:HryHCmVX
UTF-8 on 4byte
  1U⚫⚫⚫⚫ ⚪🔵🔵🔵
  2U⚫⚪🟤🟤 🟤🟤🟤🟤
  3U⚫⚪🟣🟣 🟣🟣🟣🟣
  4U⚫⚪🟢🟢 🟢🟢🟢🟢
⚫⚪以外は、マルの個数は21個だな
そ、UTF8は2の21乗つまり、21bitだ
unicodeは2の約20乗だ。utf8の方が約2倍
文字が多い。

なんてワケはない。そこが、とにかく、なんやかんやで、ややこしい
UTF8→UNICODEの変換で半分重複する。

なんて、ことはない。ように変換プラグラムを
やるのは、結構面倒な予感

てか、もう完成はしたけど、何か後味は悪い
BY 🤡

👤気にするな。結構完璧だ
🥳気にするな。動けばいいぢゃーーーん
0750プロマネの呟き
垢版 |
2024/04/28(日) 18:03:11.53ID:HryHCmVX
スマホの連絡帳の氏名に、
UTF8なら2,3,4byte文字混在
「サインΘ👻だよ 👤🤡🥳」をタイプ
それをcontacts.vcfでexport
自作ツールで 文字化けてかpritable以降の
文字列(asciiだけどutf8)を、地球人でも
解るようエンコードした。
ま、excelということもあってwindows上のためか、絵文字が白黒でデザインがしょぼい
が、とにかく、ツールバッチリ

超秘伝だか、超々秘伝の数式だか、あれバッチリ
ちなみに、👻もそれを電話帳(連絡帳)に入力もしたが、バッチリ表示。完璧だぜ。

by 🤡

絵文字が白黒? いまひとつぢゃーーーん
by 🥳

てかさ、windowsのメモ帳ってカラー表示は無理
by 👤

メモ帳、ちゃんとなおせーーーー
by 🥳バカなクレーマー
0751プロマネのつぶやき
垢版 |
2024/04/28(日) 18:19:51.71ID:HryHCmVX
ま、「サインΘ👻だよ 👤🤡🥳」をexcelに貼り付けると
絵文字は白黒だが、それぞれの文字に任意の色をつけれる。
一文字には、任意の1色だけだが、画像でないのだから、
何か、いい感じ。てか、👤のデザインがイマイチだな。
なんか、カワイイ感じになってる。👤はやはり、ブラック感のある
ワルーーーって感じなんだけど

てか、イタリックやると、👤🥳🤡もイタリック体になる
これは、ナカナカよし。
🟦🟦
🟦🟦 なかなかやるなーーーー てかマイクロソフトのロゴって
青い四角四つにいつの間にか化学変換してるな。気が付かなかった
0752ランベルト星人の呟き
垢版 |
2024/04/28(日) 22:18:28.10ID:HryHCmVX
👤今回のツール、いろいろテストで不具合発見した
ナカナカ、手間取ったが、デバッグ取り敢えず完了
ぢゃーひと休みいれるかな。
ちなみに、それは、最後の文字が「=」で継続行だ
最後の文字とは改行コードの一つ手前との意味
それに伴う改修だ。vcfにもちゃんとした規格があり
それに忠実にやってるんだな。疲れたぜ

🥳意味がさっぱりわかんないから、ok
0753752の続き、早朝レビュー
垢版 |
2024/04/29(月) 04:56:50.11ID:V3l6c++H
👤 ワタシは宇宙人。で、「=」はナゾなる制御コードだ
🤡 自称宇宙人、頭大丈夫か?
🥳 ランベルトさん、デバッグしすぎで、頭バグっちゃったーーー
👤 安心しろ。「=」は、その直後に改行でも継続と解釈という意味だ
  RFC何とかという、地球のルール。それは宇宙のスタンダードだ
🤡 ん、てかさ、「=」は、EXCELでは、それが先頭なら、関数
  として解釈しろ。という制御コードぢゃねえーーー?
👤 あ、思い出した。vcfファイルの中身から、コピペして、
  excelのセルへコピペする。トスル
🤡 すると、先頭が「=E0=80=BF」などは、文字列でなく、関数とみなす
👤 そ、あの秘伝のツールは、ホントはon EXCEL って感じ
🤡 入力のセルは文字列って指定しろ。初期設定の標準ではダメ
👤 デバッグ中に気が付き、修正は済んだ。標準でなく文字列とした
🥳 標準なんての従うからバグちゃったのーーー。スタンダード嫌いです
  スタンダード反対。宇宙やるーーーー
🤡 てか、だからヤツは宇宙人なんだぞ
0754RFC宇宙人初登場
垢版 |
2024/04/29(月) 05:10:29.84ID:V3l6c++H
® ヘーイ、ワタシはRFC宇宙人
宇宙標準てか地球の規格 RFCを貼るぞ

CRLF sequence (U+000D followed by U+000A). Long logical lines of text can be split into a multiple-physical-line representation using the following folding technique. Content lines SHOULD be folded to a maximum width of 75 octets
0755ランベルト宇宙人、自作自演
垢版 |
2024/04/29(月) 05:24:19.94ID:V3l6c++H
👤 75文字までなら改行不要で76文字で改行しろって規格❓
® そうだけど、ちがうもんねーーーー
👤 漢字10文字程度、改行しまくりだ。こらS⚪nyのスマホの
  vcfのエクスポートするの、ヘンぢゃねーーー
® ソニーさんのは、我がスタンダードRFC通りを守ってるぽぃ
👤 んーー、漢字10文字は、UTF8のPRINTABLEにデコードてか
エンコードすると何文字だ。プロマネ計算しろ
🤡 3BYTE/日本語 で、さらに、PRINTABLEだから、
えーと、一文字は、「=E0=80=BF」って感じの9octed/日本語
多分、®の75 octetsがマックスは75/9だから
漢字八文字超えたら改行しろ。ぢゃない。
ソニーさん教えて下さい。
🥳 単にアンドロイドのツールをパクらせただけだろ
グ⚪グルさんが詳しいんぢゃない。
てか、あのツールはデバッグ済んだし
キニシナイ
👤そうだな。てか地球の、ルールめんどくせー
0756プロマネ、裏のウラを、読む
垢版 |
2024/04/29(月) 05:35:23.63ID:V3l6c++H
RFCの規格、改行は、暗に、
CRLF sequence を前提に規格書を策定してるのか?
RFCってマイク🟦ソフトなのな?
BY 🤡
プログラム、の憶測って、ウガリすぎーープロマネ🧠バグってるーー
BY 🥳

有能なプロマネともなると、規格のウラのウラまで読み切る事も大切
BY 🤡

地球人に産まれて来なくて良かったぜーー BY👤

あ、自称宇宙人のランベルト宇宙人、バグった言い訳してるーー
BY 🥳
0757完了∴編集後記1
垢版 |
2024/04/29(月) 08:04:27.22ID:V3l6c++H
プログラミング設計
n文字目の先頭🟦とおく※暗に🟦は有
その次のを🟫とおく※無なら0x00が無難
さらに次を🟪とおく※ 〃
その次のを🟩とおく※ 〃

n=1 '先頭をゼロとするなら要改
Repeat until 🟦=0
if 🟦<128 then 'ascii
  ⭐=🟦
  UNICHAR(⭐)を表示
  n=n+1
elseif 🟦<192then 'なんちゃってascii
  「👻」を表示
  n=n+1
elseif 🟦<224 then '2byte
  if 128≦🟫≦191 then
    ⭐=64*(🟦-192)+(🟫-128)
    UNICHAR(⭐)を表示
    n=n+2
  else       
   「👻」を表示
    n=n+1 ' ∵1byte文字トミナス
  end if
0758= 継続の記号∵RFC2045?
垢版 |
2024/04/29(月) 08:06:07.54ID:V3l6c++H
elseif 🟦<240 then '3byte
  if 128≦🟫≦191 and
   128≦🟪≦191 then
  then '
    ⭐ =256*(16*(🟦-224)
       +INT((🟫-128)/4))
      +64*(MOD((🟫-128),4))
      +(🟪-128)
    UNICHAR(⭐)を表示
    n=n+3
  else       
   「👻」を表示
    n=n+1 ' ∵1byte文字トミナス
  end if
elseif 🟦<248 THEN
  if 128≦🟫≦191 and
   128≦🟪≦191 and
   128≦🟩≦191 then
  then '4byte
    ⭐=65536*(4*(🟦-240)
      +INT((🟫-128)/16))
      +256*(16*MOD((🟫-128),16)
      +INT(((🟪-128)/4)))
      +(64*MOD((🟪-128),4)
      +(🟩-128))
    UNICHAR(⭐)を表示
    n=n+4
  else       
   「👻」を表示
    n=n+1 ' ∵1byte文字トミナス
  end if
0759
垢版 |
2024/04/29(月) 08:07:48.87ID:V3l6c++H
else '5,6byte
   「👻」を表示
    n=n+1 ' ∵1byte文字トミナス
end if
end repeat
msgbox"やったね∵処理完了\(^o^)/"
0760=は最後が=なら継続ぢゃないアル
垢版 |
2024/04/29(月) 08:12:06.24ID:V3l6c++H
こらーーー
if 🟦<128 then 'ascii  は、

if 0=🟦 then 'null
  '何もしない
elseif 0<🟦<128 then 'ascii

ぢゃなーーーーい
てか先頭=は関数とみなすです。∵excel
継続から最後に=ですよ。
で最後は改行CrLf ですよ∵RFC2045?
BY 🤡

意味わかんない けどスゴくてヤバイ
BY 🥳
0761memopad man
垢版 |
2024/04/29(月) 14:12:05.17ID:V3l6c++H
❌ if 🟦<128 then 'ascii

🙆 if 0=🟦 then 'null2space
  ⭐=32
  unichar(⭐)
  n=n+1
elseif 0<🟦<128 then 'ascii


∴ Me is MemoPadMan.✌
∴ Me is All ®ight. ∵Me is 💯


🤡🥳👤®一同 boo boo voo boo booooooooooo.
0762プロマネ
垢版 |
2024/04/29(月) 14:22:42.15ID:V3l6c++H
if 0=🟦 ってけしからんコードだ
変数は左、定数は右、これが社会人の定式デス
∴ if 🟦 = 0 と記述しなさーーい
by 🤡プロマネの役

定数が左。変数は右。地球人にはアリエナイ
極一部の古代ギリシャ文字とかンゴ文字は知らんけど
定数が左。変数は右 代入演算子ではナイ と
地球人でも解る記述だ。モピロン、素晴らしい

by 👤ランベルト星人

🟦=0 でも 0=🟦でも、論理式なら
どっちも真偽値は同じ。
ポクはモピロン天才数学者より天才だ

by 🥳発達障害テスタ
0763JAVA星人現る
垢版 |
2024/04/29(月) 17:31:13.46ID:V3l6c++H
☕ポクはサンマイ🟤🟤システ🟤のジャバ星人だ。宜しくね。
>>757 のソースコードもどき。地球人らしいコードですね。

⭐=64*(🟦-192)+(🟫-128) ∧ ⭐=0を満たす整数解
1つでよいので、解いてみろーーー

by ☕ポクはJAVA星人

何か、宇宙人。自称だろうけど、沢山やってきた。
なんか、ヤバイ。地球が征服されちゃうの❓
はやく、宇宙人に征服してほしいです。地球のオトコに呆きたところよUFO

by 🥳

ピンクレディーのUFOのその歌詞は、
❌ 地球の男に飽きたところよ
⭕ 地球の男に呆きたところよ
なんちゃってーーーーーー

BY 🤡 今日はエイプリルフールぢゃなかった。失言しちゃった
0764ランベルト星人
垢版 |
2024/04/29(月) 17:38:44.32ID:V3l6c++H
👤 誰だ。ジャバ星人か何か知らんが、お前は絵文字一文字で☕
  でよい。www ゲラゲラ てかプロマネ、地球を防衛したなら
  プロマネが解けよ。てかオレは瞬時に解ったけど

🤡 プロマネってポクのことかな。地球人をバカにするなーー
  ていうか 
  ⭐=64*(🟦-192)+(🟫-128) ∧ ⭐=0を満たす整数解
 1つでよいなら厨房でも、解けるぜ、こらテスター解けよ
 オレッちの解っちゃった。1つなら楽勝
てか、🟦は192(0xC0)を代入して、あとは、匕・ミ・ッ
0765地球人ならバカテスターでも解けます
垢版 |
2024/04/29(月) 17:51:54.65ID:V3l6c++H
🥳 数学大好き。てかランベルト星人とかプロマネ
解けないからポクに聞いてるんだな。
無理しやがって、教えて、アゲルと、

数式 ⭐=64*(🟦-192)+(🟫-128) ───1⃣
1⃣の🟦に192を代入 ─── 2⃣
1⃣の⭐に0を代入とする。すると、
1⃣は、0=64✕(192-192)+(🟫-128) ───1⃣💨
1⃣💨をfor🟫やると、
🟫=128 ───3⃣
以上1⃣3⃣より、求めるべき整数解の一つは、
(🟦、🟫)=(192、128)
ヤッターー 解けたーーー\(^o^)/

👤 んで、それでどうしたのかな
☕ 地球人って・・・
👤 オレは地球人基準で数学パワーが∞
☕ そりゃ地球人が無限人でも宇宙人から見れば
  数学パワーはマイナス無限大だし当然だろ

🥳 よくわかんないけど、地球人を侵略してくれて
ホントうにありがとう
0766デフォルトの名無しさん
垢版 |
2024/04/29(月) 17:57:13.31ID:V3l6c++H
ランベルトは、
⭐=64*(🟦-192)+(🟫-128)=0 の解の一つ
(🟦、🟫)=(192、128)を解いたな

数式⭐が、ビット演算に変えても
(🟦、🟫)=(192、128)なら⭐はゼロになりそうだ

by 🤡地球人代表 自称プロマネ(の役)
0767ランベルト星人
垢版 |
2024/04/29(月) 19:42:39.90ID:V3l6c++H
elseif 🟦<224 then '2byte
  if 128≦🟫≦191 then
    ⭐=64*(🟦-192)+(🟫-128)
    UNICHAR(⭐)を表示
    n=n+2

で、当ロジックは🟦≧192のときに実行される。
故に実質

if 192≦🟦<224 then '2byte
  if 128≦🟫≦191 then
    ⭐=64*(🟦-192)+(🟫-128)
    UNICHAR(⭐)を表示
    n=n+2

と同じだ。さてと、一人でソースレビューするか
by 👤

地球人ぢゃナイオレも参加させろ。そのレビュー
by ☕ジャバ星人
0768デフォルトの名無しさん
垢版 |
2024/04/29(月) 19:43:33.42ID:VwlqwQ1k
CSVやTSVでセル内改行ができない問題は
行の区切りを改行文字ではなくRSやVTにすれば解決しそうだがその方法で問題あるだろうか
0769デフォルトの名無しさん
垢版 |
2024/04/30(火) 05:42:00.58ID:6q3HkpC/
そういえば、エクセルの、ある一つ、一つの、ひとつの、
セル内で文字列[xxxxyyyy]を改行は、
オペレーション的には
xxxx [ALT]+[改行] yyyy だったような。

地球の書によると、Lf(ASCIIコード10 スナワチ0x0a)だ。

CSVでセル内改行不能問題は、知らん。失礼m(_ _)m
ちな、ンゴ文字をセル内に入れる、文字の表示方向が
逆になったりする事が、よくある。

それは、バグでなく仕様の可能性、かと憶測する。
なお、数字を入れると、右詰めになり、
先頭が=だと関数とみなされることは、多い、

文字化けの要因のひとつ。該当セルを標準でなく文字列に
設定するのもひとつの手段、かな?。

試行錯誤して作成してる、😅
0770ランベルト星人とプロマネ
垢版 |
2024/04/30(火) 09:07:48.91ID:6q3HkpC/
👤 PRINTABLE:=C0=80 で👻と表示、ヤバ。バグなのか?
☕ ま、いいんぢゃなーーい
🤡 SONYさんのスマホのCNTACTS.VCFはヌル文字なんて入力不可
  また、半角数字は123なら =31=32=33 と出力だ
  2バイトには変換しないので、
  そんな不正なコードは出力しませんよーーー
  だから、ASCiiは、=C0=B8 なんて出力しません
☕  レビューやーめたーーーー
0771ランベルト星人の呟き
垢版 |
2024/04/30(火) 10:09:05.00ID:6q3HkpC/
ある文字が、UTF8で絶対に絶対に絶対に2BYTE文字の場合、
その下限てか上限は、=C2=80 だ
てか、UTF8で0xC280はなんて文字なんだろうか

🤡知らん。けど、変な文字だろ
電話帳にそんなコードは入力しないからどうでもよいので

🥳ポクのスマホの連絡帳てか電話帳の氏名に
絵文字入れても、バッチリ。ツールバッチリ
絵文字とASCII文字だけバッチリなら
他の文字は使用しないから、ツール問題なし
てか、絵文字以外かつASCii以外の文字の
入力を禁止しろーーーー
漢字は入力禁止

🤡ちゃんと日本語も難読もSONYさんのcontacts.vcfは
RCF2045守ってるのでバッチリ

👤てか、守らなくても、ワリとヘッチャラだよな

🥳絵文字バッチリだから、ヘッチャラ
0772デフォルトの名無しさん
垢版 |
2024/04/30(火) 10:23:58.61ID:6q3HkpC/
ランベルトとかいう、宇宙人の落ちこぼれが
UTF8 C280 つまりU+0080がどんな文字が
疑問に思ってるようだ。
どうやら、極めて怪しい制御コードのような
霊感を感じる。それのお絵描きしておく

BY ☕ジャバ星人でしたーーーー
0773デフォルトの名無しさん
垢版 |
2024/04/30(火) 10:39:20.69ID:6q3HkpC/
xxx ❓❓❓ PAD だろ xxxはとPADとは全く違う by 👤
xxxは未知だから、PADとかいのでもいいんぢゃない by 🤡
xとPは違う文字である。この2人目がヤバイ by 🥳
0774バカテスター
垢版 |
2024/04/30(火) 11:12:57.08ID:6q3HkpC/
🥳 それは、Padding Character というヤツ
モチロン、非表示の文字らしいです。
だから、Spaceで、表示すべきです。
xxx とか PAD と表示してるサイトが
多々見受けられる。バグですね。ーー

BY 🥳発達障害が更に悪化中
0775ランベルト星人等
垢版 |
2024/04/30(火) 11:20:15.08ID:6q3HkpC/
ちぇっ、👻表示させたかな。by 👤
そんな文字はスマホに入力できないので、
そんな文字をデコードしたのはcontacts.vcfに存在しないので
リリース済のは、修正しませーーーん by 🤡
え、リリース済❓👤
デヘヘ🤡
0776JAVA星人
垢版 |
2024/04/30(火) 15:27:13.93ID:6q3HkpC/
オレッちがソースレビューさせれば、以下のようにするのになあ

elseif 🟦<192then 'なんちゃってascii
  「👻」を表示
  n=n+1
elseif 🟦<224 then '2byte

は、
elseif 🟦<192then 'なんちゃってascii
  「👻」を表示
  n=n+1
elseif 🟦<194then 'なんちゃって2byte
  「👻」を表示
  n=n+1で容認、n=n+2が理想
elseif 🟦<224 then '2byte

by  ☕ポクはJAVA星人
0777ランベルト星人
垢版 |
2024/04/30(火) 15:35:57.73ID:6q3HkpC/
緊急PGメンテかよ。ま、
elseif 🟦<192then 'なんちゃってascii
  「👻」を表示
  n=n+1
elseif 🟦<224 then '2byte

は、
elseif 🟦<194then 'なんちゃってUTF8
  「👻」を表示
  n=n+1
elseif 🟦<224 then '2byte

で再リリースを検討する。ま、理想は☕星人の通りだが
インパクトがわからん。 
てかさ、なんちゃってUTF8なんてS⭕NYのCONTACTS.VCFに
出力はされないから、ね。

BY 👤

モピロン、再リリースは何時でもOK
BY 🤡

バグっていいぢゃーーん
BY 🥳

🤡 PGバグでも運用上はバグぢゃないもんねーーー
0778バカテスター
垢版 |
2024/04/30(火) 15:46:58.40ID:6q3HkpC/
>>777 の緊急PG修正ってコメント除けば
一文字修正するだけぢゃーーーん

❌ elseif 🟦<192then 'なんちゃってascii
⭕ elseif 🟦<194then 'なんちゃってUTF8

192を194にするだけ。1秒で修正するぢゃーーーん

プロマネとか自称宇宙人ってバカなの❓

BY 🥳超バカテスターに成りすましてみたー
0779ランベルト星人
垢版 |
2024/04/30(火) 16:26:39.63ID:6q3HkpC/
👤再リリース完了 🤡Good job ☕ま、やらかすと思ったわ 

👤UTF8では、最初の1バイト目が1100 が2byte なんて地球の書に釣られた
☕そっか、かつてのオレを思い出した
👤んー❓
☕2BYTE⇒1100 xxxx xxxx xxxx  は真か偽だな。
👤地球人には無理だろ。偏差値パワーが有限だからな地球人は
☕オレはかつて地球人だった。オマエも地球人に格下げ寸前だったな 

🤡C0 00 〜 C0 7F は、UTF8 ではなんちゃって2BYTEって 
地球の書に記載した方がいいか?

👤☕ それは正解だが、反例らしき忖度に満ちた地球の書に
記載しても、何だな。そもそも、地球人は🐴🦌だ。

🥳ちぇ、地球人をバカしたバッドエンディングなの❓
この文学作品したヒトってバカっかぢゃなーーーい

😅AUAUアウアウ
0780あっいけね
垢版 |
2024/04/30(火) 16:29:13.91ID:6q3HkpC/
>>779
❌C0 00 〜 C0 7F は、UTF8 ではなんちゃって2BYTE
⭕C0 00 〜 C2 7F は、UTF8 ではなんちゃって2BYTE
だった。他にもたくさん、ミスってそう。(⁠ ⁠・ั⁠﹏⁠・ั⁠)
0781編集後記
垢版 |
2024/04/30(火) 18:21:22.96ID:6q3HkpC/
👤プロマネよ。あのさ、ナンデ、UTF8文字列→UNICODE文字列 なんてプログラミングをオレにさせたんだ?
🤡それがさ、6年前の春は、その当時で古いスマホの電話帳
を、その当時で新しいスマホに、vcfファイル経由でコピーしたことに遡る。
👤6年前時点の古いスマホなら、android4.x新しいのなら、android8頃か
🤡んー、多分yes
🥳バージョンが古いから、vcfファイルも、モピロン、文字化けだよね。
🤡いや、vcfを当時のパソコンで開くとちゃんと氏名等の漢字は読める。平文だ
 その頃はwin8.1のヤツを使用してた。
👤vcfは漢字も平文で読めたのか
🤡yes その当時は。
👤でutf8→unicodeと関係あるんだ
🤡その当時は関係はなし、で、
 そして、機種変更した。2年前だ。
・・・・
👤vcfが2年前の機種のときに文字化けか
🤡文字化けと思ったが、デコードだな
1文字漢字がascii9文字に化学変化、後はわかるだろ

🥳グーグルので共有でいいぢゃーーーん。
 個人情報はグ⚪グルのサーバに保管だね

🤡でも、とにかくPRINTABLE: のをエンコツール自作に至ったわけ
0782デフォルトの名無しさん
垢版 |
2024/05/01(水) 00:33:47.56ID:T3vg4v9s
>>768
>CSVやTSVで、セル内改行ができない問題は

Ruby ではクォート文字で囲めば、
行区切り文字・列区切り文字・クォート文字も、データ内に入れられる

require 'csv'

input = <<"EOT"
"a""a","b,b",あ
"c
c","d\nd"
EOT

p input_ary = CSV.parse( input ) # 2次元配列
#=> [ ["a\"a", "b,b", "あ"], ["c\nc", "d\nd"] ]

# 2次元配列を、CSV 文字列に変換する
csv_str = input_ary.map( &:to_csv ).join
puts csv_str

"a""a","b,b",あ
"c
c","d
d"
0783デフォルトの名無しさん
垢版 |
2024/05/01(水) 05:45:14.27ID:ksHbXVNI
ん、微妙に話しズレるが、新たなるプロジェクト思いついた
・VBAでcontacts.csvをバイナリで読み込ませる
・CR LF などそれが2バイトでも全てLF1byteに変換する
・それをセルの んー例えばC3セルに表示
・C3セルの一つだけのセルに、contacts.vcfが表示される
・とにかく、vcfのエンコードツールをvbaで開発する
by 🤡

それより、プロマネ、プリンタかってーーー
ネットプリントめんどくせー
by 🥳👤

プロジェクトは延期ーー 🤡
0784ジャバ星人の呟き
垢版 |
2024/05/01(水) 20:43:19.84ID:ksHbXVNI

2BYTE⇒1100 xxxx xxxx xxxx の最小値って地球人よ知ってるか❓
16進で、xC000 だぜ。もし、xC280にしたいならさ、
それを簡易に表現できるパワーが必要だろ。
やたら、言い訳した内容を補足に入れてもよ。
そんなの、理解できねーーーってワケ

by ☕

でさ、なんで自称宇宙人のチミはジャバ星人って自称してるの
by 👤ランベルト星人

んーーー by☕

ま、ウスウス知ってるけど、JAVAってIBMが開発した言語❓
それとも ・・マイクロソフト ❓
BY 👤

マイクロソフトもIBMもライバルだ ぢゃーバイバイ
BY ☕
0785プロマネの呟き
垢版 |
2024/05/01(水) 21:00:20.23ID:ksHbXVNI
ジャバ星人(サンマイクロシステ⚪星人)と、ランベルト星人の
やり取り、意味深だな。
てかさ、ISO/IEC 10646 [ISO.10646] に
UTF8toUNICODE の極めて具体的なアルゴリズムが
英文で記載されてる。

モピロン、ランベルト星人やジャバ星人が開発したのは
その通りに作ってるハズだろ。

地球人の規格か概ね上位互換だ てかそれキニシナイ BY 👤
今の規格でも何か怪しい てかもぅゴリゴリだせを BY ☕

あのさ、ジャバ星人は地球からスピンアウトしたら BY 初登場のミラクル星人
0786ジャバ星人
垢版 |
2024/05/02(木) 14:20:08.07ID:cxxyFm3G
オラ、いや、ミラクル星人にはナイショだけどよ、
ランベルトとかいう宇宙人の、自称秘伝の数式
⭐=64*(🟦-192)+(🟫-128) ※UTF8で2byte専用
で⭐が127以下になる全ての🟦、🟫の非負整数解って
ま、地球人でも厨房程度の低知能で解けるだろ。

見え貼ってビット積とか使って規格書記載してるから
数式の連立方程式すら失念し、重複するだってワケ
地球人って、地球🌏の中ぢゃ、知能はマシだが、
この宇宙の中ぢゃ、もう恥ずかしくて、宇宙旅行なんて出来ないだろ
by ☕

てか、あの規格書、あれが21bitとか記載してるぞ、
20bit + 1文字だよな。地球人ってバカなのか? by 👤

いやいや、地球の数学では、
2^21 = 2^20 + 1なんぢゃねーーー ゲラゲラ by ☕

矛盾許容の数学を構築したランベルト星の数学ですら
アリエネー。てか、isoなんとかってジョークサイトだよな
by 👤

ゲラゲラゲラゲラゲラゲラ論理積以前だろスピンアウト正解 by ☕
0787正常ぽぃ地球人とランベルト星人but自作自演
垢版 |
2024/05/03(金) 06:35:56.34ID:00No5FFk
>>783 でさ、
🤡
> CR LF などが2バイトも全てLF1byteに変換
の記述って、🦩ダチョウ (無駄に長いの意)な表現だよな

👤地球人は知能はバカの一つ覚え。無限個ある欠陥だらけの
文章の、2、3点を修正して、今度は完璧だなんて思い込む

🤡てか、「あのCrLfをLfにする」の何処がダチョウな表現なんだ❓
👤正解は「Crを無視する」だろ
🤡オマエも地球人並みの知能だな。無限大の知能ってウソぢゃーーん
👤そもそも、Cr単独で改行なんてのは、アリエナイ前提だ
 モチロン、Lf単独で改行は、Unixとか比較的近年UTF8で
 地球で、主流だろ
🤡んー❓ 厳密すればするぼど、やはりダチョウ🦩になる
👤ところで、ゲーデルの不完全性定理ってどう思う
🤡あの辺りは数学ではナゾの密林だ。てか
 証明できん事を証明しましたーーー。をアリガタッてるのか
👤知らんが、あの規格書も、6〜7年前から更新ストップだろ
🤡更新すればする程、矛盾にみちた内容になってるかも
👤もはや、矛盾してるかすら解かんないとちゃう?
🤡ノーコメントとする。てかランベルトよ、
「Crを無視する」というロジックは、1行目で真かつ
k行目で真と仮定してk+1行目が真を証明が必要だ
👤てかよ、kは整数かつ1以上が必要だろ
🤡どちらかというと十分で微かにダチョウだよ
👤んーー、kは整数かつ2以上が必要 といえば十分か
🤡話しが長いな。てかゲーデル不完全性定理と関係ありそ
👤それ以前に我が星、ランベルト星の数学・論理学は矛盾許容だ
🤡それ、完全性定理ぢゃねーーー?
👤どっちでもok ∵矛盾許容
🥳ポクも宇宙人に産まれ変わりたいデーース
0788デフォルトの名無しさん
垢版 |
2024/05/04(土) 01:03:55.27ID:Lsoig7U/
VTも使うTSV形式はこんな感じか。
行末のCRLFは無くても問題ないが
あった方がテキストエディタで開いた時に見やすくなる
セルA1␉セルB1␉セルC1␋␍␊
セルA2␉セルB2␉セルC2␋␍␊

ASCIIが想定していたUSやRSの使い方はこんな所だろうか
セルA1␟セルB1␟セルC1␞␍␊
セルA2␟セルB2␟セルC2␞␍␊
0789デフォルトの名無しさん
垢版 |
2024/05/04(土) 08:00:55.56ID:XF0U8juk
🥳 てかプロマネさ、エクセルに
CSVの文章貼り付けるときどうしてる?

🤡 んー「,」の半角は
  tab に置換えてから、コピペ

🥳 「123,ABC」を「123tabABC」
てやって、A1セルに貼付けても
A1セルに「123tabABC」って表示されたよ
ウッソ付きーーーー!

👤 地球人って・・・
🤡 地球人でも、かなり、・・・・
👤 こんな文章を、書き込む奴も・・・・なのか?
🤡 ノーコメントとする。
0791デフォルトの名無しさん
垢版 |
2024/05/04(土) 16:13:25.74ID:Lsoig7U/
セルの列やセルの行を区切るのに制御文字を使えれば
セル内に,や”を入れたり改行することもできるんだよね
0792単なる呟き
垢版 |
2024/05/04(土) 18:46:03.94ID:XF0U8juk
🤡 多分、タブの制御コードは、␉ って感じだ
🥳 タブはHTなの?、ポクは英語バッチリ [Tab]ぢゃーーーん
  キーボードにHTなんてマークのキーは見つからん
👤 キーボードの[Tab]にマジックでHTって記入しちゃえー!
0793デフォルトの名無しさん
垢版 |
2024/05/05(日) 00:28:15.77ID:DTqCPhPD
垂直タブはキャレット記法で^Kだけど
PC-98のDOSで↑キーを押すと^Kが入力されたのを思い出した
他には→キーを押すと^Lが入力されたと思う
0794デフォルトの名無しさん
垢版 |
2024/05/05(日) 14:18:12.85ID:ufyV/oQQ
>>787 の自称宇宙人の👤が
「Cr単独で改行アリエナイ∴Cr無視」とか言ってますが
ヘンですね。
というか、'xxxxx␍yyyyy'は、ポクの
メモ帳で開いたら
xxxxx
yyyyy
でちゃんと改行されて表示ですよ。
改行がCr単独なんてアリエナイ なんて
勝手な前提しちゃいけません。レッテル論法禁止🚫🈲🙅

by 🤡

👤 give up てか今日はバィバィ。さよならーーー
0795デフォルトの名無しさん
垢版 |
2024/05/05(日) 20:09:04.88ID:DTqCPhPD
GUIでCR,LF,HT,BS,DEL以外の制御文字を
ソースコードなどに手動で入力して使う事がほとんど無いのは
キーボードに専用のキーが無いからなのかね?
CUIではCtrlとアルファベットキーの組み合わせで入力できたけど
GUIではショートカットキーとして使われていて制御文字は入力できないし
C1制御文字に至ってはさらに馴染みがない。
制御文字をもっと活用すればエスケープ文字が図形文字のために
その文字を表示するために特別な入力をする必要も無くなるのに。
レスを投稿する


ニューススポーツなんでも実況