Windows NTは初代からUnicodeがネイティブの文字コードです。cp932ではありません。
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。
■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
文字コード総合スレ Part10 http://mevius.2ch.net/test/read.cgi/tech/1444822140/
文字コード総合スレ Part11 https://mevius.5ch.net/test/read.cgi/tech/1516629503/
探検
文字コード総合スレ Part12
レス数が1000を超えています。これ以上書き込みはできません。
2018/12/16(日) 12:38:15.61ID:VlX3xGEw
2018/12/16(日) 12:40:36.99ID:VlX3xGEw
■参考サイト
Unicode Home Page
http://www.unicode.org/
Java Character Encodings
http://www.ingrid.org/java/i18n/encoding/
euc.JP: tech docs, BeOS tools
http://euc.jp/
IANA: Character Sets
http://www.iana.org/assignments/character-sets
Legacy Encoding Project
http://sourceforge.jp/projects/legacy-encoding/
JIS X 4061
日本語文字列照合順番
http://www.jisc.go.jp/
Unicode Home Page
http://www.unicode.org/
Java Character Encodings
http://www.ingrid.org/java/i18n/encoding/
euc.JP: tech docs, BeOS tools
http://euc.jp/
IANA: Character Sets
http://www.iana.org/assignments/character-sets
Legacy Encoding Project
http://sourceforge.jp/projects/legacy-encoding/
JIS X 4061
日本語文字列照合順番
http://www.jisc.go.jp/
2018/12/16(日) 12:45:08.07ID:VlX3xGEw
■これまでに行われた議論
・Windows 10のコマンドプロンプトでUTF-8を使用する場合chcp 65001で切替可能。日本語入力等も可
・Shift JIS や EUC-JP や Big5 や GB なんかをUnicode に変換してしまうと、ラウンドトリップは保証されるか
・単一情報をソースの文字コード(or 言語)情報なしに元に戻したい (統計的に文字の出現確率なんかを調べる)
・0x5cをUnicodeにするときにバックスラッシュに置き換えるか円マークに置き換えるかで、逆変換時に結果が変わるの問題
・丸付き数字は機種依存文字か?。Unicodeでは機種依存文字ではない。
・Safari文字コード変換のバグは
・Microsoft文字コード変換のバグは
・U+31F0..U+31FF(アイヌ語表記用小書きカタカナ)が入ってない件
・文字化けに強いishフォーマットでエロ画像を交換する場合、ssより、s7のほうが化けにくい
・SJISとUNICODEの判別はどのようにすればいいですか?BOM。無ければ、統計判断。 ライブラリを使うが吉
・ところでケータイのUnicode対応度って実際どうよ? → 対応済み
・TwitterのWebインターフェイスからだと、サロゲートペアは2文字としてカウント。140字打てない 。
・Unicode 5.2で追加されたUnicodeSMP(第1面)、Unicode 5.1で未定義だったSMPのコードポイントや第15、第16面が
Windows7では表示されない。 → 和田研細丸ゴシック2004ARIBはARIB外字を含んでいる。
・元号を安置する場所はJIS第三で確保済み。ウニコードでブロックを確保は政治力次第。
・元号は個人名ではない。特定の時間軸基準に数える年号を漢字で指す文字。
陛下の崩御後必ずしも元号が追号になるわけではない。むしろ違う場合が多い。昭和54年法律43号の元号法参照。
・文末でなければ"0"+ASCII7ビット、文末なら"1"+ASCII7ビットというエンコード。 → ヌル1バイトが貴重な時代からの負の遺産。
・Windows7出荷時に未定義だったコードポイントはフォント入れても豆腐になる。Unicode5.2は表示しない。欝だ。
・Unicode6ドラフトでPILE_OF_POO文字確定。ウニコードがもはやイミフ。SerifとSans-Serifで幅に違いは出る?
・Unicodeのzipが文字化けする。→Windows 7は公式パッチで対応可能。8以降は標準対応
・Windows 10のコマンドプロンプトでUTF-8を使用する場合chcp 65001で切替可能。日本語入力等も可
・Shift JIS や EUC-JP や Big5 や GB なんかをUnicode に変換してしまうと、ラウンドトリップは保証されるか
・単一情報をソースの文字コード(or 言語)情報なしに元に戻したい (統計的に文字の出現確率なんかを調べる)
・0x5cをUnicodeにするときにバックスラッシュに置き換えるか円マークに置き換えるかで、逆変換時に結果が変わるの問題
・丸付き数字は機種依存文字か?。Unicodeでは機種依存文字ではない。
・Safari文字コード変換のバグは
・Microsoft文字コード変換のバグは
・U+31F0..U+31FF(アイヌ語表記用小書きカタカナ)が入ってない件
・文字化けに強いishフォーマットでエロ画像を交換する場合、ssより、s7のほうが化けにくい
・SJISとUNICODEの判別はどのようにすればいいですか?BOM。無ければ、統計判断。 ライブラリを使うが吉
・ところでケータイのUnicode対応度って実際どうよ? → 対応済み
・TwitterのWebインターフェイスからだと、サロゲートペアは2文字としてカウント。140字打てない 。
・Unicode 5.2で追加されたUnicodeSMP(第1面)、Unicode 5.1で未定義だったSMPのコードポイントや第15、第16面が
Windows7では表示されない。 → 和田研細丸ゴシック2004ARIBはARIB外字を含んでいる。
・元号を安置する場所はJIS第三で確保済み。ウニコードでブロックを確保は政治力次第。
・元号は個人名ではない。特定の時間軸基準に数える年号を漢字で指す文字。
陛下の崩御後必ずしも元号が追号になるわけではない。むしろ違う場合が多い。昭和54年法律43号の元号法参照。
・文末でなければ"0"+ASCII7ビット、文末なら"1"+ASCII7ビットというエンコード。 → ヌル1バイトが貴重な時代からの負の遺産。
・Windows7出荷時に未定義だったコードポイントはフォント入れても豆腐になる。Unicode5.2は表示しない。欝だ。
・Unicode6ドラフトでPILE_OF_POO文字確定。ウニコードがもはやイミフ。SerifとSans-Serifで幅に違いは出る?
・Unicodeのzipが文字化けする。→Windows 7は公式パッチで対応可能。8以降は標準対応
2018/12/16(日) 12:46:00.56ID:VlX3xGEw
・中国語の簡体字では、へんやつくりが簡略化されるなら、その文字も自動的に簡略化して表記する国家規格が有る
・中国語の「噁心」簡化政策によると「恶(U+6076)」に統一。口偏+恶(U+6076)は普通に使われているがUnicodeにはない
・日本人のニーズが満たせないのも確かなので原規格分離(中国では「曾→曽」は簡体字と繁体字の違いとはみなされていないとか)
・UNICODEを扱うプログラムはサロゲートをぶったぎられた入力が渡されてくる場合にも備えろって→YES
・UnicodeとUTF-8の違いは?
・日本のCJK Ext.D Submissionに{魚針}が含まれてる件
U+9C75(魚箴)は強烈。いくら何でも違いすぎる。(魚針)
ひょっとしたら後で実は別字だったとか日本では異体字だが中国では別字とかになるかも知れんぞ。
中国ではってレベルじゃねーぞ。
・Unicodeは言語情報を直接扱わない。 多言語の混在表現は(unicodeでは)できないか
・Unicode文字列リストを各国言語を考慮してソートしたいんですが → ムリです。
・Unicodeサニタイズが面倒になるのか
・中国語の「噁心」簡化政策によると「恶(U+6076)」に統一。口偏+恶(U+6076)は普通に使われているがUnicodeにはない
・日本人のニーズが満たせないのも確かなので原規格分離(中国では「曾→曽」は簡体字と繁体字の違いとはみなされていないとか)
・UNICODEを扱うプログラムはサロゲートをぶったぎられた入力が渡されてくる場合にも備えろって→YES
・UnicodeとUTF-8の違いは?
・日本のCJK Ext.D Submissionに{魚針}が含まれてる件
U+9C75(魚箴)は強烈。いくら何でも違いすぎる。(魚針)
ひょっとしたら後で実は別字だったとか日本では異体字だが中国では別字とかになるかも知れんぞ。
中国ではってレベルじゃねーぞ。
・Unicodeは言語情報を直接扱わない。 多言語の混在表現は(unicodeでは)できないか
・Unicode文字列リストを各国言語を考慮してソートしたいんですが → ムリです。
・Unicodeサニタイズが面倒になるのか
2018/12/16(日) 12:46:16.07ID:VlX3xGEw
もうひとつの過去スレ:
文字コード統一スレ 1文字目
http://pc8.2ch.net/test/read.cgi/tech/1109171258/
隔離スレ:
UnicodeとUTF-8の違いは?
http://pc12.2ch.net/test/read.cgi/tech/1177930957/
UnicodeとUTF-8の違いは? その2
http://hibari.2ch.net/test/read.cgi/tech/1274937437/
UnicodeとUTF-8の違いは? その2
http://toro.2ch.net/test/read.cgi/tech/1291075205/
UnicodeとUTF-8の違い4(インディアン隔離スレ)
http://toro.2ch.net/test/read.cgi/tech/1342963035/
文字コード統一スレ 1文字目
http://pc8.2ch.net/test/read.cgi/tech/1109171258/
隔離スレ:
UnicodeとUTF-8の違いは?
http://pc12.2ch.net/test/read.cgi/tech/1177930957/
UnicodeとUTF-8の違いは? その2
http://hibari.2ch.net/test/read.cgi/tech/1274937437/
UnicodeとUTF-8の違いは? その2
http://toro.2ch.net/test/read.cgi/tech/1291075205/
UnicodeとUTF-8の違い4(インディアン隔離スレ)
http://toro.2ch.net/test/read.cgi/tech/1342963035/
2018/12/16(日) 12:48:18.57ID:VlX3xGEw
■ライブラリ
ICU - International Components for Unicode
http://site.icu-project.org/home
mlang
http://msdn.microsoft.com/ja-jp/library/aa767865(en-us).aspx
iconv
http://www.gnu.org/software/libiconv/
ICU
http://www.icu-project.org/
NKF32.DLL (非推奨)
http://www.vector.co.jp/soft/win95/util/se020949.html
ICU - International Components for Unicode
http://site.icu-project.org/home
mlang
http://msdn.microsoft.com/ja-jp/library/aa767865(en-us).aspx
iconv
http://www.gnu.org/software/libiconv/
ICU
http://www.icu-project.org/
NKF32.DLL (非推奨)
http://www.vector.co.jp/soft/win95/util/se020949.html
2018/12/16(日) 12:49:13.25ID:VlX3xGEw
■単語一覧
・UTF-16は16ビット単位にエンコードするけど、サロゲートペアがある
表現できる文字空間はUTF-8と同じく20ビットとちょっと
・丸付き数字は機種依存文字か?MSIME2007ではCP932に収録されてない文字は「環境依存文字」って表示。
MacJapaneseではフォントによっては表示されないし、フォントによっては表示される。
今のMac(内部Unicodeアプリ)は、フォント依存ではなくアプリ依存。
似非ISO-2022-JPや似非Shift_JISのドキュメント中の丸付き数字は、
素直にAppleのAPIを使ってるアプリならゲタ(U+FFFD)になる。
・Mail.appではISO-2022-JPに収まらずCP932に収まるメールは、含まれる字種によって
charset=CP932で送信される場合とISO-2022-JP(もどき)で送信される場合がある
・MSでのウニコードとSJIS変換のバグ。
U+007E TILDE <-> Shift_JIS 0x7E OVERLINE
U+301C WAVE DASH -> Shift_JIS NA 【MSの問題】
U+FF5E FULLWIDTH TILDE <-> Shift_JIS 0x8160 WAVE DASH 【MSの問題】
・SafariでのウニコードとSJIS変換のバグ。
U+007E TILDE -> Shift_JIS 0x8160 WAVE DASH 【Safariの問題】
U+301C WAVE DASH <-> Shift_JIS 0x8160 WAVE DASH
U+FF5E FULLWIDTH TILDE <-> Shift_JIS NA
・winzipの規格ではファイル名のコードページ指定もしくは記録情報が存在しない。
解決策:取り合えず、MSWin+JPではShift-jisでファイル自体には保存されている。
MACOSX=Unicode,Unix=UTF/EUC/S-JISどれでもありえる。文字に関係なくLocalLangで
再変換しているので、それをしなければよい。
・charlenでの文字列長の判定はプラットフォームにより返り値が違う(機種依存文字等)。マニュアル嫁。
・JISのエスケープシーケンスが正しく認識されない本文とか。
'0x1b, 0x24, 0x42' という3バイトを先頭に、'0x1b, 0x28, 0x42' を末尾に追加汁。
あるいはhttp://masaka.dw.land.to/mr/jmr.phpとか。
・UTF-16は16ビット単位にエンコードするけど、サロゲートペアがある
表現できる文字空間はUTF-8と同じく20ビットとちょっと
・丸付き数字は機種依存文字か?MSIME2007ではCP932に収録されてない文字は「環境依存文字」って表示。
MacJapaneseではフォントによっては表示されないし、フォントによっては表示される。
今のMac(内部Unicodeアプリ)は、フォント依存ではなくアプリ依存。
似非ISO-2022-JPや似非Shift_JISのドキュメント中の丸付き数字は、
素直にAppleのAPIを使ってるアプリならゲタ(U+FFFD)になる。
・Mail.appではISO-2022-JPに収まらずCP932に収まるメールは、含まれる字種によって
charset=CP932で送信される場合とISO-2022-JP(もどき)で送信される場合がある
・MSでのウニコードとSJIS変換のバグ。
U+007E TILDE <-> Shift_JIS 0x7E OVERLINE
U+301C WAVE DASH -> Shift_JIS NA 【MSの問題】
U+FF5E FULLWIDTH TILDE <-> Shift_JIS 0x8160 WAVE DASH 【MSの問題】
・SafariでのウニコードとSJIS変換のバグ。
U+007E TILDE -> Shift_JIS 0x8160 WAVE DASH 【Safariの問題】
U+301C WAVE DASH <-> Shift_JIS 0x8160 WAVE DASH
U+FF5E FULLWIDTH TILDE <-> Shift_JIS NA
・winzipの規格ではファイル名のコードページ指定もしくは記録情報が存在しない。
解決策:取り合えず、MSWin+JPではShift-jisでファイル自体には保存されている。
MACOSX=Unicode,Unix=UTF/EUC/S-JISどれでもありえる。文字に関係なくLocalLangで
再変換しているので、それをしなければよい。
・charlenでの文字列長の判定はプラットフォームにより返り値が違う(機種依存文字等)。マニュアル嫁。
・JISのエスケープシーケンスが正しく認識されない本文とか。
'0x1b, 0x24, 0x42' という3バイトを先頭に、'0x1b, 0x28, 0x42' を末尾に追加汁。
あるいはhttp://masaka.dw.land.to/mr/jmr.phpとか。
2018/12/16(日) 17:19:29.50ID:0LUE4AGb
oo|o|o|||o|o|o|o|||ooo|oo|o|ooooo||o||o|oooo|||o||||o|oo|o|||o|o|o|o|o|oo
ooo||o|o|||||||o|o||oo|ooo||ooo|o||oooo|oo|o||oo|||ooo||||oo||ooooo||oo||
oo||ooo|o||o||ooooo|oo|oo|o|o|||o|||||o|o|oo||oo|ooo||o||||o|o||o||o|oooo
ooo|||||o|oo|||ooo|o|oo|||||ooooooooooo|||ooo|||o||||oo|oo|||ooo|o||oo|||
ooooo|ooo||o|oo|||oooo|oo|||||ooooo||o|||oo|||o|o|o|o||||o|||||oo|oo|oo|o
||o|oo||oooooo||o|oo||o|||ooo||oo||oo||ooo|o|o|oo|||||o|o|o|||oooooo|o|||
||o||||o|oo|||o||oo||ooo|ooo|oo|||oo|o|||o|||oo|oo|oo|o|||||oooo||ooooooo
oo|oo|||||oo|||||o|oo|o||oo|||o|ooo||o|oo|||o||ooooooooo|ooooo|o|||o||o||
o|oo|o||o|oo|oo|oo|o|o|o|oo|o||||oo|oo||ooo|ooooo||||o|oo|oo|||o|||oo||||
|o||||o|||oo|o||o||oo||oooo|oo|o||oooo|oo|||||||oo|o|o|ooo|oooo||||ooo|oo
ooooo|||oo||oo|o||o|ooooooo||||||o|o||o|o|ooo||oo||o||oooo||oo|oo|||o||||
|o|||oo||o||o|o|||o||oooo|oo|||o||oo|ooooo|o|||o|||oo|ooo|ooo|||oo||oo|oo
||ooo|||ooo|||o|ooooo||||oo|||||oo||ooo|o||o||ooo|oo||oo|oo|||o|o|o|oooo|
|||oo|o||o||o|ooooooooo|o|o|||||oo|o||ooo|o||o|oo||||oo|o||o||o|ooo|||ooo
oooo|||ooooo||o||oo|ooo|||||o|oo|||o||o||ooo|ooo||oo||oo||o||o|oo|o|oo|||
oooooo||||oo|o||oo|||o|ooooo||ooo||||||oooo|||||oo||||ooo|||o|o|o|o||oooo
o|o|o|oo|o|oooo|o|ooo||oo|oo||||||||ooo|o||o||oo||o|||ooo|o||oo||oo||oo|o
oo||||oooooo|o||o|o|oooo||o|||oo|ooo|o|o|o|ooo||o|o|oo|o|||o|o|o|||o||o||
oo|oooo|oo|o|oo||||oo|||o||o|o||o||o|oooo|o||||o|o||o|ooooo||ooo||||||ooo
oo||o|oo||||oo|||||||||ooo|oo|||oo||oooo||o|o|o||||ooooooooo|oo|||oo|oo|o
o|o|||||o|o|||oo|oo|o|||o|o|||oo|oo||ooo|oo|oo||oooo||||o||||ooooooo||ooo
o|||||oo|o|||oo|ooooo|ooooo||o||oo||ooo||||oo|oooo||||oo|oooo||oo|o||||||
|oo|oo|||||oooooo||||ooo|||||ooo|oo|o|||oo|o|o|||o||ooo||ooo|o|oo|||o|ooo
ooooo|o|oo||o||||oo||oo|o|ooo||o|o|o|||ooo||||||o||oo|ooo||o|o||oo|o||ooo
|oo|ooooo||o||o|o|oo|oo|||ooo||||o|oo|oo|o||||o|oo|||o||o|||||ooooo|o|ooo
|o||ooooooo|||oo|ooo|ooo||||ooo||oo||ooo|||||||ooo|o|ooooo|||||o|o|o|||o|
ooo||o|o|||||||o|o||oo|ooo||ooo|o||oooo|oo|o||oo|||ooo||||oo||ooooo||oo||
oo||ooo|o||o||ooooo|oo|oo|o|o|||o|||||o|o|oo||oo|ooo||o||||o|o||o||o|oooo
ooo|||||o|oo|||ooo|o|oo|||||ooooooooooo|||ooo|||o||||oo|oo|||ooo|o||oo|||
ooooo|ooo||o|oo|||oooo|oo|||||ooooo||o|||oo|||o|o|o|o||||o|||||oo|oo|oo|o
||o|oo||oooooo||o|oo||o|||ooo||oo||oo||ooo|o|o|oo|||||o|o|o|||oooooo|o|||
||o||||o|oo|||o||oo||ooo|ooo|oo|||oo|o|||o|||oo|oo|oo|o|||||oooo||ooooooo
oo|oo|||||oo|||||o|oo|o||oo|||o|ooo||o|oo|||o||ooooooooo|ooooo|o|||o||o||
o|oo|o||o|oo|oo|oo|o|o|o|oo|o||||oo|oo||ooo|ooooo||||o|oo|oo|||o|||oo||||
|o||||o|||oo|o||o||oo||oooo|oo|o||oooo|oo|||||||oo|o|o|ooo|oooo||||ooo|oo
ooooo|||oo||oo|o||o|ooooooo||||||o|o||o|o|ooo||oo||o||oooo||oo|oo|||o||||
|o|||oo||o||o|o|||o||oooo|oo|||o||oo|ooooo|o|||o|||oo|ooo|ooo|||oo||oo|oo
||ooo|||ooo|||o|ooooo||||oo|||||oo||ooo|o||o||ooo|oo||oo|oo|||o|o|o|oooo|
|||oo|o||o||o|ooooooooo|o|o|||||oo|o||ooo|o||o|oo||||oo|o||o||o|ooo|||ooo
oooo|||ooooo||o||oo|ooo|||||o|oo|||o||o||ooo|ooo||oo||oo||o||o|oo|o|oo|||
oooooo||||oo|o||oo|||o|ooooo||ooo||||||oooo|||||oo||||ooo|||o|o|o|o||oooo
o|o|o|oo|o|oooo|o|ooo||oo|oo||||||||ooo|o||o||oo||o|||ooo|o||oo||oo||oo|o
oo||||oooooo|o||o|o|oooo||o|||oo|ooo|o|o|o|ooo||o|o|oo|o|||o|o|o|||o||o||
oo|oooo|oo|o|oo||||oo|||o||o|o||o||o|oooo|o||||o|o||o|ooooo||ooo||||||ooo
oo||o|oo||||oo|||||||||ooo|oo|||oo||oooo||o|o|o||||ooooooooo|oo|||oo|oo|o
o|o|||||o|o|||oo|oo|o|||o|o|||oo|oo||ooo|oo|oo||oooo||||o||||ooooooo||ooo
o|||||oo|o|||oo|ooooo|ooooo||o||oo||ooo||||oo|oooo||||oo|oooo||oo|o||||||
|oo|oo|||||oooooo||||ooo|||||ooo|oo|o|||oo|o|o|||o||ooo||ooo|o|oo|||o|ooo
ooooo|o|oo||o||||oo||oo|o|ooo||o|o|o|||ooo||||||o||oo|ooo||o|o||oo|o||ooo
|oo|ooooo||o||o|o|oo|oo|||ooo||||o|oo|oo|o||||o|oo|||o||o|||||ooooo|o|ooo
|o||ooooooo|||oo|ooo|ooo||||ooo||oo||ooo|||||||ooo|o|ooooo|||||o|o|o|||o|
2018/12/16(日) 21:10:16.93ID:3q5iKhWM
こんなスレあったんだ
Windowsのフォントって、どのフォントがどのコード体系とか字体を使っている。
などを纏めているところってある??
Windowsのフォントって、どのフォントがどのコード体系とか字体を使っている。
などを纏めているところってある??
2018/12/16(日) 23:11:32.43ID:/e3hQGaS
ちょっと考えれば分かるようなことをなぜ聞くんだろう。
2018/12/17(月) 20:40:27.55ID:kiEfSjeK
ちょっと考えれば解るなんてすごい人だな。
ちょっと書いてみ
ちょっと書いてみ
12デフォルトの名無しさん
2018/12/17(月) 21:18:18.25ID:lO+98ZHR あげ
13デフォルトの名無しさん
2018/12/18(火) 03:08:10.44ID:81OlOyOQ nkf - Network Kanji Filter Fork
https://ja.osdn.net/projects/nkf/scm/git/nkf/
v2.1.5
2018-12-15 18:19:02
https://ja.osdn.net/projects/nkf/scm/git/nkf/
v2.1.5
2018-12-15 18:19:02
14デフォルトの名無しさん
2018/12/18(火) 11:22:36.98ID:/M0/bFGF >やはり頭悪いのはunicodeと符号化を混同してる
ここは同意
>2つ以上のオクテットを使う符号単位で
>BOM入れないヤツは池沼だからな
これは嘘
ここは同意
>2つ以上のオクテットを使う符号単位で
>BOM入れないヤツは池沼だからな
これは嘘
15デフォルトの名無しさん
2018/12/19(水) 00:20:13.76ID:jOXn0Ht9 低学歴知恵遅れには
エンディアンの概念がないのが
よおく分かったわ
エンディアンの概念がないのが
よおく分かったわ
2018/12/19(水) 00:28:37.33ID:t+yG2AJO
CPUの内部形式とデータには何の関係もない
現にネットワークデータはCPUとは無関係の並びになってる
現にネットワークデータはCPUとは無関係の並びになってる
2018/12/19(水) 00:54:40.89ID:s0UhV0Jg
やっぱあれ書いたの半角さんだったんだw
18デフォルトの名無しさん
2018/12/19(水) 00:57:03.62ID:jOXn0Ht9 うわあ。。。
マジでいってんの
こういうマジもんの低学歴がこの板で
はば利かせてるのがよく分かるわ
マジで頭悪いことを
ハジもなくなんの躊躇もなくいうからな
プログラムで
いちいエンディアン変換してんのすら
しらないらしいわ
当然Unicodeのエンコード方法にも
ビッグエディアンとリトルエンディアンがある
マジでいってんの
こういうマジもんの低学歴がこの板で
はば利かせてるのがよく分かるわ
マジで頭悪いことを
ハジもなくなんの躊躇もなくいうからな
プログラムで
いちいエンディアン変換してんのすら
しらないらしいわ
当然Unicodeのエンコード方法にも
ビッグエディアンとリトルエンディアンがある
19デフォルトの名無しさん
2018/12/19(水) 00:58:18.75ID:jOXn0Ht9 もうね低学歴すぎてヤバイって
ちなみネットワークでデータを交換するときは
暗黙で基本はビッグエンディアンになってる
常識だからなコレ
ちなみネットワークでデータを交換するときは
暗黙で基本はビッグエンディアンになってる
常識だからなコレ
20デフォルトの名無しさん
2018/12/19(水) 01:00:17.18ID:jOXn0Ht9 低学歴知恵遅れって
なんでものすごい頭悪いことを
自信満々にいうわけ?
なんでものすごい頭悪いことを
自信満々にいうわけ?
21デフォルトの名無しさん
2018/12/19(水) 01:12:57.34ID:jOXn0Ht9 ちなみipアドレスの並びはビックエンディアンになってる
ポート番号も当然ビックエンディアンになってる
ソケット通信のプログラム組んだことあるなら
ポート番号設定するのにhtons(コレはオクテット2つになる)という関数を使ったことあるハズだ
ちなみにこの関数はリトルエンディアンの計算機なら
ビッグエンディアンに変換された値がかえってくる
ビッグエンディアンの計算機なら
そのままビッグエンディアンの値がかえってくる
ポート番号も当然ビックエンディアンになってる
ソケット通信のプログラム組んだことあるなら
ポート番号設定するのにhtons(コレはオクテット2つになる)という関数を使ったことあるハズだ
ちなみにこの関数はリトルエンディアンの計算機なら
ビッグエンディアンに変換された値がかえってくる
ビッグエンディアンの計算機なら
そのままビッグエンディアンの値がかえってくる
2018/12/19(水) 01:39:07.45ID:B2A2n/bL
半角カタカナはAAにしか見えない
2018/12/19(水) 06:24:21.16ID:wJcYDzdz
最近の子はバイトオーダーなんて意識しないからな
常識としては知っててほしいがけど
低レベルな処理書かなきゃ関係ないし触れることもないだろうから知らなくても困らんな
アラインメントとかパディングとかも同様
常識としては知っててほしいがけど
低レベルな処理書かなきゃ関係ないし触れることもないだろうから知らなくても困らんな
アラインメントとかパディングとかも同様
2018/12/19(水) 12:49:47.13ID:JIdS0sYR
エンディアン嘘つかない
25デフォルトの名無しさん
2018/12/19(水) 16:46:27.07ID:R6d6JT/9 >>23
バイトオーダーを意識する機会が減ったのは、xmlやjsonなどテキスト形式でデータ受け渡しすることが多くなったから。
テキスト形式ならバイトオーダーを意識せずに済むし、スクリプト言語で扱うのにも便利。
バイトオーダーを意識する機会が減ったのは、xmlやjsonなどテキスト形式でデータ受け渡しすることが多くなったから。
テキスト形式ならバイトオーダーを意識せずに済むし、スクリプト言語で扱うのにも便利。
2018/12/19(水) 20:30:33.10ID:gznchIbF
いやいや、テキストでもUTF16とかUTF32ならめっちゃ意識するやん。
>>24
豆知識、endian とは?
もともとは、卵を丸い方の端 (big end) から割る人々(Big Endians)と尖った方の端から割る人々 (Little Endians) との対立を表したものだった
豆知識、endian とは?
もともとは、卵を丸い方の端 (big end) から割る人々(Big Endians)と尖った方の端から割る人々 (Little Endians) との対立を表したものだった
2018/12/20(木) 01:35:41.75ID:jYg2YnYV
そういえばハンプティダンプティの絵文字がない
2018/12/20(木) 03:36:13.08ID:Epiz8Tj2
バイトオーダーやアラインメントは、C/C++以外の言語でバイナリデータを使おうとした時に強く意識することになる。
C/C++で開発している時はコンパイラが自動的に配置・取得してくれるデータを、スクリプト言語では自力でオフセット調整して配置・取得しなければならない。
C/C++より簡単なことが長所だったはずのC#・Java・Perl・Python言語などで、低レベルなオフセット調節を自力で行う必要に迫られる皮肉な状況が起きる。
C/C++で開発している時はコンパイラが自動的に配置・取得してくれるデータを、スクリプト言語では自力でオフセット調整して配置・取得しなければならない。
C/C++より簡単なことが長所だったはずのC#・Java・Perl・Python言語などで、低レベルなオフセット調節を自力で行う必要に迫られる皮肉な状況が起きる。
2018/12/20(木) 04:20:27.30ID:ojhJ7lIE
> バイトオーダーやアラインメントは、C/C++以外の言語でバイナリデータを使おうとした時に強く意識することになる。
C/C++言語以外ではライブラリが処理してしまうんで意識しないかな
C/C++ライブラリを呼び出すライブラリを作るときは意識するだろうけど、
それって結局C/C++言語で書くんで、あれ?意識するのはC/C++かw
C/C++言語以外ではライブラリが処理してしまうんで意識しないかな
C/C++ライブラリを呼び出すライブラリを作るときは意識するだろうけど、
それって結局C/C++言語で書くんで、あれ?意識するのはC/C++かw
2018/12/20(木) 06:53:32.14ID:Epiz8Tj2
>>30
例えばWindows環境だと、C/C++以外の言語でWin32API関数を固有の構造体を入出力に使う場合、アセンブリ並みに低レベルなオフセット調節を自力で行う必要に迫られる。
例えばWindows環境だと、C/C++以外の言語でWin32API関数を固有の構造体を入出力に使う場合、アセンブリ並みに低レベルなオフセット調節を自力で行う必要に迫られる。
2018/12/20(木) 07:18:15.99ID:ojhJ7lIE
× 例えばWindows環境だと、C/C++以外の言語でWin32API関数を固有の構造体を入出力に使う場合、アセンブリ並みに低レベルなオフセット調節を自力で行う必要に迫られる。
○ 例えばWindows環境だと、C/C++以外の言語でWin32API関数を固有の構造体を入出力に使う場合、C/C++並みに低レベルなオフセット調節を自力で行う必要に迫られる。
○ 例えばWindows環境だと、C/C++以外の言語でWin32API関数を固有の構造体を入出力に使う場合、C/C++並みに低レベルなオフセット調節を自力で行う必要に迫られる。
>>32
うーん、具体的な win32api 名(だけでいいです)を例示してください.
うーん、具体的な win32api 名(だけでいいです)を例示してください.
2018/12/20(木) 07:43:09.20ID:ojhJ7lIE
>>31に聞いてください
2018/12/20(木) 08:04:20.01ID:Epiz8Tj2
>>32
勝手に書き換えないでもらいたい。
C/C++だと構造体の各メンバ変数のアラインメントを意識しなくていいが、他の言語だとそうはいかないので、アセンブリと同じようなオフセット調節が必要。
SendMessage(WM_COPYDATA)の送受信データの読み書きなど例はいくらでもある。
勝手に書き換えないでもらいたい。
C/C++だと構造体の各メンバ変数のアラインメントを意識しなくていいが、他の言語だとそうはいかないので、アセンブリと同じようなオフセット調節が必要。
SendMessage(WM_COPYDATA)の送受信データの読み書きなど例はいくらでもある。
2018/12/20(木) 10:08:25.12ID:48mnxvPx
37デフォルトの名無しさん
2018/12/20(木) 13:46:21.36ID:P4Rv6f7s 実行メモリ上はともかく
ファイルやネットワークストリームでLEにするアホいるんか?
ファイルやネットワークストリームでLEにするアホいるんか?
38デフォルトの名無しさん
2018/12/20(木) 16:58:53.93ID:Epiz8Tj2 エンディアンもさることながら32/64bit整数の幅調節が厄介。
使っている言語が32/64bitどちら向けでビルドされたものなのかによって構造体メンバのアラインメントを適切に処理する必要が出てくる。
言い換えれば、C/C++で作った構造体をバイト列で渡し、C/C++以外の言語でバイト列を構造体に復元する処理が厄介。
単に構造体の64bit整数メンバだけ気を付けるのではダメで、構造体の全メンバのアラインメントそのものが大きく変わりうることに注意する必要がある。
使っている言語が32/64bitどちら向けでビルドされたものなのかによって構造体メンバのアラインメントを適切に処理する必要が出てくる。
言い換えれば、C/C++で作った構造体をバイト列で渡し、C/C++以外の言語でバイト列を構造体に復元する処理が厄介。
単に構造体の64bit整数メンバだけ気を付けるのではダメで、構造体の全メンバのアラインメントそのものが大きく変わりうることに注意する必要がある。
2018/12/20(木) 18:26:27.50ID:6OEKrw3R
いや、だからさ、その程度までは理解できてるのに、何故「C/C++だと構造体の各メンバ変数のアラインメントを意識しなくていいが」なんてことを言っちゃうの?
それとアラインメントの話とバイトオーダーの話を混同しないように気を付けた方がいいよ。
それとアラインメントの話とバイトオーダーの話を混同しないように気を付けた方がいいよ。
2018/12/20(木) 19:07:05.38ID:oZOw2Nhk
C/C++しらないけど、魔法のようにアライメントを
勝手に調整してくれるんじゃないの?想像しただけで
勝手に調整してくれるんじゃないの?想像しただけで
41デフォルトの名無しさん
2018/12/20(木) 21:19:19.38ID:/Up9dRku Unicodeは普通にリトルエンディアンもありだ
なんで Byte Order Mark(BOM) がファイルの先頭に入ってるのか分かってない
Javaバイトコードのcafe babeみたいな飾りだと思ってんの
リトルエンディアンの計算機ばっかりがあるとこで
ビッグエンディアンでファイルを保存する理由なんかないからな
当然、そういったコンテンツデータがHTTPでも流れてくる
なんで Byte Order Mark(BOM) がファイルの先頭に入ってるのか分かってない
Javaバイトコードのcafe babeみたいな飾りだと思ってんの
リトルエンディアンの計算機ばっかりがあるとこで
ビッグエンディアンでファイルを保存する理由なんかないからな
当然、そういったコンテンツデータがHTTPでも流れてくる
42デフォルトの名無しさん
2018/12/20(木) 21:20:17.21ID:/Up9dRku やっぱりこの板には
クルクルパーしかいない
そしてそのクルクルパーの声だけがでかい
やっぱりな低学歴知恵遅れは
この板から排除する必要がある
板が正常に機能しない
クルクルパーしかいない
そしてそのクルクルパーの声だけがでかい
やっぱりな低学歴知恵遅れは
この板から排除する必要がある
板が正常に機能しない
2018/12/20(木) 21:26:52.62ID:gpCj1726
アライメントはふつうコンパイラが適切に調整してくれるよね。
32/64bitで整数サイズの違いでメンバオフセットが変わるってのはアライメントとは別の話。
32/64bitで整数サイズの違いでメンバオフセットが変わるってのはアライメントとは別の話。
44デフォルトの名無しさん
2018/12/20(木) 21:31:46.95ID:/Up9dRku 32bitなら
ちゃんと32bitに詰まるように
メンバの順序かえる
ちゃんと32bitに詰まるように
メンバの順序かえる
45デフォルトの名無しさん
2018/12/20(木) 21:38:37.03ID:/Up9dRku char unko
char foo
int aho
short poi
char baka
int manuke
short boo
char woo
↓
int manuke
----
int aho
----
short poi
short boo
----
char unko
char foo
char baka
char woo
64bitでも考え方は同じ
強制パッキングのオプション使えるコンパイラもある
char foo
int aho
short poi
char baka
int manuke
short boo
char woo
↓
int manuke
----
int aho
----
short poi
short boo
----
char unko
char foo
char baka
char woo
64bitでも考え方は同じ
強制パッキングのオプション使えるコンパイラもある
2018/12/20(木) 21:42:31.32ID:oZOw2Nhk
今問題としてるのはファイルの話だ。
32bitシステムで作られたファイルを64bitシステムに
持ってきたとしてもファイルの内容が変わるわけじゃない
つまりC/C++で32bitでint型で扱っていたからと言って
64bitでもint型で扱ってはいけないということだ
32bitシステムで作られたファイルを64bitシステムに
持ってきたとしてもファイルの内容が変わるわけじゃない
つまりC/C++で32bitでint型で扱っていたからと言って
64bitでもint型で扱ってはいけないということだ
47デフォルトの名無しさん
2018/12/20(木) 21:44:56.46ID:/Up9dRku バカがよくやる誤りは
メモリ境界をまたぐ位置で64bit値を参照したりして
バスエラーを起こす
シリアライズデータを直に参照できると思ってるバカがあとをたたない
CISCの計算機しか使ったことないサル並の脳みそのヤツがよくやる
メモリ境界をまたぐ位置で64bit値を参照したりして
バスエラーを起こす
シリアライズデータを直に参照できると思ってるバカがあとをたたない
CISCの計算機しか使ったことないサル並の脳みそのヤツがよくやる
48デフォルトの名無しさん
2018/12/20(木) 21:53:38.53ID:/Up9dRku そんなファイル読み込むときに
普通にintなんか使わないからな
そんなことは低学歴知恵遅れしか発想できない
utf16なら16bit単位(uint16_t)
utf32なら32bit単位(uint16_t)
で読み込む
リトルエンディアンの計算機で
ビッグエンディアンのUnicode読む場合は
16bit単位なら16bit単位でオクテット列の並びを逆転させる
32bit単位なら32bit単位でオクテット列の並びを逆転させる
リトルエンディアンの計算機で
リトルエンディアンのファイル読み込むならオクテット列の並びを逆転させる必要はない
ビッグエンディアンならその逆になる
低学歴知恵遅れはこういった基本的な理解がない
普通にintなんか使わないからな
そんなことは低学歴知恵遅れしか発想できない
utf16なら16bit単位(uint16_t)
utf32なら32bit単位(uint16_t)
で読み込む
リトルエンディアンの計算機で
ビッグエンディアンのUnicode読む場合は
16bit単位なら16bit単位でオクテット列の並びを逆転させる
32bit単位なら32bit単位でオクテット列の並びを逆転させる
リトルエンディアンの計算機で
リトルエンディアンのファイル読み込むならオクテット列の並びを逆転させる必要はない
ビッグエンディアンならその逆になる
低学歴知恵遅れはこういった基本的な理解がない
2018/12/20(木) 21:59:01.65ID:gpCj1726
2018/12/20(木) 21:59:21.79ID:KozHiIkR
one little two little three little endians
51デフォルトの名無しさん
2018/12/20(木) 22:00:12.93ID:/Up9dRku だからそう書いてる
手動で自分で並べ替える
手動で自分で並べ替える
2018/12/20(木) 22:12:47.37ID:gpCj1726
自分で並べ替えろって話か。それは勘違いした、すまん。
2018/12/20(木) 22:23:36.55ID:tzmwAGAt
結局C/C++でもアライメント意識して、自分で適切な型を選択しているってわけさ
他の言語でも一緒。ただし型が違うからバイト数を指定するだけの話
他の言語でも一緒。ただし型が違うからバイト数を指定するだけの話
2018/12/20(木) 23:02:54.77ID:Epiz8Tj2
PGならば、楽するためにJava/C#/Python/Perl/Rubyなどを使ってたはずなのに、C++よりめんどくさくなって心が折れそうになる経験を一度はしておいたほうがいい。
2018/12/20(木) 23:23:21.93ID:tzmwAGAt
いや、C++よりも面倒なことってないから
そんな経験するのは無理だよ
そんな経験するのは無理だよ
56デフォルトの名無しさん
2018/12/20(木) 23:49:16.62ID:/Up9dRku やはり低学歴知恵遅れには
C++はむり
レスみればよく分かる
レスから頭の悪さがにじみ出てる
低学歴のレスはすぐにわかるわ
残念なことに
C++はむり
レスみればよく分かる
レスから頭の悪さがにじみ出てる
低学歴のレスはすぐにわかるわ
残念なことに
2018/12/21(金) 12:36:36.76ID:C7PBMVlX
データのアラインメントはどんな言語を使うにしても気にする必要がある。
しかし、Windows が VisualC++ でビルドされていて、VisualC++
もしくは互換のアラインメントができる言語でアプリを組めば、
気にしなくてもよい、ということだけだろう。
しかし、Windows が VisualC++ でビルドされていて、VisualC++
もしくは互換のアラインメントができる言語でアプリを組めば、
気にしなくてもよい、ということだけだろう。
2018/12/21(金) 14:56:12.53ID:wVAQd9sY
>>57
gcc も同じだよ。64bit版linux gccはwchar_tを16ビットにするか32ビットにするかを切り替えビルドできるからさらに厄介。
構造体を丸ごとダンプしたバイナリデータを同じOS上の別プロセスに渡すのは繊細な注意がいる。
gcc も同じだよ。64bit版linux gccはwchar_tを16ビットにするか32ビットにするかを切り替えビルドできるからさらに厄介。
構造体を丸ごとダンプしたバイナリデータを同じOS上の別プロセスに渡すのは繊細な注意がいる。
2018/12/21(金) 16:01:10.01ID:2iFVCAc3
で、なんだっけ?バイナリファイルのデータが
16bitで格納されていようが32bitで格納されていようが
C/C++だったらアライメントを勝手に調整してくれるんだっけw
へー、勝手にねー、intで扱ってれば、勝手に調整してくれるんだーw
16bitで格納されていようが32bitで格納されていようが
C/C++だったらアライメントを勝手に調整してくれるんだっけw
へー、勝手にねー、intで扱ってれば、勝手に調整してくれるんだーw
60デフォルトの名無しさん
2018/12/21(金) 16:43:13.79ID:wVAQd9sY intが16bitの組み込み向けプログラムであっても同じコンパイルオプションで作ったモジュール同士ならバイナリの復元はC言語の型キャストだけで可能。
構造体が仕様として公開されている場合、どの言語であれアラインメントを意識した実装が必要になるが、C言語は実装コストが最も低くなる傾向はある。
スクリプト言語を使う人がアラインメントを意識せずにすんでいるのは、ライブラリ実装した人が頑張ってくれた・くれているおかげ。
構造体が仕様として公開されている場合、どの言語であれアラインメントを意識した実装が必要になるが、C言語は実装コストが最も低くなる傾向はある。
スクリプト言語を使う人がアラインメントを意識せずにすんでいるのは、ライブラリ実装した人が頑張ってくれた・くれているおかげ。
2018/12/21(金) 17:01:59.77ID:2iFVCAc3
一方他の言語では、指定したオフセットから何バイト読み込むか指定するだけなのであった
2018/12/21(金) 17:02:51.29ID:2iFVCAc3
C言語は、ヘッダファイル書いた人が頑張ってくれた・くれているおかげ
2018/12/21(金) 17:23:19.85ID:wVAQd9sY
>>61
先生。指定したオフセットから何バイト読み込むか指定する作業は、まさにアセンブラと同レベルの作業じゃありませんか。違いますか、先生。
先生。指定したオフセットから何バイト読み込むか指定する作業は、まさにアセンブラと同レベルの作業じゃありませんか。違いますか、先生。
2018/12/21(金) 17:47:28.44ID:2iFVCAc3
>>63
違いますね。memcpy相当ですから
違いますね。memcpy相当ですから
2018/12/21(金) 18:13:53.48ID:ORTv1gtC
低学歴知恵遅れ先生はC/C++スレだけじゃなくてここにもくるようになったのか
2018/12/21(金) 21:50:05.59ID:0muy2Btq
>>65
色んなところにいるよ
色んなところにいるよ
2018/12/21(金) 22:02:28.52ID:SVNbSsFy
相変わらず日本語の読解に問題がありそうな奴がいるなぁ。
68デフォルトの名無しさん
2018/12/21(金) 23:50:03.63ID:j37Ohb1y まず低学歴知恵遅れは
低学歴知恵遅れの自覚がないからな
低学歴知恵遅れの自覚がないからな
69デフォルトの名無しさん
2018/12/22(土) 11:38:13.24ID:boWDflNh 実行時に使用中のCPUがLEかBEかを判定するプログラムを
Cでサンプル欲しいのですがどこかにありますか?
Cでサンプル欲しいのですがどこかにありますか?
2018/12/22(土) 13:36:46.26ID:aa5NQG9N
bool is_bigendian() {
return htons(1) == 1;
}
return htons(1) == 1;
}
2018/12/31(月) 08:52:03.67ID:Tj5kujd4
C1制御文字の<128>って多くの文字コードで「PAD」と名付けられているのに
UnicodeでのU+0080はxxxみたいに無名なのって理由ある?
UnicodeでのU+0080はxxxみたいに無名なのって理由ある?
2018/12/31(月) 13:29:33.60ID:8Z6ezMyM
U+0080,U+0081,U+0084,U+0099は、ISO6429/ECMA-48で制御文字に含まれていない
というか削除されてる
http://www.ecma-international.org/publications/standards/Ecma-048.htm
http://www.ecma-international.org/publications/files/ECMA-ST/Ecma-048.pdf
WikipediaソースによるとUnicode初期ドラフトにはU+0080も入っていたみたいなことも書かれてるね
https://en.wikipedia.org/wiki/C0_and_C1_control_codes#C1_set
というか削除されてる
http://www.ecma-international.org/publications/standards/Ecma-048.htm
http://www.ecma-international.org/publications/files/ECMA-ST/Ecma-048.pdf
WikipediaソースによるとUnicode初期ドラフトにはU+0080も入っていたみたいなことも書かれてるね
https://en.wikipedia.org/wiki/C0_and_C1_control_codes#C1_set
2019/01/01(火) 01:45:48.02ID:kXQfWbAp
なんてこった
エイプリルフールだって?
エイプリルフールだって?
2019/01/01(火) 23:58:04.80ID:j16q/z48
あけましておめでとうございます
2019年は何が起きるかしらね
2019年は何が起きるかしらね
2019/01/02(水) 00:20:17.09ID:R6tFufwf
エイプリルフールはまだだけど元号ネタとかあるだろうな
新元号『NEO平成』に決定みたいな
新元号『NEO平成』に決定みたいな
2019/01/02(水) 11:30:40.86ID:6YX6jwF2
新元号『』
2019/01/02(水) 22:33:06.92ID:Fz1uszjs
新元号が分からなくてグリフが間に合わないからUnicode 12.1を出すってのは仕方ないけど
新元号の組字のためだけにAdobeJapan1を改訂するってのは馬鹿げてる
新元号の組字のためだけにAdobeJapan1を改訂するってのは馬鹿げてる
2019/01/03(木) 00:28:36.38ID:agNiXwq6
元号は安晋に内定してるだろ
2019/01/03(木) 09:15:51.35ID:IESB6EpY
MS-DOS でのプログラミングではメモリ内の特定のバイトについて
文字の中の何バイト目かを 1 バイトずつ遡って調べるということも
あったようだけど自分ではそういうコードを書いた記憶がない。
いや、もしかしたらあったのかもしれないけど。
EUC-JP の場合は ASCII なバイトかシングルシフトが現れた時点で
確定するようだけど。Unicode の時代になって良かったね。
まあ、そんなようなことを今更思った。あけましておめでとう。
文字の中の何バイト目かを 1 バイトずつ遡って調べるということも
あったようだけど自分ではそういうコードを書いた記憶がない。
いや、もしかしたらあったのかもしれないけど。
EUC-JP の場合は ASCII なバイトかシングルシフトが現れた時点で
確定するようだけど。Unicode の時代になって良かったね。
まあ、そんなようなことを今更思った。あけましておめでとう。
2019/01/03(木) 21:04:56.87ID:ejflNGhp
2019/01/04(金) 13:59:50.88ID:8DNHKlb4
8279
2019/01/04(金) 17:36:17.24ID:opswFKCW ありがとう、まさにそういうことです。
p=strchr( path,'\\'); /* おい *p 、お前は本当に '\\' なのか? 表とかじゃないのか? */
p=strchr( path,'\\'); /* おい *p 、お前は本当に '\\' なのか? 表とかじゃないのか? */
2019/01/04(金) 18:54:02.55ID:3Gm4cMvD
Windows環境ならそこは _mbschr() でしょ。
2019/01/04(金) 19:30:16.38ID:EMYjNY+E
UnicodeはSJISよりも扱いが複雑だけど
ライブラリが揃ってるからねー
一文字が1バイトだろうと3バイトだろうと
2文字で1文字を表していようが、簡単に一文字判定ができちゃう
ライブラリが揃ってるからねー
一文字が1バイトだろうと3バイトだろうと
2文字で1文字を表していようが、簡単に一文字判定ができちゃう
2019/01/04(金) 21:30:36.38ID:atCGQoq2
複数コードポイントで1文字を表すのって上限って決まってないの?青天井?
2019/01/04(金) 22:02:58.14ID:rG/yv5Zr
UTF-8なら、最大四バイトだけど、そういうことじゃなくて?
2019/01/04(金) 22:11:30.43ID:FtJLKwOD
>>86
先ずコードポイントの意味を理解してから質問した方が良い
先ずコードポイントの意味を理解してから質問した方が良い
2019/01/04(金) 22:27:33.32ID:atCGQoq2
なんかごめん
2019/01/04(金) 23:45:49.70ID:EMYjNY+E
>>86
最大4バイトじゃないよ
漢字1文字が最大8バイト、Unicodeの「IVS」とは?
https://tech.nikkeibp.co.jp/it/article/COLUMN/20100126/343783/
Unicodeは複雑過ぎてライブラリを使わないと正しく扱うのはまず無理
もし自力で文字数をカウントしたいならこれとか読んで頑張れ
https://www.kthree.co.jp/kihelp/index.html?page=data/ivs&type=html
最大4バイトじゃないよ
漢字1文字が最大8バイト、Unicodeの「IVS」とは?
https://tech.nikkeibp.co.jp/it/article/COLUMN/20100126/343783/
Unicodeは複雑過ぎてライブラリを使わないと正しく扱うのはまず無理
もし自力で文字数をカウントしたいならこれとか読んで頑張れ
https://www.kthree.co.jp/kihelp/index.html?page=data/ivs&type=html
2019/01/04(金) 23:54:23.74ID:EMYjNY+E
ZWJシーケンス というのもあるね
https://qiita.com/nonanona/items/b148c212ba7c24942e93#%E7%B5%B5%E6%96%87%E5%AD%97%E7%94%A8%E3%81%AE%E7%95%B0%E4%BD%93%E5%AD%97%E3%82%BB%E3%83%AC%E3%82%AF%E3%82%BFemoji-variation-selector%E3%81%A8%E3%81%AF
見た目上は1文字なのに例えば U+1F468 U+200D U+1F3A8 みたいに3文字になる。
https://qiita.com/nonanona/items/b148c212ba7c24942e93#%E7%B5%B5%E6%96%87%E5%AD%97%E7%94%A8%E3%81%AE%E7%95%B0%E4%BD%93%E5%AD%97%E3%82%BB%E3%83%AC%E3%82%AF%E3%82%BFemoji-variation-selector%E3%81%A8%E3%81%AF
見た目上は1文字なのに例えば U+1F468 U+200D U+1F3A8 みたいに3文字になる。
2019/01/05(土) 00:00:08.40ID:41KVD0qa
https://unicode.org/emoji/charts/emoji-zwj-sequences.html#1f441_fe0f_200d_1f5e8_fe0f
酷いねー。見た目上は1文字なのにU+1F441 U+FE0F U+200D U+1F5E8 U+FE0F と5文字分使ってる
バイト数だと17バイトみたいね
酷いねー。見た目上は1文字なのにU+1F441 U+FE0F U+200D U+1F5E8 U+FE0F と5文字分使ってる
バイト数だと17バイトみたいね
2019/01/05(土) 00:03:32.79ID:fLBZxFEd
合成文字・絵文字とかが絡むともっと地獄になるけどな
http://tech.albert2005.co.jp/201/
https://qiita.com/nonanona/items/b148c212ba7c24942e93
http://tech.albert2005.co.jp/201/
https://qiita.com/nonanona/items/b148c212ba7c24942e93
2019/01/05(土) 00:03:39.55ID:41KVD0qa
ZWJを使うと最大11文字だって。
https://n2p.co.jp/blog/column/counting-characters-on-twitter/
https://n2p.co.jp/blog/column/counting-characters-on-twitter/
2019/01/05(土) 00:07:24.29ID:41KVD0qa
Unicodeは1文字の概念も破綻しちゃったね
1文字に見えるやろ?でもこれは11文字なんや
全く意味がわからないw
1文字に見えるやろ?でもこれは11文字なんや
全く意味がわからないw
2019/01/05(土) 00:11:16.35ID:41KVD0qa
見た目上の1文字は最大4バイト×11文字で44バイトなのかな?w
11文字ってのは今現在存在する最大が11文字ってだけで青天井?
もうライブラリ使ってないと無理だね
11文字ってのは今現在存在する最大が11文字ってだけで青天井?
もうライブラリ使ってないと無理だね
世の中にあるすべての文字をコード化してやる!
という意義には賛同していたんですけれども、(主に経済的理由により)絵文字が入った時点で失望してしまいました…
仕切りなおしたほうがいいんじゃないですか?
という意義には賛同していたんですけれども、(主に経済的理由により)絵文字が入った時点で失望してしまいました…
仕切りなおしたほうがいいんじゃないですか?
2019/01/05(土) 00:38:07.30ID:198zQJKz
仕切りなおしてもBCで絵文字は入ります。
というかもはや絵文字は世界中のスマホ/SNSユーザーに愛用されています。
ここまでくるともはや後戻りはできないのです。
というかもはや絵文字は世界中のスマホ/SNSユーザーに愛用されています。
ここまでくるともはや後戻りはできないのです。
2019/01/05(土) 00:46:41.68ID:fLBZxFEd
仕切りなおすどころかUnicodeの規格がさらに拡張されて状況悪化するんだろうなあ
Unicode12も来年・・・じゃないやもう今年リリースされる予定のはずだし
Unicode12も来年・・・じゃないやもう今年リリースされる予定のはずだし
2019/01/05(土) 01:28:42.81ID:41KVD0qa
絵文字は象形文字の発展版なんだから
文字扱いするのは当然
文字扱いするのは当然
100デフォルトの名無しさん
2019/01/05(土) 12:51:39.06ID:l3tIMYns 現代の文字は自然発生するわけでも王朝が発布するわけでもなくユニコードコンソーシアムが追加するのだ
101デフォルトの名無しさん
2019/01/05(土) 13:09:21.22ID:Lsf8iZgV >>97
世界には文盲がわんさか居るから結局象形文字が必要ってことか
世界には文盲がわんさか居るから結局象形文字が必要ってことか
102デフォルトの名無しさん
2019/01/05(土) 15:08:59.93ID:WAT5i9L3 世界が認めたニッポンのスゴーイ文化やぞ
103デフォルトの名無しさん
2019/01/05(土) 15:19:11.13ID:dE0KuiGH 当の日本人にすら絵文字を扱いきれてなかったのに
そんなもんをコード化したら破綻するに決まってるんだよなぁ……
そんなもんをコード化したら破綻するに決まってるんだよなぁ……
104デフォルトの名無しさん
2019/01/05(土) 16:29:31.32ID:XzO5Y/Fl 1964年の東京五輪での案内表示がきっかけでしょ絵文字の開花は。
>>99
絵文字と象形文字の間には確固たる断絶があります、おっしゃるような連続的なものではないと考えています
例えば、ある象形文字と別の象形文字との違いははっきりしていますが、ある絵文字と別の絵文字との違いを示す具体的な指標はないのでは?
それとも、これは私の知らなかったことですが、もしかして絵文字の内容はピクセル単位、あるいはベクターイメージですでに定義されているのですか?
絵文字と象形文字の間には確固たる断絶があります、おっしゃるような連続的なものではないと考えています
例えば、ある象形文字と別の象形文字との違いははっきりしていますが、ある絵文字と別の絵文字との違いを示す具体的な指標はないのでは?
それとも、これは私の知らなかったことですが、もしかして絵文字の内容はピクセル単位、あるいはベクターイメージですでに定義されているのですか?
106デフォルトの名無しさん
2019/01/05(土) 17:24:42.05ID:41KVD0qa はい
107デフォルトの名無しさん
2019/01/05(土) 19:28:07.65ID:2yRzjNJO 便器に◎とか〓とか描いてあっても何のことか判らんで悩むだけやぞ
108デフォルトの名無しさん
2019/01/06(日) 10:52:08.85ID:6OQPByjN 田穣崇さん『ドコモの絵文字にうんちを入れたかったのですが、社内で大反対されまして…』 うんちの絵文字がUnicodeに登録されるまでの裏話
https://togetter.com/li/1305754
https://togetter.com/li/1305754
109デフォルトの名無しさん
2019/01/09(水) 21:32:33.71ID:Duz5lH4D うんちにも色バリエーションつけたいなあ
110デフォルトの名無しさん
2019/01/10(木) 11:56:03.90ID:+qf2Eno1 カフェで野良WiFiのSSIDが絵文字になってたわ
うっかりつなぎそうになった
うっかりつなぎそうになった
111デフォルトの名無しさん
2019/01/10(木) 14:02:26.62ID:LOQSfV+x 形状バリエーションも欲しい
巻きうんち/一本糞/ビチグソ
巻きうんち/一本糞/ビチグソ
112デフォルトの名無しさん
2019/01/10(木) 18:35:20.73ID:1lL5sq44 POO WITH TURBANとかもほしい
113デフォルトの名無しさん
2019/01/14(月) 01:16:50.95ID:s6eFaywu U+FFFCとU+FFFDの違いってなんだろう。
一応https://www.unicode.org/charts/PDF/UFFF0.pdf←ここを読んでみたんだが
U+FFFCが「Unicodeの範囲で異常」、U+FFFDが「Unicodeですらない」
ことを示す文字なのかな?
一応https://www.unicode.org/charts/PDF/UFFF0.pdf←ここを読んでみたんだが
U+FFFCが「Unicodeの範囲で異常」、U+FFFDが「Unicodeですらない」
ことを示す文字なのかな?
114デフォルトの名無しさん
2019/01/14(月) 11:40:16.54ID:tN6VIVTj Unicodeですらないのに「U+〜」という表記はこれ如何にw
115デフォルトの名無しさん
2019/01/15(火) 16:00:55.99ID:exaSay/9 Replacement Characters: U+FFFC–U+FFFD
U+FFFC. The U+FFFC object replacement character is used as an insertion point for objects located within a stream of text.
All other information about the object is kept outside the character data stream.
Internally it is a dummy character that acts as an anchor point for the object’s formatting information.
In addition to assuring correct placement of an object in a data stream, the object replacement character allows the use of general stream-based algorithms for any textual aspects of embedded objects.
U+FFFD. The U+FFFD replacement character is the general substitute character in the Unicode Standard.
It can be substituted for any “unknown” character in another encoding that cannot be mapped in terms of known Unicode characters.
It can also be used as one means of indicating a conversion error, when encountering an ill-formed sequence in a conversion between Unicode encoding forms.
See Section 3.9, Unicode Encoding Forms for detailed recommendations on the use of U+FFFD as replacement for ill-formed sequences. See also Section 5.3, Unknown and Missing Characters for related topics.
U+FFFC. The U+FFFC object replacement character is used as an insertion point for objects located within a stream of text.
All other information about the object is kept outside the character data stream.
Internally it is a dummy character that acts as an anchor point for the object’s formatting information.
In addition to assuring correct placement of an object in a data stream, the object replacement character allows the use of general stream-based algorithms for any textual aspects of embedded objects.
U+FFFD. The U+FFFD replacement character is the general substitute character in the Unicode Standard.
It can be substituted for any “unknown” character in another encoding that cannot be mapped in terms of known Unicode characters.
It can also be used as one means of indicating a conversion error, when encountering an ill-formed sequence in a conversion between Unicode encoding forms.
See Section 3.9, Unicode Encoding Forms for detailed recommendations on the use of U+FFFD as replacement for ill-formed sequences. See also Section 5.3, Unknown and Missing Characters for related topics.
116デフォルトの名無しさん
2019/01/15(火) 18:43:18.89ID:cLBK0jiu >>115
sorry Japanese only please
sorry Japanese only please
117デフォルトの名無しさん
2019/01/15(火) 20:15:36.54ID:XDACXjEE >>116
なんで卑屈なの?
なんで卑屈なの?
118デフォルトの名無しさん
2019/01/16(水) 11:07:49.88ID:vTKVQdGX 朝鮮人クオリティ
119デフォルトの名無しさん
2019/01/17(木) 14:01:24.86ID:yxSqAYIN 消えゆく「黒電話」マーク…時代とともに変化
https://www.sankei.com/premium/news/190117/prm1901170009-n1.html
https://www.sankei.com/premium/news/190117/prm1901170009-n1.html
120デフォルトの名無しさん
2019/01/17(木) 14:27:36.24ID:fAu7Qwle 一方、保存ボタンには相変わらずフロッピー
121デフォルトの名無しさん
2019/01/17(木) 21:08:16.21ID:rro3H2AR122デフォルトの名無しさん
2019/01/17(木) 21:10:53.89ID:1NGaj4L3 ダウンロードかな
123デフォルトの名無しさん
2019/01/18(金) 04:13:25.86ID:6U5tZjv3 山
↑
の方が合ってると思うけど
現実は
↓
下載
↑
の方が合ってると思うけど
現実は
↓
下載
124デフォルトの名無しさん
2019/01/18(金) 15:39:10.11ID:XYduBDiM 直訳かよ
125デフォルトの名無しさん
2019/01/19(土) 00:58:09.98ID:cLBGydY8 >>115
これ使われてるの?
これ使われてるの?
126デフォルトの名無しさん
2019/01/19(土) 01:02:48.22ID:TqFwYkHH 使われてるよ
127デフォルトの名無しさん
2019/01/20(日) 06:25:45.86ID:kFywruI2128デフォルトの名無しさん
2019/01/20(日) 19:36:07.54ID:GM/wkhUD FFFC はオブジェクト用。変換のときに絵でも音楽でも写真でも、主に文字以外のものが埋め込まれていた場合用。
FFFD は文字用。変換のときに他の文字コードでは表現できる文字がユニコードでは表現できなかった場合用。
FFFD は文字用。変換のときに他の文字コードでは表現できる文字がユニコードでは表現できなかった場合用。
129127
2019/01/21(月) 07:51:07.97ID:uncS2Ppy >>128
なるほど「オブジェクト」ってそういう意味か!
ありがとう。
つまり基本的に(Unicode環境で)「文字化け」した場合は
U+FFFCを目にすることはない訳だ。
(Webブラウザなら画像は別の形で表示されるし
端末なら8bitキャラクタの集合としてU+FFFDが使われるし)
なるほど「オブジェクト」ってそういう意味か!
ありがとう。
つまり基本的に(Unicode環境で)「文字化け」した場合は
U+FFFCを目にすることはない訳だ。
(Webブラウザなら画像は別の形で表示されるし
端末なら8bitキャラクタの集合としてU+FFFDが使われるし)
130デフォルトの名無しさん
2019/01/21(月) 10:29:40.20ID:z/MdI8Lw そもそも外部に公開するドキュメントにU+FFFC,U+FFFDが存在すべきでないということでは。
アプリケーションが内部で使ってよい領域という意味と受け取ったわ。
アプリケーションが内部で使ってよい領域という意味と受け取ったわ。
漢字コードのことでわからなくなりましたので質問いたします。
よろしくお願いいたします。
https://pc.watch.impress.co.jp/docs/column/config/1158344.html
>文字データをシフトJISではなく、Unicodeで保存するとどんないいことがあるのか。
>たとえばUnicodeならあらゆる言語の文字を混在させることができる。
>Wordでしか文書を書かないエンドユーザーにはそんなこと当たり前じゃないかと言われそうだが、
これって本当ですか?
私見では日本語の漢字と中国語の漢字を同一文書にて同時に表示できないし混在もできない、と思っていたんですが…。
CJK 漢字統合の影響はもう過去の話になってしまったんでしょうか?
よろしくお願いいたします。
https://pc.watch.impress.co.jp/docs/column/config/1158344.html
>文字データをシフトJISではなく、Unicodeで保存するとどんないいことがあるのか。
>たとえばUnicodeならあらゆる言語の文字を混在させることができる。
>Wordでしか文書を書かないエンドユーザーにはそんなこと当たり前じゃないかと言われそうだが、
これって本当ですか?
私見では日本語の漢字と中国語の漢字を同一文書にて同時に表示できないし混在もできない、と思っていたんですが…。
CJK 漢字統合の影響はもう過去の話になってしまったんでしょうか?
132デフォルトの名無しさん
2019/01/22(火) 02:31:06.16ID:leGefjnc 字体とか書体を文字としてどう考えるか、で答えが変わるだろ
>>132
現に存在するUTF-32/UTF-8 という文字コードの集合を使用した場合に日本語と中国語の漢字を
@:同一文書に含ませることは可能でしょうか?A:@が可能であったとして、PC の画面にて同時に表示することは可能でしょうか?
現に存在するUTF-32/UTF-8 という文字コードの集合を使用した場合に日本語と中国語の漢字を
@:同一文書に含ませることは可能でしょうか?A:@が可能であったとして、PC の画面にて同時に表示することは可能でしょうか?
134デフォルトの名無しさん
2019/01/22(火) 02:59:07.23ID:leGefjnc どっちも可能
135デフォルトの名無しさん
2019/01/22(火) 07:59:46.55ID:Um5Ij+zI 新しめのブラウザでUTF-8の文書を書いて、中国圏の自体にしたい文字を
<span lang="zh">
みたいに指定してやると全く同じコードポイントでも違う字形になる。
<span lang="zh">
みたいに指定してやると全く同じコードポイントでも違う字形になる。
136デフォルトの名無しさん
2019/01/22(火) 13:07:54.27ID:/wbMKv3O137デフォルトの名無しさん
2019/01/22(火) 14:56:00.21ID:SJtsjRub138デフォルトの名無しさん
2019/01/22(火) 23:10:13.56ID:MZI8yiK5139デフォルトの名無しさん
2019/01/23(水) 08:37:00.98ID:bn3mLL6F >131
私?では日本?の?字と中国?の?字を同一文?にて同?に表示できるし混在もできるが。
私?では日本?の?字と中国?の?字を同一文?にて同?に表示できるし混在もできるが。
140デフォルトの名無しさん
2019/01/23(水) 08:38:04.03ID:bn3mLL6F あちゃー。unicode文字が全部?になってしまった。
141デフォルトの名無しさん
2019/01/23(水) 12:18:22.13ID:djVGMpuO142デフォルトの名無しさん
2019/01/23(水) 20:08:35.75ID:9uGbsXCn >>141
文字がないのに文字コード化できるの?
文字がないのに文字コード化できるの?
143デフォルトの名無しさん
2019/01/23(水) 23:59:31.81ID:einaVBCe 漂流する論点
144デフォルトの名無しさん
2019/01/24(木) 10:44:11.21ID:TePOwsZ1 論点ずらしは朝鮮人のはじまり
145デフォルトの名無しさん
2019/01/24(木) 14:09:11.07ID:CmuJPGgn146デフォルトの名無しさん
2019/01/24(木) 14:37:04.33ID:YqEq6vd1 Unicodeだからできないなんて、誰も言ってないと思うのだが。
被害妄想にとりつかれた朝鮮人みたいだな。
被害妄想にとりつかれた朝鮮人みたいだな。
147デフォルトの名無しさん
2019/01/24(木) 14:59:51.89ID:CmuJPGgn148デフォルトの名無しさん
2019/01/24(木) 23:03:59.13ID:YqEq6vd1 >>147
>じゃ、この発言で言いたかったことは何だって言うの?
(unicodeならすべての言語を混在できるという話しを受けて)
あらゆる言語とは言うけど、縄文時代の日本語を混在させるのは無理
だろ。他に何があるってんだ?
>じゃ、この発言で言いたかったことは何だって言うの?
(unicodeならすべての言語を混在できるという話しを受けて)
あらゆる言語とは言うけど、縄文時代の日本語を混在させるのは無理
だろ。他に何があるってんだ?
149デフォルトの名無しさん
2019/01/25(金) 11:58:11.28ID:Syn0T0uw150デフォルトの名無しさん
2019/01/25(金) 12:36:50.26ID:EnRgcOgq 宇宙の惑星や生命体の多さから言って
UNICODEじゃ全然足りないのは明らか
UNICODEじゃ全然足りないのは明らか
151デフォルトの名無しさん
2019/01/25(金) 14:50:56.20ID:fW+xzaQf152デフォルトの名無しさん
2019/01/25(金) 21:01:41.10ID:Syn0T0uw これ誰かがわざと論点動かして遊んでるだけだな…
153デフォルトの名無しさん
2019/01/25(金) 21:59:31.32ID:cTfFLjRM154デフォルトの名無しさん
2019/01/26(土) 15:18:19.02ID:yVAkGzul >>152
朝鮮人メンタル
朝鮮人メンタル
155デフォルトの名無しさん
2019/01/26(土) 17:43:06.71ID:+ikAikUs なぜ文字コードスレで文字の無い言語の話をしようと思ったのか
156デフォルトの名無しさん
2019/01/27(日) 20:08:40.52ID:fsCM9HoX そこに文字がないから
157デフォルトの名無しさん
2019/01/28(月) 17:43:32.30ID:2/HZJEKq win32apiスレ荒すな!
158デフォルトの名無しさん
2019/01/29(火) 08:22:23.73ID:NccK+bbj なんか旧かなキチガイと同じ臭いがする
159デフォルトの名無しさん
2019/02/01(金) 11:28:25.54ID:FNQUOW/0 いきなりですが質問失礼します
とあるオンラインゲームをやってまして
そこで名前のソートの規則から、そのゲームが採用している文字コードの符号化方式を知りたいのですが
各コードにおいての文字の並びと、実際のゲーム内での文字のならびに違いがあったので素人の私にはお手上げ状態です
素人なりに6時間ほどぐぐってみたりしたのですが、それらしい符号化方式は特定できませんでした
スプレッドシートに、ゲーム内で実際にソートされていた文字を順番も合わせてまとめました
文字コードや符号化のスペシャリストのみなさんにこれを見てもらって、一番近い符号化方式をお教えいただけたらうれしいです
文字ソートまとめ、上から下に向かって昇順になっています
https://docs.google.com/spreadsheets/d/1QbN1zHY8BLnUampdKYVIRzK34SrTdq2gkMBgct03Fu8/edit?usp=sharing
それではよろしくお願いします
とあるオンラインゲームをやってまして
そこで名前のソートの規則から、そのゲームが採用している文字コードの符号化方式を知りたいのですが
各コードにおいての文字の並びと、実際のゲーム内での文字のならびに違いがあったので素人の私にはお手上げ状態です
素人なりに6時間ほどぐぐってみたりしたのですが、それらしい符号化方式は特定できませんでした
スプレッドシートに、ゲーム内で実際にソートされていた文字を順番も合わせてまとめました
文字コードや符号化のスペシャリストのみなさんにこれを見てもらって、一番近い符号化方式をお教えいただけたらうれしいです
文字ソートまとめ、上から下に向かって昇順になっています
https://docs.google.com/spreadsheets/d/1QbN1zHY8BLnUampdKYVIRzK34SrTdq2gkMBgct03Fu8/edit?usp=sharing
それではよろしくお願いします
160デフォルトの名無しさん
2019/02/01(金) 11:40:45.63ID:FNQUOW/0 このサイトを参考に文字コード引っ張って来てみました
http://ash.jp/code/unitbl21.htm
区 点 JIS SJIS EUC UTF-8 UTF-16 字
01 86 2176 8196 A1F6 EFBC8A FF0A *
84 06 7426 EAA4 F4A6 E78699 7199 熙
17 77 316D 898D B1ED E78795 71D5 燕
44 80 4C70 96EE CCF0 E79FA2 77E2 矢
27 71 3B67 8E87 BBE7 E7B4AB 7D2B 紫
01 49 2151 8170 A1D1 EFBD9D FF5D }
ゲーム内では熙 燕 矢 紫の順にソートされており
引っ張ってきた文字コードを見ると、数字と文字のソート関係が昇順で一致していたのがUTF-8かUTF-16だったので
その2つかな?と思ったのですが、実際にそれらの符号化のサイトを見てみたら、ゲーム内のソートとはまた違う規則性のようでした
実験として、符号化の一番値の大きい文字である「FF5D }」を文字として使ってみたところ
先の4つの漢字の下にソートされたのでUTFあたりが近そうなのですが、それ以上は素人にはわからないので困ってしまっている状況です。
どうかご助言の方なにとぞよろしくお願いします。
http://ash.jp/code/unitbl21.htm
区 点 JIS SJIS EUC UTF-8 UTF-16 字
01 86 2176 8196 A1F6 EFBC8A FF0A *
84 06 7426 EAA4 F4A6 E78699 7199 熙
17 77 316D 898D B1ED E78795 71D5 燕
44 80 4C70 96EE CCF0 E79FA2 77E2 矢
27 71 3B67 8E87 BBE7 E7B4AB 7D2B 紫
01 49 2151 8170 A1D1 EFBD9D FF5D }
ゲーム内では熙 燕 矢 紫の順にソートされており
引っ張ってきた文字コードを見ると、数字と文字のソート関係が昇順で一致していたのがUTF-8かUTF-16だったので
その2つかな?と思ったのですが、実際にそれらの符号化のサイトを見てみたら、ゲーム内のソートとはまた違う規則性のようでした
実験として、符号化の一番値の大きい文字である「FF5D }」を文字として使ってみたところ
先の4つの漢字の下にソートされたのでUTFあたりが近そうなのですが、それ以上は素人にはわからないので困ってしまっている状況です。
どうかご助言の方なにとぞよろしくお願いします。
161デフォルトの名無しさん
2019/02/01(金) 13:28:31.64ID:OoI2nX80 区別しない文字があるんだから文字コード外のルールでソートされてるんだろ
特定の符号化を示唆する特徴が見られたとしてもそれは実際に採用されてる符号化と直接の関係がない
特定の符号化を示唆する特徴が見られたとしてもそれは実際に採用されてる符号化と直接の関係がない
162デフォルトの名無しさん
2019/02/01(金) 14:36:54.05ID:5sjBS9D2 StrCmpLogicalWとか知らなそう?
163デフォルトの名無しさん
2019/02/01(金) 18:36:04.25ID:FNQUOW/0164デフォルトの名無しさん
2019/02/01(金) 19:29:42.41ID:GHV5J4t+ Unicode(UTF-8, UTF-16)はコードポイント順とは別にソート順のデータが定義されてるんだけど
記号類がアルファベットの前に来るってのはそれっぽいような
http://www.unicode.org/Public/UCA/latest/allkeys.txt
でも〆の位置は明らかに違うなぁ
記号類がアルファベットの前に来るってのはそれっぽいような
http://www.unicode.org/Public/UCA/latest/allkeys.txt
でも〆の位置は明らかに違うなぁ
165デフォルトの名無しさん
2019/02/01(金) 22:48:31.77ID:UXXgl86T >>161
ほんそれ
ほんそれ
166デフォルトの名無しさん
2019/02/01(金) 23:10:01.58ID:1OLKpSdz 例えば韓国製のゲームなら韓国語での文字コード順になってるかもな
データベースにMySQLを使ってるかもしれないという前提だと
MySQLでのソート順序はCollationという
http://variable.jp/2009/07/14/mysql-collation/
> MySQL5.0では,126種類でMySQL5.1では,127種類のCollationが用意されている。
> 一つの文字コードに複数のCollationが用意されていて、文字データの場合,文字コードによって,
> 並びが変化する。
127種類のうちUTF8系だけで21種類の順番が存在する
データベースにMySQLを使ってるかもしれないという前提だと
MySQLでのソート順序はCollationという
http://variable.jp/2009/07/14/mysql-collation/
> MySQL5.0では,126種類でMySQL5.1では,127種類のCollationが用意されている。
> 一つの文字コードに複数のCollationが用意されていて、文字データの場合,文字コードによって,
> 並びが変化する。
127種類のうちUTF8系だけで21種類の順番が存在する
167デフォルトの名無しさん
2019/02/04(月) 15:09:00.52ID:ipefWero 中国製なら中文系かもな。「Big5」とか「CNS11643(EUC_TW)」とか、「GB2312(EUC_CN)」とか。
168デフォルトの名無しさん
2019/02/05(火) 19:23:22.90ID:9Z2hbdGL 日本製でもCO-59とかの可能性がある。
169デフォルトの名無しさん
2019/02/06(水) 14:24:15.52ID:r9SYyl7G 230 New Emojis in Final List for 2019
https://blog.emojipedia.org/230-new-emojis-in-final-list-for-2019/
https://blog.emojipedia.org/230-new-emojis-in-final-list-for-2019/
170デフォルトの名無しさん
2019/02/06(水) 15:28:47.74ID:kcXvzDdu 絵文字ちゃうやん
ただの絵
ただの絵
171デフォルトの名無しさん
2019/02/06(水) 21:57:35.71ID:/jZJbKDa >>169
ブリックパックの右二つがなんだかわからない
ブリックパックの右二つがなんだかわからない
172デフォルトの名無しさん
2019/02/07(木) 00:13:13.64ID:XGqZMSaR だんだんレゴみたいになってきたな
173デフォルトの名無しさん
2019/02/07(木) 18:52:35.59ID:rnocbaU8 >>171
南アの飲み物マテと牡蠣じゃねーの
南アの飲み物マテと牡蠣じゃねーの
174デフォルトの名無しさん
2019/02/08(金) 04:31:41.05ID:6HMnnMCZ なんか真珠できてない?
175デフォルトの名無しさん
2019/02/08(金) 19:56:39.86ID:oJ2kcRDW 真珠を絵に入れるなら pearl oyster にしとけばいいのに
176デフォルトの名無しさん
2019/02/09(土) 15:36:03.22ID:3lTArmdf >>110
SSIDって英数字だけじゃないの?
SSIDって英数字だけじゃないの?
177デフォルトの名無しさん
2019/02/09(土) 16:49:37.43ID:UMSUoHVI >>176
ほとんどのルーターで禁止されているけど、ルーターのWebUIでSSIDを設定する時に
JavaScriptの文字列チェックを外して強引にUTF-8で設定させるのが一部で流行っているらしい。
ほとんどのルーターで禁止されているけど、ルーターのWebUIでSSIDを設定する時に
JavaScriptの文字列チェックを外して強引にUTF-8で設定させるのが一部で流行っているらしい。
178デフォルトの名無しさん
2019/02/10(日) 00:42:00.71ID:katisOGx 内部UTF-8なの?
179デフォルトの名無しさん
2019/02/10(日) 00:57:47.38ID:nr+SJD/m 内部では単なるヌル終端のバイト列として扱ってるだけなんだろう
180デフォルトの名無しさん
2019/02/10(日) 15:54:10.44ID:PXpe84p+ 無理やり設定しても繋げられなくなる気がする
181デフォルトの名無しさん
2019/02/10(日) 19:57:18.23ID:MigChu0H 💩
うんこ
🍭
あめ
うんこ
🍭
あめ
182デフォルトの名無しさん
2019/02/10(日) 20:01:32.56ID:MigChu0H 🍭
あめ
☔
雨
あめ
☔
雨
183デフォルトの名無しさん
2019/02/10(日) 22:34:53.92ID:Amp5CTrh >>180
見えているのに到達できない場所みたいだな
見えているのに到達できない場所みたいだな
184デフォルトの名無しさん
2019/02/10(日) 23:37:08.37ID:/Ok9Y0Js ユニコードの文字の説明(#から右の部分)がのっているテキストファイルの置き場所って
どこかわかります。できれば、日本語だけでなく全文字が欲しい。
↓こんなやつがずらっと。
0x878D U+337E # SQUARE ERA NAME MEIZI [2000]
どこかわかります。できれば、日本語だけでなく全文字が欲しい。
↓こんなやつがずらっと。
0x878D U+337E # SQUARE ERA NAME MEIZI [2000]
185デフォルトの名無しさん
2019/02/10(日) 23:45:31.96ID:/Ok9Y0Js https://unicode.org/Public/MAPPINGS/
ここは知っています。
ここは知っています。
186デフォルトの名無しさん
2019/02/11(月) 18:36:04.22ID:QUwqB+eg そこ知ってるならもう辿り着けたも同然なのに
一つ上がってみよう
一つ上がってみよう
187デフォルトの名無しさん
2019/02/12(火) 17:07:51.47ID:uPzbFBNW 一昔前に、大塩平八郎のLANや応仁のLANというSSIDが話題になったことがあるよね。
俺は見たこと無くて何とも言えないのだけど、実際に接続できたのだろうか?
俺は見たこと無くて何とも言えないのだけど、実際に接続できたのだろうか?
188デフォルトの名無しさん
2019/02/14(木) 19:27:45.79ID:Ny/2bQvT 文字化け先生はなんかあったのか
189デフォルトの名無しさん
2019/02/14(木) 21:24:21.21ID:sLL+4j00 境界判定するつもりが教会判定することになり異端審問にかけられた。
190デフォルトの名無しさん
2019/02/15(金) 10:47:46.35ID:9AJYray/ Nobody expects the Spanish Inquisition!
>>190
Nobody knows the trouble i've seen, nobody knows but Jesus!
Nobody knows the trouble i've seen, nobody knows but Jesus!
192デフォルトの名無しさん
2019/02/23(土) 21:24:43.04ID:nqqF93LL https://unicode.org/cldr/utility/character.jsp?a=1D00
↑ここにアクセスしても空白のページが表示されるだけなんだけど
みなさんもそう?
前までは確かに存在したページの筈……。
↑ここにアクセスしても空白のページが表示されるだけなんだけど
みなさんもそう?
前までは確かに存在したページの筈……。
193デフォルトの名無しさん
2019/02/24(日) 11:44:00.18ID:A1cNJX+Z 確かに空白だな、と思ってソース見たらtofuが並んでた
194デフォルトの名無しさん
2019/02/24(日) 14:46:38.10ID:YwY0sV++ Service Temporarily Unavailable
195デフォルトの名無しさん
2019/02/24(日) 17:25:45.84ID:Nokppl90 そうか…
あのページはすごい便利に使わしてもらってたのに、利用できないとは残念
あのページはすごい便利に使わしてもらってたのに、利用できないとは残念
196デフォルトの名無しさん
2019/02/25(月) 10:45:27.39ID:Opp/wdL5 >>192 がトドメ刺したんか
197デフォルトの名無しさん
2019/02/25(月) 10:51:17.50ID:Opp/wdL5198デフォルトの名無しさん
2019/02/27(水) 18:11:26.22ID:NPiQGjbt >>197
そのページから個々の文字に関する情報って見れなくね?
そのページから個々の文字に関する情報って見れなくね?
199デフォルトの名無しさん
2019/03/06(水) 23:53:15.90ID:3quF+PLE unicode 12.0 出てた
200デフォルトの名無しさん
2019/03/07(木) 07:31:58.41ID:T3odpijK >>199
unicode、すっかりグダグダたな。なんだよ絵文字って。
unicode、すっかりグダグダたな。なんだよ絵文字って。
201デフォルトの名無しさん
2019/03/07(木) 08:59:33.50ID:6IyvIIuW Announcing The Unicode Standard, Version 12.0
http://blog.unicode.org/2019/03/announcing-unicode-standard-version-120.html
http://blog.unicode.org/2019/03/announcing-unicode-standard-version-120.html
202デフォルトの名無しさん
2019/03/07(木) 11:12:32.47ID:MaxgRiSY 仕事する馬鹿ほど面倒なものはない
203デフォルトの名無しさん
2019/03/07(木) 20:32:36.31ID:2TYLONzR U+32ffにはplaceholderも入れてないのか
204デフォルトの名無しさん
2019/03/08(金) 07:46:36.72ID:IGi7MMC9205デフォルトの名無しさん
2019/03/08(金) 14:51:06.96ID:uMMKH+w1206デフォルトの名無しさん
2019/03/08(金) 18:46:01.42ID:soybuSeV その読みにくい文体、中学のマイコン部の先輩が部誌に書いてたコラムに似てるなと思った
207デフォルトの名無しさん
2019/03/08(金) 18:58:34.86ID:8O+4MLhG 内容はともかく
> それに、今みたいなポリコレ棒が猛威を振るう時代だったら、CJK統合は行われなかったでしょうね。
> 部外者が他文化の文字に対してもの申す事は、文化への攻撃・侵害・侵略として糾弾されたでしょうから。
> 日本人や中国人側からではなく、米国や欧州の国々の方から強い反対が出たでしょう。
<https://qiita.com/yumetodo/items/54e1a8230dbf513ea85b#comment-ba92e82cf5ff8a829c10>
↑これはなるほどと思った。政治的正当性についてとやかく言うつもりはないが
CJK統合はマジでそのCJK文化圏にいる利用者からは扱いずらすぎるからな……。
「意味や字形が似ている文字なら同じ符号を割り当てていい」のなら,
フラクツゥールを態々用意せずに,lang=de-x-Frakみたいな指定があったときに
文字「A」を「𝔄」という字形で表示すればいいのに,そうしてない。
> それに、今みたいなポリコレ棒が猛威を振るう時代だったら、CJK統合は行われなかったでしょうね。
> 部外者が他文化の文字に対してもの申す事は、文化への攻撃・侵害・侵略として糾弾されたでしょうから。
> 日本人や中国人側からではなく、米国や欧州の国々の方から強い反対が出たでしょう。
<https://qiita.com/yumetodo/items/54e1a8230dbf513ea85b#comment-ba92e82cf5ff8a829c10>
↑これはなるほどと思った。政治的正当性についてとやかく言うつもりはないが
CJK統合はマジでそのCJK文化圏にいる利用者からは扱いずらすぎるからな……。
「意味や字形が似ている文字なら同じ符号を割り当てていい」のなら,
フラクツゥールを態々用意せずに,lang=de-x-Frakみたいな指定があったときに
文字「A」を「𝔄」という字形で表示すればいいのに,そうしてない。
208デフォルトの名無しさん
2019/03/08(金) 19:17:05.59ID:orP5LHkV 苦情が出た時のために拡張領域があるんだから許してあげてよ。
209デフォルトの名無しさん
2019/03/08(金) 20:40:25.47ID:9ZplOVC2 小さいゐゑヰヱは "used to write archaic Japanese" なんだけど
小さいヲンは実は典拠が微妙
同じワ行音ってことで何となく入っちゃった
小さいヲンは実は典拠が微妙
同じワ行音ってことで何となく入っちゃった
210デフォルトの名無しさん
2019/03/08(金) 20:41:24.22ID:9ZplOVC2 同じってのはヲの方だけど
211デフォルトの名無しさん
2019/03/08(金) 22:42:36.27ID:orP5LHkV リンゴロゴ(U+F8FF)を使った Tim が正しく表示される環境は限定的なのかな?
私は「ティム・アップル」 トランプ氏言い間違えに本人が便乗
https://www.afpbb.com/articles/-/3214744
【3月8日 AFP】米アップル(Apple)のティム・クック(Tim Cook)最高経営責任者(CEO)は7日、
ドナルド・トランプ(Donald Trump)米大統領に名前を呼び間違えられたことを受け、
公式ツイッター(Twitter)アカウントの名前を「ティム・アップル」に変更した。
トランプ氏は6日、ホワイトハウス(White House)で開かれた会合で、
アップルの国内投資と雇用創出について感謝の意を述べた際、クック氏を「ティム・アップル」と呼び、ツイッター上で話題を呼んだ。
するとクック氏は翌朝、これに便乗し、自身のツイッターの表示名を「ティム」の後にアップルのロゴをつけたものに変更。
ツイッターユーザーからは、米マイクロソフト(Microsoft)共同創業者のビル・ゲイツ(Bill Gates)氏を
「ビル・マイクロソフト」、米電気自動車(EV)大手テスラ(Tesla)のイーロン・マスク(Elon Musk)最高経営責任者(CEO)を
「イーロン・テスラ」、初代米大統領のジョージ・ワシントン(George Washington)を
「ジョージ・アメリカ」と呼んだらどうかといったトランプ氏への提案も飛び出した。
ヒラリー・クリントン(Hillary Clinton)元米国務長官を「Crooked Hillary(歪んだヒラリー)」と呼ぶなど、
ニックネームを生み出してきたことで知られるトランプ氏は、過去にも同じような言い間違えをしている。
昨年には、米航空防衛大手ロッキード・マーチン(Lockheed Martin)のマリリン・ヒューソン(Marillyn Hewson)CEOを「マリリン・ロッキード」と紹介した。
(c)AFP
ティム・クック氏のツイッター・アカウント
https://twitter.com/tim_cook
https://twitter.com/5chan_nel (5ch newer account)
私は「ティム・アップル」 トランプ氏言い間違えに本人が便乗
https://www.afpbb.com/articles/-/3214744
【3月8日 AFP】米アップル(Apple)のティム・クック(Tim Cook)最高経営責任者(CEO)は7日、
ドナルド・トランプ(Donald Trump)米大統領に名前を呼び間違えられたことを受け、
公式ツイッター(Twitter)アカウントの名前を「ティム・アップル」に変更した。
トランプ氏は6日、ホワイトハウス(White House)で開かれた会合で、
アップルの国内投資と雇用創出について感謝の意を述べた際、クック氏を「ティム・アップル」と呼び、ツイッター上で話題を呼んだ。
するとクック氏は翌朝、これに便乗し、自身のツイッターの表示名を「ティム」の後にアップルのロゴをつけたものに変更。
ツイッターユーザーからは、米マイクロソフト(Microsoft)共同創業者のビル・ゲイツ(Bill Gates)氏を
「ビル・マイクロソフト」、米電気自動車(EV)大手テスラ(Tesla)のイーロン・マスク(Elon Musk)最高経営責任者(CEO)を
「イーロン・テスラ」、初代米大統領のジョージ・ワシントン(George Washington)を
「ジョージ・アメリカ」と呼んだらどうかといったトランプ氏への提案も飛び出した。
ヒラリー・クリントン(Hillary Clinton)元米国務長官を「Crooked Hillary(歪んだヒラリー)」と呼ぶなど、
ニックネームを生み出してきたことで知られるトランプ氏は、過去にも同じような言い間違えをしている。
昨年には、米航空防衛大手ロッキード・マーチン(Lockheed Martin)のマリリン・ヒューソン(Marillyn Hewson)CEOを「マリリン・ロッキード」と紹介した。
(c)AFP
ティム・クック氏のツイッター・アカウント
https://twitter.com/tim_cook
https://twitter.com/5chan_nel (5ch newer account)
212デフォルトの名無しさん
2019/03/08(金) 23:59:07.12ID:AN9FdtGs Private Use Area を公にさらす変態
213デフォルトの名無しさん
2019/03/09(土) 00:06:34.07ID:bJz0o3uK 私用領域U+E50Aが渋谷109の絵文字に割り当てられているツイッターさんの前でも同じこと言えんの?
https://twitter.com/muota_here/status/657111322656555008
https://twitter.com/5chan_nel (5ch newer account)
https://twitter.com/muota_here/status/657111322656555008
https://twitter.com/5chan_nel (5ch newer account)
214デフォルトの名無しさん
2019/03/09(土) 03:14:15.24ID:JZDf7HgY Tim Appleと呼ばれたTim Cook、Tim Tofuを名乗る。
215デフォルトの名無しさん
2019/03/09(土) 07:26:47.29ID:ZOfzHyh2216デフォルトの名無しさん
2019/03/09(土) 07:28:53.38ID:JheZ4dDX >>207
ぁたιゎゆるさナょぃ
ぁたιゎゆるさナょぃ
217デフォルトの名無しさん
2019/03/09(土) 20:48:52.13ID:3uujbs1q218デフォルトの名無しさん
2019/03/10(日) 00:01:29.10ID:cA8Bnujj >>216
「あたしわゆる」の後なんて書いてあるの?
「あたしわゆる」の後なんて書いてあるの?
219デフォルトの名無しさん
2019/03/10(日) 00:29:48.57ID:XmX8U4WX221デフォルトの名無しさん
2019/03/11(月) 11:18:28.54ID:PmMIa9FT222デフォルトの名無しさん
2019/03/11(月) 12:16:12.73ID:tDJ/xRRJ 我は汝、汝は我。 禁断の叡智は開かれた。
223デフォルトの名無しさん
2019/03/14(木) 16:59:19.77ID:ZsZ3eZF+ UAX #29: Unicode Text Segmentation
http://www.unicode.org/reports/tr29/tr29-35.html#Modifications
Unicode 12.0.0 では新しく U+FF10..U+FF19 の全角数字を数字扱いするようになったのね。
UAX #14 では Ideographic のままだし何で今頃変えたのかよく分からないけど。
http://www.unicode.org/reports/tr29/tr29-35.html#Modifications
Unicode 12.0.0 では新しく U+FF10..U+FF19 の全角数字を数字扱いするようになったのね。
UAX #14 では Ideographic のままだし何で今頃変えたのかよく分からないけど。
224デフォルトの名無しさん
2019/03/14(木) 22:33:54.00ID:+YVU0bVz これから漢数字とか丸数字も数字扱いしだすゾォー^
属性定義するのはいいけど定義をコロコロ変えてんじゃねぇよ
属性定義するのはいいけど定義をコロコロ変えてんじゃねぇよ
225デフォルトの名無しさん
2019/03/15(金) 00:54:56.25ID:h1OQ6sr0226デフォルトの名無しさん
2019/03/15(金) 06:30:19.25ID:/rrmc9zm ダブルクリックで文字列選択するような機能に影響でなければいいけどなあ
鈴木一郎が全部漢字だから一気に選択できたのに一が数字だからってんで
鈴木/一/郎なんて分けられたらやっかいだ
鈴木一郎が全部漢字だから一気に選択できたのに一が数字だからってんで
鈴木/一/郎なんて分けられたらやっかいだ
227デフォルトの名無しさん
2019/03/15(金) 06:41:57.81ID:t7/3/Ky+ Unicodeじゃなくて個別のライブラリの仕様次第だと思うけど、近い将来影響が出てきそうだね。
228デフォルトの名無しさん
2019/03/15(金) 12:06:24.49ID:JrKcPYyj >>226
うわあ
うわあ
229デフォルトの名無しさん
2019/03/15(金) 12:07:15.17ID:JrKcPYyj そういえば(今もそうかは知らないが)Firefoxは「々」がそういう選択のされ方だった。あれはなんでなんだろう。
230デフォルトの名無しさん
2019/03/15(金) 14:05:00.83ID:SEjqglYP 漢数字の数字扱いまだ?
231デフォルトの名無しさん
2019/03/15(金) 15:31:55.15ID:oAURdopD そして参とか陸とかまで数字扱いされて地獄へ
232デフォルトの名無しさん
2019/03/15(金) 15:39:45.46ID:a2hOwysQ ソート順が萬>千>百>拾とかか
233デフォルトの名無しさん
2019/03/15(金) 19:19:14.57ID:WyyrIOit Unicode 11の時点で十進法表記に基づく0-9相当の文字はNumeric扱いされてたようだから
FF10..FF19は確かに漏れだな
http://www.unicode.org/Public/11.0.0/ucd/auxiliary/WordBreakProperty.txt
FF10..FF19は確かに漏れだな
http://www.unicode.org/Public/11.0.0/ucd/auxiliary/WordBreakProperty.txt
234デフォルトの名無しさん
2019/03/15(金) 19:36:37.30ID:t7/3/Ky+ 正規表現ライブラリpcreは境界判定\bや英数字判定\wの判定方法をフラグPCRE_UCPで切り替えられるようになっている。
grepの-Pオプションはpcreを使うのだけど、境界判定\bが-Eオプションと違う動きになる。PCRE_UCPオプションを使ってビルドいないからだろうと思う。
grepの-Pオプションはpcreを使うのだけど、境界判定\bが-Eオプションと違う動きになる。PCRE_UCPオプションを使ってビルドいないからだろうと思う。
235デフォルトの名無しさん
2019/03/22(金) 01:21:11.28ID:8w4+OmEG ふむ
236デフォルトの名無しさん
2019/03/23(土) 19:29:06.12ID:4GARFTFw ふまない
237デフォルトの名無しさん
2019/03/23(土) 23:02:35.35ID:GanpYc3U ふまれたい
238デフォルトの名無しさん
2019/03/24(日) 03:18:52.69ID:OrJDHzVf フモフモ
239デフォルトの名無しさん
2019/03/24(日) 11:24:12.73ID:Rpzr04ID もふもふ
240デフォルトの名無しさん
2019/03/24(日) 14:16:39.59ID:2vsRyi47 このスレかどっかでC99で作られたUnicodeライブラリの紹介を見掛けた気がするんだけど
誰か知らないですか。
確かに5ちゃんねるの文字コード関連のレスで
「---っていうライブラリが便利だよ」みたいな文章だったと思うんですけど。。。
なぜかそのとき ライブラリのWebページをブクマし忘れてて そのライブラリの名前を失念してしまったんです
誰か知らないですか。
確かに5ちゃんねるの文字コード関連のレスで
「---っていうライブラリが便利だよ」みたいな文章だったと思うんですけど。。。
なぜかそのとき ライブラリのWebページをブクマし忘れてて そのライブラリの名前を失念してしまったんです
241デフォルトの名無しさん
2019/03/24(日) 14:32:46.63ID:DqM6OskA 過去様が卒業したとこ
242デフォルトの名無しさん
2019/03/24(日) 16:01:40.15ID:4oYv+rwZ 未来様。
243デフォルトの名無しさん
2019/03/27(水) 17:42:59.30ID:WhOBGSwK ICUは有名なのですぐ見付かるだろうしなによりC99じゃない。
utf8procじゃねーの?
utf8procじゃねーの?
244デフォルトの名無しさん
2019/04/01(月) 17:18:38.72ID:89NTFMVc このスレのみんなは㋿だって先に知ってたんだな
245デフォルトの名無しさん
2019/04/01(月) 20:45:19.42ID:rsPxYoMK お前ら、システム改修の時は互換漢字もちゃんと考慮しろよ
https://twitter.com/yabuki/status/1112565487995518979
https://twitter.com/5chan_nel (5ch newer account)
https://twitter.com/yabuki/status/1112565487995518979
https://twitter.com/5chan_nel (5ch newer account)
246デフォルトの名無しさん
2019/04/01(月) 22:00:00.14ID:SiO8nKzk 新元号発表の時の墨書、楷書体だけど「令」の字形はU+F9A8に似ていた。
何らかの揉め事になって面白い事になるかも。
何らかの揉め事になって面白い事になるかも。
247デフォルトの名無しさん
2019/04/01(月) 23:51:37.27ID:PpRhn1A4 てか「人一卩」と「人丶マ」は異体字セレクタにあるけど、官房長官が掲げた「人丶卩」が無いな
248デフォルトの名無しさん
2019/04/02(火) 02:25:50.36ID:v8tjfRTs Gengo-Oshuujiコレクションを申請するときがきたか
249デフォルトの名無しさん
2019/04/02(火) 07:20:09.23ID:DRYM+8L2 あのお習字も公文書扱いらしいな
汎用電子あたりにぶち込んでいいぞ
汎用電子あたりにぶち込んでいいぞ
250デフォルトの名無しさん
2019/04/02(火) 10:10:03.96ID:GTYTa8Tr 個人的には新元号に2004年のJISで例示字形変更された字や第2水準以下の字が使われなくて良かったと思ってる。
251デフォルトの名無しさん
2019/04/02(火) 12:05:10.00ID:5+C+zQyU252デフォルトの名無しさん
2019/04/02(火) 12:10:05.14ID:5+C+zQyU253デフォルトの名無しさん
2019/04/02(火) 14:05:03.11ID:k+6mhhx+ 新元号「令和」と文字コード(主にUnicode)の問題
https://togetter.com/li/1333809
https://togetter.com/li/1333809
254デフォルトの名無しさん
2019/04/02(火) 18:12:09.33ID:ONyiz5iP アドビのフォントが新元号「令和」に対応--2パターンの合字を追加
https://japan.cnet.com/article/35135080/
この手の合字をもっと増やしてもいいと思う。絵文字をボコボコ増やすよりも有意義だ。
㌀、㍇は既にある。ゲートウェイの合字があると面白い。
山手線の新駅の名前に使える。
https://japan.cnet.com/article/35135080/
この手の合字をもっと増やしてもいいと思う。絵文字をボコボコ増やすよりも有意義だ。
㌀、㍇は既にある。ゲートウェイの合字があると面白い。
山手線の新駅の名前に使える。
255デフォルトの名無しさん
2019/04/02(火) 21:47:42.61ID:qF1eZplP 集合住宅名にありがちシリーズだと㌞・㌪はあるがヒルズとかテラスとかがないな
256デフォルトの名無しさん
2019/04/02(火) 23:57:38.32ID:6o2aISb6 いらんわ
257デフォルトの名無しさん
2019/04/03(水) 19:17:17.44ID:1gOVHweX Unicodeに入れるのはむりぽ
AJ1ならワンチャンあるかも
AJ1ならワンチャンあるかも
258デフォルトの名無しさん
2019/04/03(水) 22:13:58.47ID:FgHYrjKu259デフォルトの名無しさん
2019/04/03(水) 23:15:11.57ID:cN3kYbRs 常用漢字から選ぶとは最初に告知されてたが、
2010年追加の常用漢字の中には第2水準以下だったりJIS2004で字形変更されて
2点しんにょうや古い食へんの字があるよな。
教育漢字にはならなくて小学校では習わない字のままだったけど。
2010年追加の常用漢字の中には第2水準以下だったりJIS2004で字形変更されて
2点しんにょうや古い食へんの字があるよな。
教育漢字にはならなくて小学校では習わない字のままだったけど。
260デフォルトの名無しさん
2019/04/04(木) 00:45:49.30ID:gljFUA1G あの「令和」っていう習字の画像って公文書として入手できないのかな。
261デフォルトの名無しさん
2019/04/04(木) 01:42:15.29ID:WKiiXHnA 習字の意味分かってる?
262デフォルトの名無しさん
2019/04/04(木) 02:37:07.88ID:RbPEvSJ+ どのメーカーの半紙と墨汁を使ったか公開すればバカ売れだな
263デフォルトの名無しさん
2019/04/04(木) 03:17:29.09ID:sXgQQUMv 字が下手過ぎた
やり直せ
やり直せ
264デフォルトの名無しさん
2019/04/04(木) 08:30:46.45ID:VfgtU/Z4 https://twitter.com/yanok/status/1113052042254143489
令の字に関してなぜかU+F9A8なんて話が流れてきた。韓国KSコード由来の互換漢字。
これは『改訂新版 プログラマのための文字コード技術入門』p.110に書いたような理由で入ったものだけども、扱うことはまずないのでは。
それ言うんならU+2F24の「⼤」を使った「⼤正」は今までチェックしてたのかい?
これはUnicodeになぜか別立てで入っている康熙部首の符号位置。
https://twitter.com/5chan_nel (5ch newer account)
令の字に関してなぜかU+F9A8なんて話が流れてきた。韓国KSコード由来の互換漢字。
これは『改訂新版 プログラマのための文字コード技術入門』p.110に書いたような理由で入ったものだけども、扱うことはまずないのでは。
それ言うんならU+2F24の「⼤」を使った「⼤正」は今までチェックしてたのかい?
これはUnicodeになぜか別立てで入っている康熙部首の符号位置。
https://twitter.com/5chan_nel (5ch newer account)
265デフォルトの名無しさん
2019/04/04(木) 13:53:52.02ID:lQbbBBhx リとり間違うような恥ずかしい間違いだな
266デフォルトの名無しさん
2019/04/04(木) 15:25:32.68ID:c6BVWPCA >>264
電子化された契約文書に大正の年号が使われることがないから影響もなかった。
電子化された契約文書に大正の年号が使われることがないから影響もなかった。
267デフォルトの名無しさん
2019/04/06(土) 15:08:14.87ID:uziyxFMz 大正時代に生まれた人なんかいくらでも電子管理の対象になりうるだろ
268デフォルトの名無しさん
2019/04/06(土) 19:32:01.25ID:EXSfDg77 大正はIME類に成語として登録されてるからよっぽどでもないかぎり他の大は出てこんわね。
でも令和は現状自由変換状態で、この状況はみんなのスマホやPCが“令和対応”のものに更新されるまで当面続く。
そこに「こっちの令が正しい形」説が追い打ちをかけてきてるのが困ったところ。
でも令和は現状自由変換状態で、この状況はみんなのスマホやPCが“令和対応”のものに更新されるまで当面続く。
そこに「こっちの令が正しい形」説が追い打ちをかけてきてるのが困ったところ。
269デフォルトの名無しさん
2019/04/07(日) 11:42:20.44ID:8ULyWhed じゃあ令和もIME登録したらいい,って思っちゃうのは素人考えなんですかね。
270デフォルトの名無しさん
2019/04/07(日) 14:27:30.40ID:LEvc5MB9 他人のIMEに一括登録できるなら何かのプロだな。
あるいは単に問題を取り違えてる素人かもしれん。
あるいは単に問題を取り違えてる素人かもしれん。
271デフォルトの名無しさん
2019/04/08(月) 00:28:20.42ID:gS267+Xj 令和
令和
令和
272デフォルトの名無しさん
2019/04/08(月) 12:50:59.09ID:mdLXKZZ1 江戸時代の地震記録した古文書495点 市民参加して解読完了!「くずし字学んだ」 2019年04月07日 06時00分 @ハザードラボ
https://www.hazardlab.jp/know/topics/detail/2/8/28696.html
https://www.hazardlab.jp/contents/post_info/2/8/6/28696/09_01.png
江戸時代の古文書に記録された災害の歴史。くずし字を現代文字に直しながら読んでいくプロジェクトだ(京都大)
京都大学は、地震研究所図書室が所蔵する江戸時代の地震を記録した古文書495点の解読を終了したと発表した。
2017年1月にスタートした解読作業は、4600人を超える一般市民が参加してくずし字で書かれている古文書を、一字ずつ現代文字に活字化するという
プロジェクトで、過去の災害の歴史を学ぶきっかけにつながるという。
古代から地震が多かった日本では、『日本書紀』に残る416年の「允恭(いんぎょう)地震」を最古として、数多くの史料が残されている。しかし、解読されたのは
そのうちのほんの一部で、有益な情報のほとんどが手付かずの状態だ。
https://www.hazardlab.jp/know/topics/detail/2/8/28696.html
https://www.hazardlab.jp/contents/post_info/2/8/6/28696/09_01.png
江戸時代の古文書に記録された災害の歴史。くずし字を現代文字に直しながら読んでいくプロジェクトだ(京都大)
京都大学は、地震研究所図書室が所蔵する江戸時代の地震を記録した古文書495点の解読を終了したと発表した。
2017年1月にスタートした解読作業は、4600人を超える一般市民が参加してくずし字で書かれている古文書を、一字ずつ現代文字に活字化するという
プロジェクトで、過去の災害の歴史を学ぶきっかけにつながるという。
古代から地震が多かった日本では、『日本書紀』に残る416年の「允恭(いんぎょう)地震」を最古として、数多くの史料が残されている。しかし、解読されたのは
そのうちのほんの一部で、有益な情報のほとんどが手付かずの状態だ。
273デフォルトの名無しさん
2019/04/08(月) 12:51:41.80ID:mdLXKZZ1 くずし字学習アプリを使ってゲーム感覚で学ぶ
https://www.hazardlab.jp/contents/post_info/2/8/6/28696/cover.jpg
翻刻が終わった『地震年代記』(国立民族博物館)
京都大学大学院の「古地震研究会」は2017年1月、東大地震研究所の図書室が所蔵する古文書495点をインターネット上に公開し、Wikipediaのように閲覧者が
現代文字に書き換えるプロジェクトを開始。これまでに4626人が登録し、このうち347人が実際に文字の入力作業に参加した結果、新書30?35冊分の文字数に
あたる465万文字が入力されたという。
「みんなで翻刻」というこのサイトには、数多くのくずし字のパターンや、江戸時代の本から収集した3000種類近い熟語が収録されており、
くずし字学習支援アプリと連携することで、初心者でもくずし字を学ぶことができる機能が備わっている。(翻刻=文字起こし)
過去の災害の歴史を学ぶきっかけに
https://www.hazardlab.jp/contents/post_info/2/8/6/28696/apri.png
学習アプリを使って、ゲーム感覚でくずし字を学ぶ
スタート当初は、地震研究所二代目所長をつとめた地震学者の石本巳四雄(みしお)氏がコレクションした114点の災害史料の翻刻を目標としていたが、
開始から5カ月後には完了。その後、資料を追加することで495点すべての作業が終わった。
今後は、ほかの資料館が所蔵する史料も登録を進め、翻刻を続ける計画なので、興味がある人は今からでも遅くない。パソコン1台あれば誰でもアクセス
できるので、ぜひ一度サイトを訪問してほしい。古文書の解読の楽しさはもちろん、自分が住んでいる地域で過去に起こった地震の歴史を学ぶこともできる。
https://www.hazardlab.jp/contents/post_info/2/8/6/28696/cover.jpg
翻刻が終わった『地震年代記』(国立民族博物館)
京都大学大学院の「古地震研究会」は2017年1月、東大地震研究所の図書室が所蔵する古文書495点をインターネット上に公開し、Wikipediaのように閲覧者が
現代文字に書き換えるプロジェクトを開始。これまでに4626人が登録し、このうち347人が実際に文字の入力作業に参加した結果、新書30?35冊分の文字数に
あたる465万文字が入力されたという。
「みんなで翻刻」というこのサイトには、数多くのくずし字のパターンや、江戸時代の本から収集した3000種類近い熟語が収録されており、
くずし字学習支援アプリと連携することで、初心者でもくずし字を学ぶことができる機能が備わっている。(翻刻=文字起こし)
過去の災害の歴史を学ぶきっかけに
https://www.hazardlab.jp/contents/post_info/2/8/6/28696/apri.png
学習アプリを使って、ゲーム感覚でくずし字を学ぶ
スタート当初は、地震研究所二代目所長をつとめた地震学者の石本巳四雄(みしお)氏がコレクションした114点の災害史料の翻刻を目標としていたが、
開始から5カ月後には完了。その後、資料を追加することで495点すべての作業が終わった。
今後は、ほかの資料館が所蔵する史料も登録を進め、翻刻を続ける計画なので、興味がある人は今からでも遅くない。パソコン1台あれば誰でもアクセス
できるので、ぜひ一度サイトを訪問してほしい。古文書の解読の楽しさはもちろん、自分が住んでいる地域で過去に起こった地震の歴史を学ぶこともできる。
274デフォルトの名無しさん
2019/04/08(月) 12:54:44.65ID:mdLXKZZ1 みんなで翻刻
https://honkoku.org/
https://honkoku.org/
275デフォルトの名無しさん
2019/04/09(火) 12:37:03.63ID:cLV16Pee UTF-8って、制御コード含まれることはないんだっけか
276デフォルトの名無しさん
2019/04/09(火) 13:07:46.20ID:9ML7UTJk だぶりのコードもあるし
不正コードでおかしくなるシステムもある
不正コードでおかしくなるシステムもある
277デフォルトの名無しさん
2019/04/09(火) 14:29:47.00ID:KelUteYn だぶりのわたなべさん
278デフォルトの名無しさん
2019/04/09(火) 23:57:15.76ID:7iU2pxay279デフォルトの名無しさん
2019/04/13(土) 16:03:07.58ID:UCcAxlmJ280デフォルトの名無しさん
2019/04/16(火) 14:56:33.54ID:l4UDEMAP 新元号名で使用する文字コードについて(周知)
https://www.meti.go.jp/policy/it_policy/kaigen/20190405_kaigen_code.pdf
https://www.meti.go.jp/policy/it_policy/kaigen/20190405_kaigen_code.pdf
281デフォルトの名無しさん
2019/04/19(金) 00:40:25.06ID:SszpXZZX 周知元年
282デフォルトの名無しさん
2019/04/19(金) 00:42:08.08ID:E436SlHO 草なぎの剣って
なぎはどの字が正解?
なぎはどの字が正解?
283デフォルトの名無しさん
2019/04/19(金) 00:45:03.52ID:p/ztoCUW 薙
284デフォルトの名無しさん
2019/04/19(金) 02:32:47.43ID:ixte0yp9 〓
285デフォルトの名無しさん
2019/04/19(金) 06:10:41.34ID:XxVTl/mO 草[データ欠損]の剣
286デフォルトの名無しさん
2019/04/19(金) 14:43:52.39ID:K/dFwraF wwwの件
287デフォルトの名無しさん
2019/04/19(金) 15:47:39.94ID:y/MVEQAL 草なぎって芸柏lにいるよな
288デフォルトの名無しさん
2019/04/20(土) 21:38:10.03ID:F8mbqA+i >>254
Unicodeに収録されている「パーツ」と「ほか」が追加されるとUnicode仮名合字が揃うから最優先
Unicodeに収録されている「パーツ」と「ほか」が追加されるとUnicode仮名合字が揃うから最優先
289デフォルトの名無しさん
2019/04/21(日) 01:51:55.93ID:ojSCyBaB タイ行きたくなってきた
290デフォルトの名無しさん
2019/04/21(日) 01:54:55.60ID:x0mJ9C0y お?GoGoか?それともMP?w
291デフォルトの名無しさん
2019/04/21(日) 13:49:25.89ID:tITQ2Bq3292デフォルトの名無しさん
2019/04/21(日) 17:44:13.32ID:sl+JTl2l どれや
293デフォルトの名無しさん
2019/04/21(日) 23:16:48.91ID:oi8OpLnl ψ
294デフォルトの名無しさん
2019/04/21(日) 23:28:17.18ID:sMtprdSr >>291
GW?
GW?
295デフォルトの名無しさん
2019/04/21(日) 23:34:13.27ID:Ac4MsT8t >>293
ソ連の旗に書いてあるやつ?
ソ連の旗に書いてあるやつ?
296デフォルトの名無しさん
2019/04/22(月) 02:38:56.56ID:V0Ep5EOp 鋤?
297デフォルトの名無しさん
2019/04/22(月) 03:12:27.93ID:3Wv0MOni >>296
見ているとゲシュタポ崩壊してくる
見ているとゲシュタポ崩壊してくる
298デフォルトの名無しさん
2019/04/22(月) 04:58:25.98ID:K/a5X4tg 屮屮
299デフォルトの名無しさん
2019/04/22(月) 06:48:42.73ID:LkdKQQlY †
300デフォルトの名無しさん
2019/04/22(月) 21:46:31.50ID:KyfckjPA 艸
301デフォルトの名無しさん
2019/04/22(月) 23:13:49.10ID:7Lb1KZDb 草ァ!
302デフォルトの名無しさん
2019/04/26(金) 15:10:00.86ID:h/0smdVx 役所から『楷書体の“令和”の“令”の“マ”を明朝体のように縦棒に直せ』と指示がきた「どっちでもいいはずでは」
https://togetter.com/li/1341711
https://togetter.com/li/1341711
303デフォルトの名無しさん
2019/04/26(金) 16:10:02.69ID:ICRz1tVq これ結果的に包摂への理解が世間に広がれるきっかけになればいいなあ
304デフォルトの名無しさん
2019/04/26(金) 17:26:05.43ID:kg5yc1Gc 令の下はアベのアが正しいと閣議決定
305デフォルトの名無しさん
2019/04/26(金) 20:07:56.08ID:vOVYhDJF あそうのアと聞いたが
306デフォルトの名無しさん
2019/04/26(金) 21:07:22.44ID:zkZoCC1n 昭和天皇「あっそう」
307デフォルトの名無しさん
2019/04/30(火) 00:24:58.84ID:fTPg0Gzh 準備は万全でしょうか?
308デフォルトの名無しさん
2019/04/30(火) 02:48:38.56ID:qV7WSa+K309デフォルトの名無しさん
2019/04/30(火) 03:08:50.84ID:SjzICe9T 影響なんぞあるかなあ?
310デフォルトの名無しさん
2019/04/30(火) 10:48:06.61ID:O+RhbMFB もし見える環境なら
これ
↓
㋿
らしい
これ
↓
㋿
らしい
311デフォルトの名無しさん
2019/04/30(火) 10:51:51.20ID:M/y36yih 裏向きですよ官房長官
312デフォルトの名無しさん
2019/04/30(火) 19:08:38.83ID:mmURSAfG 理屈と軟膏はどこにでも付くなw
313デフォルトの名無しさん
2019/05/01(水) 00:10:53.03ID:Cxjz7JYJ 皆さまご無事ですか?
314デフォルトの名無しさん
2019/05/01(水) 03:27:20.94ID:zkmvQa1R 応答がありませんね…
315デフォルトの名無しさん
2019/05/01(水) 16:53:36.94ID:qjSscuuh Unicode、~ のように一文字版の令和を追加
https://hayabusa9.5ch.net/test/read.cgi/news/1556695686/
https://hayabusa9.5ch.net/test/read.cgi/news/1556695686/
316デフォルトの名無しさん
2019/05/01(水) 19:22:56.99ID:PSa6BJih 元号合字はBCだと思ってたのに
新しく増やす余地があるのなら慶応以前のもないと気持ち悪いなあ
保元とか平治とかちょうだいよ
新しく増やす余地があるのなら慶応以前のもないと気持ち悪いなあ
保元とか平治とかちょうだいよ
317デフォルトの名無しさん
2019/05/02(木) 02:19:04.44ID:oFArPNDY318デフォルトの名無しさん
2019/05/02(木) 02:56:54.78ID:fwW+HFuA 官房長官が額縁を掲げたという先例をそのまま踏襲したことにより、
将来にわたる日本の改元時儀式が爆誕した瞬間である
将来にわたる日本の改元時儀式が爆誕した瞬間である
319デフォルトの名無しさん
2019/05/02(木) 23:10:42.85ID:/beTzGTL ~みたいなのってNECの外字由来じゃなかったっけ
なんで今さらシフトJIS時代の遺物の仲間みたいなものを増やすんだか
なんで今さらシフトJIS時代の遺物の仲間みたいなものを増やすんだか
320デフォルトの名無しさん
2019/05/02(木) 23:35:48.89ID:I+5xWFxb 「シフトJIS時代の遺物」に依存している人が少なからずいて、その人たちが令和のも作られるのを望んだんだろ
321デフォルトの名無しさん
2019/05/02(木) 23:45:38.82ID:7n99qwI2 つってもシフトJIS時代の遺物アプリケーションでは使えないんだぞ。なんだそれ。
322デフォルトの名無しさん
2019/05/03(金) 00:00:56.27ID:wXDfhaGQ >>321
それで使えなくてもかまわないんだろ
それで使えなくてもかまわないんだろ
323デフォルトの名無しさん
2019/05/03(金) 00:03:09.80ID:97u3Xpxh 世の中の大部分のワープロソフトはunicode対応済みだからSJIS縛りはない。
324デフォルトの名無しさん
2019/05/03(金) 08:59:56.88ID:zgghhlv4 U+32FFのスポンサーになるやつおらんの
http://unicode.org/consortium/adopted-characters.html
http://unicode.org/consortium/adopted-characters.html
325デフォルトの名無しさん
2019/05/03(金) 14:14:26.24ID:/bmAVHAq >>319
IT技術者なら使わないけど、変換候補に出でくるものを使うのがなぜいけないのかと思うのが世の中の大半。
IT技術者なら使わないけど、変換候補に出でくるものを使うのがなぜいけないのかと思うのが世の中の大半。
326デフォルトの名無しさん
2019/05/03(金) 14:38:44.99ID:22DEOz6X327デフォルトの名無しさん
2019/05/03(金) 14:42:17.77ID:3Vz/qKoh328デフォルトの名無しさん
2019/05/03(金) 14:46:59.15ID:Q171sR7D >>327
入れるのを望む人が少ないから入らないんだろ
入れるのを望む人が少ないから入らないんだろ
329デフォルトの名無しさん
2019/05/04(土) 10:55:56.42ID:mtwbaS1U KB4495667 適用記念カキコ
合紫順~㋿
https://support.microsoft.com/ja-jp/help/4495667/windows-10-update-kb4495667
合紫順~㋿
https://support.microsoft.com/ja-jp/help/4495667/windows-10-update-kb4495667
330デフォルトの名無しさん
2019/05/04(土) 20:44:56.14ID:Hwt49Fxi 令和対応のWindows Updateは適用しないでください
https://osdn.net/projects/kancollesniffer/news/26014
https://osdn.net/projects/kancollesniffer/news/26014
331デフォルトの名無しさん
2019/05/05(日) 09:10:16.53ID:vN64IIVG >>330
MS UI Gothicは等幅フォントだったのか
MS UI Gothicは等幅フォントだったのか
332デフォルトの名無しさん
2019/05/05(日) 14:06:52.01ID:a/tGSf18 仮に慶応以前も入れるとしたらさすがにBMP外だろうな。
333デフォルトの名無しさん
2019/05/05(日) 15:38:00.22ID:vTdWYBgo >>330
ワロヌ
ワロヌ
334デフォルトの名無しさん
2019/05/05(日) 15:55:58.30ID:9Ygu+RTn >>330
自分の設計ミスじゃねーかw
自分の設計ミスじゃねーかw
335デフォルトの名無しさん
2019/05/05(日) 16:30:52.35ID:O86syOAN GW入る前からそういう話を聞いてたけど
https://twitter.com/u_1mu/status/1122083801662803968
https://twitter.com/5chan_nel (5ch newer account)
https://twitter.com/u_1mu/status/1122083801662803968
https://twitter.com/5chan_nel (5ch newer account)
336デフォルトの名無しさん
2019/05/05(日) 16:49:51.40ID:2d0rYk3C まあDLLバージョン非互換地獄みたいなのと根は同じと考えれば大変だなと思う
337デフォルトの名無しさん
2019/05/05(日) 19:01:34.13ID:McO+DcFw おそらく今世紀半ば頃になるだろう令和の次以降も組み文字入れるつもりなのだろうか?
338デフォルトの名無しさん
2019/05/05(日) 20:35:38.58ID:l5IfNH0H 不思議なもんで平成31年がはるか昔のように感じられる。
339デフォルトの名無しさん
2019/05/05(日) 21:59:40.84ID:i5vkPu2K340デフォルトの名無しさん
2019/05/05(日) 23:33:12.08ID:afKxHVhL >>339
問題が出るのがWinFormsだけとは限らない(少なくともExcelは確実に再現する)らしいから
GW明けには大問題になりそうな気がするんだけど、いまのところ全然そんな話になってないのがちょっと怖い
まさか「令和」の合字を付け足すだけのWindowsUpdateで
フォント幅の定義が勝手に変更されるなんて思わないよな・・・・
不幸中の幸いは「Microsoftがやらかしたことなんで開発側も被害者です」と言い張れることか
問題が出るのがWinFormsだけとは限らない(少なくともExcelは確実に再現する)らしいから
GW明けには大問題になりそうな気がするんだけど、いまのところ全然そんな話になってないのがちょっと怖い
まさか「令和」の合字を付け足すだけのWindowsUpdateで
フォント幅の定義が勝手に変更されるなんて思わないよな・・・・
不幸中の幸いは「Microsoftがやらかしたことなんで開発側も被害者です」と言い張れることか
341デフォルトの名無しさん
2019/05/06(月) 00:01:39.11ID:Y5VmjYQ0 勝手に見た目が変わってしまうのは迷惑と言えば迷惑だけど、それが問題かというと
大半はそうでもないんでない?スマホアプリほど表示サイズにシビアでもないだろうし。
大半はそうでもないんでない?スマホアプリほど表示サイズにシビアでもないだろうし。
342デフォルトの名無しさん
2019/05/06(月) 00:09:47.64ID:6izbbc1p343デフォルトの名無しさん
2019/05/06(月) 00:27:47.76ID:Y5VmjYQ0 印刷フォームのレイアウトが崩れたりとかはあるかな。
ただまぁ、印刷用フォントにUI Gothic使ってたりしたらそれ自体バグと言っていいかもしれない。
ただまぁ、印刷用フォントにUI Gothic使ってたりしたらそれ自体バグと言っていいかもしれない。
344デフォルトの名無しさん
2019/05/06(月) 19:57:45.87ID:o0+2Jvom Excelの罫線で帳票造って印刷してるところは阿鼻叫喚だなω
345デフォルトの名無しさん
2019/05/06(月) 20:29:59.74ID:Ao47xCvU なんだかな感がありつつもさすがに影響でかいから修正すると思うけど、
ユーザー側が最新に合わせて調整し終えたところで修正が入って再阿鼻叫喚ありそう
ユーザー側が最新に合わせて調整し終えたところで修正が入って再阿鼻叫喚ありそう
346デフォルトの名無しさん
2019/05/06(月) 23:24:02.94ID:w/vwmWEJ そもそもExcelの印刷機能はプリンタが変わっただけで文字切れする
347デフォルトの名無しさん
2019/05/06(月) 23:43:52.79ID:lqbkXOHI レイアウトが崩れても見なくなる部分がなければ最悪なんとかなるけど
切れて見えなくなる部分で影響が有ると嫌だな
自分は余裕を持たせる事が多いけど
やたらピッタリにしろ
っていう圧力が強いんだよなぁ
切れて見えなくなる部分で影響が有ると嫌だな
自分は余裕を持たせる事が多いけど
やたらピッタリにしろ
っていう圧力が強いんだよなぁ
348デフォルトの名無しさん
2019/05/07(火) 02:19:33.96ID:GL9QN5WP 知らないんだけどExcelってフォント埋め込みできないの?
349デフォルトの名無しさん
2019/05/07(火) 11:57:21.14ID:33OoCrhk WYSIWYG ってどこ行ったん
350デフォルトの名無しさん
2019/05/08(水) 12:24:09.58ID:edc8315b The Unicode Blog: Unicode Version 12.1 released in support of the Reiwa Era
http://blog.unicode.org/2019/05/unicode-12-1-en.html
The Unicode Blog: Unicode コンソーシアムは「令和」をサポートする Unicode 12.1 を正式リリースしました
http://blog.unicode.org/2019/05/unicode-12-1-jp.html
Unicode 12.1.0
http://www.unicode.org/versions/Unicode12.1.0/
Unicode 12.1.0キター
http://blog.unicode.org/2019/05/unicode-12-1-en.html
The Unicode Blog: Unicode コンソーシアムは「令和」をサポートする Unicode 12.1 を正式リリースしました
http://blog.unicode.org/2019/05/unicode-12-1-jp.html
Unicode 12.1.0
http://www.unicode.org/versions/Unicode12.1.0/
Unicode 12.1.0キター
351デフォルトの名無しさん
2019/05/08(水) 12:34:08.70ID:EI+Yt2nX 令和は入れて金正恩は入れないのはダブスタじゃないんですか
352デフォルトの名無しさん
2019/05/08(水) 14:17:35.02ID:Y9Xu92ZN そちらの事情詳しくないんだけど最新版ではじょんうんもコード振られてるの?
353デフォルトの名無しさん
2019/05/08(水) 16:59:08.16ID:hW7QTTE+ 2011年に改訂されて三代目の文字が追加されたと言われているな。
去年L2に文書が出てた。
http://www.unicode.org/L2/L2018/18011-info-kps9566-2011.pdf
去年L2に文書が出てた。
http://www.unicode.org/L2/L2018/18011-info-kps9566-2011.pdf
354デフォルトの名無しさん
2019/05/08(水) 17:50:08.89ID:+GcC1zVN いきなり?で草
外に向けて公式発表とかはしてないのか
外に向けて公式発表とかはしてないのか
355デフォルトの名無しさん
2019/05/08(水) 19:23:31.67ID:D1yI4PRN 令和の合字(U+32FF)は結局シフトJIS環境では使えないし、
まだこれを含むフォントがインストールされてなく表示出来ない事がある環境依存文字だから使うなとか
そもそも互換文字だから使うな、「令」(U+4EE4)と「和」(U+548C)を並べて書けとか言われるんやろ
まだこれを含むフォントがインストールされてなく表示出来ない事がある環境依存文字だから使うなとか
そもそも互換文字だから使うな、「令」(U+4EE4)と「和」(U+548C)を並べて書けとか言われるんやろ
356デフォルトの名無しさん
2019/05/08(水) 23:41:31.32ID:g6pGEhqR どうせ、利用するフォントによって、どの文字まで表示できるか?決まるんだから
変な文字は使わず、90年までの規格で止めとくほうが正解かもね。
変な文字は使わず、90年までの規格で止めとくほうが正解かもね。
357デフォルトの名無しさん
2019/05/09(木) 12:49:52.00ID:MGsavNMK 今回はそういう話じゃないぞ
358デフォルトの名無しさん
2019/05/09(木) 23:57:50.74ID:2Upif9A1 令和組み文字はCP932には入れないようだが、
JISX0213には入れるのだろうか?
JISX0213には入れるのだろうか?
359デフォルトの名無しさん
2019/05/10(金) 00:24:53.97ID:jEyv0NCa つーかそろそろ日本工業規格も令和に対応すべきだと思うのだが。
JIX X 0213だけじゃなくてJIS X 0301とかも。
JIX X 0213だけじゃなくてJIS X 0301とかも。
360デフォルトの名無しさん
2019/05/10(金) 08:46:20.50ID:ObISzXw3 CP932に追加は無いだろうけど最近の過去互換の軽視ぷりからするとやらかす可能性が完全0じゃないのが怖い
361デフォルトの名無しさん
2019/05/10(金) 10:21:33.96ID:6UVTgwma 半角カタカナも滅べば良いし
年号の合字も無限に増やすのは無理だから
常に二文字表記で文字幅で調整すれば良い
天皇陛下万歳
千代に八千代に
年号の合字も無限に増やすのは無理だから
常に二文字表記で文字幅で調整すれば良い
天皇陛下万歳
千代に八千代に
362デフォルトの名無しさん
2019/05/10(金) 14:53:16.98ID:CKiiAb8j Android Qに絵文字64種類が追加。うち53種類が男女区別あいまいな人物のデザイン
https://japanese.engadget.com/2019/05/09/android-q-64-53/
https://japanese.engadget.com/2019/05/09/android-q-64-53/
363デフォルトの名無しさん
2019/05/10(金) 18:18:29.29ID:mVkH2fqp das emoji
364デフォルトの名無しさん
2019/05/11(土) 22:48:01.24ID:+ReHs7Ms 絵文字とかと同じ 令[ZWJ]和 でいいのにな
専用の文字コードが必要なのかと
専用の文字コードが必要なのかと
365デフォルトの名無しさん
2019/05/12(日) 01:19:24.51ID:ki3sPmcj 漢字のジョイントって意図が不明瞭にならないか?
偏旁に配置した新字を創字したいのかなと思ってしまう
偏旁に配置した新字を創字したいのかなと思ってしまう
366デフォルトの名無しさん
2019/05/12(日) 13:36:08.25ID:VATOmp33 ほとんど見掛けないけど漢字位置記述文字みたいなの使えば?
367デフォルトの名無しさん
2019/05/12(日) 16:00:08.02ID:Pj0ORKPL あれは人間への説明用であって合成して表示させるものじゃないから違うような
> the reader can then create a mental picture of the ideographs from the description.
> In particular, support for the characters in the Ideographic Description block does not require the rendering engine to recreate the graphic appearance of the described character.
> the reader can then create a mental picture of the ideographs from the description.
> In particular, support for the characters in the Ideographic Description block does not require the rendering engine to recreate the graphic appearance of the described character.
368デフォルトの名無しさん
2019/05/12(日) 19:33:59.77ID:VATOmp33 あ,そうなのか。
あれを適切に設定すれば,対応したビューアで自由に漢字が表現できるもんだとばかり……。
教えてくれてありがとう。
あれを適切に設定すれば,対応したビューアで自由に漢字が表現できるもんだとばかり……。
教えてくれてありがとう。
369デフォルトの名無しさん
2019/05/12(日) 21:21:35.48ID:3Fo18FOg あれだと縦書きと横書きで並び変えられないしね
欲しいのは組み文字ジョインター
キ[KMJ]ジ[KMJ]マア[KMJ]パ[KMJ]ー[KMJ]ト
これで
キジアパ
マ ート
マキ
ジ
│ア
トパ
をつくりたい
欲しいのは組み文字ジョインター
キ[KMJ]ジ[KMJ]マア[KMJ]パ[KMJ]ー[KMJ]ト
これで
キジアパ
マ ート
マキ
ジ
│ア
トパ
をつくりたい
370デフォルトの名無しさん
2019/05/12(日) 21:26:39.48ID:C+tli6s4 ジョインター?
ジョイナーでは?w
ジョイナーでは?w
371デフォルトの名無しさん
2019/05/12(日) 22:42:17.83ID:7HEr7+9q ジョイナス
372デフォルトの名無しさん
2019/05/13(月) 13:30:46.64ID:Dlu9US9y 女医
茄子
茄子
373デフォルトの名無しさん
2019/05/13(月) 14:31:34.73ID:iR6Bb+jK へへ
のの
も
へじ
のの
も
へじ
374デフォルトの名無しさん
2019/05/14(火) 01:37:14.88ID:M5HaQ5Df375デフォルトの名無しさん
2019/05/14(火) 03:18:02.18ID:j93RjJXe でも令和合字入れちゃったからなあ
先行規格がない生まれながらの互換文字ってかわいそうじゃない?
先行規格がない生まれながらの互換文字ってかわいそうじゃない?
376デフォルトの名無しさん
2019/05/14(火) 11:34:15.69ID:HHew+yI/ 同じ失敗を繰り返すタイプ
数百年先を見通せない政策
数百年先を見通せない政策
377デフォルトの名無しさん
2019/05/14(火) 11:58:39.59ID:ThbRtqnv 理論上は文字コードを無限に増やせる仕様じゃないとダメでしょ。
378デフォルトの名無しさん
2019/05/14(火) 13:44:33.88ID:bepTC+/0 次の次で途絶えそうだし大丈夫じゃね?
379デフォルトの名無しさん
2019/05/14(火) 17:50:04.82ID:kz8JbfNJ はい、不敬罪。
380デフォルトの名無しさん
2019/05/14(火) 19:19:08.26ID:ThbRtqnv 不経済
381デフォルトの名無しさん
2019/05/15(水) 08:08:31.21ID:cTm8l9eF 不敬罪ではないでしょうw
実際女子しか生まれていない皇家も有るし
何らかの対策をしないと途絶える可能性は有るよ
継続させたいなら
本気で対策しないと拙いよ実際
実際女子しか生まれていない皇家も有るし
何らかの対策をしないと途絶える可能性は有るよ
継続させたいなら
本気で対策しないと拙いよ実際
382デフォルトの名無しさん
2019/05/15(水) 08:35:40.27ID:nWHAKFhQ >>345
今日の定例アップデートで修正入ったみたい
今日の定例アップデートで修正入ったみたい
383デフォルトの名無しさん
2019/05/15(水) 08:43:30.54ID:n5xZGXi9 だから今のうちに隠し子を作っておけと
結婚してから外で子供を作るのは嫁の人権上まずいけど
若気の至りなら仕方が無いだろう
結婚してから外で子供を作るのは嫁の人権上まずいけど
若気の至りなら仕方が無いだろう
384デフォルトの名無しさん
2019/05/15(水) 08:48:22.54ID:GDL/z8kb385デフォルトの名無しさん
2019/05/15(水) 12:28:24.15ID:Pf7Y4ylf ほとんど報道されないけどたまに逮捕されてるよな
>>378御愁傷様
>>378御愁傷様
386デフォルトの名無しさん
2019/05/15(水) 12:44:57.00ID:n5xZGXi9 アホがいる
387デフォルトの名無しさん
2019/05/15(水) 12:53:44.49ID:DmEZFbwt 地球外知的生命体との遭遇を前提に、拡張性を確保しとかないとね。
388デフォルトの名無しさん
2019/05/15(水) 13:14:54.94ID:dq2v0yjU 僕の肛門も拡張されそうです!
389デフォルトの名無しさん
2019/05/18(土) 16:38:38.85ID:F01l0NEI 質問
https://www.unicode.org/Public/MAPPINGS/OBSOLETE/EASTASIA/JIS/JIS0212.TXT
X0212補助漢字とUnicodeの変換テーブルは↑で良いのでしょうか?
補助漢字には詳しくなくobsolete下にあるのでこれでよいのかよくわかりません。
https://www.unicode.org/Public/MAPPINGS/OBSOLETE/EASTASIA/JIS/JIS0212.TXT
X0212補助漢字とUnicodeの変換テーブルは↑で良いのでしょうか?
補助漢字には詳しくなくobsolete下にあるのでこれでよいのかよくわかりません。
390デフォルトの名無しさん
2019/05/20(月) 22:06:47.10ID:WPLI0l6z Consortiumが提供しているのはそれくらいかと
391デフォルトの名無しさん
2019/05/20(月) 23:48:08.42ID:8Vf/KPej 0x2237 0x007E # TILDE
これはやめた方がいいんじゃないかな…
後はまあ
これはやめた方がいいんじゃないかな…
後はまあ
392デフォルトの名無しさん
2019/05/21(火) 18:21:29.99ID:wbjhm+VX >>391
全角チルダ問題ですか?
全角チルダ問題ですか?
393デフォルトの名無しさん
2019/05/21(火) 18:56:30.38ID:1e7kqOhQ チルダは主要フォントは同じ字形になっちゃったから、
ユニコードNGの環境で初めて気づくことも多いんだよね
ユニコードNGの環境で初めて気づくことも多いんだよね
394デフォルトの名無しさん
2019/05/21(火) 20:48:03.29ID:Qf+frYPs めんどいなあ
395デフォルトの名無しさん
2019/05/30(木) 21:05:37.63ID:QqsVAtGz Apple、算盤の絵文字がおかしいと批判される
https://idle.srad.jp/story/19/05/30/0450219/
https://idle.srad.jp/story/19/05/30/0450219/
396デフォルトの名無しさん
2019/05/31(金) 06:42:14.69ID:RBuyAv83 そろばんはどうでもいいが
チーズの位置は許せない
チーズの位置は許せない
397デフォルトの名無しさん
2019/05/31(金) 17:25:05.59ID:mv11bAX3 つうか誰が何の目的で入れたんだよ
絵文字増やすことが目的になってるだろもう
絵文字増やすことが目的になってるだろもう
398デフォルトの名無しさん
2019/06/02(日) 16:33:02.27ID:DEukDi4F だってこれまで一般人からは存在も意識されてなかった文字コードの改訂が
「今年の新絵文字発表」化してから急に世界中の注目を浴びる一大イベントになったんだもん
そら浮かれるよ
「今年の新絵文字発表」化してから急に世界中の注目を浴びる一大イベントになったんだもん
そら浮かれるよ
399デフォルトの名無しさん
2019/06/02(日) 20:25:46.71ID:A9OZ+7QR 鼻濁音を表す仮名か゜、き゜、く゜、け゜、こ゜、カ゜、キ゜、ク゜、ケ゜、コ゜は
JIS X 0213ではそれぞれ1文字としてコードが割り当てられたのに、Unicodeでは
半濁点なしの仮名と半濁点の2文字で表さなければいけない。Unicodeにも1文字として
収録してもらいたい。
辞書に使われる記号 [名]、[形]、(単)、(複) など ([ ]は角丸正方形、( )は丸囲み文字) も
欲しい。
JIS X 0213ではそれぞれ1文字としてコードが割り当てられたのに、Unicodeでは
半濁点なしの仮名と半濁点の2文字で表さなければいけない。Unicodeにも1文字として
収録してもらいたい。
辞書に使われる記号 [名]、[形]、(単)、(複) など ([ ]は角丸正方形、( )は丸囲み文字) も
欲しい。
400デフォルトの名無しさん
2019/06/02(日) 20:47:27.41ID:SX5hebJf401デフォルトの名無しさん
2019/06/02(日) 20:57:42.19ID:gW1x1cZy NHKの情報番組によると、最近スマホに移行した役者の役所広司さんはガラケーの絵文字が好きでスマホの絵文字が不満らしい。
402デフォルトの名無しさん
2019/06/02(日) 21:05:37.93ID:A9OZ+7QR >>400
テレビ番組表で使われる記号[字]、[ニ]、[多]、[声]、[吹]、[演]など ([ ]は正方形囲み文字) は
Enclosed Ideographic Supplement (U+1F2xx) として収録されたから、同じブロックの
空き領域に辞書用の記号も追加してもらいたい。
テレビ番組表で使われる記号[字]、[ニ]、[多]、[声]、[吹]、[演]など ([ ]は正方形囲み文字) は
Enclosed Ideographic Supplement (U+1F2xx) として収録されたから、同じブロックの
空き領域に辞書用の記号も追加してもらいたい。
403デフォルトの名無しさん
2019/06/02(日) 21:16:20.35ID:GqRagKZH よくわからん
合成文字ではいけない理由って今時ある?
合成文字ではいけない理由って今時ある?
404デフォルトの名無しさん
2019/06/02(日) 21:22:49.71ID:gW1x1cZy 池江 璃花子さんのツイート
https://twitter.com/rikakoikee/status/1135127518258667520
ポップコーンが美味しかった。
美味しいチャーハン食べたい。
チーズドックもマックのポテトも食べたい…🍟
美味しいお寿司🍣アボカド🥑
と、からみチキン
食べたいものと行きたいとこが多すぎる🐭🏰
https://twitter.com/5chan_nel (5ch newer account)
https://twitter.com/rikakoikee/status/1135127518258667520
ポップコーンが美味しかった。
美味しいチャーハン食べたい。
チーズドックもマックのポテトも食べたい…🍟
美味しいお寿司🍣アボカド🥑
と、からみチキン
食べたいものと行きたいとこが多すぎる🐭🏰
https://twitter.com/5chan_nel (5ch newer account)
405デフォルトの名無しさん
2019/06/03(月) 12:00:01.49ID:ZJy6OnVg 絵文字専用スレの分離独立を提案します
406デフォルトの名無しさん
2019/06/03(月) 12:14:25.26ID:C5QZ8dlg それはよくない
407デフォルトの名無しさん
2019/06/03(月) 17:14:50.77ID:9GoUaP2A さもる。とは?
408デフォルトの名無しさん
2019/06/03(月) 18:10:06.92ID:waosREqi この板に絵文字スレを別に作るのはいい案だとは思えない。一緒に扱ったほうがいい。
他の、スマホ系やネット文化系の板で絵文字スレを立てるのはそっちの文脈での必要に応じてやればいいが。
他の、スマホ系やネット文化系の板で絵文字スレを立てるのはそっちの文脈での必要に応じてやればいいが。
409デフォルトの名無しさん
2019/06/04(火) 04:29:34.76ID:34q0LBOl 板的には絵文字禁止で
410デフォルトの名無しさん
2019/06/04(火) 09:25:30.78ID:mdhyHdfA 絵文字はただのコードポイントだからなあ
411デフォルトの名無しさん
2019/06/04(火) 10:53:27.04ID:uvNmGZET このスレが絵文字の話題で埋まるのは勘弁
412デフォルトの名無しさん
2019/06/04(火) 11:53:04.76ID:mdhyHdfA これまでのところ埋まってないぞ
413デフォルトの名無しさん
2019/06/04(火) 20:23:40.45ID:gwjuh1zM >>403
それを言ったら、漢字も合字で構わなくないか? 1文字ずつコードを割り当てずに、
パーツ(部首など)に分解し、パーツと配置方法をコードで指定するIDS方式にする。
ハングルも音素に分解する。そうすれば、CJKが占めていた膨大なコード領域が
明け渡され、Unicodeを16ビットに戻せる。非CJK圏の人々はそれを望んでいそう。
漢字は情報伝達効率がとても良くて、字 2バイトで character 18バイトと同等の
情報を伝達できる。IDS上下, ウ冠, 子 の6バイトで表しても、18バイトの3分の1しか
まだない。
それを言ったら、漢字も合字で構わなくないか? 1文字ずつコードを割り当てずに、
パーツ(部首など)に分解し、パーツと配置方法をコードで指定するIDS方式にする。
ハングルも音素に分解する。そうすれば、CJKが占めていた膨大なコード領域が
明け渡され、Unicodeを16ビットに戻せる。非CJK圏の人々はそれを望んでいそう。
漢字は情報伝達効率がとても良くて、字 2バイトで character 18バイトと同等の
情報を伝達できる。IDS上下, ウ冠, 子 の6バイトで表しても、18バイトの3分の1しか
まだない。
414デフォルトの名無しさん
2019/06/04(火) 20:34:02.28ID:XXr8i2SB shit
糞
そうか?
糞
そうか?
415デフォルトの名無しさん
2019/06/04(火) 20:35:22.41ID:XXr8i2SB バイトでいうならそうか…
画数で無駄だなぁって思っちゃった
画数で無駄だなぁって思っちゃった
416デフォルトの名無しさん
2019/06/04(火) 22:15:09.20ID:S8UlmLic417デフォルトの名無しさん
2019/06/04(火) 23:31:18.83ID:sg371bFW >>399で書かれてる辞書で使われるような丸囲みとか四角囲みはU+20DDやU+20DEと組み合わせて表せばいい。
例えば[名]はU+540D U+20DE、(単)はU+5358 U20DDで表せる。
例えば[名]はU+540D U+20DE、(単)はU+5358 U20DDで表せる。
418デフォルトの名無しさん
2019/06/05(水) 21:51:36.51ID:uJguGtrO >>413
俺もそういうのがいいとは思うけど
同じ手偏でも幅が微妙に違ったりするじゃん。
そういうのって計算というより正直 美的感覚に基づくものだから,
結局 一字一字に「手偏の幅」とかいったパラメータを与える必要が出てきそう。
俺もそういうのがいいとは思うけど
同じ手偏でも幅が微妙に違ったりするじゃん。
そういうのって計算というより正直 美的感覚に基づくものだから,
結局 一字一字に「手偏の幅」とかいったパラメータを与える必要が出てきそう。
419デフォルトの名無しさん
2019/06/05(水) 22:43:55.33ID:U4lYdkMb420デフォルトの名無しさん
2019/06/06(木) 11:04:53.81ID:NifDLxm9 >>419
418だがそれはいいね。
418だがそれはいいね。
421デフォルトの名無しさん
2019/06/06(木) 13:09:21.77ID:V+RhrtBc 正直IPAmjにだけ入ってるクラスの漢字見てるとこれIDSでどうすんのって思うよ。今更どうしようもないと思う。
422蟻人間 ◆T6xkBnTXz7B0
2019/06/06(木) 13:32:02.81ID:8KYXjatA 台湾に漢字の部首を組み合わせてフォントを合成する技術があるらしい。
423デフォルトの名無しさん
2019/06/06(木) 19:13:54.79ID:NifDLxm9424蟻人間 ◆T6xkBnTXz7B0
2019/06/06(木) 19:56:27.90ID:W0KBfnTD425デフォルトの名無しさん
2019/06/06(木) 23:21:56.20ID:mU5eCwwC 技術も何もメイリオあたりもそういうのじゃなかったっけ
結局調整が必要になるっぽいけど
結局調整が必要になるっぽいけど
426デフォルトの名無しさん
2019/06/07(金) 08:07:16.78ID:rFfmCjQx なんか思ってた技術と違うわ。
IDSの組合せをそれが表現する漢字と対応させるんかと思ってた。
IDSの組合せをそれが表現する漢字と対応させるんかと思ってた。
427デフォルトの名無しさん
2019/06/07(金) 11:40:10.92ID:nJu+ZeI9 糸冬
マ
マ
428デフォルトの名無しさん
2019/06/09(日) 18:38:42.78ID:+hAUN3Ld 漢字構成記述文字列って複数の記述文字の組み合わせとそもそもの複数の文字とをどうやって区別するんだろう。
「⿰山⿱上下」という並びが「峠」を意味するのか「山𠧗」を意味するのか区別できなくね?
「⿰山⿱上下」という並びが「峠」を意味するのか「山𠧗」を意味するのか区別できなくね?
429デフォルトの名無しさん
2019/06/09(日) 20:33:00.79ID:SSgQq8CW 頻出度?
430デフォルトの名無しさん
2019/06/09(日) 22:49:36.82ID:lml609nH 1文字になる以外の解釈が可能な定義にはなってないように見えるが
431デフォルトの名無しさん
2019/06/10(月) 00:45:55.32ID:/7QyuKh+ というかもともとそういうもんじゃない?
あれは人間が読むことを前提にした文中で説明を簡素にするために使う記号であって
合成とか機械処理とかをやることははなから考えてないと思う。
あれは人間が読むことを前提にした文中で説明を簡素にするために使う記号であって
合成とか機械処理とかをやることははなから考えてないと思う。
432デフォルトの名無しさん
2019/06/10(月) 11:07:15.11ID:g6tidy/F ⿰山⿱上下 → 山𠧗
⿰⿱山上下 → 峠
⿰⿱山上下 → 峠
433デフォルトの名無しさん
2019/06/10(月) 11:10:17.22ID:g6tidy/F434デフォルトの名無しさん
2019/06/10(月) 11:14:02.36ID:DwfAnHcn435デフォルトの名無しさん
2019/06/10(月) 13:25:56.68ID:ujTvUCPf カッコなしで誤解釈の余地なくやるにはRPNにすればよいのでは?
436デフォルトの名無しさん
2019/06/10(月) 14:05:24.64ID:DwfAnHcn 括弧なしでも漢字構成記述文字列は一意に定まるぞ。
曖昧さの余地はない筈。
曖昧さの余地はない筈。
437デフォルトの名無しさん
2019/06/10(月) 14:06:48.56ID:DwfAnHcn ていうかそもそも漢字構成記述文字列自体がポーランド記法っぽい性格を持ってる。
⿰⿱山上下なら⿰(⿱(山, 上), 下)みたいな関数表示になって↑>>434みたいな字形になる。
⿰⿱山上下なら⿰(⿱(山, 上), 下)みたいな関数表示になって↑>>434みたいな字形になる。
438デフォルトの名無しさん
2019/06/10(月) 14:17:40.77ID:g6tidy/F 同じ文字を二通り以上の表現方法があるのはセキュリティ上やばいと爺さんが言ってた
UTF-8みたいなやつ
UTF-8みたいなやつ
439デフォルトの名無しさん
2019/06/10(月) 14:19:52.70ID:g6tidy/F 例えば
⿰男⿰女男
と
⿰⿰男女男
⿰男⿰女男
と
⿰⿰男女男
440デフォルトの名無しさん
2019/06/10(月) 14:43:12.52ID:VjrzvIQA 男女 男
右端は俺orz
右端は俺orz
441デフォルトの名無しさん
2019/06/10(月) 14:45:35.90ID:AYc4wpPC 全然関係ないが男女男男女女男女男女を思い出した。おっさんだな、俺。
442デフォルトの名無しさん
2019/06/10(月) 14:55:32.08ID:DwfAnHcn >>439
嬲は「⿲男女男」じゃないの?
嬲は「⿲男女男」じゃないの?
443デフォルトの名無しさん
2019/06/10(月) 14:56:33.42ID:g6tidy/F だから複数あるっていう意味で書いたんだが
正規化で一つにっていうのは判る
正規化で一つにっていうのは判る
444デフォルトの名無しさん
2019/06/10(月) 20:42:06.03ID:QC59E/Dz 表現意図としては比が2:1:1と1:1:2と1:1:1で違いがあるような
445デフォルトの名無しさん
2019/06/10(月) 23:11:41.70ID:rO86gbFX >>399-400
鼻濁音付き仮名文字は日本NBから提案したけど蹴られて今の姿になった。
http://std.dkuug.dk/JTC1/SC2/WG2/docs/n2092.pdf
仮名文字に限らずシーケンスで表現可能な文字に単体の文字コードを割り振ってもらうのは
相当説得力のある理由が要る。
逆に辞書用の記号は提案書を出せば通る可能性ありそう。
鼻濁音付き仮名文字は日本NBから提案したけど蹴られて今の姿になった。
http://std.dkuug.dk/JTC1/SC2/WG2/docs/n2092.pdf
仮名文字に限らずシーケンスで表現可能な文字に単体の文字コードを割り振ってもらうのは
相当説得力のある理由が要る。
逆に辞書用の記号は提案書を出せば通る可能性ありそう。
446デフォルトの名無しさん
2019/06/11(火) 01:59:35.04ID:SK3ydrDR ぽげむたは?
447デフォルトの名無しさん
2019/06/11(火) 04:13:44.44ID:Yb3f0IhW448デフォルトの名無しさん
2019/06/11(火) 08:44:46.66ID:GW+sQhXS 将棋好きのおいらとしては、ひっくり返った「玉」「飛」「歩」とかも
登録してほしいと思うのだが。
登録してほしいと思うのだが。
449デフォルトの名無しさん
2019/06/11(火) 10:41:29.12ID:Yb3f0IhW >>448
Unicodeってそもそも将棋の駒 全部登録されてないんじゃ?
Unicodeってそもそも将棋の駒 全部登録されてないんじゃ?
450デフォルトの名無しさん
2019/06/11(火) 11:48:29.98ID:9Qw6sZwd 笑→ケケ夭
とか
禁→木木示
とか
哭→口口犬
とか
と
畿→糸糸田戈
は同じ表現?
とか
禁→木木示
とか
哭→口口犬
とか
と
畿→糸糸田戈
は同じ表現?
451デフォルトの名無しさん
2019/06/11(火) 12:18:11.06ID:Yb3f0IhW452デフォルトの名無しさん
2019/06/11(火) 12:35:42.68ID:GW+sQhXS453デフォルトの名無しさん
2019/06/11(火) 14:57:42.64ID:Y18rXsQw 文字表現ってことで
●●構えっていうと門しか思い出せないし
●●囲いっていうと口しか思い出せないけど
将棋の駒の白抜き五角形は囲いなんだろうか
●●構えっていうと門しか思い出せないし
●●囲いっていうと口しか思い出せないけど
将棋の駒の白抜き五角形は囲いなんだろうか
454デフォルトの名無しさん
2019/06/11(火) 17:55:27.24ID:Yb3f0IhW いっそのことCombining Diacritical Marks for Symbolsあたりに将棋の駒の枠線を登録してもらえればいい
455デフォルトの名無しさん
2019/06/12(水) 00:03:22.24ID:82Q6hISi >>424
そこ日本の会社
そこ日本の会社
456デフォルトの名無しさん
2019/06/12(水) 01:16:49.13ID:ynCJAfYS >>454
枠線の中に複数文字入れるのどうするとか
中に「と」みたいなのを表示したい場合それは本当に「と」で表現するのかとかいろいろややこしくなりそう
将棋みたいに中身が決まってるやつは一通り個別に並べてもらったほうがシンプルじゃないのかな…
枠線の中に複数文字入れるのどうするとか
中に「と」みたいなのを表示したい場合それは本当に「と」で表現するのかとかいろいろややこしくなりそう
将棋みたいに中身が決まってるやつは一通り個別に並べてもらったほうがシンプルじゃないのかな…
457デフォルトの名無しさん
2019/06/12(水) 01:57:37.00ID:qj/fM2VI458デフォルトの名無しさん
2019/06/12(水) 07:01:32.61ID:XwhNnAHz あ、すでに議論の対象にはなってるのか。
459デフォルトの名無しさん
2019/06/12(水) 08:39:27.70ID:QJXYMRLU >>453
黒と白で、先手と後手を表しているだけだよ。
黒と白で、先手と後手を表しているだけだよ。
460デフォルトの名無しさん
2019/06/12(水) 09:02:03.43ID:om/mzkP2 文章中に書くなら白黒五角形で十分だと思うが、なんで盤面まで表現したがるかな。
461デフォルトの名無しさん
2019/06/12(水) 11:21:19.79ID:tqvE0DW+ 歩の裏の「と」があるべき位置に
「テ」だったか「〒EL」みたいな
意味不明な文字が書いてある駒セットを
観たことがあるけど
あれはなんだったんだろう
朝鮮語か?
「テ」だったか「〒EL」みたいな
意味不明な文字が書いてある駒セットを
観たことがあるけど
あれはなんだったんだろう
朝鮮語か?
462デフォルトの名無しさん
2019/06/12(水) 12:54:03.65ID:QJXYMRLU T
三 みたいなやつ?
全ての「成金」の文字は「金」を崩した文字だよ。
「と金」も、本当は「と」と書いてあるわけではなく、
「金」を崩した結果、「と」みたいになっているだけだよ。
三 みたいなやつ?
全ての「成金」の文字は「金」を崩した文字だよ。
「と金」も、本当は「と」と書いてあるわけではなく、
「金」を崩した結果、「と」みたいになっているだけだよ。
463デフォルトの名無しさん
2019/06/12(水) 13:18:58.92ID:tqvE0DW+ Tも三も金なんですね
464デフォルトの名無しさん
2019/06/12(水) 17:24:29.90ID:XwhNnAHz どうでもいいけどそのレスを見て
その内 崩し字も登録されそう…とか思ったw
太字のaとかがなぜか「文字」として登録されてるんだから金の崩し字が登録されてもおかしくない
その内 崩し字も登録されそう…とか思ったw
太字のaとかがなぜか「文字」として登録されてるんだから金の崩し字が登録されてもおかしくない
465デフォルトの名無しさん
2019/06/12(水) 17:54:37.18ID:o59LDmQW 歩兵の裏は金と同じ読みの今(きん)の崩し字をあてたので
「と」と極めて似た文字になったという説がある
「と」と極めて似た文字になったという説がある
466デフォルトの名無しさん
2019/06/12(水) 23:56:15.89ID:4S3+zhe0 T
ニ
ヘ
なんでこれで金になるのかさっぱり判らん
https://blogimg.goo.ne.jp/user_image/50/8a/03ddf56cb868756327fb330bdd9e5231.jpg
あと
|
とか
レ
とか
謎のが多すぎ
ニ
ヘ
なんでこれで金になるのかさっぱり判らん
https://blogimg.goo.ne.jp/user_image/50/8a/03ddf56cb868756327fb330bdd9e5231.jpg
あと
|
とか
レ
とか
謎のが多すぎ
467デフォルトの名無しさん
2019/06/13(木) 01:03:53.78ID:WD6Kvaf7 崩し字はむずかしうてわからん
468デフォルトの名無しさん
2019/06/13(木) 01:05:01.31ID:WD6Kvaf7 崩し字というかバラし字?
469デフォルトの名無しさん
2019/06/13(木) 01:11:22.08ID:uH0MzXQS >>457
どうなったか調べてみた。L2/18-170は2018年8月開催のUTC #156で議論され、
議事録には提案者にfeedbackを返したとだけ記録されている。
http://www.unicode.org/L2/L2018/18183.htm のe.5
で、この文書番号で検索すると同じ提案者の出したL2/18-342が引っかかって
そこにこう書いてある。
> Shogi proposal. The proposal I am talking about is (L2/18-170), the committee's
> rationale for rejection was that: “the symbols in question were not attested in
> lines of text”.
インラインテキスト中で使われている用例が示されていないのでrejectされたらしい。
どうなったか調べてみた。L2/18-170は2018年8月開催のUTC #156で議論され、
議事録には提案者にfeedbackを返したとだけ記録されている。
http://www.unicode.org/L2/L2018/18183.htm のe.5
で、この文書番号で検索すると同じ提案者の出したL2/18-342が引っかかって
そこにこう書いてある。
> Shogi proposal. The proposal I am talking about is (L2/18-170), the committee's
> rationale for rejection was that: “the symbols in question were not attested in
> lines of text”.
インラインテキスト中で使われている用例が示されていないのでrejectされたらしい。
470デフォルトの名無しさん
2019/06/13(木) 01:32:11.84ID:domb7+if なるほどなあ。
チェストーはインラインで使ったりするもんなんだろうか
チェストーはインラインで使ったりするもんなんだろうか
471デフォルトの名無しさん
2019/06/13(木) 06:29:39.15ID:IV8IxRGq 日本NBが後押しすれば10646に入りそうな気がするけどね
漢字以外は興味持たないだろうって見透かされてるんだろうな
漢字以外は興味持たないだろうって見透かされてるんだろうな
472デフォルトの名無しさん
2019/06/14(金) 11:32:49.03ID:BMAIfRwQ まあ言いたかないけど 欧米が制定した企画だからね……。
あきらかに文化的な偏りはあると思う。
この間もモンゴル文字かなんかを文字の結合方式とかをほとんど考慮しないで登録してしまった
という旨でUnicode共同体を批判してるブログ見掛けたし。
あきらかに文化的な偏りはあると思う。
この間もモンゴル文字かなんかを文字の結合方式とかをほとんど考慮しないで登録してしまった
という旨でUnicode共同体を批判してるブログ見掛けたし。
473デフォルトの名無しさん
2019/06/14(金) 12:45:36.88ID:AVMOMmmV https://nixeneko.hatenablog.com/entry/2018/03/04/140000
モンゴル文字のことはよくわからんが、ここに書いてあることによると、
> モンゴル文字は、語の中のどの位置にくるかによって、また母音調和等によって形が変化する。
> 中国・モンゴル国の両国ともに現状と地続きの音声アプローチの方を支持しているようであるが、
> 最終的にどの方式が選ばれるにしろ、相互運用性が確保されることは期待できそうである。
ということだから、現状の規格は、中国・モンゴル国が希望したものであって
欧米人が悪いというわけではないと思う。
モンゴル文字のことはよくわからんが、ここに書いてあることによると、
> モンゴル文字は、語の中のどの位置にくるかによって、また母音調和等によって形が変化する。
> 中国・モンゴル国の両国ともに現状と地続きの音声アプローチの方を支持しているようであるが、
> 最終的にどの方式が選ばれるにしろ、相互運用性が確保されることは期待できそうである。
ということだから、現状の規格は、中国・モンゴル国が希望したものであって
欧米人が悪いというわけではないと思う。
474デフォルトの名無しさん
2019/06/14(金) 12:54:39.24ID:AVMOMmmV ただ、似たようなものは英文にもあるわけで、fish や office のように、
f,i,j,l が続く場合は、文字を合字(リガチャ)にする場合が多い。
しかし、MSword も TeX も、「合字にせよ」という指定を入れなくても、
勝手に合字にしてくれるわけで、モンゴル文字も(よく解らんけど)
同じようにできないのかな、とは思う。
f,i,j,l が続く場合は、文字を合字(リガチャ)にする場合が多い。
しかし、MSword も TeX も、「合字にせよ」という指定を入れなくても、
勝手に合字にしてくれるわけで、モンゴル文字も(よく解らんけど)
同じようにできないのかな、とは思う。
475デフォルトの名無しさん
2019/06/14(金) 13:00:53.97ID:AVMOMmmV ごめん。誤り。MSwordは指定しない限り、合字にはならなかった。
476デフォルトの名無しさん
2019/06/14(金) 21:13:23.45ID:bakZpKUF ガチャーン合体!
477デフォルトの名無しさん
2019/06/15(土) 12:06:26.17ID:s4HbSmAb >>466
筆で金とうい字を1000回くらい書くとわかるようになるよ。ようは手抜き。
筆で金とうい字を1000回くらい書くとわかるようになるよ。ようは手抜き。
478デフォルトの名無しさん
2019/06/15(土) 21:00:26.68ID:dgVxOSWc わけわからんまで崩していくのは日本独特?
479デフォルトの名無しさん
2019/06/16(日) 11:45:02.01ID:NdAq/MEw これもなんで金になるのか判らんやつ
と
でいいのに
https://encrypted-tbn0.gstatic.com/images?q=tbn:ANd9GcRN0np1ZmeG8ZgXTV8K1Vjx-yF9KCNZgu3AKkiOYyYxdnnl-wk7
と
でいいのに
https://encrypted-tbn0.gstatic.com/images?q=tbn:ANd9GcRN0np1ZmeG8ZgXTV8K1Vjx-yF9KCNZgu3AKkiOYyYxdnnl-wk7
480デフォルトの名無しさん
2019/06/16(日) 13:03:35.22ID:8f8EXiHl 木天火土水で6人目のゴールドは光です・・・
481デフォルトの名無しさん
2019/06/16(日) 17:16:00.47ID:UaT4ATnR >>479-480
わらったw
わらったw
482デフォルトの名無しさん
2019/06/18(火) 06:18:41.06ID:3nOE2mBA プログラム板にキチガイ降臨中!botに一晩も反応する異常さ
一般人(学校恩師)に殺害予告をしているのでスレ建て通報してください。
https://mevius.5ch.net/test/read.cgi/tech/1559872586/
142 名前:a4 ◆700L1Efzuv 投稿日:2019/06/18(火) 05:29:55 ID://qVkzO
>>141
名古屋の人な 俺ね、君の問題を大橋先生と混ぜないことにする。つまりね、
片桐孝洋のことをボコろうと思う。普通に顎の骨を折る。これくらいで警察来るか?
一般市民とかさ、普通にさ、俺らの秘密なんだけどさ、日本人なんて復活ねーから。
一般人(学校恩師)に殺害予告をしているのでスレ建て通報してください。
https://mevius.5ch.net/test/read.cgi/tech/1559872586/
142 名前:a4 ◆700L1Efzuv 投稿日:2019/06/18(火) 05:29:55 ID://qVkzO
>>141
名古屋の人な 俺ね、君の問題を大橋先生と混ぜないことにする。つまりね、
片桐孝洋のことをボコろうと思う。普通に顎の骨を折る。これくらいで警察来るか?
一般市民とかさ、普通にさ、俺らの秘密なんだけどさ、日本人なんて復活ねーから。
483デフォルトの名無しさん
2019/06/22(土) 01:57:21.14ID:t+lz7b+S484デフォルトの名無しさん
2019/06/25(火) 03:50:40.53ID:wcrPNuwW ヲシテ文字って使えないの?
485デフォルトの名無しさん
2019/06/25(火) 05:40:01.35ID:DXMPLOPq Unicode協会が配布してるプログラムでシェルスクリプトでUTF-8文字列を扱えるデータってないかな。
入力されたUTF-8文字列が何文字かを判定したりするのに都合の良いスクリプト。
入力されたUTF-8文字列が何文字かを判定したりするのに都合の良いスクリプト。
486デフォルトの名無しさん
2019/06/25(火) 06:09:39.19ID:1JIWmrxD にほんごでおk
487デフォルトの名無しさん
2019/06/25(火) 06:42:32.78ID:DXMPLOPq CLDR for shellみたいなのがないかなと。
488デフォルトの名無しさん
2019/06/25(火) 13:49:53.45ID:takEpFxW Unicode協会って書かれると、アグネスがやってるパチモンに見えてくる
489デフォルトの名無しさん
2019/06/28(金) 22:59:11.92ID:NkHCwivq 使えないよ
その手の文字が登録されたことはあるのかな
その手の文字が登録されたことはあるのかな
490デフォルトの名無しさん
2019/06/29(土) 01:02:31.02ID:P81PdZpf Dohentaiyagana
491デフォルトの名無しさん
2019/06/29(土) 01:49:55.29ID:LWdOpl9S 神代VSでまとめてしまおう
492デフォルトの名無しさん
2019/06/29(土) 02:20:12.41ID:g9Pe6ky6 最近Kenのツイートが酷い
LunaticとかAdobe的にいいのか
LunaticとかAdobe的にいいのか
493デフォルトの名無しさん
2019/06/30(日) 02:04:42.75ID:1ALBmyOB 絵文字をリガチャとして実装するという話を聞いたことがあるが
良いアイデアだと思う。
これ以上貴重な符号位置を占有しないで欲しい。
良いアイデアだと思う。
これ以上貴重な符号位置を占有しないで欲しい。
494デフォルトの名無しさん
2019/06/30(日) 02:44:42.35ID:KxegnpZe 絵文字ガチャに見えた
495デフォルトの名無しさん
2019/06/30(日) 18:46:20.88ID:1ALBmyOB https://symbolset.com/
これとか。素晴しい発想だと思いませんこと?(お嬢様風)
これとか。素晴しい発想だと思いませんこと?(お嬢様風)
496デフォルトの名無しさん
2019/06/30(日) 19:55:14.68ID:VWoLS78P 全然
497デフォルトの名無しさん
2019/06/30(日) 20:32:53.74ID:MkBgWLvD 見る側の環境によって、絵文字を使った側の人が意図しなかった単語に化ける現象が発生してしまう
498デフォルトの名無しさん
2019/06/30(日) 21:02:05.57ID:1ALBmyOB >>497
実はそれを意図しているんだな、これが。
Webフォントが使えなかった場合に,意味不明な私的領域のコードポイントではなくその絵文字の「意味」の単語になるっていうフェールセーフ。
この発想はアクセシビリティの面からしてすごいと思う。
今までも↑こういうことを実現する手段はあったが(aria-*とか::beforeとかを活用する),
いささかハックじみた手法だったのに対して,この方法はほとんど何のひねりもないし,かつ
高いアクセシビリティを誇る。
実はそれを意図しているんだな、これが。
Webフォントが使えなかった場合に,意味不明な私的領域のコードポイントではなくその絵文字の「意味」の単語になるっていうフェールセーフ。
この発想はアクセシビリティの面からしてすごいと思う。
今までも↑こういうことを実現する手段はあったが(aria-*とか::beforeとかを活用する),
いささかハックじみた手法だったのに対して,この方法はほとんど何のひねりもないし,かつ
高いアクセシビリティを誇る。
499デフォルトの名無しさん
2019/06/30(日) 21:31:19.26ID:2juPiYlp なんか公式ページの説明が簡素すぎてよく分からん。
素晴らしさを伝える記事とかないの?
素晴らしさを伝える記事とかないの?
500デフォルトの名無しさん
2019/06/30(日) 22:16:35.89ID:MkBgWLvD >>498
全然意図してないと思うぞ。>使った側の人が意図しなかった単語に化ける現象
これがアクセシビリティ向上になるのは入力者が単語と絵文字の対応を把握している場合だけで、
把握してない場合は入力者が知らない結果が出力される謎フォールバックになる。
入力者が絵文字パレットから選ぶ仕組みなら単語を把握してない可能性が高まるし、
個別に校正かけるなら元々あるimg altとかではなくWebフォントを使う強みは何?ってなるし
全然意図してないと思うぞ。>使った側の人が意図しなかった単語に化ける現象
これがアクセシビリティ向上になるのは入力者が単語と絵文字の対応を把握している場合だけで、
把握してない場合は入力者が知らない結果が出力される謎フォールバックになる。
入力者が絵文字パレットから選ぶ仕組みなら単語を把握してない可能性が高まるし、
個別に校正かけるなら元々あるimg altとかではなくWebフォントを使う強みは何?ってなるし
501デフォルトの名無しさん
2019/06/30(日) 23:23:56.67ID:sPnkqdOZ どのフォントでどこからどこまでリガチャっていう指定を含めないといけないからプレーンテキストで利用できない
リッチテキスト使えるなら画像でいい
リッチテキスト使えるなら画像でいい
502デフォルトの名無しさん
2019/07/01(月) 00:12:01.52ID:vOsPyG+v This is a pen.とか[ Download Now!]みたいにもともと並べて使うことも多いしな。
This is a penpen.や[Download Download Now!]は変やろ。あとThat is a guin.の誤爆避けも必要になる。
This is a penpen.や[Download Download Now!]は変やろ。あとThat is a guin.の誤爆避けも必要になる。
503デフォルトの名無しさん
2019/07/01(月) 05:12:02.84ID:2smzn43h504デフォルトの名無しさん
2019/07/01(月) 05:12:32.89ID:2smzn43h >>500
Webフォントを使う強みはページ読み込み速度の向上だと思うよ。
Webフォントを使う強みはページ読み込み速度の向上だと思うよ。
505デフォルトの名無しさん
2019/07/01(月) 05:13:03.16ID:2smzn43h >>500
あ、それと色とか大きさとかをCSSでより柔軟に調整できる。
あ、それと色とか大きさとかをCSSでより柔軟に調整できる。
506デフォルトの名無しさん
2019/07/01(月) 12:02:58.02ID:liKrIWIO SVGベタ書きがいいと思う
507デフォルトの名無しさん
2019/07/01(月) 13:38:09.58ID:Ltl936Sg WebフォントってDL待ちでむしろ遅いイメージしかないな…
508デフォルトの名無しさん
2019/07/01(月) 16:21:02.28ID:MoEwNeEz 日本語だとどうしても…
サブセット化もこれから足してくコンテンツ考えるとあんまりいいソリューションとは…
サブセット化もこれから足してくコンテンツ考えるとあんまりいいソリューションとは…
509デフォルトの名無しさん
2019/07/01(月) 19:16:16.83ID:2smzn43h510デフォルトの名無しさん
2019/07/01(月) 21:01:31.88ID:1h0unusf 推すなあ。
あえてこれ使いたいと思うならもちろん自由に使えばいいと思うが、
正直これを選ぶメリットがある局面はすごく限られてる気しかしない。
あえてこれ使いたいと思うならもちろん自由に使えばいいと思うが、
正直これを選ぶメリットがある局面はすごく限られてる気しかしない。
511デフォルトの名無しさん
2019/07/04(木) 14:48:01.78ID:nXaEmuLe ISO/IEC 10646:2017/Amd 2:2019 - Nandinagari, Georgian extension, and other characters
https://www.iso.org/standard/73773.html
いつの間にか完成していた。
https://www.iso.org/standard/73773.html
いつの間にか完成していた。
512デフォルトの名無しさん
2019/07/05(金) 07:31:35.09ID:CMdnJVDV JISにも取り込まれるかな?
513デフォルトの名無しさん
2019/07/12(金) 14:32:58.64ID:q8HbeEfz >>97
BCってなに?
BCってなに?
514デフォルトの名無しさん
2019/07/12(金) 23:51:11.25ID:aHiS7zOG ブラックキャップ
515デフォルトの名無しさん
2019/07/13(土) 19:08:40.33ID:Wy302ne8 まじめに答えてほしかった。。。
516デフォルトの名無しさん
2019/07/13(土) 20:43:48.97ID:tESkaNg7 ?
517デフォルトの名無しさん
2019/07/13(土) 22:47:35.97ID:0DH1k/wL >>516
何これ?
何これ?
518デフォルトの名無しさん
2019/07/14(日) 01:25:41.28ID:cxt0+A+5 ブラックキャップ
519デフォルトの名無しさん
2019/07/14(日) 09:54:29.74ID:N6Jg+9Qo ワロタ
520デフォルトの名無しさん
2019/07/14(日) 22:04:02.29ID:GSQZGuhE521デフォルトの名無しさん
2019/07/15(月) 03:44:17.27ID:GN7I2Kmp 単に後方互換だろ…
522デフォルトの名無しさん
2019/07/15(月) 04:14:22.81ID:GXO+LVjR BA-90使いたいのに斑の黄顔になるのはなんだかなー
523デフォルトの名無しさん
2019/07/16(火) 23:08:05.64ID:6ZdisLnD IC: 相互互換性
FC: 前方互換性
BC: 後方互換性
UC: 上位互換性
LC: 下位互換性
ちい覚えた
FC: 前方互換性
BC: 後方互換性
UC: 上位互換性
LC: 下位互換性
ちい覚えた
524デフォルトの名無しさん
2019/07/17(水) 11:56:39.82ID:FD/sfaX1 LeftとかRightとかCorrectは無いんか
525デフォルトの名無しさん
2019/07/17(水) 16:54:36.95ID:Lq1+nMLH >>524
correctはともかく左右は確実にねーだろw
correctはともかく左右は確実にねーだろw
526デフォルトの名無しさん
2019/07/18(木) 14:33:21.11ID:44Ax18Yo 共産とりっけんと社民社と国民主と令和革命はLC互換
527デフォルトの名無しさん
2019/07/18(木) 23:12:28.17ID:BkvY1rKv >>526
わろたw
わろたw
528デフォルトの名無しさん
2019/07/23(火) 15:56:55.39ID:vatz3/hX https://github.com/qntm/base65536
↑Unicodeの基本多言語面を使ったエンコード方法w
↑Unicodeの基本多言語面を使ったエンコード方法w
529デフォルトの名無しさん
2019/07/23(火) 17:04:19.76ID:yKl7I/yp 高度に発達したエンコードはMojibakeと見分けがつかない
530デフォルトの名無しさん
2019/07/24(水) 00:37:51.21ID:ArGZw8p9 基本多言語面って制御文字含んでるよね。
それbaseXXの本来の意味を成してないw
それbaseXXの本来の意味を成してないw
531デフォルトの名無しさん
2019/08/18(日) 16:07:01.10ID:zqR8kD3Y W3Cのwebページが文字化けしてて草。
文字コードの本元の一つがこんな体たらくでいいのだろうか…w
https://www.w3.org/People/mimasa/xmldev.html.ja.sjis
文字コードの本元の一つがこんな体たらくでいいのだろうか…w
https://www.w3.org/People/mimasa/xmldev.html.ja.sjis
532デフォルトの名無しさん
2019/08/18(日) 17:27:15.46ID:wpOWgZAQ 読めるけど...?
533デフォルトの名無しさん
2019/08/18(日) 23:04:31.46ID:8LEpKI7v ISO-2022-JP のくせに content-type: text/html; charset=shift_jis で送ってきてるからなあ
534デフォルトの名無しさん
2019/08/19(月) 01:20:35.42ID:JKQq3Dbg (´・・∀・・`)ほう
535デフォルトの名無しさん
2019/08/19(月) 06:07:28.33ID:xlQPwL5+536デフォルトの名無しさん
2019/08/19(月) 07:31:42.15ID:SJok1opV537デフォルトの名無しさん
2019/08/19(月) 08:38:57.28ID:xlQPwL5+ ところでW3Cって文字コードの制定とかに関わってたっけ?
XMLが使う符号化文字集合にUnicodeを推奨してるくらいじゃない?
XMLが使う符号化文字集合にUnicodeを推奨してるくらいじゃない?
538デフォルトの名無しさん
2019/08/20(火) 11:37:07.61ID:zlJnj2O9 >>531
これはひどいω
これはひどいω
539デフォルトの名無しさん
2019/08/20(火) 11:39:07.12ID:zlJnj2O9 >>533
ファイル名まで .sjis つけてるくせになんで iso-2022-jp で保存してるのかイミフ
ファイル名まで .sjis つけてるくせになんで iso-2022-jp で保存してるのかイミフ
540デフォルトの名無しさん
2019/08/20(火) 18:30:12.77ID:Gkd3xMH4 なんか同じような原因で文字化けしてるページに対して
同じようなレスをした記憶が…と思ったら前スレにあった。
記憶障害じゃなくてよかったw
https://mevius.5ch.net/test/read.cgi/tech/1516629503/821-843
同じようなレスをした記憶が…と思ったら前スレにあった。
記憶障害じゃなくてよかったw
https://mevius.5ch.net/test/read.cgi/tech/1516629503/821-843
541デフォルトの名無しさん
2019/08/20(火) 21:44:07.86ID:Y189B2BT HTMLをiso-2022-jpにするのって
どこの文化なんだろうか?
Windowsはsjisだからありえないし
Linuxも昔の普通はEUC-JPだろ?
iso-2022-jpはメールにしか使われてなかったはずだが
どこの文化なんだろうか?
Windowsはsjisだからありえないし
Linuxも昔の普通はEUC-JPだろ?
iso-2022-jpはメールにしか使われてなかったはずだが
542デフォルトの名無しさん
2019/08/20(火) 21:47:57.43ID:UVunetX1 >>531
イシカワ マサヤスというのは誰だろうね。
イシカワ マサヤスというのは誰だろうね。
543デフォルトの名無しさん
2019/08/20(火) 21:51:25.41ID:Y189B2BT イシカワ マサヤスさんでは?
544デフォルトの名無しさん
2019/08/20(火) 21:52:36.86ID:UVunetX1 石川雅康と石川哲志は親族だろうか?
どちらもICT業界から去ったのかな。
どちらもICT業界から去ったのかな。
545デフォルトの名無しさん
2019/08/20(火) 21:54:13.55ID:Y189B2BT またつまらんものを
546デフォルトの名無しさん
2019/08/20(火) 21:58:33.22ID:UVunetX1 XHTMLが終わってしまって、そのまま放置の石川さん。
547デフォルトの名無しさん
2019/08/20(火) 22:46:49.05ID:anpoimU7 >>541
sjisやeuc-jpが整う前は、HTMLをiso-2022-jpにするのも選択肢の一つだったらしい
ttp://www.tohoho-web.com/lng/199801/98011002.htm
sjisやeuc-jpが整う前は、HTMLをiso-2022-jpにするのも選択肢の一つだったらしい
ttp://www.tohoho-web.com/lng/199801/98011002.htm
549デフォルトの名無しさん
2019/08/20(火) 23:43:43.88ID:Gkd3xMH4 > どこかの雑誌で、「charset=iso-2022-jp は自動判別の指定」と堂々と紹介された
http://web.archive.org/web/19980116120529/http://www.pro.or.jp/~fuji/horrible/horrible.kanji.html
えぇ……。
http://web.archive.org/web/19980116120529/http://www.pro.or.jp/~fuji/horrible/horrible.kanji.html
えぇ……。
550デフォルトの名無しさん
2019/08/21(水) 00:08:09.19ID:/FRdjxvW 1998年当時のWebブラウザはキャラクタセットの判定すら怪しかった。
551デフォルトの名無しさん
2019/08/21(水) 02:35:13.27ID:GZen3C6t >>549
そのリンク先に書いてあるけど、iso-2022-jp が使われてるのはMSが発端なのか?
> name="GENERATOR" content="Microsoft FrontPage 2.0"
> というのが各HTMLファイルの先頭にあることから、Microsoft の FrontPage が 漢字コードがシフトJISのファイルであるにもか かわらず、iso-2022-jp の指定するからではないかと思われます。
そのリンク先に書いてあるけど、iso-2022-jp が使われてるのはMSが発端なのか?
> name="GENERATOR" content="Microsoft FrontPage 2.0"
> というのが各HTMLファイルの先頭にあることから、Microsoft の FrontPage が 漢字コードがシフトJISのファイルであるにもか かわらず、iso-2022-jp の指定するからではないかと思われます。
552デフォルトの名無しさん
2019/08/21(水) 03:44:23.93ID:jDiMObB6553551
2019/08/21(水) 05:07:33.18ID:GZen3C6t あ、違ったわ。MSのはMicrosoft FrontPage 2.0がmetaタグの指定を間違ってるって話で
HTMLの内容がiso-2022-jpというのはまた別問題か
sjis以外あるかな?ってやってみたら他のエンコーディングも見つかったし
>>531は単なる文字コード変換ミスかな?
https://www.w3.org/People/mimasa/xmldev.html.ja.aaaaa
HTMLの内容がiso-2022-jpというのはまた別問題か
sjis以外あるかな?ってやってみたら他のエンコーディングも見つかったし
>>531は単なる文字コード変換ミスかな?
https://www.w3.org/People/mimasa/xmldev.html.ja.aaaaa
554デフォルトの名無しさん
2019/08/21(水) 14:49:37.63ID:ur92HW83 拡張子付け間違いか
555デフォルトの名無しさん
2019/08/22(木) 06:16:14.71ID:mlpPC2JR ブラウザって一時だけでも拡張子によって文字コードを判断してた時期があったの?
俺の記憶にはないのだけども……。
俺の記憶にはないのだけども……。
556デフォルトの名無しさん
2019/08/22(木) 06:36:57.94ID:jM8tCXZ0 だからこれはjisという拡張子でHTTPヘッダのcharsetもshift_jisなのに
中身がiso-2022-jpなんだってば
iso-2022-jpが使えるテキストエディタで書いたか
sjisに変換すべきところをiso-2022-jpに変換してしまったということ
昔のWindowsで書いたならsjisになるだろうから変換ミスかなって話
中身がiso-2022-jpなんだってば
iso-2022-jpが使えるテキストエディタで書いたか
sjisに変換すべきところをiso-2022-jpに変換してしまったということ
昔のWindowsで書いたならsjisになるだろうから変換ミスかなって話
557デフォルトの名無しさん
2019/08/22(木) 08:04:31.58ID:jlFkmCtz jisって拡張子ならiso-2022-jp(JISコード)なのは意図通りだろ
HTTPヘッダのcharsetが食い違ってるだけで
HTTPヘッダのcharsetが食い違ってるだけで
558デフォルトの名無しさん
2019/08/22(木) 09:50:35.92ID:xQsiKIbM 鯖の仕様が変わってcharsetのデフォが変わったからな
サーバー引越のときに設定間違えた可能性はあり得る
サーバー引越のときに設定間違えた可能性はあり得る
559デフォルトの名無しさん
2019/08/22(木) 10:23:09.36ID:jM8tCXZ0560デフォルトの名無しさん
2019/08/22(木) 10:30:34.86ID:jM8tCXZ0 昔のブラウザはHTTPヘッダのcharsetよりも
ドキュメントからの文字コード判定の方を重視していた。
なぜならセキュリティというかサーバー運営者がよくわかっておらず
設定変更の必要性を理解できていなかったので設定されてなかった
たとえ設定変更ができるサーバーでもユーザーが理解していなかった
そんな時代だからブラウザで表示できれば良し程度のレベルが普通で
今からするとチェックが甘かった。その当時の間違った文字コードのページが今も残っている。
たぶんこんなところ
ドキュメントからの文字コード判定の方を重視していた。
なぜならセキュリティというかサーバー運営者がよくわかっておらず
設定変更の必要性を理解できていなかったので設定されてなかった
たとえ設定変更ができるサーバーでもユーザーが理解していなかった
そんな時代だからブラウザで表示できれば良し程度のレベルが普通で
今からするとチェックが甘かった。その当時の間違った文字コードのページが今も残っている。
たぶんこんなところ
562デフォルトの名無しさん
2019/08/22(木) 10:35:00.76ID:jM8tCXZ0563デフォルトの名無しさん
2019/08/22(木) 10:38:26.99ID:8JJS2LZD564デフォルトの名無しさん
2019/08/22(木) 15:58:03.72ID:mlpPC2JR 皆さん落ち着いて
565デフォルトの名無しさん
2019/08/23(金) 17:29:19.40ID:bWgnQwQ7 なんでUTF8以外違法になった今そんな話してんだか・・・
566デフォルトの名無しさん
2019/08/23(金) 17:59:07.09ID:UifFOlyJ × 違法 ○ 非推奨
567デフォルトの名無しさん
2019/08/24(土) 00:05:20.43ID:Ka96Zrl8 秘宝とか緋水晶とか何の話をしてるんだ?
568デフォルトの名無しさん
2019/08/25(日) 20:34:39.12ID:++G8a3I1 ムーンプリズムパワー!メイクアップ!
569デフォルトの名無しさん
2019/08/25(日) 22:05:01.03ID:E2o3oeEK タリスマン
570デフォルトの名無しさん
2019/08/25(日) 22:36:09.44ID:heTmUHGD クリマタスミ
571デフォルトの名無しさん
2019/08/28(水) 13:35:52.48ID:AiVdwxrR ひまだ
572デフォルトの名無しさん
2019/08/28(水) 19:19:16.62ID:lfvHhqTB サクラエディタがとうの昔にUTF32対応していた事実をいまごろ知った。
573デフォルトの名無しさん
2019/08/28(水) 20:04:07.93ID:FG4A80Dg じっさい32じたいそんな使わないだろw
574デフォルトの名無しさん
2019/08/29(木) 18:28:30.40ID:VG5IecJ5 でもUTF-16の「どんな文字でも固定ビット幅」という利点が失われてしまった今,
固定ビット幅が実現できる唯一の規格であるUTF-32は希少では。
固定ビット幅が実現できる唯一の規格であるUTF-32は希少では。
575デフォルトの名無しさん
2019/08/29(木) 18:42:08.11ID:y3rrvHgi 読むぶんにはナイーブな実装で足りるからいいけど実際使うとなったら00が無駄に思えてきて敬遠しがち
だからもしかすると文字コードでさえ適材適所なのかと考え始めている
だからもしかすると文字コードでさえ適材適所なのかと考え始めている
576デフォルトの名無しさん
2019/08/29(木) 18:49:00.69ID:1ks18uap 内部表現は32bit単位で固定長の方が楽
ファイル読み書きのときはutf-8で勝利
あとはcps932が滅ぶのを待つだけ
ファイル読み書きのときはutf-8で勝利
あとはcps932が滅ぶのを待つだけ
577デフォルトの名無しさん
2019/08/29(木) 19:05:33.35ID:VG5IecJ5 OSのインターフェースはUTF-8,内部表現はUTF-32が一番いいのかもね。
UTF-32だとASCIIに比べて単純計算で四倍弱の容量を食ってしまうのが難点。
でもOSの本体くらいならそもそもテキストとして表現されてるファイルも少ないし案外肥大化は防げるのかも。
UTF-32だとASCIIに比べて単純計算で四倍弱の容量を食ってしまうのが難点。
でもOSの本体くらいならそもそもテキストとして表現されてるファイルも少ないし案外肥大化は防げるのかも。
578デフォルトの名無しさん
2019/08/29(木) 19:09:37.98ID:CAV+1+Xc という会話を何年も前にこのスレで観た
579デフォルトの名無しさん
2019/08/29(木) 19:11:19.48ID:YrWceYNE 複数のコードポイントのシーケンスで一文字を表現するUNICODEだから
UTF-32でも一文字が32bitで収まるとは限らないからUTF-8でも大差ない
UTF-32でも一文字が32bitで収まるとは限らないからUTF-8でも大差ない
580デフォルトの名無しさん
2019/08/29(木) 20:02:33.30ID:jljmwQsV プログラミング言語C++に関していうと、x64版Linux用gccは既定でwchar_tのサイズが4バイト。
つまりx64版Linux用gccはstd::wstringがUTF-32。誰も使っていないように見えてそうでもない。
つまりx64版Linux用gccはstd::wstringがUTF-32。誰も使っていないように見えてそうでもない。
581デフォルトの名無しさん
2019/08/29(木) 21:00:32.68ID:FJllEP/G 【名案】0〜9の代わりにUnicode全文字を使えば「65536進法」になり,なんでも1桁で表現できるから2桁の計算が不要! ・・・ためしに「65021−65018=3」ってどう書くの?
https://togetter.com/li/1396827
https://togetter.com/li/1396827
582デフォルトの名無しさん
2019/08/29(木) 22:50:02.31ID:azXlKn0W UTF-16でも8バイト必要なのに、32bit(4バイト)に収まるわけ無いだろうw
漢字1文字が最大8バイト、Unicodeの「IVS」とは?
https://tech.nikkeibp.co.jp/it/article/COLUMN/20100126/343783/
漢字1文字が最大8バイト、Unicodeの「IVS」とは?
https://tech.nikkeibp.co.jp/it/article/COLUMN/20100126/343783/
583デフォルトの名無しさん
2019/08/29(木) 23:01:38.50ID:jljmwQsV UTF-8だけで必要十分という結論に到達せざるをえない現実
584デフォルトの名無しさん
2019/08/29(木) 23:09:19.19ID:azXlKn0W 逆なんだよな。
本来UTF-32だけで必要十分だったのにどんどん複雑にしていって、
UTF-32でも不便になったからUTF-8でいいでしょ?
どうせ単純には扱えずライブラリ使うしか無いんだから。
という必要十分な文字コードを捨てたというのが現実
本来UTF-32だけで必要十分だったのにどんどん複雑にしていって、
UTF-32でも不便になったからUTF-8でいいでしょ?
どうせ単純には扱えずライブラリ使うしか無いんだから。
という必要十分な文字コードを捨てたというのが現実
585デフォルトの名無しさん
2019/08/29(木) 23:11:55.32ID:jljmwQsV 宇宙に存在するすべての知的生命体が用いている文字すべてを網羅するのがUnicodeの理念。
たったの32bitで足りるわけがない。
たったの32bitで足りるわけがない。
586デフォルトの名無しさん
2019/08/30(金) 00:11:25.73ID:h/StilS8 文字コードのスレッドなのにUnicodeがわかっていないやつらばかりw
587デフォルトの名無しさん
2019/08/30(金) 01:01:22.62ID:LpXSw35l UTF-32じゃなくてUCS4じゃないの?内部コードに便利なのは
588デフォルトの名無しさん
2019/08/30(金) 01:29:38.44ID:/ghu33Nb >>586
ではどうぞ御説明をどうぞw
ではどうぞ御説明をどうぞw
589デフォルトの名無しさん
2019/08/30(金) 13:00:23.27ID:oVszNH41 >>579
codecvtは糞だ
codecvtは糞だ
590デフォルトの名無しさん
2019/08/30(金) 13:03:12.55ID:oVszNH41591デフォルトの名無しさん
2019/08/30(金) 15:32:59.58ID:6uSriybI >>588
UTF-16を16ビットで1文字を表すと思い込んでいる人間がいるが、16ビット単位でデータ扱うだけで、1文字が32ビットのこともある。
UTF-16を16ビットで1文字を表すと思い込んでいる人間がいるが、16ビット単位でデータ扱うだけで、1文字が32ビットのこともある。
592デフォルトの名無しさん
2019/08/30(金) 15:56:24.57ID:iPGqG8dk >>591
それぐらいみんな知ってる
それぐらいみんな知ってる
593デフォルトの名無しさん
2019/08/30(金) 17:05:21.42ID:GEn/r+mZ >>592
それぐらいみんな知ってる
それぐらいみんな知ってる
594デフォルトの名無しさん
2019/08/30(金) 17:19:36.31ID:57FOZgRt ビットサイズ固定でどうにかなると思っていた時期が俺にもありました。
595デフォルトの名無しさん
2019/08/30(金) 17:27:36.02ID:GEn/r+mZ596デフォルトの名無しさん
2019/08/31(土) 10:08:53.77ID:0iGUnrw4 >>591
スレの流れみた?UTF-32の話をしてんだぞ?
スレの流れみた?UTF-32の話をしてんだぞ?
597デフォルトの名無しさん
2019/08/31(土) 15:33:43.16ID:SHne0DDt >>596
そのまえ
そのまえ
598デフォルトの名無しさん
2019/08/31(土) 15:35:30.15ID:SHne0DDt 6 仕様書無しさん sage 2019/08/31(土) 11:36:13.12
日本人ならUTF16を掲げるJavaを支持すべきだ
日本人ならUTF16を掲げるJavaを支持すべきだ
599デフォルトの名無しさん
2019/08/31(土) 15:37:04.56ID:3i1dPJsj >>598
それは理由が書いてないから、読む価値ある?
それは理由が書いてないから、読む価値ある?
600デフォルトの名無しさん
2019/08/31(土) 15:45:23.47ID:4qIvp+ND なんで毛唐の決めたコードを支持するのか、意味が分からん
ネットウヨの類は米英には尻の穴まで晒すようだし困ったものだ
ネットウヨの類は米英には尻の穴まで晒すようだし困ったものだ
601デフォルトの名無しさん
2019/08/31(土) 15:56:52.05ID:3i1dPJsj ん?支持しなくて良いよ
602デフォルトの名無しさん
2019/08/31(土) 17:12:51.44ID:0iGUnrw4603デフォルトの名無しさん
2019/08/31(土) 17:59:12.56ID:Yn5v13ie ネットウヨw
604デフォルトの名無しさん
2019/08/31(土) 20:21:37.85ID:5EL66xzp re2のようにUTF-8にしか正式対応していない正規表現ライブラリもある。
605デフォルトの名無しさん
2019/08/31(土) 22:52:53.39ID:0iGUnrw4 寧ろre2がUTF-32に対応すべきでは。
もしくはiconv使う。
もしくはiconv使う。
606デフォルトの名無しさん
2019/08/31(土) 22:58:57.55ID:3i1dPJsj UTF-32対応は難しいから無理だろ
607デフォルトの名無しさん
2019/09/01(日) 01:36:48.58ID:sYwYgS29 iconv禁止
608デフォルトの名無しさん
2019/09/01(日) 09:07:17.74ID:XF6G4Ohn NKF(Network Kanji code conversion Filter)を使えば?
Ruby にも、NKF モジュールがある
Ruby にも、NKF モジュールがある
609デフォルトの名無しさん
2019/09/01(日) 10:46:26.40ID:YneNC5Ev 別にコード変換ツールを探してるわけじゃなくね?w
610デフォルトの名無しさん
2019/09/01(日) 10:52:49.46ID:kCJZVLuH どこぞの皇帝や中国王朝みたいに文字の方を変えて宇宙統一してしまえば良い
文字コードに合った文字だけ使えば解決
文字コードに合った文字だけ使えば解決
611デフォルトの名無しさん
2019/09/01(日) 12:53:54.91ID:k0czTyLP 収録文字数が2の16乗を超えた時点でUTF16は破綻したんだから、サロゲートペアなんて
煩雑な延命策を取らず、UTF32に完全移行すべきだった。
UTF16を残したせいでUTF32にも皺寄せが来ている。UTF32ではU+FFFFFFFFまで
対応できるはずなのに、UTF16のサロゲートペアで表せるU+10FFFFまでに符号空間が
制約されてしまった。つまり、実質的に32ビットではなく21ビットコードになってしまった。
UTF16を全廃しUTF32を本来の32ビットまで拡張すれば、異字体を異字体セレクタなしで
収録できるから、すべての文字を32ビットで表せて単純明快になる。
煩雑な延命策を取らず、UTF32に完全移行すべきだった。
UTF16を残したせいでUTF32にも皺寄せが来ている。UTF32ではU+FFFFFFFFまで
対応できるはずなのに、UTF16のサロゲートペアで表せるU+10FFFFまでに符号空間が
制約されてしまった。つまり、実質的に32ビットではなく21ビットコードになってしまった。
UTF16を全廃しUTF32を本来の32ビットまで拡張すれば、異字体を異字体セレクタなしで
収録できるから、すべての文字を32ビットで表せて単純明快になる。
612デフォルトの名無しさん
2019/09/01(日) 13:07:58.05ID:lmQdJ5gb >>611
いろいろ間違ってるなw
まずUTF-16という仕様にはサロゲートペアが最初から含まれてる
UTF32に完全移行って何を移行するっていうんだ?互換性がないんだから
既に使われてるものを簡単に変えられるわけがない。
UTF32が21bitコードになってしまったのはUTF-8のせいだ
21bitあれば209万7152文字を表現できるんだから異字体セレクタなしで十分収録できる
いろいろ間違ってるなw
まずUTF-16という仕様にはサロゲートペアが最初から含まれてる
UTF32に完全移行って何を移行するっていうんだ?互換性がないんだから
既に使われてるものを簡単に変えられるわけがない。
UTF32が21bitコードになってしまったのはUTF-8のせいだ
21bitあれば209万7152文字を表現できるんだから異字体セレクタなしで十分収録できる
613デフォルトの名無しさん
2019/09/01(日) 13:11:25.72ID:xmxF7u0H 異体字セレクタが導入されたのは別にコードポイントが足りないからじゃないだろ。
異体字なんて数が限られているし、それ以上に役に立たない絵文字をバンバン追加している状況だし。
異体字なんて数が限られているし、それ以上に役に立たない絵文字をバンバン追加している状況だし。
614デフォルトの名無しさん
2019/09/01(日) 13:35:49.57ID:JCPxJyAV MSがUTF-16を採用したせいで廃止しようにもできないだろ
CP932とSJISとUTF16が生き残ってるのもだいたいこいつのせいだ
CP932とSJISとUTF16が生き残ってるのもだいたいこいつのせいだ
615デフォルトの名無しさん
2019/09/01(日) 13:40:59.73ID:kCJZVLuH >>612
おまいもかなり可笑しいなω
おまいもかなり可笑しいなω
616デフォルトの名無しさん
2019/09/01(日) 13:42:43.07ID:k0czTyLP >>612
>まずUTF-16という仕様にはサロゲートペアが最初から含まれてる
あれ、そうだった? だとしたら、UTF16は最初から破綻していたってことだな。
変なものを作らずにUTF32を導入すべきだった。
>UTF32に完全移行って何を移行するっていうんだ?互換性がないんだから
>既に使われてるものを簡単に変えられるわけがない。
シフトJISからUnicodeへも互換性がないのに移行が進んだだろ。
>UTF32が21bitコードになってしまったのはUTF-8のせいだ
UTF8は可変長だから、32ビットでも表そう思えば表せる。
21ビットになったのはUTF16のせい。
>21bitあれば209万7152文字を表現できるんだから異字体セレクタなしで十分収録できる
収録した記号は他にも色々あるし、U+F0000〜U+10FFFFは外字領域だし、
21ビットだけでは心許ない。
>>613
異字体セレクタは同じコードでもAdobe-Japan1とMoji_Johoで字体が違う
滅茶苦茶な欠陥規格だから、さっさと廃止した方が良い。
>まずUTF-16という仕様にはサロゲートペアが最初から含まれてる
あれ、そうだった? だとしたら、UTF16は最初から破綻していたってことだな。
変なものを作らずにUTF32を導入すべきだった。
>UTF32に完全移行って何を移行するっていうんだ?互換性がないんだから
>既に使われてるものを簡単に変えられるわけがない。
シフトJISからUnicodeへも互換性がないのに移行が進んだだろ。
>UTF32が21bitコードになってしまったのはUTF-8のせいだ
UTF8は可変長だから、32ビットでも表そう思えば表せる。
21ビットになったのはUTF16のせい。
>21bitあれば209万7152文字を表現できるんだから異字体セレクタなしで十分収録できる
収録した記号は他にも色々あるし、U+F0000〜U+10FFFFは外字領域だし、
21ビットだけでは心許ない。
>>613
異字体セレクタは同じコードでもAdobe-Japan1とMoji_Johoで字体が違う
滅茶苦茶な欠陥規格だから、さっさと廃止した方が良い。
617デフォルトの名無しさん
2019/09/01(日) 14:01:22.04ID:JCPxJyAV (もしかして: フォント)
618デフォルトの名無しさん
2019/09/01(日) 14:17:44.56ID:Cv4S4gQH >>616
> UTF8は可変長だから、32ビットでも表そう思えば表せる。
無理。UTF-8は「自由に可変にできる文字コード」ではない。
ビットパターンが決まっていて最大21bitまでしか表現できない
> UTF8は可変長だから、32ビットでも表そう思えば表せる。
無理。UTF-8は「自由に可変にできる文字コード」ではない。
ビットパターンが決まっていて最大21bitまでしか表現できない
619デフォルトの名無しさん
2019/09/01(日) 14:29:25.97ID:k0czTyLP >>618
原理的にはUTF8は「自由に可変にできる文字コード」で32ビットも表せる。
UTF16の制約で符号空間が21ビットのU+10FFFFまでと定められたから、
UTF8もそれを超えるコードを規格外とみなすようにしただけ。
原理的にはUTF8は「自由に可変にできる文字コード」で32ビットも表せる。
UTF16の制約で符号空間が21ビットのU+10FFFFまでと定められたから、
UTF8もそれを超えるコードを規格外とみなすようにしただけ。
620デフォルトの名無しさん
2019/09/01(日) 14:38:49.28ID:5y1tL0M+621デフォルトの名無しさん
2019/09/01(日) 15:12:24.21ID:VpClr4jS >>614
JavaやJavaScriptの内部エンコーディングもUTF-16だが
JavaやJavaScriptの内部エンコーディングもUTF-16だが
622デフォルトの名無しさん
2019/09/01(日) 15:24:13.07ID:Cv4S4gQH623デフォルトの名無しさん
2019/09/02(月) 15:56:23.21ID:8MncpZHQ 魔法(圧力)
624デフォルトの名無しさん
2019/09/02(月) 16:24:11.77ID:KSSQVEnP625デフォルトの名無しさん
2019/09/02(月) 22:33:53.67ID:8MncpZHQ マジレスするとOOXMLとかXPSとか「ある程度便利だけど既存の規格で十分じゃない?」というMS独自規格を、
MSが企業に圧力を掛けたりして広めてきた歴史を言ってるんじゃなかろうか。
念の為言っておくとOOXML←OpenDocument、XPS←PDFね。
MSが企業に圧力を掛けたりして広めてきた歴史を言ってるんじゃなかろうか。
念の為言っておくとOOXML←OpenDocument、XPS←PDFね。
626デフォルトの名無しさん
2019/09/03(火) 00:26:14.39ID:EcUF0HHf そんな圧力あったかなあ
627デフォルトの名無しさん
2019/09/03(火) 06:39:22.40ID:KovswbEV628デフォルトの名無しさん
2019/09/03(火) 08:49:15.73ID:/ybqtULG MSがXPSを作った時、まだPDFは標準規格化されてなかったはずだが
それにPDFの競合規格はXPS以外にもたくさんある
https://ja.wikipedia.org/wiki/Portable_Document_Format#PDF%E3%81%AE%E7%AB%B6%E5%90%88%E8%A6%8F%E6%A0%BC
それにPDFの競合規格はXPS以外にもたくさんある
https://ja.wikipedia.org/wiki/Portable_Document_Format#PDF%E3%81%AE%E7%AB%B6%E5%90%88%E8%A6%8F%E6%A0%BC
629デフォルトの名無しさん
2019/09/03(火) 10:21:51.94ID:KovswbEV PDFはアドビのプロプラフォーマットってイメージが抜けないw
630デフォルトの名無しさん
2019/09/03(火) 10:34:53.29ID:gWEsYspA JavaだってSunのプロプラ言語だぞ
631667
2019/09/03(火) 12:40:23.25ID:JzHlK+VD 今は違うけどね
632デフォルトの名無しさん
2019/09/03(火) 15:04:07.63ID:jfAsT/N5 そのうち「MSはUnicodeを潰すためにCP932を作った」とか言い出す奴が出てくる
633デフォルトの名無しさん
2019/09/03(火) 15:40:05.81ID:KovswbEV Windowsの内部でCP932に依存している。
英語版Windowsも含めて日本語文字コードが内部で使われている
って思ってるやつは本当にいる
英語版Windowsも含めて日本語文字コードが内部で使われている
って思ってるやつは本当にいる
634デフォルトの名無しさん
2019/09/03(火) 16:56:31.60ID:MR8tgZNH >>627
LinuxはWindowsとは思想がほぼ真逆だからね。
多様性を重んじる。俺はそっちのほうが好きかな。
でもそれを至高とするあまり,古いカーネルや別の派生版との互換性が,Windowsのそれらに比べてない。
LinuxはWindowsとは思想がほぼ真逆だからね。
多様性を重んじる。俺はそっちのほうが好きかな。
でもそれを至高とするあまり,古いカーネルや別の派生版との互換性が,Windowsのそれらに比べてない。
635デフォルトの名無しさん
2019/09/03(火) 16:58:35.78ID:MR8tgZNH636デフォルトの名無しさん
2019/09/03(火) 17:26:28.25ID:KovswbEV >>634
だから多様性を重んじるっていうのは
競合するフォーマットが複数できるってことで
(例えば画像フォーマットや圧縮フォーマット)
Microsoftが独自フォーマットを作るのと同じ思想なんだよ
だから多様性を重んじるっていうのは
競合するフォーマットが複数できるってことで
(例えば画像フォーマットや圧縮フォーマット)
Microsoftが独自フォーマットを作るのと同じ思想なんだよ
637デフォルトの名無しさん
2019/09/03(火) 17:35:15.54ID:KovswbEV638デフォルトの名無しさん
2019/09/03(火) 19:23:12.90ID:i0SweFPn639デフォルトの名無しさん
2019/09/03(火) 19:25:28.03ID:KovswbEV > Windowsは表面的にはSJISで
ほらな、SJISじゃないって言ってんのにSJISだっていう
潜在意識レベルでそう思い込んでるから治しようがないw
ほらな、SJISじゃないって言ってんのにSJISだっていう
潜在意識レベルでそう思い込んでるから治しようがないw
640デフォルトの名無しさん
2019/09/03(火) 19:51:10.42ID:9BNoj6TJ WindowsというよりWindowsアプリが特定のOEMコードページやANSIコードページに決め打ちして作られてる物があるということだろ
他言語の状況は知らんけど日本語以外でも似たようなものだろうな
他言語の状況は知らんけど日本語以外でも似たようなものだろうな
641デフォルトの名無しさん
2019/09/03(火) 21:04:34.10ID:VgehgunL Linuxの思想自体は多様性を重んじるのかもしれんが、ユーザーはそれに反して
「UTF-8以外死ね」みたいに言う奴多いよな。
「UTF-8以外死ね」みたいに言う奴多いよな。
642デフォルトの名無しさん
2019/09/03(火) 21:08:34.33ID:KovswbEV そうはいってもLinuxはASCIIと互換性がない文字コード(例 UTF-32)は死ねだからw
影響範囲が大きすぎて、LinuxはUTF-16とかUTF-32には事実上対応できないんだよね
影響範囲が大きすぎて、LinuxはUTF-16とかUTF-32には事実上対応できないんだよね
643デフォルトの名無しさん
2019/09/03(火) 21:51:19.99ID:kvsGhJj2 文字集合を符号化するのは、文字の区切れが判断できないからって解釈してんだけどあってる?
644デフォルトの名無しさん
2019/09/03(火) 22:15:09.34ID:18+sQUYN645デフォルトの名無しさん
2019/09/04(水) 01:38:53.56ID:Gs/bLtCt 一橋大学アウティング事件でググれ
646デフォルトの名無しさん
2019/09/04(水) 04:00:00.76ID:xGPrnpMI647デフォルトの名無しさん
2019/09/04(水) 09:16:30.39ID:n47u8TF1648デフォルトの名無しさん
2019/09/04(水) 18:11:05.05ID:gX5VYMvu >>639
Windowsが作るシステムファイルもSJISですよ?
Windowsが作るシステムファイルもSJISですよ?
649デフォルトの名無しさん
2019/09/04(水) 18:12:22.94ID:vwhL3cv7 >>648
そういうネタはいらんから
そういうネタはいらんから
650デフォルトの名無しさん
2019/09/04(水) 18:52:19.95ID:gX5VYMvu >>649
延々と嘘を書くのはやめてもらえませんか?
延々と嘘を書くのはやめてもらえませんか?
651デフォルトの名無しさん
2019/09/04(水) 19:01:15.19ID:vwhL3cv7 ネタにネタをかぶせてもつまらんで
652デフォルトの名無しさん
2019/09/04(水) 19:24:35.38ID:gX5VYMvu 妄想か
653デフォルトの名無しさん
2019/09/04(水) 22:41:17.45ID:n47u8TF1 まあWindowsはNTカーネルとは限らないからな
654デフォルトの名無しさん
2019/09/05(木) 00:35:42.74ID:rtvg+Hab >>653はNTカーネルに限ると完全Unicode対応って意味やで
655デフォルトの名無しさん
2019/09/05(木) 00:50:59.59ID:5i/MxHnj ここでUnicodeといっちゃうあたりの頭の弱さよ
656デフォルトの名無しさん
2019/09/05(木) 01:09:51.35ID:rtvg+Hab657デフォルトの名無しさん
2019/09/05(木) 01:11:05.81ID:rtvg+Hab どうせ言い返す言葉は無いだろうから
待ってても時間の無駄なので先に言っておくと
何も言わない or 捨て台詞はくだけ なら俺に喧嘩売らなければいいのにw
待ってても時間の無駄なので先に言っておくと
何も言わない or 捨て台詞はくだけ なら俺に喧嘩売らなければいいのにw
658デフォルトの名無しさん
2019/09/05(木) 04:37:49.32ID:5ZYYoPpa 完全Unicode対応ならどの符号化方式も対応してなきゃダメだろ
659デフォルトの名無しさん
2019/09/05(木) 05:59:20.80ID:rtvg+Hab ※ LinuxはUTF-16、UTF-32に対応していません
660デフォルトの名無しさん
2019/09/05(木) 06:00:04.95ID:rtvg+Hab ※ MacもUTF-16、UTF-32に対応していません
661デフォルトの名無しさん
2019/09/05(木) 06:48:35.75ID:5ZYYoPpa 他者を貶めたところで>>654が真実になることはない
662デフォルトの名無しさん
2019/09/05(木) 06:54:53.66ID:rtvg+Hab 他者を貶めるってなんのこと?
663デフォルトの名無しさん
2019/09/05(木) 07:53:38.03ID:5ZYYoPpa >>662
NTカーネル以外のものは他者だろ
NTカーネル以外のものは他者だろ
664デフォルトの名無しさん
2019/09/05(木) 08:02:45.45ID:rtvg+Hab じゃあNTカーネルに限ってはUnicodeっていうのは正しいってこと?
665デフォルトの名無しさん
2019/09/05(木) 12:58:50.41ID:5R9ffMew どーしても我流を貫きたいんだなw
まあ他人の人生だから干渉するつもりはないが,そういう生き方は苦労すると思うぞ?
まあ他人の人生だから干渉するつもりはないが,そういう生き方は苦労すると思うぞ?
666デフォルトの名無しさん
2019/09/11(水) 17:58:19.49ID:quHYHgkx667デフォルトの名無しさん
2019/09/12(木) 12:27:59.62ID:umd/llTn 全然関係ないけどWPへのリンクはMWの短縮URLが使える。
https://w.wiki/8Ew
https://w.wiki/8Ew
668デフォルトの名無しさん
2019/09/12(木) 12:43:49.99ID:vEKot6kT 本当に短縮したいところは日本語ページのパーセントエンコードされたところだがうまくいかないもんだな
669デフォルトの名無しさん
2019/09/13(金) 09:23:49.73ID:rpBkWpcK 日本語のページも短縮URLにできるんだけど,そうじゃなくて?
670デフォルトの名無しさん
2019/09/13(金) 10:11:35.77ID:wKEqF87n 文字通り文字コードのエンコードを間違えてるんだろう
671デフォルトの名無しさん
2019/09/13(金) 16:18:49.47ID:nYKvQkSU [%E5は無効なエンコードです。メインページに戻る。]
672デフォルトの名無しさん
2019/09/13(金) 17:19:54.63ID:PF759nqS 当たり前だけど問題ないな
https://w.wiki/8Hy
https://w.wiki/8Hy
673デフォルトの名無しさん
2019/09/14(土) 00:14:10.89ID:UZ9Fxxpp これ使われた順に生成されていくの?
そのうち4文字になるんかな
そのうち4文字になるんかな
674デフォルトの名無しさん
2019/09/14(土) 00:23:57.48ID:FV8dJ/wR 絵文字などサロゲートペアが必要な領域をUTF-7で表現するとUTF-32よりもバイトサイズが大きくなる。まめな。
675デフォルトの名無しさん
2019/09/14(土) 11:56:27.23ID:mIZ3m5oP utf-7が使われてる環境とかデータとか出会ったことが無い
676デフォルトの名無しさん
2019/09/15(日) 03:21:10.57ID:TEajZO+5 見せたろか
677デフォルトの名無しさん
2019/09/15(日) 04:11:30.07ID:LMFjfaUx 見せて!
678デフォルトの名無しさん
2019/09/15(日) 04:14:52.61ID:vhYJbDpr utf7ってasciiじゃないっけ?
679デフォルトの名無しさん
2019/09/15(日) 05:00:59.65ID:cvkFPip1 ここにはない
680デフォルトの名無しさん
2019/09/15(日) 10:05:21.58ID:tu3q64lr681デフォルトの名無しさん
2019/09/16(月) 06:54:09.51ID:vTAkg/qq じゃ,そういうことじゃん
682デフォルトの名無しさん
2019/09/21(土) 16:46:43.93ID:7QW0JGF+ UTF-8もUTF-7も「ASCII互換にしようと思えばできる」文字符号化方式で
UTF-16/32は端から過去互換性を捨ててるっていう理解OK?
UTF-16/32は端から過去互換性を捨ててるっていう理解OK?
683デフォルトの名無しさん
2019/09/21(土) 17:12:22.41ID:icgczTg/ 互換の意味判ってるか?
684デフォルトの名無しさん
2019/09/21(土) 17:13:19.94ID:AMltcnvP >>682
ちゃんと仕様読め
ちゃんと仕様読め
685デフォルトの名無しさん
2019/09/22(日) 02:18:18.82ID:tTe+mIIa >>682
意味がわからない
意味がわからない
686デフォルトの名無しさん
2019/09/22(日) 11:35:45.78ID:LQCFANDg >>682
OK
OK
687デフォルトの名無しさん
2019/09/22(日) 12:48:42.82ID:Uxh+z88Q688デフォルトの名無しさん
2019/09/22(日) 15:28:59.04ID:yDiw/0G9 教訓:5chで情報収集するな
689デフォルトの名無しさん
2019/09/22(日) 21:23:59.11ID:rg/me2jP 互換って何なの
690デフォルトの名無しさん
2019/09/22(日) 22:18:40.20ID:sBc79exV 揚げ足取り終了。
質問。皆さんが普段使っている文字コード変換ライブラリでおススメはなんですか。
質問。皆さんが普段使っている文字コード変換ライブラリでおススメはなんですか。
691デフォルトの名無しさん
2019/09/22(日) 23:28:10.21ID:JTFkWMft お勧めもなにもiconvかICUで大体用は足りる
それで満足しなきゃ自分で作るしかない
それで満足しなきゃ自分で作るしかない
692デフォルトの名無しさん
2019/09/23(月) 08:58:26.51ID:10n0KRvd 文字コードの変換だけ?
いまどきのまともな言語環境なら変換元のエンコーディングさえ分かってれば標準機能で出来るだろうに
それとも全角⇔半角の変換みたいなのをやりたいってこと?
いまどきのまともな言語環境なら変換元のエンコーディングさえ分かってれば標準機能で出来るだろうに
それとも全角⇔半角の変換みたいなのをやりたいってこと?
693デフォルトの名無しさん
2019/09/23(月) 11:35:21.05ID:3qdqqJ07 こっちはだめ
https://ja.cppreference.com/w/cpp/string/multibyte/wcstombs
https://ja.cppreference.com/w/cpp/string/multibyte/mbstowcs
これ使え
https://docs.microsoft.com/ja-jp/cpp/c-runtime-library/reference/mbstowcs-s-mbstowcs-s-l?view=vs-2019
https://docs.microsoft.com/ja-jp/cpp/c-runtime-library/reference/wcstombs-s-wcstombs-s-l?view=vs-2019
https://ja.cppreference.com/w/cpp/string/multibyte/wcstombs
https://ja.cppreference.com/w/cpp/string/multibyte/mbstowcs
これ使え
https://docs.microsoft.com/ja-jp/cpp/c-runtime-library/reference/mbstowcs-s-mbstowcs-s-l?view=vs-2019
https://docs.microsoft.com/ja-jp/cpp/c-runtime-library/reference/wcstombs-s-wcstombs-s-l?view=vs-2019
694デフォルトの名無しさん
2019/09/23(月) 14:54:10.02ID:FPxFvDjY Windows SDK付属のデバッグ用ソースを見たところmbstowcs_sの文字コード変換は、Win32APIであるMultiByteToWideCharを使っているようですね。
695デフォルトの名無しさん
2019/09/23(月) 15:08:29.22ID:3qdqqJ07 MultiByteToWideChar / WideCharToMultiByte 最強
697デフォルトの名無しさん
2019/09/23(月) 16:01:34.44ID:51KZjw6P null-terminatedとそうでない場合の仕様の違いをちゃんと理解してなくて
バグった挙句によけいな1byte追加しちゃったりした思い出。
バグった挙句によけいな1byte追加しちゃったりした思い出。
698デフォルトの名無しさん
2019/09/23(月) 16:24:42.75ID:3qdqqJ07699デフォルトの名無しさん
2019/09/24(火) 00:23:12.23ID:FsJR6FDp 長い上にださい略し方だ…
700デフォルトの名無しさん
2019/09/24(火) 14:25:04.46ID:oiN+60ax python3でlogging使ってsyslogに出力すると
ASCIIで出力してもなぜか最後に\0が付いてログが残る
鯖側のsyslogdの方で付いてるのかと思ったが
そうじゃなくてpython3が勝手に付けてるみたい
python3のstringがunicode化したときにバグ入ったんかな
python2のときはそんなこと無かった気がする
ASCIIで出力してもなぜか最後に\0が付いてログが残る
鯖側のsyslogdの方で付いてるのかと思ったが
そうじゃなくてpython3が勝手に付けてるみたい
python3のstringがunicode化したときにバグ入ったんかな
python2のときはそんなこと無かった気がする
701デフォルトの名無しさん
2019/09/25(水) 12:14:01.12ID:9XZAk7bA ttps://bugs.python.org/issue12168
702デフォルトの名無しさん
2019/09/25(水) 13:11:07.39ID:BmMtZLRv 深い闇を垣間見た気がする
handler.log_format_string = '<%d>%s'
だと no attribute
handler.setFormatter(logging.Formatter('%(message)s'))
だと結局 \0 付いたままでした
handler.log_format_string = '<%d>%s'
だと no attribute
handler.setFormatter(logging.Formatter('%(message)s'))
だと結局 \0 付いたままでした
703デフォルトの名無しさん
2019/09/25(水) 13:18:01.66ID:BmMtZLRv コンストラクタ呼ぶ前に
logging.handlers.SysLogHandler.append_nul = False
で解決しました
thx!
logging.handlers.SysLogHandler.append_nul = False
で解決しました
thx!
704デフォルトの名無しさん
2019/09/25(水) 14:09:59.51ID:sdHp2tVC エンコードされた文字のバイト並びが
utf-8 と cp832 で同じ(にみえる)ものってどんなのがあります?
そもそも 3bytes と 2bytes なのは仕方ないのですが
utf-8 だと (xx yy zz)
みたいなのが
cp932 だと (xx yy) 00
逆に
cp932 だと (uu vv) (ww xx) (yy zz)
みたいなのが
utf-8 だと (uu vv ww) (xx yy zz)
みたいなのでも良いです
そもそもありえない?
utf-8 と cp832 で同じ(にみえる)ものってどんなのがあります?
そもそも 3bytes と 2bytes なのは仕方ないのですが
utf-8 だと (xx yy zz)
みたいなのが
cp932 だと (xx yy) 00
逆に
cp932 だと (uu vv) (ww xx) (yy zz)
みたいなのが
utf-8 だと (uu vv ww) (xx yy zz)
みたいなのでも良いです
そもそもありえない?
705デフォルトの名無しさん
2019/09/25(水) 14:11:59.88ID:cBdVtg+x cp932 ってことはいわゆる半角カナも入れて良いのカナ
706デフォルトの名無しさん
2019/09/25(水) 14:14:32.79ID:sdHp2tVC 出来れば「美乳」みたいなクオリティ高いのが良いです
707デフォルトの名無しさん
2019/09/25(水) 16:32:05.43ID:vuS5tsH7 美乳ってどういう特長を持ってたんだっけ?
エージェントが読み込んだときに確実にShift JISだって判定できるんだっけか。
エージェントが読み込んだときに確実にShift JISだって判定できるんだっけか。
708デフォルトの名無しさん
2019/09/25(水) 23:44:33.31ID:2M81F3EH PC初心者です。
あるexeファイルをコマンドウインドウで開く。ということをしなきゃならないんだけどシフト+右クリックしてもコマンドウインドウで開くというのがありませんでした
調べたら、コマンドウインドウで開くを表示したい場合メモ帳で名前を付けて保存の時に文字コードをUnicodeにして保存し実行したらレジストリがどうたら書いてあったんでしようとしたら、文字コードにUnicodeがありませんでした。
どうしたら良いですか?
あるexeファイルをコマンドウインドウで開く。ということをしなきゃならないんだけどシフト+右クリックしてもコマンドウインドウで開くというのがありませんでした
調べたら、コマンドウインドウで開くを表示したい場合メモ帳で名前を付けて保存の時に文字コードをUnicodeにして保存し実行したらレジストリがどうたら書いてあったんでしようとしたら、文字コードにUnicodeがありませんでした。
どうしたら良いですか?
709デフォルトの名無しさん
2019/09/26(木) 00:04:19.37ID:Gir9qHZJ ↓最高に面白い回答
710デフォルトの名無しさん
2019/09/26(木) 00:06:20.67ID:1IaRoLf+711デフォルトの名無しさん
2019/09/26(木) 01:58:07.64ID:MW37nPtB >>704
ASCII以外ではたぶん無いんじゃないかな
cp932としてもutf-8としても正しいバイト列で
それぞれが別の単語になるケースを探したことがあるけど、
それでも両方が意味のある単語になる例は見つけられかった
どういう目的でそういう例を探してるの?
ASCII以外ではたぶん無いんじゃないかな
cp932としてもutf-8としても正しいバイト列で
それぞれが別の単語になるケースを探したことがあるけど、
それでも両方が意味のある単語になる例は見つけられかった
どういう目的でそういう例を探してるの?
712デフォルトの名無しさん
2019/09/26(木) 08:30:15.09ID:NQV5DCT+713デフォルトの名無しさん
2019/10/08(火) 14:05:40.55ID:yxEiS4UK ブログラムソースをUTF16やUTF32で書いてる人いるの?
ブログラム内の文字列のデータじゃなくてブログラムの地の部分
ブログラム内の文字列のデータじゃなくてブログラムの地の部分
714デフォルトの名無しさん
2019/10/08(火) 14:10:33.38ID:J68M6wrj そんなゴリホーモおらんやろ
715デフォルトの名無しさん
2019/10/08(火) 15:33:52.08ID:Dgw8eufS 誰が読むんだ
716デフォルトの名無しさん
2019/10/23(水) 21:57:19.58ID:CiGuyy89 まるでUTF-16文書は読むのに向かないかのような発言やな
まともなエディタなら読めて当然。
まともなエディタなら読めて当然。
717デフォルトの名無しさん
2019/10/23(水) 23:42:00.06ID:/s0IRa9G ICUなんてほぼほぼUTF-16ですよ。
718デフォルトの名無しさん
2019/10/24(木) 17:29:35.02ID:mthfJT/n なんかUnicodeのサイト分裂した?
719デフォルトの名無しさん
2019/10/24(木) 18:37:57.14ID:FCkKS+Hu 青っぽいデザイン変更で入口が使いにくくなってる辺り?
720デフォルトの名無しさん
2019/10/27(日) 00:29:12.62ID:DVVulqOc なにそれこわい
721デフォルトの名無しさん
2019/10/29(火) 16:20:42.34ID:A7Naqht0722デフォルトの名無しさん
2019/11/01(金) 01:07:36.40ID:iOCNEHbC 結局見つかったのは何なの
723デフォルトの名無しさん
2019/11/01(金) 01:07:53.40ID:iOCNEHbC 書くとこ間違えた失礼
724デフォルトの名無しさん
2019/11/15(金) 19:48:26.91ID:CD4iEOnB 文を書くときに?や()などの半角にも全角にもある文字はどっちを使うべきなのか迷う。
数字やアルファベットは半角を使うのが普通だからASCIIコードにある文字はASCIIコードを使った方がいいんだろうか
数字やアルファベットは半角を使うのが普通だからASCIIコードにある文字はASCIIコードを使った方がいいんだろうか
725デフォルトの名無しさん
2019/11/15(金) 21:21:21.06ID:NIGKt6uf 特に拘りが無いならNFKCに倣う
726デフォルトの名無しさん
2019/11/15(金) 23:13:58.98ID:csRpQu7P JIS X 0208 を 0201 のスーパーセットにしなかったのが諸悪の根源
727デフォルトの名無しさん
2019/11/15(金) 23:28:13.72ID:69Rrw1ZJ そもそも世界中の文字を一つの体系で包括できると考えたりしたのが…ブツブツ
728デフォルトの名無しさん
2019/11/16(土) 09:13:00.94ID:0g4G1zYO サル共がコンピュータを使わなければ面倒がないのに
とか思われてるよ
とか思われてるよ
729デフォルトの名無しさん
2019/11/16(土) 10:56:43.05ID:t6zcY+AG ASCII に含まれてる記号は半角で入力してる
っていうか IME で半角優先にしてるのでそっちばっかりになる
IME ON の状態であってもスペースももちろん半角だ
っていうか IME で半角優先にしてるのでそっちばっかりになる
IME ON の状態であってもスペースももちろん半角だ
730デフォルトの名無しさん
2019/11/17(日) 00:12:46.29ID:ZZ8XSzBD チルダとかハイフンマイナス、引用符あたりは迷う。
これらは単に全角と半角の関係ではないんじゃないかという気がする。
これらは単に全角と半角の関係ではないんじゃないかという気がする。
731デフォルトの名無しさん
2019/11/19(火) 22:24:19.13ID:lA4rVXxm 0-9A-Za-z は半角だけどその他はちょっと迷うかな
! や ? は書いてるのが日本語漢字仮名交じり文なら全角にするかも
! や ? は書いてるのが日本語漢字仮名交じり文なら全角にするかも
732デフォルトの名無しさん
2019/11/20(水) 09:53:23.76ID:grCkJCm3733デフォルトの名無しさん
2019/11/21(木) 16:10:59.78ID:0qs1xY5M 俺は「,」のほうが寧ろ収まりがいいように見えるけどな。
感性で判断するんじゃなくて,論理的根拠をもって「,」か「、」かを決めるべきよね。
感性で判断するんじゃなくて,論理的根拠をもって「,」か「、」かを決めるべきよね。
734デフォルトの名無しさん
2019/11/21(木) 18:03:44.71ID:oVdD3irj 日本語の文章は分かち書きをするわけではないから、
点があるのにコンマのような後ろにスペースを要する記号を使うのはおかしいと思う。
丸の代わりにピリオドを使うのも同じ。
それにしても、公文書の混ぜこぜの用法はどっちつかずだよな。
もともと、和文タイプライターで使われていた用法なのではないか?
点があるのにコンマのような後ろにスペースを要する記号を使うのはおかしいと思う。
丸の代わりにピリオドを使うのも同じ。
それにしても、公文書の混ぜこぜの用法はどっちつかずだよな。
もともと、和文タイプライターで使われていた用法なのではないか?
735デフォルトの名無しさん
2019/11/21(木) 18:06:42.91ID:oVdD3irj 使ったこと無いからわからなかったが、全角コンマなんてのがあるんだな。
これって、全角英数と同じで、日本語の体裁に合わせるためにわざわざ作られた文字だよねぇ。
これって、全角英数と同じで、日本語の体裁に合わせるためにわざわざ作られた文字だよねぇ。
736デフォルトの名無しさん
2019/11/21(木) 19:11:00.69ID:wlMAy4t9737デフォルトの名無しさん
2019/11/21(木) 21:10:52.53ID:cn6yPDJX738デフォルトの名無しさん
2019/11/21(木) 21:14:37.01ID:gyc1+QC+ 見分けられないで言い切られたらコーヒー噴くしかない
739デフォルトの名無しさん
2019/11/21(木) 21:51:21.49ID:HJrbCtCI 文字コードスレなのにいまだに「全角」とか言う奴いるんだな
740デフォルトの名無しさん
2019/11/21(木) 22:11:40.82ID:Ht1weGMK ここまで無知だと辛いどころか辛さも感じないほどにアホなんだろうな
739は
739は
741デフォルトの名無しさん
2019/11/21(木) 22:27:48.86ID:T5O6V3Nl カッコは半角と全角でベースラインが違うフォントも少なくないんで
囲う文字に合わせてる
囲う文字に合わせてる
742デフォルトの名無しさん
2019/11/22(金) 00:27:47.62ID:5/IABJQJ そもそも日本語は句読点は使っていなくて使われ始めたのが
欧米のカンマやピリオドの影響で明治後期くらいからだからな
欧米のカンマやピリオドの影響で明治後期くらいからだからな
743デフォルトの名無しさん
2019/11/22(金) 01:42:56.04ID:1ACgXjue FULLWIDTHとか出てくるのを全角以外にどう呼べと
744デフォルトの名無しさん
2019/11/22(金) 01:49:03.41ID:VSWkIrxm 句点の代わりに「候(そうろう)」を使ってたんでしょ、昔の人は。
745デフォルトの名無しさん
2019/11/22(金) 02:26:32.88ID:7JxndsMv 日本はもともと縦書きで「,」なんて使ってなかっただろ?
縦書きでどの位置に「,」を打てばいいのよ?
縦書きでどの位置に「,」を打てばいいのよ?
746デフォルトの名無しさん
2019/11/22(金) 03:23:33.25ID:QBgvTUOv 縦書きは、を使って横書きは,を使えばいいじゃん
なんで臨機応変に対応できないんだろう?
なんで臨機応変に対応できないんだろう?
747デフォルトの名無しさん
2019/11/22(金) 03:31:46.87ID:7JxndsMv 臨機応変に縦書きと横書きを変換するからだよ
ウェブ上では横書き、本にしたら縦書きとかな
ウェブ上では横書き、本にしたら縦書きとかな
748デフォルトの名無しさん
2019/11/22(金) 15:56:12.49ID:WtZSxTNA 漢文で書かれた本の中には、句点は、文字の横に○をつけていたものがる。
江戸時代のくずし字でかられた読み本は、句読点なし。読む人が判断することになっている。
江戸時代のくずし字でかられた読み本は、句読点なし。読む人が判断することになっている。
749デフォルトの名無しさん
2019/11/22(金) 18:59:44.59ID:VSWkIrxm 教科書フォントに慣れ切って高卒レベルの古典教養しかない現代人は「くずし字」の原書をほとんど読めない問題。
750デフォルトの名無しさん
2019/11/22(金) 19:10:33.77ID:+ybPmekP 筆で書かないと身につかんよ
751デフォルトの名無しさん
2019/11/22(金) 19:31:16.58ID:VSWkIrxm 中学高校の古典の授業で、原書を写真印刷した文書を読ませる機会を与えるべきだろう。
活字慣れした現代人は太平洋戦争中の日記や戦場から送られてきた手紙さえ読めない。
活字慣れした現代人は太平洋戦争中の日記や戦場から送られてきた手紙さえ読めない。
752デフォルトの名無しさん
2019/11/22(金) 20:55:41.01ID:QBgvTUOv 厨二満載の文集が他人に読まれなくなる日も近いんだな
よかったワープロが普及する前で
よかったワープロが普及する前で
753デフォルトの名無しさん
2019/11/22(金) 21:23:42.16ID:SnsQ0S1X アメリカでも筆記体が廃れつつあるんじゃなかったか
せいぜいサインする時に使うくらい
せいぜいサインする時に使うくらい
754デフォルトの名無しさん
2019/11/22(金) 22:42:29.42ID:+ybPmekP ラテン文字は筆を選ばないでも問題無いが
漢字や仮名は楷書でも筆の運びをちゃんと学んだ方が近道
漢字や仮名は楷書でも筆の運びをちゃんと学んだ方が近道
755デフォルトの名無しさん
2019/11/22(金) 23:50:42.29ID:1ACgXjue 墨汁ドバー
756デフォルトの名無しさん
2019/11/23(土) 09:52:15.28ID:StIP5iHr ん? 江戸時代から句読点はあったよ。
多分、由来は漢文の補助点で句の切れ目に「、」を打って読みやすくしたもの。文末も句点だった模様。
多分、由来は漢文の補助点で句の切れ目に「、」を打って読みやすくしたもの。文末も句点だった模様。
757デフォルトの名無しさん
2019/11/23(土) 10:17:05.69ID:LEhIlmd1 >>756
一般に使われ出したのは明治でしょ
一般に使われ出したのは明治でしょ
758デフォルトの名無しさん
2019/11/23(土) 10:53:20.31ID:cBKKqL2b >>749-750
今年の漢字の季節ですね
今年の漢字の季節ですね
759デフォルトの名無しさん
2019/11/23(土) 14:16:40.50ID:SCQQhBmf 風か水かって感じかなあ
災とかはこの前使ったよね
災とかはこの前使ったよね
760デフォルトの名無しさん
2019/11/23(土) 14:20:31.57ID:Lev/ciM6 金とか何回か選ばれてるのはあるな
二年連続とかは知らん
二年連続とかは知らん
761デフォルトの名無しさん
2019/11/23(土) 15:30:58.21ID:OKqvuGhi 令
762デフォルトの名無しさん
2019/11/23(土) 16:40:21.39ID:l4WHmfnE もうそろそろコンピュータの世界では
32ビット固定長の文字コードを使うようにしても
良いのじゃないだろうか?
32ビット固定長の文字コードを使うようにしても
良いのじゃないだろうか?
764デフォルトの名無しさん
2019/11/23(土) 17:45:30.08ID:ExB3uxT/ C言語がASCII前提としていたので、
UTF16やUTF32では互換性を保てなかったのが理由
UTF16やUTF32では互換性を保てなかったのが理由
765デフォルトの名無しさん
2019/11/23(土) 18:02:19.00ID:UeuUKNdC 32bitで足りるんか?
766デフォルトの名無しさん
2019/11/23(土) 18:05:22.65ID:Lev/ciM6 今のところ32bitっつってもスカスカだろ
767デフォルトの名無しさん
2019/11/23(土) 18:45:44.31ID:KvoIJqUR 文字が4億も存在するんかいな。
768デフォルトの名無しさん
2019/11/23(土) 18:46:53.89ID:k/QFWxVo じゃけん戸籍に登録されてる異字体全部収録しましょうね〜(鬼畜)
769デフォルトの名無しさん
2019/11/23(土) 18:51:31.87ID:KvoIJqUR 旧字体はIPAがマップしたんじゃなかったっけ?
770デフォルトの名無しさん
2019/11/23(土) 20:53:37.67ID:x1VOKq1M 固定長好きな人が定期的に出てくるのはなんでなの?
セレクタとか合成文字とか固定長に押し込むの非現実的でしょうに
セレクタとか合成文字とか固定長に押し込むの非現実的でしょうに
771デフォルトの名無しさん
2019/11/23(土) 21:03:09.45ID:pGKd1Nh3 21bitもの空間与えたら要らん文字まで突っ込みまくってごみ溜めみたいになってしまったじゃないか。
772デフォルトの名無しさん
2019/11/23(土) 21:12:47.43ID:LYBJTBw0 絵文字は特に漢字に馴染みが無い連中が嬉しがってるけど、象形文字の発明前に戻ったようだよ
具材がどうだとか細かなこと言ってて抽象化とは程遠いし、少なくとも色は与えるべきじゃなかった
具材がどうだとか細かなこと言ってて抽象化とは程遠いし、少なくとも色は与えるべきじゃなかった
773デフォルトの名無しさん
2019/11/23(土) 23:04:09.59ID:uD1YCxhq >769
ipaは都合約6万字ある
ipaは都合約6万字ある
774デフォルトの名無しさん
2019/11/24(日) 00:15:00.98ID:daL/rw2X 16bit固定なら世界中の文字が記述できるとして始まったのがそもそものUnicodeだからな
775デフォルトの名無しさん
2019/11/24(日) 07:48:18.59ID:wAZlnZnW >>757
お前の一般が何かによる。
正式な正書法になったのは明治から。江戸時代の正書法は漢文の白文か武士の候文。
一方で庶民向けの版本や貸本では江戸期から句読点が使われてるので、本を読む層には馴染みがあった。
あと手習いの手本とかにも句読点があるので文字習う段階で知識として知ってるのでは。
お前の一般が何かによる。
正式な正書法になったのは明治から。江戸時代の正書法は漢文の白文か武士の候文。
一方で庶民向けの版本や貸本では江戸期から句読点が使われてるので、本を読む層には馴染みがあった。
あと手習いの手本とかにも句読点があるので文字習う段階で知識として知ってるのでは。
776デフォルトの名無しさん
2019/11/24(日) 11:58:02.36ID:bBACDgxb >>776
おもしろいと思っていってるの?
おもしろいと思っていってるの?
778デフォルトの名無しさん
2019/11/24(日) 12:07:46.48ID:bBACDgxb QZさんからレスもらえるとは思わなかった
779デフォルトの名無しさん
2019/11/24(日) 12:30:57.16ID:4a4z1fkQ780デフォルトの名無しさん
2019/11/24(日) 12:43:02.24ID:iwyjZSbL 質問じゃなくて、馬鹿にしてるんだろ
え?それ面白くないよ?面白いと思ってんの?プークスクス
という意味
え?それ面白くないよ?面白いと思ってんの?プークスクス
という意味
781デフォルトの名無しさん
2019/11/24(日) 12:53:04.27ID:6n0WdTOH >>781
なぜ韓国人だとおもったのですか?
なぜ韓国人だとおもったのですか?
785デフォルトの名無しさん
2019/11/24(日) 13:13:33.28ID:BlMs70wA 憲法9条を改正するだけじゃダメなのよ。
軍の統帥権が天皇と征夷大将軍(内閣総理大臣)のどちらにあるのか明確にしないと。
軍の統帥権が天皇と征夷大将軍(内閣総理大臣)のどちらにあるのか明確にしないと。
786デフォルトの名無しさん
2019/11/24(日) 15:33:55.44ID:EdYAI6jd >>762
そのまえに格納方法をビッグエンディアンかリトルエンディアンで統一してくれ
そのまえに格納方法をビッグエンディアンかリトルエンディアンで統一してくれ
787デフォルトの名無しさん
2019/11/24(日) 17:10:15.65ID:5wTOyTy7788デフォルトの名無しさん
2019/11/25(月) 15:25:07.92ID:s1hiXzdE >>787
おっとそれ以上言っちゃあいけない
おっとそれ以上言っちゃあいけない
789デフォルトの名無しさん
2019/11/30(土) 13:54:16.72ID:eovy2x2M 【びっくりサイエンス】 日本古来の「くずし字」にAIで挑む 解読の競技大会は中国が優勝
https://special.sankei.com/a/life/article/20191130/0001.html
2019.11.30
https://special.sankei.com/a/life/article/20191130/0001.html
2019.11.30
790デフォルトの名無しさん
2019/11/30(土) 15:03:21.41ID:dLS32wGr 別に「びっくり」ではないなw
791デフォルトの名無しさん
2019/11/30(土) 21:10:49.04ID:OkgV2S2L それ言ったらドンキーにも延焼する
792デフォルトの名無しさん
2019/11/30(土) 21:25:08.69ID:mO6/udRn ドンキーほうけーい
793デフォルトの名無しさん
2019/12/01(日) 17:02:36.55ID:zxgavQqm 今年の漢字は天
794デフォルトの名無しさん
2019/12/01(日) 17:27:44.79ID:xqkDTdKR いっそU+32FFと書いてほしい
795デフォルトの名無しさん
2019/12/03(火) 02:50:32.39ID:TSc17kJh 「くずし字」AIが解読 ラーメン判別法も応用! | NHKニュース
2019年12月2日 19時21分
https://www3.nhk.or.jp/news/html/20191202/k10012198561000.html
「くずし字」解読は「文系」より「理系」向き!?
驚き! ラーメン判別の技を応用
AIの解読能力 高めるポイントは?
数億点もある難読資料 高まるAIへの期待
歴史資料の研究者からも期待の声
2019年12月2日 19時21分
https://www3.nhk.or.jp/news/html/20191202/k10012198561000.html
「くずし字」解読は「文系」より「理系」向き!?
驚き! ラーメン判別の技を応用
AIの解読能力 高めるポイントは?
数億点もある難読資料 高まるAIへの期待
歴史資料の研究者からも期待の声
796デフォルトの名無しさん
2019/12/03(火) 12:56:42.44ID:dBsSbed7 可変長の文字コードは、CPUのパイプライン処理とは相性が悪いはず。大量の文字
データのやりとりやファイルサイズが小さくなるのは理解できるけれども。
でもそれは圧縮機構を別途に設けたのではだめなのか?
データのやりとりやファイルサイズが小さくなるのは理解できるけれども。
でもそれは圧縮機構を別途に設けたのではだめなのか?
797デフォルトの名無しさん
2019/12/03(火) 14:48:10.41ID:32eP5DBa 異体字セレクタとして色だけじゃなく斜体、下線、太字などのHTML的な要素も入れてみたらどうか
798デフォルトの名無しさん
2019/12/03(火) 15:19:10.13ID:9x1aaywv 倍角、四倍角も入れて
799デフォルトの名無しさん
2019/12/03(火) 15:35:57.78ID:IUIY88nX HTMLががんばってCSSに追い出したスタイル要素を文字コードが取り込んだらかわいそうw
800デフォルトの名無しさん
2019/12/03(火) 17:26:32.29ID:Y2nmLwy/ Unicodeは文字コードじゃなくて文字シーケンスと名前を変えるべき
801デフォルトの名無しさん
2019/12/04(水) 16:24:48.77ID:IlQO2KEp802デフォルトの名無しさん
2019/12/04(水) 19:52:55.02ID:sxQF45hm 連続してないからあくまでも記号扱いなんだろうな。
803デフォルトの名無しさん
2019/12/04(水) 20:23:19.21ID:bwCWk38v 発音記号なんかはただの小文字aの異体字で意味が違ったりするからなあ
でもそもそもを言い出したらYとVが元は同源だったりして、「純粋な文字」を綺麗に定義するのは無理よ
でもそもそもを言い出したらYとVが元は同源だったりして、「純粋な文字」を綺麗に定義するのは無理よ
804デフォルトの名無しさん
2019/12/05(木) 15:53:38.96ID:1Yvcqq3b >>801
「優遇」っていうか,そういう文字を収録してた符号化文字集合と互換性を持たせるために導入したんでは。
例えば「(株)」っていう文字とかに代表される囲み文字はかなり日本語圏に偏向してるけど,
これだって日本を優遇してるんじゃなくて,日本で開発された符号化文字集合がそういう文字を含んでたから収録されている。
「優遇」っていうか,そういう文字を収録してた符号化文字集合と互換性を持たせるために導入したんでは。
例えば「(株)」っていう文字とかに代表される囲み文字はかなり日本語圏に偏向してるけど,
これだって日本を優遇してるんじゃなくて,日本で開発された符号化文字集合がそういう文字を含んでたから収録されている。
805デフォルトの名無しさん
2019/12/05(木) 16:32:04.91ID:IbmhSLeW IMEの辞書とかは数学とか物理とか理系用語にめちゃくちゃ弱いイメージ
806デフォルトの名無しさん
2019/12/06(金) 14:18:04.16ID:CxS2VDwU807デフォルトの名無しさん
2019/12/06(金) 23:32:11.23ID:Ob0T3VF2 SKK使ってるからだけどそんな印象は全く無い
808デフォルトの名無しさん
2019/12/10(火) 22:31:10.24ID:zD6aLrgM SKKは既定の辞書はすごく弱いけど語句登録がほぼ一瞬でできるのが利点よね。
809デフォルトの名無しさん
2020/01/01(水) 02:03:31.89ID:ZBRDXVGi あけましておめでとう!
今年もこのスレの皆さんに多幸感がありますように!
今年もこのスレの皆さんに多幸感がありますように!
810デフォルトの名無しさん
2020/01/01(水) 11:19:22.03ID:tqBP4ADq 字にはヒラギノ〜ル♪
811デフォルトの名無しさん
2020/01/01(水) 22:58:15.38ID:fGGzsdYV あけましておめでとうございます
ISO/IEC 10646の新版は今年中に出るかな〜?
ISO/IEC 10646の新版は今年中に出るかな〜?
812デフォルトの名無しさん
2020/01/03(金) 06:32:52.61ID:wMN1Z8Zd Consolasは良いフォントだとは思うのだけど、全角中黒「・」(U+30FB)が半角中黒(U+FF65)と判別しにくいところが気になる。
まぁ、文字コードの問題ではないんだが。
まぁ、文字コードの問題ではないんだが。
813デフォルトの名無しさん
2020/01/03(金) 10:33:29.05ID:lHIykz7y 特定のフォントの特定の文字だけ任意に入れ替えるパッチとかフックとか無いんだっけ
814デフォルトの名無しさん
2020/01/03(金) 22:33:53.11ID:wMN1Z8Zd >>813
レスありがとう。どのOSにもそういう仕組みはないと思う。
よく上げられる例として、フォントの明示的な設定なしに\マークをバックスラッシュとして表示することはできない、というのもあるし。
一文字づつ判定して適切なフォントに変えて描画する処理を個々のアプリ自身が実装する必要があるはず。
レスありがとう。どのOSにもそういう仕組みはないと思う。
よく上げられる例として、フォントの明示的な設定なしに\マークをバックスラッシュとして表示することはできない、というのもあるし。
一文字づつ判定して適切なフォントに変えて描画する処理を個々のアプリ自身が実装する必要があるはず。
815デフォルトの名無しさん
2020/01/07(火) 14:48:29.36ID:lPDbYu1J どのアプリの絵文字が「実際に使えるはさみの絵文字」なのか? - GIGAZINE
https://gigazine.net/news/20200106-which-emoji-scissors-close/
面白い
https://gigazine.net/news/20200106-which-emoji-scissors-close/
面白い
816デフォルトの名無しさん
2020/01/07(火) 15:01:40.99ID:2Dq0zKSW 左利き用のはさみも用意汁ωωω
817デフォルトの名無しさん
2020/01/07(火) 15:12:21.25ID:dfBogwvq ちなみによく切れるはさみはここが曲線
https://bungu.plus.co.jp/product/cut/img/fcc_smart_03.jpg
https://bungu.plus.co.jp/product/cut/img/fcc_smart_03.jpg
818デフォルトの名無しさん
2020/01/07(火) 16:36:04.95ID:g+gnVlWv はさみディレクションセレクター
819デフォルトの名無しさん
2020/01/18(土) 12:49:25.00ID:jQMC+jX5 ぷにコードに関するチラ裏
localghost👻ってかわいくね?
→今まで危険そうで敬遠してたIDNに興味をもつ
→WikipediaとRFC3492を頼りにPunycodeのアルゴリズムを調べる
→エンコーダを自前で組んでみて、idn2コマンドやPythonの'idna'エンコーディングと比べてみる
→正規化する必要のある文字がどんどんふえる
→idn2とpythonのidnaってかなり違わくね?? <-イマココ
idn2はギリシャ文字の「語尾のシグマ」ς(U+03C2)をσにしないし、あとチェロキー文字の大文字?を小文字?にしないし、けど小文字?はSupplementなのがなんかあやしいし、でidnaとどっちが正しいのか考えるのが面倒になって投げた
localghost👻ってかわいくね?
→今まで危険そうで敬遠してたIDNに興味をもつ
→WikipediaとRFC3492を頼りにPunycodeのアルゴリズムを調べる
→エンコーダを自前で組んでみて、idn2コマンドやPythonの'idna'エンコーディングと比べてみる
→正規化する必要のある文字がどんどんふえる
→idn2とpythonのidnaってかなり違わくね?? <-イマココ
idn2はギリシャ文字の「語尾のシグマ」ς(U+03C2)をσにしないし、あとチェロキー文字の大文字?を小文字?にしないし、けど小文字?はSupplementなのがなんかあやしいし、でidnaとどっちが正しいのか考えるのが面倒になって投げた
820デフォルトの名無しさん
2020/01/24(金) 09:35:27.22ID:jBJ9cIqM 6月のWG2は高松になったのか
また国外から来にくそうな
また国外から来にくそうな
821デフォルトの名無しさん
2020/01/26(日) 00:45:55.40ID:C+NhYhXj 道後温泉に行くか
822デフォルトの名無しさん
2020/01/30(木) 14:46:03.72ID:WswUNrPx Unicode Emoji 13.0 - Now final for 2020
http://blog.unicode.org/2020/01/unicode-emoji-130-now-final-for-2020.html
http://blog.unicode.org/2020/01/unicode-emoji-130-now-final-for-2020.html
823デフォルトの名無しさん
2020/01/30(木) 16:08:26.17ID:m1itn91m 今更タピ岡かい
824デフォルトの名無しさん
2020/01/31(金) 12:43:23.65ID:G4fIlptF Unicodeは完全にコンソーシアムのおもちゃになってんな
825デフォルトの名無しさん
2020/01/31(金) 15:08:09.88ID:OCbveUqO タピオカミルクティーがあるのに、将棋の駒がフルセット揃っていないのは納得できない。
>>825
詰将棋用に上下逆の漢字を入れて欲しかった
詰将棋用に上下逆の漢字を入れて欲しかった
827デフォルトの名無しさん
2020/01/31(金) 22:55:44.99ID:GHfVRZCY G入れるのまじやめて
828デフォルトの名無しさん
2020/02/01(土) 00:49:18.17ID:6vnUAWit 要するに新種の漢字なんだな
国ごとに生活が違うから、結局何万種必要になる
国ごとに生活が違うから、結局何万種必要になる
829デフォルトの名無しさん
2020/02/02(日) 00:50:49.11ID:wzqxdRGo 将棋の駒は多分誰も提案書を出さないせい
830デフォルトの名無しさん
2020/02/02(日) 01:02:15.43ID:0w4OLLiX それ通ったらドンジャラ提案するわ
831デフォルトの名無しさん
2020/02/02(日) 01:17:07.29ID:Vi9q8JVy 漢字の扱いは本当に難しい
手書きの分析しているソフトは本当に賢いと思うわ
まああれは面倒な文字はそもそも判定せず、
主要な文字から似たものを選んでいるだけではあるが・・・
手書きの分析しているソフトは本当に賢いと思うわ
まああれは面倒な文字はそもそも判定せず、
主要な文字から似たものを選んでいるだけではあるが・・・
832デフォルトの名無しさん
2020/02/03(月) 01:41:22.43ID:qflv74w2 テスト٩( 'ω' )و
833デフォルトの名無しさん
2020/02/03(月) 08:57:05.26ID:uSBWqXrE 825だが、将棋の駒がダメな理由は、>>469 にある通り、
> インラインテキスト中で使われている用例が示されていないのでrejectされたらしい。
ということらしいが、なら、タピオカミルクティーにインラインテキスト中で
使われている用例があるのか、と言いたい。だから納得できない。
> インラインテキスト中で使われている用例が示されていないのでrejectされたらしい。
ということらしいが、なら、タピオカミルクティーにインラインテキスト中で
使われている用例があるのか、と言いたい。だから納得できない。
834デフォルトの名無しさん
2020/02/03(月) 11:59:58.53ID:62FLJlST 解説本だと普通に使われてるよな
835デフォルトの名無しさん
2020/02/03(月) 13:40:49.09ID:yHobSnyY タピオカが使われているのかと誤読
836デフォルトの名無しさん
2020/02/03(月) 13:47:35.80ID:62FLJlST 読み手のリテラシーが問われます
837デフォルトの名無しさん
2020/02/03(月) 13:54:08.64ID:eKPmxfCz 天使を天便と読み取ったまま放置するとか割とマジ。
838デフォルトの名無しさん
2020/02/03(月) 22:56:08.65ID:KZTuy2Ys 架空の文字は登録しないというポリシーもあったと思ったが、emojiに関してはやりたい放題だな。
839デフォルトの名無しさん
2020/02/03(月) 22:59:18.31ID:wgq762c2 漢字以前の象形文字モドキの再発明だからなぁ
取捨選択もなく全然洗練されないまま数だけ増えてる
取捨選択もなく全然洗練されないまま数だけ増えてる
840デフォルトの名無しさん
2020/02/03(月) 23:33:42.55ID:s4V/Vj8i そのうち抽象化が進んでいくのか
841デフォルトの名無しさん
2020/02/04(火) 13:26:51.57ID:gTERf/2s 政治的に正しい仏教徒としては、墓石のバリエーションの少なさには納得いかんぞ
842デフォルトの名無しさん
2020/02/04(火) 13:28:31.24ID:c6iCZcrL コーヒー、お茶、タクシー、台風もほしい
843デフォルトの名無しさん
2020/02/04(火) 20:12:02.43ID:U7azh68T844デフォルトの名無しさん
2020/02/04(火) 21:29:49.71ID:t1/0lpTx 絵文字ってここにどう書き込めばいいんです?
☸️
↓
☸
専ブラでは絵文字として読めるがWebブラウザー(Chrome/旧Edge/IE11@Win10)で見ても◆◆状態でうまく表示されない…
☸️
↓
☸
専ブラでは絵文字として読めるがWebブラウザー(Chrome/旧Edge/IE11@Win10)で見ても◆◆状態でうまく表示されない…
845デフォルトの名無しさん
2020/02/05(水) 08:47:40.80ID:fZOBAWLP >>842
全部あるぞ。お茶は「湯呑み」として。検索の仕方が足りない。
全部あるぞ。お茶は「湯呑み」として。検索の仕方が足りない。
846デフォルトの名無しさん
2020/02/05(水) 10:08:51.00ID:So1jciyU 🍵 you know me.
847デフォルトの名無しさん
2020/02/05(水) 10:23:19.19ID:MS9bo9CR 固定フォントのターミナルのような環境である文字のフォントの幅が全幅か半幅か判別する確実な方法ってありますか?
Unicode前提です
Unicode的にアジアンなんとかというドキュメントでそれに触れられているのを見つけましたが
結局のところ使用されているフォントで決まるような気がします
となるとCLIアプリが表示する前に判別する方法はないような
表示したあとならターミナルにカーソル位置問い合わせればわかりそうだと思いましたが
Unicode前提です
Unicode的にアジアンなんとかというドキュメントでそれに触れられているのを見つけましたが
結局のところ使用されているフォントで決まるような気がします
となるとCLIアプリが表示する前に判別する方法はないような
表示したあとならターミナルにカーソル位置問い合わせればわかりそうだと思いましたが
848デフォルトの名無しさん
2020/02/05(水) 10:24:42.24ID:MS9bo9CR 固定フォントじゃなくて等幅フォントでした
849デフォルトの名無しさん
2020/02/05(水) 16:23:36.59ID:2rKdW1Ec てすと
☸
☸
850デフォルトの名無しさん
2020/02/05(水) 16:24:56.28ID:2rKdW1Ec851デフォルトの名無しさん
2020/02/05(水) 16:28:36.97ID:2rKdW1Ec852デフォルトの名無しさん
2020/02/05(水) 16:30:38.68ID:So1jciyU ☸ 法輪ラブ ☸
853デフォルトの名無しさん
2020/02/05(水) 18:34:07.02ID:qBm/0cTb >>847
・Unicodeでは文字幅は 0(結合文字)、1(いわゆる半角)、2(いわゆる全角)、1か2(曖昧幅) のいずれかに決まっている
・1か2になるのはαや☆などであり、東アジアの環境で2、それ以外で1
・wcwidthで調べるとその値を返すが、曖昧幅への対応がどうなっているかは分からない
・linuxのglibcは、データを自分で修正しない限り曖昧幅は1扱い(LANG=ja_JP.eucJPすれば2にはなる)
・CLIでのカーソル位置はカーネルのttyドライバが担当しており、そもそもフォン卜の情報を持っていない
・linuxカーネルでは全ての文字が(全角も)幅1扱い
・行編集もtty担当なので、catをそのまま実行して全角文字を入力後backspaceするとカーソルがずれる
・多くのシェルはwcwidthで入力/削除された文字やプロンプトに表示する文字の幅を調べ、必要に応じてカーソルを移動させる
・ターミナルはwcwidthまたは同等の独自関数(曖昧幅の設定ができることが多い)で文字幅を調べて、実際に表示させる
・等幅フォントでも曖昧幅の文字がどちらで実装されているかそれぞれ異なる上、ターミナルはフォントの文字幅情報を使わないことが多い(プロポーショナルでないことのみ確認)
・↑により、文字が重なったり変な隙間ができたりすることがある
・一部のターミナルはwcwidthの結果に従うように文字を潰したり引きのばしたりして表示する(minttyとか)
・アプリ(シェルとか)、ライブラリ(ncursesとか)、端末マルチプレクサ(tmuxとか)、端末エミュレータ、カーネル(tty)、フォント全てで想定する幅がそろっていないとうまく動かない
・日本語フォントの多くは曖昧幅2なので、linuxのCLIではαや☆がおかしくなることが多い(wcwidthが1を返すせい)
・Unicodeを作った西洋人は馬鹿だから、罫線素片の幅も曖昧で、ncursesがバグる
・絵文字は文字幅1だが、フォン卜の多くは2で実装されているのでおかしくなる
・Unicodeでは文字幅は 0(結合文字)、1(いわゆる半角)、2(いわゆる全角)、1か2(曖昧幅) のいずれかに決まっている
・1か2になるのはαや☆などであり、東アジアの環境で2、それ以外で1
・wcwidthで調べるとその値を返すが、曖昧幅への対応がどうなっているかは分からない
・linuxのglibcは、データを自分で修正しない限り曖昧幅は1扱い(LANG=ja_JP.eucJPすれば2にはなる)
・CLIでのカーソル位置はカーネルのttyドライバが担当しており、そもそもフォン卜の情報を持っていない
・linuxカーネルでは全ての文字が(全角も)幅1扱い
・行編集もtty担当なので、catをそのまま実行して全角文字を入力後backspaceするとカーソルがずれる
・多くのシェルはwcwidthで入力/削除された文字やプロンプトに表示する文字の幅を調べ、必要に応じてカーソルを移動させる
・ターミナルはwcwidthまたは同等の独自関数(曖昧幅の設定ができることが多い)で文字幅を調べて、実際に表示させる
・等幅フォントでも曖昧幅の文字がどちらで実装されているかそれぞれ異なる上、ターミナルはフォントの文字幅情報を使わないことが多い(プロポーショナルでないことのみ確認)
・↑により、文字が重なったり変な隙間ができたりすることがある
・一部のターミナルはwcwidthの結果に従うように文字を潰したり引きのばしたりして表示する(minttyとか)
・アプリ(シェルとか)、ライブラリ(ncursesとか)、端末マルチプレクサ(tmuxとか)、端末エミュレータ、カーネル(tty)、フォント全てで想定する幅がそろっていないとうまく動かない
・日本語フォントの多くは曖昧幅2なので、linuxのCLIではαや☆がおかしくなることが多い(wcwidthが1を返すせい)
・Unicodeを作った西洋人は馬鹿だから、罫線素片の幅も曖昧で、ncursesがバグる
・絵文字は文字幅1だが、フォン卜の多くは2で実装されているのでおかしくなる
854デフォルトの名無しさん
2020/02/05(水) 20:43:09.91ID:f5dE3Mu+ >>853
詳しい解説サンクス
詳しい解説サンクス
855デフォルトの名無しさん
2020/02/05(水) 23:12:39.17ID:zWcxLf4u856デフォルトの名無しさん
2020/02/06(木) 00:00:39.94ID:SQAVqXtr >>844うちでも見れた
857デフォルトの名無しさん
2020/02/07(金) 22:23:32.71ID:DCA95dh2 継ぎ接ぎだらけの一貫してない仕様だからな
858デフォルトの名無しさん
2020/02/08(土) 17:47:47.28ID:hv0txQ7A Unicodeの時代に今更だけど、
シフトJISの第2バイトがA0〜FFでなく
40〜FCにしたのは何でだろう
シフトJISの第2バイトがA0〜FFでなく
40〜FCにしたのは何でだろう
859デフォルトの名無しさん
2020/02/08(土) 17:48:29.82ID:hv0txQ7A 訂正
×A0〜FF
〇80〜FF
×A0〜FF
〇80〜FF
860デフォルトの名無しさん
2020/02/08(土) 18:36:07.73ID:zjMP9HD4 JISの区点は1区あたり94点
0x40開始で0x7Fを避けて2区分取ると0xFCになる
0x40開始で0x7Fを避けて2区分取ると0xFCになる
861デフォルトの名無しさん
2020/02/09(日) 12:59:57.61ID:tCetl5aZ やっぱ漢字1文字は2バイトの方がいい
862デフォルトの名無しさん
2020/02/09(日) 15:51:09.68ID:gml78nRc >>858
半角カナのせいで80〜FFでは足りないから
半角カナのせいで80〜FFでは足りないから
863デフォルトの名無しさん
2020/02/09(日) 19:30:21.11ID:tCetl5aZ シフトJISはもう少し工夫すれば
JISコードの変換式もより簡単にでき
2バイト目もASCII領域を使わずにダメ文字も発生せず
補助漢字も全て入れられた
JISコードの変換式もより簡単にでき
2バイト目もASCII領域を使わずにダメ文字も発生せず
補助漢字も全て入れられた
864デフォルトの名無しさん
2020/02/09(日) 19:32:13.43ID:tCetl5aZ 補助漢字は半角カナと排他だけど
865デフォルトの名無しさん
2020/02/10(月) 16:27:01.61ID:TGcYvj29 EUCで良かったんよ
866デフォルトの名無しさん
2020/02/10(月) 19:14:50.21ID:hRmPfOYI EUCだと半角カナも補助漢字もバイト数が増えるからな...
868デフォルトの名無しさん
2020/02/11(火) 08:36:25.76ID:K5Jxm44G 非漢字_:[81-98] [80-9F]
第1水準:[80-9F] [A1-FE]
第2水準:[E0-FF] [A1-FE],[E0-EB] [80-9F]
補助漢字:[A0-DD] [A1-FE],[A4-C1] [80-9F]
補助漢字は半角カナと排他利用
第1水準:[80-9F] [A1-FE]
第2水準:[E0-FF] [A1-FE],[E0-EB] [80-9F]
補助漢字:[A0-DD] [A1-FE],[A4-C1] [80-9F]
補助漢字は半角カナと排他利用
>>868
それは結局半角カナを潰しただけのことでは?
それは結局半角カナを潰しただけのことでは?
870デフォルトの名無しさん
2020/02/11(火) 18:51:44.66ID:K5Jxm44G >>869
補助漢字6000字近くを使えるというメリットがあれば
半角カナをフェードアウトするには十分な機会になっただろう
補助漢字(JIS X 0212)が制定されたのは1990年だから
その翌年の1991年に発売されたMS-DOS 5.0あたりで
KANA ON/OFFコマンドを追加し、半角カナ/補助漢字の切り替えが出来れば
従来のテキストファイルの読み込みなども対応できる
補助漢字6000字近くを使えるというメリットがあれば
半角カナをフェードアウトするには十分な機会になっただろう
補助漢字(JIS X 0212)が制定されたのは1990年だから
その翌年の1991年に発売されたMS-DOS 5.0あたりで
KANA ON/OFFコマンドを追加し、半角カナ/補助漢字の切り替えが出来れば
従来のテキストファイルの読み込みなども対応できる
>>870
文字コードのマップ切り替えはコンテンツ側で指示するべきことであって、OS/アプリ側で切り替えて対応するとか、発想が変だとおもいますね
文字コードのマップ切り替えはコンテンツ側で指示するべきことであって、OS/アプリ側で切り替えて対応するとか、発想が変だとおもいますね
872デフォルトの名無しさん
2020/02/12(水) 01:19:59.31ID:l8Pmdafn いっその事1byte=32bitにすればサロゲートペアもBOMも要らなくなるし多バイト文字という概念もなくなる
873デフォルトの名無しさん
2020/02/12(水) 02:15:22.28ID:H21UjGBC なくならない
合成文字はなくせない
合成文字はなくせない
874デフォルトの名無しさん
2020/02/12(水) 05:02:58.88ID:K3E1Z6OS >>871
コンテンツ側でなくユーザー側
コンテンツ側でなくユーザー側
875デフォルトの名無しさん
2020/02/12(水) 10:06:52.88ID:a1w2Xqz0 1文字=64bitやろ
876デフォルトの名無しさん
2020/02/12(水) 13:30:20.44ID:KzEjZzkq877デフォルトの名無しさん
2020/02/12(水) 13:32:59.34ID:yKNbCROk 👽 全宇宙の未知なる知的生命体の使用言語を網羅しなきゃならないのだから可変長は必須
878デフォルトの名無しさん
2020/02/12(水) 20:36:54.81ID:ytylQgpT >>876
え、じゃあイギリスの旗はさらにそれにスコットランド分とアイルランド分が追加されるの
え、じゃあイギリスの旗はさらにそれにスコットランド分とアイルランド分が追加されるの
879デフォルトの名無しさん
2020/02/12(水) 21:06:37.28ID:Kml/rCmZ >>878がおもしろいことを言った
880デフォルトの名無しさん
2020/02/13(木) 15:10:18.42ID:Xqo24CtP ウェールズ「俺は?」
881デフォルトの名無しさん
2020/02/13(木) 21:26:26.80ID:KYt0SeFn Google、絵文字を組み合わせた「ハート付きうんち」などを使える「Emoji Kitchen」開始
https://www.itmedia.co.jp/news/articles/2002/13/news068.html
https://www.itmedia.co.jp/news/articles/2002/13/news068.html
882デフォルトの名無しさん
2020/02/14(金) 11:14:07.77ID:SoYJxWJg そんな文字要らんわ
883デフォルトの名無しさん
2020/02/14(金) 13:42:19.65ID:4TN7y+1I グーグルってしょっちゅう意味のわからんことするよな
884デフォルトの名無しさん
2020/02/14(金) 14:22:25.49ID:WtuYdkw5 MSやAppleだって訳判らんことするときもある
885デフォルトの名無しさん
2020/02/14(金) 14:26:10.19ID:MCgyW5To 実行ファイルがテキストとデータで構成されるように、絵文字表現もテキストとデータを組み合わせた文法が出てきそう。
886デフォルトの名無しさん
2020/02/14(金) 17:14:21.07ID:CPLKNT1n 顔文字より正規表現のためのメタ文字とかあったほうが良いのにね。
まあGoogleじゃ無理か。
まあGoogleじゃ無理か。
887デフォルトの名無しさん
2020/02/14(金) 21:11:02.23ID:qxpoECq4 (.*_*)
888デフォルトの名無しさん
2020/02/14(金) 22:37:55.75ID:cKxgCMj+ そのメタ文字にマッチしたい正規表現を書く日が来るぞ
889デフォルトの名無しさん
2020/02/15(土) 00:14:12.35ID:W/mb2gir \
890デフォルトの名無しさん
2020/02/15(土) 05:28:54.23ID:uhBKJdO0 規格名:JIS X 0215
文字数:15000字超(非漢字:1700字超,漢字:13300字超)
区点域:0〜127区,0〜127点(最大16384字収納)
通 称:いちごJIS
文字数:15000字超(非漢字:1700字超,漢字:13300字超)
区点域:0〜127区,0〜127点(最大16384字収納)
通 称:いちごJIS
891デフォルトの名無しさん
2020/02/21(金) 14:33:03.02ID:MAyK0RyJ https://twitter.com/akinomyoga/status/1230127240806985728
修正の入った Cygwin 3.1.4 のリリースノートが来て、見てみたら @cjksingle という不穏な locale が発明されてる。
何かと思ったら「CJK文字も全て半角にすれば文字幅問題解決じゃん」という欧米人(東欧系?)の思いつきで、これは新しい悪夢なのでは…。mintty は仕事が早すぎ
https://gitlab.freedesktop.org/terminal-wg/specifications/issues/9#note_406682
因みにこの東欧人を追うともっと面白い(?)ものが。。漢字や絵文字が行末に収まらない時は左半分はその行に右半分は次の行に表示するのが合理的だと Windows Terminal に赴いて主張してる。
曰く、殆どの漢字は偏(へん)と旁(つくり)から成るので分断しても意味を失わないとか…
https://github.com/microsoft/terminal/issues/4345#issuecomment-578434025
https://twitter.com/5chan_nel (5ch newer account)
修正の入った Cygwin 3.1.4 のリリースノートが来て、見てみたら @cjksingle という不穏な locale が発明されてる。
何かと思ったら「CJK文字も全て半角にすれば文字幅問題解決じゃん」という欧米人(東欧系?)の思いつきで、これは新しい悪夢なのでは…。mintty は仕事が早すぎ
https://gitlab.freedesktop.org/terminal-wg/specifications/issues/9#note_406682
因みにこの東欧人を追うともっと面白い(?)ものが。。漢字や絵文字が行末に収まらない時は左半分はその行に右半分は次の行に表示するのが合理的だと Windows Terminal に赴いて主張してる。
曰く、殆どの漢字は偏(へん)と旁(つくり)から成るので分断しても意味を失わないとか…
https://github.com/microsoft/terminal/issues/4345#issuecomment-578434025
https://twitter.com/5chan_nel (5ch newer account)
892デフォルトの名無しさん
2020/02/21(金) 15:07:53.93ID:5cQWFY2c 糸
色
女
子
言
周
色
女
子
言
周
893デフォルトの名無しさん
2020/02/21(金) 20:47:45.26ID:cxQoHGS6 半角と全角の区別付かなくなると困るから元の半角文字はさらに半分で表示したらどうかな
894デフォルトの名無しさん
2020/02/21(金) 22:45:17.77ID:gYJx2Nw8 まぁ、全部全角にすれば万事解決なんだけどな。
895デフォルトの名無しさん
2020/02/22(土) 03:15:16.13ID:s2EVAxz+ 絵文字っていわゆる全角よね
896デフォルトの名無しさん
2020/03/02(月) 02:11:23.28ID:dBpw1NjL いわゆるって何を指してる?
897デフォルトの名無しさん
2020/03/02(月) 16:54:16.25ID:HI7PDIWr 公式定義ではなく現実によく目にする幅、かな
898デフォルトの名無しさん
2020/03/02(月) 17:38:15.13ID:glnmwhpK 最近は倍角とか4倍角とか聴かなくなったな
899デフォルトの名無しさん
2020/03/07(土) 16:24:06.57ID:dtD2Xrrp Microsoft、Shift_JISや外字からUnicodeへの移行を呼びかけ | スラド
https://srad.jp/story/20/03/06/1237211/
Windows と日本語のテキストについて - Windows Blog for Japan
https://blogs.windows.com/japan/2020/02/20/about-windows-and-japanese-text/
https://srad.jp/story/20/03/06/1237211/
Windows と日本語のテキストについて - Windows Blog for Japan
https://blogs.windows.com/japan/2020/02/20/about-windows-and-japanese-text/
900デフォルトの名無しさん
2020/03/07(土) 18:02:03.37ID:8MkGFgNt 外字というと丸囲みの数字が@〜S以外にもほしくて
21以降も外字で作ってしまっていた事務所を思い出す
何度かPCを入れ替えるうちに使わなくなり、忘れ去られ、
久々に古い文書を引っ張り出して来たら謎の文字化けで外字の存在が発覚
外字が何故かSから始まってたり途中に別の字が挟まってたりしてもはや解読作業
21以降も外字で作ってしまっていた事務所を思い出す
何度かPCを入れ替えるうちに使わなくなり、忘れ去られ、
久々に古い文書を引っ張り出して来たら謎の文字化けで外字の存在が発覚
外字が何故かSから始まってたり途中に別の字が挟まってたりしてもはや解読作業
901デフォルトの名無しさん
2020/03/08(日) 21:08:48.53ID:LYEGO22Q ㉑
902デフォルトの名無しさん
2020/03/08(日) 22:48:15.28ID:NQM2xZbu 今は㊿まであるんだな、知らんかったわ
903デフォルトの名無しさん
2020/03/09(月) 05:26:10.28ID:z9inAChS (0)とか黒丸の小文字英字とか白丸のンとか黒丸の仮名とかは
Unicodeですら未だに無いんだよな...
Unicodeですら未だに無いんだよな...
904デフォルトの名無しさん
2020/03/09(月) 14:12:03.27ID:A2Epg0dL それはわいせつだからでは
905デフォルトの名無しさん
2020/03/09(月) 14:20:33.44ID:o76Az6W+ わいせつだって文字情報じゃないか!
それともなにか君は辞書から陰茎とか陰核という単語を削除せよというのか!
それともなにか君は辞書から陰茎とか陰核という単語を削除せよというのか!
906デフォルトの名無しさん
2020/03/09(月) 16:04:20.40ID:5ouitKt0907デフォルトの名無しさん
2020/03/09(月) 17:52:27.97ID:T4gz2l9R908デフォルトの名無しさん
2020/03/09(月) 20:31:39.39ID:D+UZfSM4 お城マークってある?
凸の下辺がないようなやつ
凸の下辺がないようなやつ
909デフォルトの名無しさん
2020/03/09(月) 21:26:52.19ID:bpMBC8cG910デフォルトの名無しさん
2020/03/09(月) 22:01:13.14ID:d9MHF8Nm >>908
⛫
⛫
911デフォルトの名無しさん
2020/03/09(月) 23:06:46.00ID:5OM/DcPa ゴリッパだな
912デフォルトの名無しさん
2020/03/10(火) 07:55:14.17ID:LhHy3+ze913デフォルトの名無しさん
2020/03/10(火) 09:32:00.64ID:Ae1RdIX3 一方場所が足りない云々でCJK統合漢字爆誕
914デフォルトの名無しさん
2020/03/10(火) 12:18:50.37ID:QGyf5BSI アレはUNICODEが16ビットだったときの産物だからなー
囲み付き文字は合字でなんぼでも表示できるんじゃなかったのか?
黒字に白抜きはないか。
囲み付き文字は合字でなんぼでも表示できるんじゃなかったのか?
黒字に白抜きはないか。
915デフォルトの名無しさん
2020/03/11(水) 00:27:59.48ID:GChSseC+ ⓿と🄌は何が違うのこれ
916デフォルトの名無しさん
2020/03/12(木) 14:56:02.24ID:PErtSW6n Announcing The Unicode$#174; Standard, Version 13.0
https://home.unicode.org/announcing-the-unicode-standard-version-13-0/
https://home.unicode.org/announcing-the-unicode-standard-version-13-0/
917デフォルトの名無しさん
2020/03/13(金) 04:51:42.81ID:XfurYgbf 要らん文字ばっか増えていくな
918デフォルトの名無しさん
2020/03/13(金) 07:25:49.78ID:YqqN4LBM う、うん…
919デフォルトの名無しさん
2020/03/13(金) 20:00:06.77ID:gnCwby5S Unicode 13.0.0
http://www.unicode.org/versions/Unicode13.0.0/
Components of Unicode 13.0.0
http://www.unicode.org/versions/components-13.0.0.html
Core Specification (PDF)
http://www.unicode.org/versions/Unicode13.0.0/UnicodeStandard-13.0.pdf
Code Charts (PDF・110 MB)
http://www.unicode.org/Public/13.0.0/charts/CodeCharts.pdf
http://www.unicode.org/versions/Unicode13.0.0/
Components of Unicode 13.0.0
http://www.unicode.org/versions/components-13.0.0.html
Core Specification (PDF)
http://www.unicode.org/versions/Unicode13.0.0/UnicodeStandard-13.0.pdf
Code Charts (PDF・110 MB)
http://www.unicode.org/Public/13.0.0/charts/CodeCharts.pdf
920デフォルトの名無しさん
2020/03/13(金) 20:29:09.67ID:No4fNSBg でっかいPDFだなあ
921デフォルトの名無しさん
2020/03/13(金) 22:24:02.25ID:4HcCQorc あれ、もうUnicode 13.0.0出たの?
改訂するのは確か毎年6月ねって決めたんじゃ……と思ったら去年から3月だった。
改訂するのは確か毎年6月ねって決めたんじゃ……と思ったら去年から3月だった。
922デフォルトの名無しさん
2020/03/14(土) 04:49:42.78ID:vXPyxgSI Win10は頻繁にバージョンアップしてるけど、
使ってるUnicodeは2015年に出た8.0のままなんだよな...
使ってるUnicodeは2015年に出た8.0のままなんだよな...
923デフォルトの名無しさん
2020/03/14(土) 05:08:58.28ID:3vkWqFOe そーそー
新しいフォント入れてもリンクが効かんという...
全部入りフォント作るにゃ16bitの壁
新しいフォント入れてもリンクが効かんという...
全部入りフォント作るにゃ16bitの壁
924デフォルトの名無しさん
2020/03/14(土) 16:17:25.81ID:Vl0/NIrd え、そうなんだ
そんな罠が
そんな罠が
925デフォルトの名無しさん
2020/03/18(水) 09:00:29.25ID:z60BWivb926デフォルトの名無しさん
2020/04/09(木) 14:28:17.94ID:+HIZu5X+ Unicode 14.0 Delayed for 6 Months
http://blog.unicode.org/2020/04/unicode-140-delayed-for-6-months.html
Due to COVID-19, the Unicode Consortium has decided to postpone the release of version 14.0 of the Unicode Standard by 6 months, from March to September of 2021.
This delay will also impact related specifications and data, such as new emoji characters.
This announcement does not affect the new emoji included in Unicode Standard version 13.0 announced on March 10, 2020.
http://blog.unicode.org/2020/04/unicode-140-delayed-for-6-months.html
Due to COVID-19, the Unicode Consortium has decided to postpone the release of version 14.0 of the Unicode Standard by 6 months, from March to September of 2021.
This delay will also impact related specifications and data, such as new emoji characters.
This announcement does not affect the new emoji included in Unicode Standard version 13.0 announced on March 10, 2020.
927デフォルトの名無しさん
2020/04/09(木) 17:31:08.32ID:gZ/Igrwb せっかくだから細菌とは別にウイルスの絵文字つくってくれ
928デフォルトの名無しさん
2020/04/09(木) 23:42:25.68ID:V4nj16/7 コロナ菌入れるの?
929デフォルトの名無しさん
2020/04/10(金) 03:17:26.49ID:8l6zYGEZ マスク
トイレットペーパー
トイレットペーパー
930デフォルトの名無しさん
2020/04/10(金) 14:38:09.67ID:4/xjxgO5 細菌の絵文字なんてあるのか
🦠
🦠
931デフォルトの名無しさん
2020/04/10(金) 15:29:18.32ID:CRpi4reg 最近出来た
932デフォルトの名無しさん
2020/04/11(土) 06:13:53.13ID:AQJyoftj 外人が絵文字大好きなのは勝手だけど、既存コードの部分もちゃんとして欲しい
933デフォルトの名無しさん
2020/04/11(土) 16:23:43.45ID:c2aeXPYf e門司
934デフォルトの名無しさん
2020/04/18(土) 12:50:14.52ID:VYQrLT4k 最近出来た細菌の絵文字・・・
935デフォルトの名無しさん
2020/04/18(土) 14:58:29.31ID:7V75MQ+C なるほど、最近と細菌がかかってる、とこういうわけですな
936デフォルトの名無しさん
2020/05/07(木) 16:04:22.09ID:yKMQxEI8 するってえと何かい?
最近と細菌がかかってるというわけかい?
最近と細菌がかかってるというわけかい?
937デフォルトの名無しさん
2020/05/08(金) 15:47:36.35ID:5Vn36V2D ウィルスの絵文字も頼むわ
938デフォルトの名無しさん
2020/05/09(土) 15:44:09.31ID:c4xb28ev corona emoji
939デフォルトの名無しさん
2020/05/20(水) 21:19:51.18ID:KtsKIWM6 https://lister.tokyo/emoji/unicode_emoji.php?emoji=%F0%9F%A6%A0
絵文字
🦠
意味
微生物
【類似・説明】細菌、ウイルス、アメーバなどを表す
絵文字
🦠
意味
微生物
【類似・説明】細菌、ウイルス、アメーバなどを表す
940デフォルトの名無しさん
2020/05/21(木) 14:54:55.41ID:iHD0We8W ちょっといくらなんでも雑やな
941デフォルトの名無しさん
2020/05/22(金) 00:52:38.66ID:JDT7oTvt ウィルスを生物扱いする悪い子はここか?
942デフォルトの名無しさん
2020/05/22(金) 21:40:13.82ID:Olq8ijH/ ゴブリン&オーガ
943デフォルトの名無しさん
2020/06/20(土) 20:24:55.95ID:vzEBoOvQ944デフォルトの名無しさん
2020/06/20(土) 20:46:42.29ID:p75lHsHl ひらがなの'あ'よりも'W'のほうが幅広だったり、
★マークが半角幅だったりするフォントが溢れてるのに、
半角全角区別しても仕方ないだろ
★マークが半角幅だったりするフォントが溢れてるのに、
半角全角区別しても仕方ないだろ
945デフォルトの名無しさん
2020/06/20(土) 21:34:59.63ID:IMDB9vKB まあだからそこはターミナルとか限られた環境の話で。
フォントもそれ用のを選ぶし。
そろそろ全角半角なんてのをやめて、文字のカラム位置を揃えたいならフォントの
メトリックスの方で調整すればいいだけ、かもしれないけど。
フォントもそれ用のを選ぶし。
そろそろ全角半角なんてのをやめて、文字のカラム位置を揃えたいならフォントの
メトリックスの方で調整すればいいだけ、かもしれないけど。
946デフォルトの名無しさん
2020/06/21(日) 00:33:45.74ID:MWbXBJfF >>943
絵文字の幅って公式定義があるの?
絵文字の幅って公式定義があるの?
947デフォルトの名無しさん
2020/06/21(日) 14:21:00.23ID:la0O1Akk >>946
Unicodeに収録された文字には文字幅のプロパティがある、という意味で。
Unicodeに収録された文字には文字幅のプロパティがある、という意味で。
948デフォルトの名無しさん
2020/06/22(月) 00:32:43.95ID:DUn6aEuN949デフォルトの名無しさん
2020/06/22(月) 19:13:13.28ID:Y25pVs1y >>894 ? 知らんがなw
そもそも「全部」ってどういう意味だ? 全部の文字? 全部のターミナルに関わるソフトの挙動?
そもそも「全部」ってどういう意味だ? 全部の文字? 全部のターミナルに関わるソフトの挙動?
950デフォルトの名無しさん
2020/06/22(月) 20:41:37.97ID:NxxL+RwQ 発端は>>891だろう
951デフォルトの名無しさん
2020/06/23(火) 00:16:31.95ID:regXwJpa 既存定義とは違う新しい定義の話題に
「既存定義があるぞ」は全然かみ合ってないし
知らんがなと笑われてもそれこそ知らんがな
「既存定義があるぞ」は全然かみ合ってないし
知らんがなと笑われてもそれこそ知らんがな
952デフォルトの名無しさん
2020/06/23(火) 10:14:55.66ID:4kHZmTBE 倍角と2倍角は違うんだっけ
4倍角もあったような
4倍角もあったような
953デフォルトの名無しさん
2020/06/24(水) 00:49:18.29ID:U0shKhxD 倍角って横だよね
縦倍角ってのもあった気がする
縦倍角ってのもあった気がする
954デフォルトの名無しさん
2020/06/24(水) 02:37:42.69ID:Qbz2qwLg 〴〳
〵〵
これの有効活用をしたい
〵〵
これの有効活用をしたい
955デフォルトの名無しさん
2020/06/24(水) 12:14:26.52ID:deVcUtEo >>951
というかどういうレベルの話をしているのか掴みかねてね。
「絵文字にはUnicodeで文字幅が定義されている」これは大雑把に正しいぞ。
リンク先の元ネタをフォローしてみようか? U+2764 U+FE0F はどうするか、という話。
ここでは誰もフォローしてなかったのでこのレベルの話はしてないと理解した。
でもフォローしてみよう。
というかどういうレベルの話をしているのか掴みかねてね。
「絵文字にはUnicodeで文字幅が定義されている」これは大雑把に正しいぞ。
リンク先の元ネタをフォローしてみようか? U+2764 U+FE0F はどうするか、という話。
ここでは誰もフォローしてなかったのでこのレベルの話はしてないと理解した。
でもフォローしてみよう。
956デフォルトの名無しさん
2020/06/24(水) 12:28:35.59ID:deVcUtEo と思ったがまたそのうちw
957デフォルトの名無しさん
2020/06/24(水) 13:08:49.76ID:Qbz2qwLg どこまでもかみあわんやっちゃな
958デフォルトの名無しさん
2020/06/24(水) 19:38:46.76ID:e6Wuxio/ というか、既存の定義とは何かもはっきりしてなかったのに新しい定義?
なので既存の定義(の一つ)を示してみたのだが。
全角半角というのは、SJISとかEUCとか使ってた頃の化石の概念だが、ターミナルでの
文字表示にナニゲに悪くはないので、むやみに廃止せず、Unicodeの種類が増殖していく中
如何にサポートできるか? それとも廃止した方がいいのか? あるいはターミナル自体が化石w?
みたいな問題意識を共有? できるならば話はできるかもw
なので既存の定義(の一つ)を示してみたのだが。
全角半角というのは、SJISとかEUCとか使ってた頃の化石の概念だが、ターミナルでの
文字表示にナニゲに悪くはないので、むやみに廃止せず、Unicodeの種類が増殖していく中
如何にサポートできるか? それとも廃止した方がいいのか? あるいはターミナル自体が化石w?
みたいな問題意識を共有? できるならば話はできるかもw
959デフォルトの名無しさん
2020/06/24(水) 22:24:49.91ID:N310/pVU んだからUnicodeは全角半角を再定義してるんだよ
https://ja.wikipedia.org/wiki/東アジアの文字幅
https://ja.wikipedia.org/wiki/東アジアの文字幅
960デフォルトの名無しさん
2020/06/25(木) 18:59:45.90ID:xHxuQznk >>959
なんだそれを「再」定義というのか。だったらその前の「定義」って何? どれのこと?
SJISやEUCで、文字のバイト数=幅という「慣習」はあったと思うが。大昔に。
で、U+2764 U+FE0Fはその再定義では駄目なので再々定義しないといけないw
個人的な意見ではU+2764 U+FE0Fは半角でいい(せざるを得ない)と判断する。
その根拠は... 省略w
ただ、ターミナルの特殊性 vs フォントのデザイン vs 文字コードで幅を決定 等、
いろいろと無理がある中で妥協点を見つけるとすると、そうなるかな、という感じ。
なんだそれを「再」定義というのか。だったらその前の「定義」って何? どれのこと?
SJISやEUCで、文字のバイト数=幅という「慣習」はあったと思うが。大昔に。
で、U+2764 U+FE0Fはその再定義では駄目なので再々定義しないといけないw
個人的な意見ではU+2764 U+FE0Fは半角でいい(せざるを得ない)と判断する。
その根拠は... 省略w
ただ、ターミナルの特殊性 vs フォントのデザイン vs 文字コードで幅を決定 等、
いろいろと無理がある中で妥協点を見つけるとすると、そうなるかな、という感じ。
961デフォルトの名無しさん
2020/06/25(木) 22:37:41.64ID:5bjWZftZ 曖昧な定義は定義じゃないというならべつに「再」は削ってもいいが?
962デフォルトの名無しさん
2020/06/26(金) 13:02:51.64ID:PjbtVFt+ %s の文字数とかで文字列の幅調整出来ないんだよな
963デフォルトの名無しさん
2020/06/26(金) 20:34:46.91ID:gjCuj5Av しかし絵文字の力はすごい。
これを使いたいがために外人共もUnicodeを以前よりはるかに意識するようになってきてる。
VSとか、漢字の字形の微妙な差とかの用途より、もはや絵文字がメインユーザー。
同様なことが「文字幅」にも起きつつあるようだ。もはや東アジアだけの問題ではないのかもw
これを使いたいがために外人共もUnicodeを以前よりはるかに意識するようになってきてる。
VSとか、漢字の字形の微妙な差とかの用途より、もはや絵文字がメインユーザー。
同様なことが「文字幅」にも起きつつあるようだ。もはや東アジアだけの問題ではないのかもw
964デフォルトの名無しさん
2020/06/26(金) 20:59:35.95ID:7oUp4uPe そして線がごちゃごちゃしてる漢字はいらなくね?って話になって排除されるんでしょう?
白人のやることはいつもそうだ
白人のやることはいつもそうだ
>>964
それはグレートチャイナ様が抵抗してくださるのでは?
それはグレートチャイナ様が抵抗してくださるのでは?
966デフォルトの名無しさん
2020/06/26(金) 22:11:14.85ID:7oUp4uPe 彼らも漢字から線減らしてるじゃん
そのうち中共の悪事を次世代に隠すために漢字を扱えるのは中共の上の方だけになりかねない気もする
そのとき中国の一般人民が使ってるのが絵文字だよ
そのうち中共の悪事を次世代に隠すために漢字を扱えるのは中共の上の方だけになりかねない気もする
そのとき中国の一般人民が使ってるのが絵文字だよ
>>966
それは失策だったという評判です、実際、現行である第一次案は通りましたが、第二次漢字簡化方案は失敗しました
それは失策だったという評判です、実際、現行である第一次案は通りましたが、第二次漢字簡化方案は失敗しました
968デフォルトの名無しさん
2020/06/27(土) 00:33:35.05ID:swJlVBV3 簡字体は半角でも行けそう感あるな
969デフォルトの名無しさん
2020/06/27(土) 01:47:56.80ID:9wE9An+g 斎と斉と齊と齋は一緒だから一つにしろとかな
渡辺渡邊渡邉もどうせ一緒だろうとか
渡辺渡邊渡邉もどうせ一緒だろうとか
970デフォルトの名無しさん
2020/06/27(土) 01:53:30.16ID:2VXy+TcG ひどいよな
一と二や三などたかが横線の一本二本すら妥協できないのに、
異体字はひとつにまとめようとするひどい話だ。
一と二や三などたかが横線の一本二本すら妥協できないのに、
異体字はひとつにまとめようとするひどい話だ。
971デフォルトの名無しさん
2020/06/27(土) 02:06:13.19ID:a36N+BtR972デフォルトの名無しさん
2020/06/27(土) 02:22:38.17ID:n/FbqQvh そして再委託で中国人アルバイトに丸投げして
年金記録問題になるとな
年金記録問題になるとな
973デフォルトの名無しさん
2020/06/27(土) 02:25:59.19ID:cFHckwkh カンジカナヘンカン(キリッ
974デフォルトの名無しさん
2020/06/27(土) 03:48:57.43ID:N26qrFyY でもそれ用途があってのことだから規格側の仕事じゃないのよね
統合したいのなら運用のほうを変えないことにはね
いずれにしてももう入れちゃったから永久保存だね
統合したいのなら運用のほうを変えないことにはね
いずれにしてももう入れちゃったから永久保存だね
976デフォルトの名無しさん
2020/06/27(土) 08:30:57.19ID:fTkQtmqM >>970
マジレスすると「異体字」という言葉は正しく使って欲しい気が。
マジレスすると「異体字」という言葉は正しく使って欲しい気が。
977デフォルトの名無しさん
2020/06/27(土) 08:59:10.45ID:8YWxnx/1978デフォルトの名無しさん
2020/06/27(土) 09:13:49.81ID:wwwZDyDi イタイ痔でイタイ字
ミミズ腫れでミミズ字
老眼でヨタヨタ字震え字
ギャル文字マルモジオタ字ハングル文字
° ° ° °
± ± ± ±
² ² ² ²
³ ³ ³ ³
ミミズ腫れでミミズ字
老眼でヨタヨタ字震え字
ギャル文字マルモジオタ字ハングル文字
° ° ° °
± ± ± ±
² ² ² ²
³ ³ ³ ³
979デフォルトの名無しさん
2020/06/27(土) 09:39:39.53ID:twDHZDh4 >>977
メンバーの斉の字どころか、なんとか坂っグループ自体も区別できてないので何ら問題ないなw
メンバーの斉の字どころか、なんとか坂っグループ自体も区別できてないので何ら問題ないなw
980デフォルトの名無しさん
2020/06/27(土) 09:58:34.18ID:g61E5/Hd >>963
あと絵文字と言えば、今流行りの、肌の色がどうたらってやつな。このせいで複雑化した。
でも、他にも目の色とか髪の色とかもあるが、独立には選べないぞ?
ここら辺はいいのか? 大騒ぎしてる奴ら。
なんてことを書いてるとそのうちそれぞれのトーンセレクタが入ってさらに複雑化したりして。
あとは目がツリ目で気に入らないorその逆とかでそういうセレクタとか。
唇が分厚いorその逆のセレクタとか。
おっと誰か来たようだ
あと絵文字と言えば、今流行りの、肌の色がどうたらってやつな。このせいで複雑化した。
でも、他にも目の色とか髪の色とかもあるが、独立には選べないぞ?
ここら辺はいいのか? 大騒ぎしてる奴ら。
なんてことを書いてるとそのうちそれぞれのトーンセレクタが入ってさらに複雑化したりして。
あとは目がツリ目で気に入らないorその逆とかでそういうセレクタとか。
唇が分厚いorその逆のセレクタとか。
おっと誰か来たようだ
981デフォルトの名無しさん
2020/06/27(土) 14:15:22.95ID:bBs10q1N 表意文字を使ってない奴らに絵文字を語らせるのは1000年早いわ。
982デフォルトの名無しさん
2020/06/27(土) 15:22:20.76ID:QSLeN3Uh ขอบคุณค่ะ
983デフォルトの名無しさん
2020/06/27(土) 19:08:33.76ID:g61E5/Hd なるほど、絵文字への文句というのは、文字の抽象を理解できない奴らからのしょうもない
文句かも、確かに。
文句かも、確かに。
984デフォルトの名無しさん
2020/06/28(日) 11:00:01.09ID:9sOk9wG3985デフォルトの名無しさん
2020/06/28(日) 20:30:07.87ID:PNBTsuo1 参照ならむしろSJIS範囲内だ
各自環境でどう表示されてるかは関知しない
各自環境でどう表示されてるかは関知しない
986デフォルトの名無しさん
2020/07/01(水) 17:25:24.99ID:MDN2nnZZ 俺の名前は明朝体だと口高で、楷書体だとはしご高なので、はしご高と口高は統合されてないと逆に困る。
はしご高問題とか伝統的な漢字の書体のことを全く知らないド素人が単なるフォントの違いを勝手に別の漢字扱いしただけだろ。
はしご高問題とか伝統的な漢字の書体のことを全く知らないド素人が単なるフォントの違いを勝手に別の漢字扱いしただけだろ。
987デフォルトの名無しさん
2020/07/01(水) 19:30:44.51ID:V8kaCwil つまり単なるフォントの違いにこだわるド素人の名前ってこと・・・?
988デフォルトの名無しさん
2020/07/01(水) 19:32:49.62ID:IfUrt5hg 面って旧字体か知らんけど内側が口の字もあるんだね
989デフォルトの名無しさん
2020/07/01(水) 22:04:25.91ID:21fnQhh9 「包摂」の概念を知らないといけないな。
「包摂 文字コード」で検索すると出てくるが、「そ」や「り」は一画で
書く場合と、二画で書く場合があるが、それは「同一の文字であって
字体が異なるだけ」とみなすのが「包摂」ということ。
「高」と「」は別の文字と考えられ、「包摂」されていない。
すなわち文字コードも分けられている。これは、unicodeで規定された
以上、もう変えることはできない。
「包摂 文字コード」で検索すると出てくるが、「そ」や「り」は一画で
書く場合と、二画で書く場合があるが、それは「同一の文字であって
字体が異なるだけ」とみなすのが「包摂」ということ。
「高」と「」は別の文字と考えられ、「包摂」されていない。
すなわち文字コードも分けられている。これは、unicodeで規定された
以上、もう変えることはできない。
990デフォルトの名無しさん
2020/07/02(木) 05:58:14.56ID:29pTsVv7 >>989
(1) 日本(JIS)では包摂されてた
(2) 台湾では包摂されてなかった -> Unicode で採用
(参考) CP932では包摂されてない -> 5chは実際にはCP932、ということでいいのかな?
Unicodeで別になってて嬉しい人は台湾に感謝しないとw
(1) 日本(JIS)では包摂されてた
(2) 台湾では包摂されてなかった -> Unicode で採用
(参考) CP932では包摂されてない -> 5chは実際にはCP932、ということでいいのかな?
Unicodeで別になってて嬉しい人は台湾に感謝しないとw
991デフォルトの名無しさん
2020/07/02(木) 20:52:25.00ID:Ia6zfvih 野家
993デフォルトの名無しさん
2020/07/02(木) 23:07:28.07ID:NYHAh4sv994デフォルトの名無しさん
2020/07/03(金) 01:39:17.36ID:I4sf0FL7 いや、本来の漢字の伝統だと JIS の包摂基準の方が正しくて Unicode のは間違っている素人基準だって話。
そのせいで、手書きの文字が印刷した書類と違っているというバカな注文つけてくる役人がいて困る。
口高でもはしご高でもない草書や行書の高はどうするつもりなんだw
そのせいで、手書きの文字が印刷した書類と違っているというバカな注文つけてくる役人がいて困る。
口高でもはしご高でもない草書や行書の高はどうするつもりなんだw
995デフォルトの名無しさん
2020/07/03(金) 02:49:52.70ID:C0o/qkVy そのせいじゃないだろう
996デフォルトの名無しさん
2020/07/03(金) 08:00:38.22ID:I4sf0FL7 私の場合はそのせいだよ。
WEB申請(UTF16)と手書きが違うのでちょっと役場まで来いやゴラって言われたので。
WEB申請(UTF16)と手書きが違うのでちょっと役場まで来いやゴラって言われたので。
997デフォルトの名無しさん
2020/07/03(金) 09:38:17.14ID:oXZRCloQ 自分はずっとだいざきで書いてて住民票やパスポートもそれで申請してた。
が、いつからかたちざきで書くよう求められるようになった。
なんか基準が変わったのか?
が、いつからかたちざきで書くよう求められるようになった。
なんか基準が変わったのか?
998デフォルトの名無しさん
2020/07/03(金) 11:53:19.11ID:6268sYfp 嵜
ア
ア
999デフォルトの名無しさん
2020/07/03(金) 14:11:53.17ID:/+uSoVK/ ア崎
1000デフォルトの名無しさん
2020/07/03(金) 14:13:13.87ID:/+uSoVK/ ↑ホントだ変換入力してるのに文字化けする
10011001
Over 1000Thread このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 565日 1時間 34分 59秒
新しいスレッドを立ててください。
life time: 565日 1時間 34分 59秒
10021002
Over 1000Thread 5ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。
───────────────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────
会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。
▼ プレミアム会員登録はこちら ▼
https://premium.5ch.net/
▼ 浪人ログインはこちら ▼
https://login.5ch.net/login.php
運営にご協力お願いいたします。
───────────────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────
会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。
▼ プレミアム会員登録はこちら ▼
https://premium.5ch.net/
▼ 浪人ログインはこちら ▼
https://login.5ch.net/login.php
レス数が1000を超えています。これ以上書き込みはできません。
ニュース
- 習政権、高市首相への態度硬化 台湾有事発言で連日非難 中国 ★11 [ぐれ★]
- 国内ホテル、既にキャンセルも 訪日客関連業界、事態見守る ★3 [蚤の市★]
- 日本損失1.7兆円に修正 中国渡航自粛の影響試算 [蚤の市★]
- 「どうしようもない」 ため息つくアジアの玄関口 中国の訪日自粛で−福岡市 [蚤の市★]
- 「アベノミクス」で投資対象と化したマンション ローンの低金利続き「年収の12倍」借りる20代出現 [蚤の市★]
- 食品の高騰対策、政府が交付金の「特別枠」検討 原則全ての自治体で [蚤の市★]
- 【超絶悲報】日本政府「高市さんの答弁撤回はない。政権として弱腰と映る姿勢は見せられない」これもう立憲岡田の議員辞職しかないだろ [519511584]
- 【実況】博衣こよりのえちえち朝こよ🧪
- 台湾「高市さんが台湾人の悲願を叶えてくれた!」これじゃ高市さん発言撤回できないぢゃん😰 [523957489]
- 高市周辺、さすがに焦り始めるww「小さな火種が火事になりかけている。早く鎮火しなくてはいけない」 [271912485]
- 【超悲報】中国への武力行使、世論調査で「賛成」「どちらかといえば賛成」48.8% 「反対」「どちらかといえば反対」の44.2%を上回る [314039747]
- 中国「高市が頭を下げて謝罪しない限り、絶対に許さない」 [329329848]
