プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、ShiftJIS、JIS、EUC、Uincode、 UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。
■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
文字コード総合スレ Part10 [転載禁止]©2ch.net
レス数が1000を超えています。これ以上書き込みはできません。
1デフォルトの名無しさん
2015/10/14(水) 20:29:00.08ID:xctG4AAd2015/10/14(水) 20:30:38.15ID:xctG4AAd
■参考サイト
Unicode Home Page
http://www.unicode.org/
Java Character Encodings
http://www.ingrid.org/java/i18n/encoding/
euc.JP: tech docs, BeOS tools
http://euc.jp/
IANA: Character Sets
http://www.iana.org/assignments/character-sets
Legacy Encoding Project
http://sourceforge.jp/projects/legacy-encoding/
CP50220
森山さんの説明
http://lists.sourceforge.jp/mailman/archives/legacy-encoding-talk-ja/2006-March/000002.html
JISX4061
日本語文字列照合順番
http://www.jisc.go.jp/
Unicode Home Page
http://www.unicode.org/
Java Character Encodings
http://www.ingrid.org/java/i18n/encoding/
euc.JP: tech docs, BeOS tools
http://euc.jp/
IANA: Character Sets
http://www.iana.org/assignments/character-sets
Legacy Encoding Project
http://sourceforge.jp/projects/legacy-encoding/
CP50220
森山さんの説明
http://lists.sourceforge.jp/mailman/archives/legacy-encoding-talk-ja/2006-March/000002.html
JISX4061
日本語文字列照合順番
http://www.jisc.go.jp/
2015/10/14(水) 20:31:02.98ID:xctG4AAd
■これまでに行われた議論
・WinでCP50220 は Unicode からマルチバイト文字への変換でいわゆる半角カタカナを全角カタカナに置き換え
内部的には Unicode -> CP932 -> CP5022x って変換な気もする
・人名をソートかけたらバストサイズ順の並びになる?
・Shift JIS や EUC-JP や Big5 や GB なんかをUnicode に変換してしまうと、ラウンドトリップは保証されるか
・単一情報をソースの文字コード(or 言語)情報なしに元に戻したい (統計的に文字の出現確率なんかを調べる)
・PC-98x1シリーズのMS-DOSはShift_JISだが漢字ROMはJIS、変換は何処で行っていた?
・0x5cをUnicodeにするときにバックスラッシュに置き換えるか円マークに置き換えるかで、逆変換時に結果が変わるの問題
・丸付き数字は機種依存文字か?。MSIME2007ではCP932に収録されてない文字は「環境依存文字」って表示。
Macではフォントによっては表示されないし、フォントによっては表示される
・Shift_JISと名乗っているCP932やISO-2022-JPと名乗っているCP50220を表示(Unicodeに変換)する際に
機種依存文字はサポートされるか?
・Safari文字コード変換のバグは
・Microsoft文字コード変換のバグは
・U+31F0..U+31FF(アイヌ語表記用小書きカタカナ)が入ってない件
・なぜ携帯業界はunicode化しないのか?
・このスレへの書き込みはブラウザが2chへ送り出す時点でUnicodeからShift_JISに変換しているのか
・文字化けに強いishフォーマットでエロ画像を交換する場合、ssより、s7のほうが化けにくい
・WinでCP50220 は Unicode からマルチバイト文字への変換でいわゆる半角カタカナを全角カタカナに置き換え
内部的には Unicode -> CP932 -> CP5022x って変換な気もする
・人名をソートかけたらバストサイズ順の並びになる?
・Shift JIS や EUC-JP や Big5 や GB なんかをUnicode に変換してしまうと、ラウンドトリップは保証されるか
・単一情報をソースの文字コード(or 言語)情報なしに元に戻したい (統計的に文字の出現確率なんかを調べる)
・PC-98x1シリーズのMS-DOSはShift_JISだが漢字ROMはJIS、変換は何処で行っていた?
・0x5cをUnicodeにするときにバックスラッシュに置き換えるか円マークに置き換えるかで、逆変換時に結果が変わるの問題
・丸付き数字は機種依存文字か?。MSIME2007ではCP932に収録されてない文字は「環境依存文字」って表示。
Macではフォントによっては表示されないし、フォントによっては表示される
・Shift_JISと名乗っているCP932やISO-2022-JPと名乗っているCP50220を表示(Unicodeに変換)する際に
機種依存文字はサポートされるか?
・Safari文字コード変換のバグは
・Microsoft文字コード変換のバグは
・U+31F0..U+31FF(アイヌ語表記用小書きカタカナ)が入ってない件
・なぜ携帯業界はunicode化しないのか?
・このスレへの書き込みはブラウザが2chへ送り出す時点でUnicodeからShift_JISに変換しているのか
・文字化けに強いishフォーマットでエロ画像を交換する場合、ssより、s7のほうが化けにくい
2015/10/14(水) 20:31:39.28ID:xctG4AAd
・中国語の簡体字では、へんやつくりが簡略化されるなら、その文字も自動的に簡略化して表記する国家規格が有る
・中国語の「?心」簡化政策によると「?(U+6076)」に統一。口偏+?(U+6076)は普通に使われているがUnicodeにはない
・日本人のニーズが満たせないのも確かなので原規格分離(中国では「曾→曽」は簡体字と繁体字の違いとはみなされていないとか)
・UNICODEを扱うプログラムはサロゲートをぶったぎられた入力が渡されてくる場合にも備えろって→YES
・UnicodeとUTF-8の違いは?
・日本のCJK Ext.D Submissionに{魚針}が含まれてる件
U+9C75(魚箴)は強烈。いくら何でも違いすぎる。(魚針)
ひょっとしたら後で実は別字だったとか日本では異体字だが中国では別字とかになるかも知れんぞ。
中国ではってレベルじゃねーぞ。
・Windows Vista での「IME パッド - 文字一覧」の「JIS X 0213 (1面)」のバグ
UTF-16: 0x304B 0x309A → Unicode: U+FD61809A (間違い) (ISO/IEC10646はU+10FFFFまで)
サロゲートペアからコードポイントを引き出す計算を無理やり適用(間違い)
((0x304B - 0xD800) << 10) + (0x309A - 0xDC00) + 0x10000が 0xFD61809A になる。
・文字コードではインドカレーは飲み物か否か。カレーパンうまうま。
・CJK混在の漢字環境ってどうやって、切り分ければいいの? → ムリです。
・Winzipで保存されるファイル名が文字化け→zipではコードページ情報が無い。直接zipファイルから切り出せ
・Unicodeは言語情報を直接扱わない。 多言語の混在表現は(unicodeでは)できないか
・Unicode文字列リストを各国言語を考慮してソートしたいんですが → ムリです。
・Unicodeサニタイズが面倒になるのか
・中国語の「?心」簡化政策によると「?(U+6076)」に統一。口偏+?(U+6076)は普通に使われているがUnicodeにはない
・日本人のニーズが満たせないのも確かなので原規格分離(中国では「曾→曽」は簡体字と繁体字の違いとはみなされていないとか)
・UNICODEを扱うプログラムはサロゲートをぶったぎられた入力が渡されてくる場合にも備えろって→YES
・UnicodeとUTF-8の違いは?
・日本のCJK Ext.D Submissionに{魚針}が含まれてる件
U+9C75(魚箴)は強烈。いくら何でも違いすぎる。(魚針)
ひょっとしたら後で実は別字だったとか日本では異体字だが中国では別字とかになるかも知れんぞ。
中国ではってレベルじゃねーぞ。
・Windows Vista での「IME パッド - 文字一覧」の「JIS X 0213 (1面)」のバグ
UTF-16: 0x304B 0x309A → Unicode: U+FD61809A (間違い) (ISO/IEC10646はU+10FFFFまで)
サロゲートペアからコードポイントを引き出す計算を無理やり適用(間違い)
((0x304B - 0xD800) << 10) + (0x309A - 0xDC00) + 0x10000が 0xFD61809A になる。
・文字コードではインドカレーは飲み物か否か。カレーパンうまうま。
・CJK混在の漢字環境ってどうやって、切り分ければいいの? → ムリです。
・Winzipで保存されるファイル名が文字化け→zipではコードページ情報が無い。直接zipファイルから切り出せ
・Unicodeは言語情報を直接扱わない。 多言語の混在表現は(unicodeでは)できないか
・Unicode文字列リストを各国言語を考慮してソートしたいんですが → ムリです。
・Unicodeサニタイズが面倒になるのか
2015/10/14(水) 20:31:59.03ID:xctG4AAd
・SJISとUNICODEの判別はどのようにすればいいですか?BOM。無ければ、統計判断。 ライブラリを使うが吉
・ところでケータイのUnicode対応度って実際どうよ? → ウンコマークもUnicodeに追加されるんだな。
・WindowsXP で フォルダに使用できないフォルダ名はどうやって判定
→ ちょっとアホな方法だけど、%TEMP% フォルダの下で実際に作ってみて。本当に作成できるかどうかで判断。
・TwitterのWebインターフェイスからだと、サロゲートペアは2文字としてカウント。140字打てない 。
・Unicode 5.2で追加されたUnicodeSMP(第1面)、Unicode 5.1で未定義だったSMPのコードポイントや第15、第16面が
Windows7では表示されない。 → 和田研細丸ゴシック2004ARIBはARIB外字を含んでいる。
・WindowsXP SP3でMicrosoftのJIS2004フォント環境でサロゲートペア文字が表示されない。→
コントロールパネル-地域と言語のオプション-[言語]タブで
「複合文字や右から左方向に書く言語 (タイ語を含む) のファイルをインストールする」にチェック
・URLの%で続く2桁の0-9、A-Fへの変換は、UTF-8→urlencodeによる。RFC1738を嫁。
・菊紋、桐紋、葵紋などは文字か?海栗コードへの挿入は難しい。そこでTRONだ!!
・元号を安置する場所はJIS第三で確保済み。ウニコードでブロックを確保は政治力次第。
・元号は個人名ではない。特定の時間軸基準に数える年号を漢字で指す文字。
陛下の崩御後必ずしも元号が追号になるわけではない。むしろ違う場合が多い。昭和54年法律43号の元号法参照。
・文末でなければ"0"+ASCII7ビット、文末なら"1"+ASCII7ビットというエンコード。 → ヌル1バイトが貴重な時代からの負の遺産。
・Windows7出荷時に未定義だったコードポイントはフォント入れても豆腐になる。Unicode5.2は表示しない。欝だ。
・Unicode6ドラフトでPILE_OF_POO文字確定。ウニコードがもはやイミフ。SerifとSans-Serifで幅に違いは出る?
・shift-jisからUTF-8変換でサイズ1.5倍。でも圧縮すれば平均10%増加程度。用途に合わせて使うべし。
・「wchar_tは>849の嫁。>849の許可無くしてUTF16だの32だの無理矢理突っ込むのは許さん。」
・電子演算機では文字化けなんて飾りです。UTF-8/UTF16の人にはそれがわからんのですよ。
・ところでケータイのUnicode対応度って実際どうよ? → ウンコマークもUnicodeに追加されるんだな。
・WindowsXP で フォルダに使用できないフォルダ名はどうやって判定
→ ちょっとアホな方法だけど、%TEMP% フォルダの下で実際に作ってみて。本当に作成できるかどうかで判断。
・TwitterのWebインターフェイスからだと、サロゲートペアは2文字としてカウント。140字打てない 。
・Unicode 5.2で追加されたUnicodeSMP(第1面)、Unicode 5.1で未定義だったSMPのコードポイントや第15、第16面が
Windows7では表示されない。 → 和田研細丸ゴシック2004ARIBはARIB外字を含んでいる。
・WindowsXP SP3でMicrosoftのJIS2004フォント環境でサロゲートペア文字が表示されない。→
コントロールパネル-地域と言語のオプション-[言語]タブで
「複合文字や右から左方向に書く言語 (タイ語を含む) のファイルをインストールする」にチェック
・URLの%で続く2桁の0-9、A-Fへの変換は、UTF-8→urlencodeによる。RFC1738を嫁。
・菊紋、桐紋、葵紋などは文字か?海栗コードへの挿入は難しい。そこでTRONだ!!
・元号を安置する場所はJIS第三で確保済み。ウニコードでブロックを確保は政治力次第。
・元号は個人名ではない。特定の時間軸基準に数える年号を漢字で指す文字。
陛下の崩御後必ずしも元号が追号になるわけではない。むしろ違う場合が多い。昭和54年法律43号の元号法参照。
・文末でなければ"0"+ASCII7ビット、文末なら"1"+ASCII7ビットというエンコード。 → ヌル1バイトが貴重な時代からの負の遺産。
・Windows7出荷時に未定義だったコードポイントはフォント入れても豆腐になる。Unicode5.2は表示しない。欝だ。
・Unicode6ドラフトでPILE_OF_POO文字確定。ウニコードがもはやイミフ。SerifとSans-Serifで幅に違いは出る?
・shift-jisからUTF-8変換でサイズ1.5倍。でも圧縮すれば平均10%増加程度。用途に合わせて使うべし。
・「wchar_tは>849の嫁。>849の許可無くしてUTF16だの32だの無理矢理突っ込むのは許さん。」
・電子演算機では文字化けなんて飾りです。UTF-8/UTF16の人にはそれがわからんのですよ。
2015/10/14(水) 23:23:47.69ID:obUlIRbX
2015/10/14(水) 23:28:48.06ID:+mXu/6rb
もうひとつの過去スレ:
文字コード統一スレ 1文字目
http://pc8.2ch.net/test/read.cgi/tech/1109171258/
隔離スレ:
UnicodeとUTF-8の違いは?
http://pc12.2ch.net/test/read.cgi/tech/1177930957/
UnicodeとUTF-8の違いは? その2
http://hibari.2ch.net/test/read.cgi/tech/1274937437/
UnicodeとUTF-8の違いは? その2
http://toro.2ch.net/test/read.cgi/tech/1291075205/
UnicodeとUTF-8の違い4(インディアン隔離スレ)
http://toro.2ch.net/test/read.cgi/tech/1342963035/
文字コード統一スレ 1文字目
http://pc8.2ch.net/test/read.cgi/tech/1109171258/
隔離スレ:
UnicodeとUTF-8の違いは?
http://pc12.2ch.net/test/read.cgi/tech/1177930957/
UnicodeとUTF-8の違いは? その2
http://hibari.2ch.net/test/read.cgi/tech/1274937437/
UnicodeとUTF-8の違いは? その2
http://toro.2ch.net/test/read.cgi/tech/1291075205/
UnicodeとUTF-8の違い4(インディアン隔離スレ)
http://toro.2ch.net/test/read.cgi/tech/1342963035/
2015/10/14(水) 23:29:44.73ID:+mXu/6rb
■ライブラリ
IBM Globalization - ICU
http://www-306.ibm.com/software/globalization/icu/
NKF32.DLL
http://www.vector.co.jp/soft/win95/util/se020949.html
バベル
http://tricklib.com/cxx/ex/babel/
バベルの文字コード判定で使ってる日本語文書内での各文字の出現頻度データです。
http://tricklib.com/cxx/ex/babel/scoremap.csv
mlang
http://msdn.microsoft.com/ja-jp/library/aa767865(en-us).aspx
iconv
http://www.gnu.org/software/libiconv/
ICU
http://www.icu-project.org/
IBM Globalization - ICU
http://www-306.ibm.com/software/globalization/icu/
NKF32.DLL
http://www.vector.co.jp/soft/win95/util/se020949.html
バベル
http://tricklib.com/cxx/ex/babel/
バベルの文字コード判定で使ってる日本語文書内での各文字の出現頻度データです。
http://tricklib.com/cxx/ex/babel/scoremap.csv
mlang
http://msdn.microsoft.com/ja-jp/library/aa767865(en-us).aspx
iconv
http://www.gnu.org/software/libiconv/
ICU
http://www.icu-project.org/
2015/10/14(水) 23:30:41.28ID:+mXu/6rb
■単語一覧
・UTF-16は16ビット単位にエンコードするけど、サロゲートペアがある
表現できる文字空間はUTF-8と同じく20ビットとちょっと
・丸付き数字は機種依存文字か?MSIME2007ではCP932に収録されてない文字は「環境依存文字」って表示。
MacJapaneseではフォントによっては表示されないし、フォントによっては表示される。
今のMac(内部Unicodeアプリ)は、フォント依存ではなくアプリ依存。
似非ISO-2022-JPや似非Shift_JISのドキュメント中の丸付き数字は、
素直にAppleのAPIを使ってるアプリならゲタ(U+FFFD)になる。
・Mail.appではISO-2022-JPに収まらずCP932に収まるメールは、含まれる字種によって
charset=CP932で送信される場合とISO-2022-JP(もどき)で送信される場合がある
・MSでのウニコードとSJIS変換のバグ。
U+007E TILDE <-> Shift_JIS 0x7E OVERLINE
U+301C WAVE DASH -> Shift_JIS NA 【MSの問題】
U+FF5E FULLWIDTH TILDE <-> Shift_JIS 0x8160 WAVE DASH 【MSの問題】
・SafariでのウニコードとSJIS変換のバグ。
U+007E TILDE -> Shift_JIS 0x8160 WAVE DASH 【Safariの問題】
U+301C WAVE DASH <-> Shift_JIS 0x8160 WAVE DASH
U+FF5E FULLWIDTH TILDE <-> Shift_JIS NA
・winzipの規格ではファイル名のコードページ指定もしくは記録情報が存在しない。
解決策:取り合えず、MSWin+JPではShift-jisでファイル自体には保存されている。
MACOSX=Unicode,Unix=UTF/EUC/S-JISどれでもありえる。文字に関係なくLocalLangで
再変換しているので、それをしなければよい。
・charlenでの文字列長の判定はプラットフォームにより返り値が違う(機種依存文字等)。マニュアル嫁。
・JISのエスケープシーケンスが正しく認識されない本文とか。
'0x1b, 0x24, 0x42' という3バイトを先頭に、'0x1b, 0x28, 0x42' を末尾に追加汁。
あるいはhttp://masaka.dw.land.to/mr/jmr.phpとか。
・UTF-16は16ビット単位にエンコードするけど、サロゲートペアがある
表現できる文字空間はUTF-8と同じく20ビットとちょっと
・丸付き数字は機種依存文字か?MSIME2007ではCP932に収録されてない文字は「環境依存文字」って表示。
MacJapaneseではフォントによっては表示されないし、フォントによっては表示される。
今のMac(内部Unicodeアプリ)は、フォント依存ではなくアプリ依存。
似非ISO-2022-JPや似非Shift_JISのドキュメント中の丸付き数字は、
素直にAppleのAPIを使ってるアプリならゲタ(U+FFFD)になる。
・Mail.appではISO-2022-JPに収まらずCP932に収まるメールは、含まれる字種によって
charset=CP932で送信される場合とISO-2022-JP(もどき)で送信される場合がある
・MSでのウニコードとSJIS変換のバグ。
U+007E TILDE <-> Shift_JIS 0x7E OVERLINE
U+301C WAVE DASH -> Shift_JIS NA 【MSの問題】
U+FF5E FULLWIDTH TILDE <-> Shift_JIS 0x8160 WAVE DASH 【MSの問題】
・SafariでのウニコードとSJIS変換のバグ。
U+007E TILDE -> Shift_JIS 0x8160 WAVE DASH 【Safariの問題】
U+301C WAVE DASH <-> Shift_JIS 0x8160 WAVE DASH
U+FF5E FULLWIDTH TILDE <-> Shift_JIS NA
・winzipの規格ではファイル名のコードページ指定もしくは記録情報が存在しない。
解決策:取り合えず、MSWin+JPではShift-jisでファイル自体には保存されている。
MACOSX=Unicode,Unix=UTF/EUC/S-JISどれでもありえる。文字に関係なくLocalLangで
再変換しているので、それをしなければよい。
・charlenでの文字列長の判定はプラットフォームにより返り値が違う(機種依存文字等)。マニュアル嫁。
・JISのエスケープシーケンスが正しく認識されない本文とか。
'0x1b, 0x24, 0x42' という3バイトを先頭に、'0x1b, 0x28, 0x42' を末尾に追加汁。
あるいはhttp://masaka.dw.land.to/mr/jmr.phpとか。
2015/10/14(水) 23:31:54.53ID:+mXu/6rb
JTC1/SC2/WG2 - ISO/IEC 10646 - UCS
http://std.dkuug.dk/JTC1/SC2/WG2/
ISO/IEC JTC1/SC2/WG2/IRG
Ideographic Rapporteur Group
http://appsrv.cse.cuhk.edu.hk/~irg/
http://std.dkuug.dk/JTC1/SC2/WG2/
ISO/IEC JTC1/SC2/WG2/IRG
Ideographic Rapporteur Group
http://appsrv.cse.cuhk.edu.hk/~irg/
2015/10/15(木) 18:31:09.40ID:xOsbEBDE
>>4が化けてるな前スレもだが
2015/10/15(木) 18:40:33.47ID:jm/ZzoYR
4とか5とかもう引き継がなくていいのでは
2015/10/16(金) 16:24:02.87ID:rHUq12EW
&#x6076;
2015/10/16(金) 16:24:47.61ID:rHUq12EW
恶
2015/10/17(土) 20:16:21.68ID:E+N5KQ+e
文化庁の文化審議会漢字小委員会は16日、漢字の手書き文字について、「とめる」か「はらう」かなど、細部にこだわって正誤を判断せず、多様な字形を認めるべきだとする指針の中間報告案をまとめた。
2015/10/18(日) 22:08:48.48ID:/JqZyvWj
明日から松江でWG2らしいけど文書非公開だと流れが追えなくてつまらんな
2015/10/19(月) 00:12:31.07ID:Vwmjvaq0
うむつまらん
2015/10/22(木) 19:44:06.99ID:HJqUYTXB
Unicodeおじさんがミラーしてくれた
http://www.unicode.org/wg2/docs/
Nushuが1b170からになってるってことはKana Supplementがそこまで広がったのかな
http://www.unicode.org/wg2/docs/
Nushuが1b170からになってるってことはKana Supplementがそこまで広がったのかな
2015/10/24(土) 00:34:11.18ID:5L65oHkd
2015/10/25(日) 03:36:16.82ID:fgAWLXG9
2015/10/25(日) 12:49:19.83ID:ekYyyren
>>12
引き継がないとはどういう意味ですか?
引き継がないとはどういう意味ですか?
2015/10/25(日) 18:50:42.59ID:zgU7ZYeY
3-5と9はもうテンプレから外していいんじゃないかなって話かと
20も言うように古いし更新されてないしどういう文脈の話かわからないのもあるし
レス番指定してるレスが混じってるけどPart何スレかもわからないしよく見ると色々あれ
20も言うように古いし更新されてないしどういう文脈の話かわからないのもあるし
レス番指定してるレスが混じってるけどPart何スレかもわからないしよく見ると色々あれ
2015/10/25(日) 19:24:02.31ID:A/UjGnAW
2015/10/25(日) 19:33:16.94ID:8Ekj0BDy
>>9は議論の軌跡としては正しいのかも知れないけど内容が間違いだらけなので消した方が吉
2015/10/26(月) 20:48:28.23ID:hvOVpGBH
絵文字馬鹿のOむかつく
とっとと干されりゃいいのに
とっとと干されりゃいいのに
2015/10/27(火) 07:41:18.41ID:ecThD4uO
ほんとにな
他に実績ない絵を字として登録してない?
そのうちLINEスタンプとか報道写真も登録するんじゃねえの。
一方で互換性ガー言って過去のミス登録を修正しないし。
WAVE DASH例示字形ですら25年かかるという無能揃いの組織。
過去版との互換性なんかとうの昔になくなってるのに。
他に実績ない絵を字として登録してない?
そのうちLINEスタンプとか報道写真も登録するんじゃねえの。
一方で互換性ガー言って過去のミス登録を修正しないし。
WAVE DASH例示字形ですら25年かかるという無能揃いの組織。
過去版との互換性なんかとうの昔になくなってるのに。
2015/10/27(火) 23:40:44.85ID:b1wh6dDM
Unicodeコンソーシアムがアレなのは否定しないってか同意だが
WAVE DASHの問題はMSが独自の変換表を使ってるからなので
正直例示字形だけ直されてもあまり意味がってか字形だけならWindows Vista以降修正されてるし
いやそりゃ正しい波の形になったから気分はすっきりするけど。
WAVE DASHの問題はMSが独自の変換表を使ってるからなので
正直例示字形だけ直されてもあまり意味がってか字形だけならWindows Vista以降修正されてるし
いやそりゃ正しい波の形になったから気分はすっきりするけど。
2015/10/28(水) 02:14:09.30ID:6/ByidLc
ってか全角チルダのほうの字形(?)を上に寄せてくれんかな。
2015/10/28(水) 07:10:47.43ID:en6I5N16
>WAVE DASHの問題はMSが独自の変換表を使ってるから
どうしてこういう見え透いた嘘を平気でつけるんだろうか
どうしてこういう見え透いた嘘を平気でつけるんだろうか
2015/10/29(木) 20:27:41.85ID:Lz+b+/gX
>>29
無知?それとも俺には問題ないという青年の主張?
無知?それとも俺には問題ないという青年の主張?
2015/11/02(月) 21:17:58.86ID:AsQYV5Wm
>>29
勉強し直そうね
勉強し直そうね
2015/11/02(月) 21:18:31.16ID:AsQYV5Wm
>>28
ほんまそれ
ほんまそれ
2015/11/03(火) 04:49:27.68ID:i5nTnJv9
逆Sの記号ってなんでないんだろう?
2015/11/03(火) 05:49:15.31ID:zO1n76ez
M?
2015/11/03(火) 07:38:16.60ID:sxF23lrF
Ƨ
2015/11/03(火) 17:26:02.76ID:P1Dl09Tr
クローゼットの中にそういうハンガーみたいな金具たくさん入ってるけど
どういうときに使えるのか未だにわからない。
どういうときに使えるのか未だにわからない。
2015/11/04(水) 00:41:30.22ID:L8/5F95r
肩の厚みのあるハンガーをたくさんかけると、
スペースが無駄になるので互い違いに高さを変える。
スペースが無駄になるので互い違いに高さを変える。
2015/11/04(水) 01:28:04.95ID:uMca4o1w
向きが90度ずれない?
S字のを2個連結すれば戻るけど2個使い前提の道具なの?
S字のを2個連結すれば戻るけど2個使い前提の道具なの?
2015/11/04(水) 16:58:03.51ID:QtO4ndAT
2015/11/05(木) 23:49:21.72ID:clXjiXU8
スレ違いかもしれんが
ネットで、ある日本語のテキストファイルを見たら化け化けだった
3分の1くらいのみ見れる
これをブラウザで簡体字中国語を選ぶと見れるという書き込みを見つけたので、
そうしたら見れた
これはどういうこと?
中国語扱う人が日本語をGB2312でエンコードしてたってこと?
ネットで、ある日本語のテキストファイルを見たら化け化けだった
3分の1くらいのみ見れる
これをブラウザで簡体字中国語を選ぶと見れるという書き込みを見つけたので、
そうしたら見れた
これはどういうこと?
中国語扱う人が日本語をGB2312でエンコードしてたってこと?
2015/11/05(木) 23:59:17.68ID:gSAo/oaU
ふつうに考えるとそうだろうな
2015/11/06(金) 06:30:43.46ID:6Ax8SlYK
2015/11/07(土) 23:09:16.59ID:NHx999Nj
2015/11/08(日) 14:35:15.95ID:y8uRNach
お国自慢絵文字か。文字コードに押し込もうというわけでなければ、
ありふれたご当地ゆるキャラを何匹か並べたら大体同じ趣旨の日本版になるな。
ありふれたご当地ゆるキャラを何匹か並べたら大体同じ趣旨の日本版になるな。
2015/11/08(日) 17:13:00.26ID:BjW4Fik6
絵文字は文字以上に定義も難しいしキリがないからユーザー外字領域に閉じ込めておけばよかったのに。
2015/11/09(月) 00:23:08.17ID:loOQ2SCd
作った奴と押し込む奴は往々にして別、
2015/11/09(月) 01:28:50.80ID:9QpSgphP
>>46
?
?
2015/11/09(月) 07:42:22.13ID:L+fm0eEi
さすがに、外字領域での大規模な運用ぐらいはされてないと押し込みの提案も出ないんじゃなかろうか
2015/11/09(月) 09:49:40.58ID:Yjqxj+LL
nokiaの端末に入っちゃったんでしょう?
2015/11/09(月) 14:08:54.96ID:wh2HsxEX
Unicode 10.0あたりになったら収録されるんだろうか?
2015/11/09(月) 22:16:17.29ID:yLbPQAdL
>>49
そうなの?文字として?
そうなの?文字として?
2015/11/09(月) 23:44:45.41ID:BJx9eA+t
ビットコインマーク、Unicodeに収録へ | スラド IT
http://it.srad.jp/story/15/11/09/055230/
Bitcoin 'B' Approved By Computer Text Standards Body
http://www.coindesk.com/bitcoin-unicode-symbol-approval/
http://www.unicode.org/L2/L2015/15229-bitcoin-sign.pdf
http://it.srad.jp/story/15/11/09/055230/
Bitcoin 'B' Approved By Computer Text Standards Body
http://www.coindesk.com/bitcoin-unicode-symbol-approval/
http://www.unicode.org/L2/L2015/15229-bitcoin-sign.pdf
2015/11/10(火) 12:10:29.99ID:tU9IcOly
ペリカもはよ
54デフォルトの名無しさん
2015/11/11(水) 22:12:58.76ID:mDE1AFdu ぼ
さ
ん
さ
ん
55& ◆Pw.ZL0FkaP42
2015/11/11(水) 22:13:45.21ID:mDE1AFdu s
2015/11/11(水) 22:23:37.04ID:rMaJFptQ
GB2312に平仮名、片仮名が収録されているというのも不可解なもんだ。
あいつら反日、嫌日のはずなのに。
あいつら反日、嫌日のはずなのに。
2015/11/11(水) 23:13:58.34ID:oIjjO58x
シュエエアィサィ的な使い方を想定していたんじゃなかろうか
2015/11/12(木) 23:09:21.24ID:fGMv4NR4
しかも簡体字フォントの仮名のデザインが脱力。
日本語版Windowsにも標準で付いている。たぶんMacにも。
日本語版Windowsにも標準で付いている。たぶんMacにも。
2015/11/13(金) 14:48:06.39ID:tDbTQZeN
韓国のKS C 5601(KS X 1001)にも平仮名、片仮名入ってるし
単にJIS C 6226(JIS X 0208)の構造コピーして必要なところ以外はそのまま放置しただけなんじゃ……。
単にJIS C 6226(JIS X 0208)の構造コピーして必要なところ以外はそのまま放置しただけなんじゃ……。
2015/11/13(金) 16:17:05.05ID:UEuwKYUJ
日本語の文章捏造するために必要だから
2015/11/13(金) 17:57:15.36ID:P1S0o/po
GBKはX 0208をベースに作った
韓国はX 0208をパクった上に起源を主張し出した
韓国はX 0208をパクった上に起源を主張し出した
2015/11/14(土) 12:15:58.19ID:cxUMG3m7
そういうのは嫌韓嫌中スレでやってねw
63デフォルトの名無しさん
2015/11/14(土) 16:21:16.08ID:JBEqdozk Androidでのダウンロードしたアプリのapkファイルを取り出してESファイルエクスプローラというアプリでapkファイルの拡張子をzipにして中身を見てるんだけど文字化けしてみえない
どの文字コードにしても見えない
どの文字コードにしても見えない
2015/11/14(土) 16:31:04.02ID:1yIT8GQx
文字コード関係なし
2015/11/18(水) 16:49:52.57ID:UgIpz7zK
すみません
今ISO-IRの資料を収集してるんですが
http://www.itscj.ipsj.or.jp/ISO-IR/232mapping.txt
の対応表ファイル持ってる方いらっしゃいませんか?
PDFはサーバーにデータ残ってるみたいで保存出来たんですが
他は消されちゃったみたいなんですよね。。。
今ISO-IRの資料を収集してるんですが
http://www.itscj.ipsj.or.jp/ISO-IR/232mapping.txt
の対応表ファイル持ってる方いらっしゃいませんか?
PDFはサーバーにデータ残ってるみたいで保存出来たんですが
他は消されちゃったみたいなんですよね。。。
2015/11/19(木) 01:28:49.91ID:Cr0FNu0Z
2015/11/20(金) 02:58:25.44ID:n24r8VSJ
人名漢字など「文字情報基盤」約6万字の暫定私用コードと対応フォント公開 -INTERNET Watch
http://internet.watch.impress.co.jp/docs/news/20151117_731123.html
http://internet.watch.impress.co.jp/docs/news/20151117_731123.html
2015/11/20(金) 16:27:32.87ID:Q3IEXjzg
>>66
そう、これです!
ありがとうございます!
ずっと
http://www.itscj.ipsj.or.jp/〜
と
http://kikaku.itscj.ipsj.or.jp/〜
の方ばかり探してたんですが、
https://の方にまだあったんですね、気付かなかった。。。
ありがとうございました。
そう、これです!
ありがとうございます!
ずっと
http://www.itscj.ipsj.or.jp/〜
と
http://kikaku.itscj.ipsj.or.jp/〜
の方ばかり探してたんですが、
https://の方にまだあったんですね、気付かなかった。。。
ありがとうございました。
2015/11/21(土) 03:23:51.12ID:YeqL1+4P
gbkの ひらがな はEUC-JPと互換性がある
ひらがなが含まれてるgbkなテキストファイルを自動判別すると
EUC-JPと認識される
ひらがなが含まれてるgbkなテキストファイルを自動判別すると
EUC-JPと認識される
2015/11/21(土) 06:36:56.04ID:GdR6w5S8
お前かお前の使ってるクソソフトが認識したことを
さも普遍的であるかのように「認識される」と書かれても
さも普遍的であるかのように「認識される」と書かれても
71デフォルトの名無しさん
2015/11/21(土) 14:00:50.43ID:EEYvP2Nj2015/11/21(土) 14:57:31.75ID:w+2inzGV
全てって…
具体名を十個挙げてみてくれ。
具体名を十個挙げてみてくれ。
2015/11/22(日) 15:40:38.08ID:CReeeeGe
仕様と実装をごちゃ混ぜにしないでほしい
2015/11/24(火) 07:50:30.03ID:CRysEeOZ
grepをutf16対応にして欲しいわ
2015/11/24(火) 12:09:48.94ID:BW2JWDBU
>>73
ANSI(SJIS) / JIS / EUC(EUC-JP) / UNICODE / UTF-8
だけしか対応してないんなら仕様だろうけど
EmEditorはgbk / big5も表示可能だが自動識別はダメ
ANSI(SJIS) / JIS / EUC(EUC-JP) / UNICODE / UTF-8
だけしか対応してないんなら仕様だろうけど
EmEditorはgbk / big5も表示可能だが自動識別はダメ
2015/11/24(火) 16:09:46.89ID:y63rqxtS
EUC系の自動判別には限界があるってだけの話じゃないのそれ
2015/11/24(火) 17:13:28.90ID:AzY4Y1Jb
馬鹿に言ってもしょうがないんだよなあ
2015/11/24(火) 21:06:35.37ID:T8a74y+F
文字コードの仕様の話と製品の仕様(実装)の話をごっちゃにしないでください
2015/11/25(水) 13:54:24.53ID:5G4DFNSQ
文字化けし辛い・自動判別に強いという意味ではISO-2022-JP最強だな
80デフォルトの名無しさん
2015/11/25(水) 21:01:53.81ID:Bzkw7eST >>74
utf-8でガマンガマン
utf-8でガマンガマン
2015/11/26(木) 10:04:26.60ID:esn3xG4v
プログラミングやマークアップで場面によって"utf8"だったり"utf-8"だったり"UTF8"だったり"UTF-8"だったりするのは何とかならんのですかね
2015/11/26(木) 18:52:12.64ID:V1IifTg+
83デフォルトの名無しさん
2015/11/26(木) 20:23:24.34ID:k6+g+Go3 >>79
https://ja.wikipedia.org/wiki/ISO-2022-JP
独自拡張しすぎだろ
utf-8最強なのだが
Win9x時代に ANSI(s-jis) + utf-8(※s-jisに無い文字をutf-8にしてる) なんてファイル作る糞ソフトがあったな
https://ja.wikipedia.org/wiki/ISO-2022-JP
独自拡張しすぎだろ
utf-8最強なのだが
Win9x時代に ANSI(s-jis) + utf-8(※s-jisに無い文字をutf-8にしてる) なんてファイル作る糞ソフトがあったな
2015/11/26(木) 22:39:18.80ID:i5VTRdPj
>>82
utf-8に関しては-が付いてておかしくなる方がおかしい。
utf-8に関しては-が付いてておかしくなる方がおかしい。
2015/11/26(木) 22:43:40.69ID:i5VTRdPj
86デフォルトの名無しさん
2015/11/26(木) 23:24:19.12ID:dmQOYIsX2015/11/26(木) 23:37:04.25ID:o1tgPu22
そんなのはプログラミングやマークアップでの指定方法の仕様次第
おかしくなると思うのはバカ
おかしくなると思うのはバカ
2015/11/26(木) 23:41:50.71ID:1gB3GczG
お前が馬鹿だ
89デフォルトの名無しさん
2015/11/27(金) 07:32:51.99ID:B8BSEsh/2015/11/27(金) 15:43:44.97ID:ssdfMMFk
91デフォルトの名無しさん
2015/11/30(月) 21:59:17.66ID:jgXroiuo 「して欲しい」じゃなく自分でやってみればいいのに。
92デフォルトの名無しさん
2015/11/30(月) 22:34:12.03ID:CwTedwfo UTF-8って日本語はほぼ3バイトだと思っていいんだっけ?
仕事仲間がそう言ってたけど不安。
仕事仲間がそう言ってたけど不安。
2015/11/30(月) 22:58:14.64ID:/7/T57pL
そういう曖昧な表現なら答えはyesでありnoでもあるだろう
2015/12/01(火) 02:33:52.32ID:juK8PVcx
iconv -f Shift_JIS -t UTF-8 file_name > new_file
サイズを比較
new_fileは、file_nameより1.5倍おおきい
# 日本人にとってUTF-8がいいわけない
サイズを比較
new_fileは、file_nameより1.5倍おおきい
# 日本人にとってUTF-8がいいわけない
2015/12/01(火) 02:44:11.35ID:juK8PVcx
ほとんど3バイト
Japanese, Chinese and Korean characters are almost entirely (if not entirely) 3 bytes on UTF-8.
3バイトは、UTF-16をつかう理由になる。
the three-byteness of CJK characters is an often-cited reason to use UTF-16 instead of UTF-8.
http://forum.dlang.org/post/hum5gl$2hfm$1@digitalmars.com
Japanese, Chinese and Korean characters are almost entirely (if not entirely) 3 bytes on UTF-8.
3バイトは、UTF-16をつかう理由になる。
the three-byteness of CJK characters is an often-cited reason to use UTF-16 instead of UTF-8.
http://forum.dlang.org/post/hum5gl$2hfm$1@digitalmars.com
2015/12/01(火) 03:51:29.82ID:Ik5f2d1Y
>>94-95
ファイルサイズの事を書くならもっと考慮すべきだな
UTF-8に変換するとどの程度ファイルサイズが膨らむのかは文書の内容により異なる
例えばこのスレの95までのdatファイルの場合は次のようになっていて
元のファイルに対してUTF-8は約 1.25 倍、UTF-16は約 1.5 倍だった
$ wc -c 1444822140-*
26775 1444822140-cp932.dat
40234 1444822140-utf16.dat
33434 1444822140-utf8.dat
ワープロなどの独自形式の内部でUCS2を使うことは十分に意味があると思う
しかしSHIFT_JISのプレーンテキストを変換する場合は、おおよそUTF-8が最大1.5倍
なのに対してUTF-16は最大2倍になる事を忘れてはいけない
ファイルサイズの事を書くならもっと考慮すべきだな
UTF-8に変換するとどの程度ファイルサイズが膨らむのかは文書の内容により異なる
例えばこのスレの95までのdatファイルの場合は次のようになっていて
元のファイルに対してUTF-8は約 1.25 倍、UTF-16は約 1.5 倍だった
$ wc -c 1444822140-*
26775 1444822140-cp932.dat
40234 1444822140-utf16.dat
33434 1444822140-utf8.dat
ワープロなどの独自形式の内部でUCS2を使うことは十分に意味があると思う
しかしSHIFT_JISのプレーンテキストを変換する場合は、おおよそUTF-8が最大1.5倍
なのに対してUTF-16は最大2倍になる事を忘れてはいけない
2015/12/01(火) 10:01:27.63ID:2Tu3vetc
UTF-8で日本語が基本3バイト、はもう慣れたけど
ブログやらWikiで日本語使うと1文字につき9バイト必要なのはさすがにちょっと萎える
%E3%81%8B%E3%81%A3%E3%81%B1%E3%81%88%E3%81%B3%E3%81%9B%E3%82%93
とかたった数文字を表すのに長すぎだっての。
文字コードというかUTF-8をパーセントエンコーディング?する時の問題だけれど。
ブログやらWikiで日本語使うと1文字につき9バイト必要なのはさすがにちょっと萎える
%E3%81%8B%E3%81%A3%E3%81%B1%E3%81%88%E3%81%B3%E3%81%9B%E3%82%93
とかたった数文字を表すのに長すぎだっての。
文字コードというかUTF-8をパーセントエンコーディング?する時の問題だけれど。
2015/12/01(火) 19:29:51.08ID:k1p/Pdr9
パーセントエンコーディングって単語自体が長くてめんどい。
もっと短く、パンコとかで通用するようにならないかな。
もっと短く、パンコとかで通用するようにならないかな。
2015/12/01(火) 20:03:05.10ID:ampHwdqN
別に人が手作業でやってるわけじゃないのに
なにぶつぶつ言ってるんだろ
なにぶつぶつ言ってるんだろ
100デフォルトの名無しさん
2015/12/01(火) 20:18:47.62ID:cchxtPU5 >>94
そんな程度のことでutf-8を辞める訳にはいかない。
そんな程度のことでutf-8を辞める訳にはいかない。
101デフォルトの名無しさん
2015/12/01(火) 20:40:03.81ID:RA+mqEJ1102デフォルトの名無しさん
2015/12/01(火) 22:44:13.88ID:/t42lLyY URLのパーセントエンコーディングは脆弱性の宝庫になるくらいでただ使う側としてはどうでもいいけど
punycodeはまじでやめろ
punycodeはまじでやめろ
103デフォルトの名無しさん
2015/12/01(火) 23:03:02.39ID:csnzGfyE なんでやめないといけないぷに?
いいじゃないかぷに。
いいじゃないかぷに。
104デフォルトの名無しさん
2015/12/02(水) 01:31:49.86ID:3/uIxAsF 日本語のソート順くらい日本人に決めさせろや
105デフォルトの名無しさん
2015/12/02(水) 09:35:48.18ID:wYxvpGTD 人の感覚じゃなくて、機械的な感覚がないと・・・
106デフォルトの名無しさん
2015/12/02(水) 10:05:36.38ID:amR8vvu9 >>104
提案しろよ。
そもそも読みがわからんとソート出来ないのが日本語なんで、
単漢字のソート順なんて大したこだわりないだろ。
植物、人の名前なんか、音読み、訓読み、当て読みと
二種類以上あるの珍しくないからな。
提案しろよ。
そもそも読みがわからんとソート出来ないのが日本語なんで、
単漢字のソート順なんて大したこだわりないだろ。
植物、人の名前なんか、音読み、訓読み、当て読みと
二種類以上あるの珍しくないからな。
107デフォルトの名無しさん
2015/12/02(水) 10:18:22.35ID:wYxvpGTD JISコードに頼ったソートも今のコンピュータ環境じゃ、笑・・・・
脆弱性ってのは未熟もんがやるからとかでは
やりこんでる人でもバグは残ることも あ・・・
脆弱性ってのは未熟もんがやるからとかでは
やりこんでる人でもバグは残ることも あ・・・
108デフォルトの名無しさん
2015/12/02(水) 13:55:56.97ID:NJ9kFAss 日本語のソート順で思い出したが、
JIS(X 0208)が第1水準と第2水準で違う並べ方してるのも意味分からん。
代表音訓でも部首画数順でもいいから統一して欲しかった。
JIS(X 0208)が第1水準と第2水準で違う並べ方してるのも意味分からん。
代表音訓でも部首画数順でもいいから統一して欲しかった。
109デフォルトの名無しさん
2015/12/04(金) 12:30:36.89ID:ujmgtERp 最近勉強し出したのか?
ソート順は確かに面倒だけど他の仕様との絡みを知ればこうするしかないと思う。
理想は理想で持っておけばいいんじゃね?
将来、漢字表刷新するかもしれんし、シフトJIS死滅するかもしれんし。
ソート順は確かに面倒だけど他の仕様との絡みを知ればこうするしかないと思う。
理想は理想で持っておけばいいんじゃね?
将来、漢字表刷新するかもしれんし、シフトJIS死滅するかもしれんし。
110デフォルトの名無しさん
2015/12/04(金) 12:38:17.66ID:kxI+vXrK シフトJIS死滅するのは構わないが、漢字の文化的側面を理解しようともしない欧米人が適当に並べた順でソートされるのは納得いかん。
111デフォルトの名無しさん
2015/12/04(金) 12:53:33.88ID:gpSQ8UEd でもJISコードなら希望通りのソートができるわけでもないだろ
112デフォルトの名無しさん
2015/12/04(金) 14:24:16.07ID:616grxEX 何のために仮名文字があると思っているのか。
113デフォルトの名無しさん
2015/12/04(金) 18:29:07.64ID:zfbjjPeM 文字コード順でソートしてるアホ
114デフォルトの名無しさん
2015/12/04(金) 20:17:25.57ID:urrQLDlj いつまでたっても文字集合順序バカはいなくならないね。
全てのいじたいに
全てのいじたいに
115デフォルトの名無しさん
2015/12/05(土) 09:09:04.31ID:0xZl9ZTr 半角カタカナで読みもかいておく。ひとにかいてもらうとかまぁたいへんだけど…
昇順にするとき、半角カタカナで比較して行を並べ替える
昇順にするとき、半角カタカナで比較して行を並べ替える
116デフォルトの名無しさん
2015/12/05(土) 10:43:28.38ID:oE97tTMi なんでメモ蝶を保存するときに
シフトジスでなくアンジーって表示されてんの?
シフトジスでなくアンジーって表示されてんの?
117デフォルトの名無しさん
2015/12/05(土) 11:20:47.89ID:VAg3AW+y >>116
アメリカ人がバカだから
アメリカ人がバカだから
118デフォルトの名無しさん
2015/12/05(土) 19:58:46.22ID:kjmBg6FK119デフォルトの名無しさん
2015/12/05(土) 20:50:07.85ID:K2AVyHLa120デフォルトの名無しさん
2015/12/06(日) 00:47:45.72ID:ods/Bdie 英語でもWindows-1252であってANSI関係ないけどなー
後にISO/IEC 8859-1になるものが昔ANSIのドラフトとして提案されてたってのが名前の由来らしいけど
Windowsのはそれ更に独自拡張したやつだし
後にISO/IEC 8859-1になるものが昔ANSIのドラフトとして提案されてたってのが名前の由来らしいけど
Windowsのはそれ更に独自拡張したやつだし
121デフォルトの名無しさん
2015/12/06(日) 09:58:13.03ID:pIhfFp+J122デフォルトの名無しさん
2015/12/06(日) 10:48:45.84ID:snTz5MuC お前らも意味不明な文章を見たときに
「日本語でおK」って言うだろ?
それと同じ事だ
「日本語でおK」って言うだろ?
それと同じ事だ
123デフォルトの名無しさん
2015/12/06(日) 11:36:05.85ID:jSbqCg57 答えるの面倒な質問だよなw
ANSI==932じゃない
Winowsが繁体字版なら950で保存される
ANSI==932じゃない
Winowsが繁体字版なら950で保存される
124デフォルトの名無しさん
2015/12/06(日) 12:39:48.92ID:61iq3tHI >>120
8859-1だけじゃなくて8859の8bit使うコーディングシステムの変種という理解だろうね。
8859-1だけじゃなくて8859の8bit使うコーディングシステムの変種という理解だろうね。
125デフォルトの名無しさん
2015/12/07(月) 08:05:52.84ID:jRU2iLzO126デフォルトの名無しさん
2015/12/09(水) 07:55:39.86ID:jI2VmBLr というか昔はANSIが決めてISOが追認って規格がたくさんあった。
アメリカではANSIの規格名で呼び続けることもあった。
アメリカではANSIの規格名で呼び続けることもあった。
127デフォルトの名無しさん
2015/12/09(水) 08:29:25.15ID:Kwr/X5Fv ほうほう、シフトジスもANSIが決めたのですか
それは初耳です
それは初耳です
128デフォルトの名無しさん
2015/12/09(水) 09:52:29.63ID:jI2VmBLr129デフォルトの名無しさん
2015/12/09(水) 16:27:04.50ID:lqAlbDFw カメラのフィルムに書いてある数字のこと昔はASA感度って言ってたのに気が付いたらISO感度ってみんな言うようになってたなみたいな話かna
130デフォルトの名無しさん
2015/12/09(水) 22:54:10.41ID:wiCS3usg 朝感度
磯感度
磯感度
131デフォルトの名無しさん
2015/12/10(木) 08:01:54.07ID:XGY4goXY >>127
えっ!?何言ってんの⁇
えっ!?何言ってんの⁇
132デフォルトの名無しさん
2015/12/18(金) 18:25:49.47ID:HJbW+QnG133デフォルトの名無しさん
2015/12/19(土) 00:00:59.61ID:CW6jl8Ze 第一水準のなんでこの漢字訓読みなんだって漢字もそれ由来なん?
134デフォルトの名無しさん
2015/12/19(土) 09:33:24.36ID:HazuH4Vs たとえばおしえて
135デフォルトの名無しさん
2015/12/19(土) 22:28:28.39ID:dMkmHKK1 NDL-70の「扱」は「圧」と「安」の間
136デフォルトの名無しさん
2015/12/20(日) 02:41:57.27ID:YliIi6mv あっあっあん
137デフォルトの名無しさん
2015/12/20(日) 10:16:50.75ID:XCzWC+ME しごく
こく
こく
138デフォルトの名無しさん
2015/12/20(日) 10:19:07.37ID:XCzWC+ME 音読みが表外
139デフォルトの名無しさん
2016/01/01(金) 03:45:50.30ID:doWmnGIT あけまして
140デフォルトの名無しさん
2016/01/01(金) 10:51:09.09ID:w8UZcEt0 しめました
141デフォルトの名無しさん
2016/01/01(金) 23:48:50.10ID:AG0KIon8 ISO/IEC 10646のAmd.はもう無料公開されないのかしら
142デフォルトの名無しさん
2016/01/03(日) 11:09:11.17ID:dkSYzm34143デフォルトの名無しさん
2016/01/06(水) 19:04:13.23ID:JzbnS0qc 年寄りの昔話だな
144デフォルトの名無しさん
2016/01/06(水) 20:12:47.63ID:iuDSHbH+ 書き起こして記録しておくことは大切
145デフォルトの名無しさん
2016/01/06(水) 20:53:18.67ID:PPpC6D2R 確かに。
146デフォルトの名無しさん
2016/01/15(金) 16:58:58.27ID:KQq8mMFq 特定機種の話でアレだが
スマホのXperiaがZ4かZ5か知らんけどUnicodeの補助文字(BMP外の文字)表示出来るようになってたわ
俺のZ3では豆腐でがっかりだったのに、いつの間に。
スマホのXperiaがZ4かZ5か知らんけどUnicodeの補助文字(BMP外の文字)表示出来るようになってたわ
俺のZ3では豆腐でがっかりだったのに、いつの間に。
147デフォルトの名無しさん
2016/01/15(金) 18:41:54.97ID:P2RUw3PT 豆腐になるっていうのは普通に考えると
表示能力はあるけどフォントが無いだけだからフォント入れれば済む話では
表示能力はあるけどフォントが無いだけだからフォント入れれば済む話では
148デフォルトの名無しさん
2016/01/16(土) 01:02:26.88ID:JNkmPv0K 何個の豆腐かにもよるんじゃなかろうか
149デフォルトの名無しさん
2016/01/19(火) 13:39:56.61ID:dtt1X0Ve150デフォルトの名無しさん
2016/01/19(火) 20:31:34.42ID:AH+kA+fr 使ったならちゃんとそう書けって話で
使うなということではない
使うなということではない
151デフォルトの名無しさん
2016/01/22(金) 19:46:47.72ID:Eb9O6glo [要出典]
てか
てか
152デフォルトの名無しさん
2016/01/22(金) 20:00:04.23ID:QBUelO2B アホの安岡が
『「常用漢字表と人名用漢字表を元にしてテキストを作成した[1]」のが事実なら』
と鍵かっこで強調してるというのに
日本語も読めないのかこの馬鹿(>151)は
『「常用漢字表と人名用漢字表を元にしてテキストを作成した[1]」のが事実なら』
と鍵かっこで強調してるというのに
日本語も読めないのかこの馬鹿(>151)は
153デフォルトの名無しさん
2016/01/25(月) 22:08:23.80ID:hLxKxz0/ Unicodeには常用漢字表も人名用漢字表も含まれてるから、
結局のとこ、Unihanで無問題な希ガス
結局のとこ、Unihanで無問題な希ガス
154デフォルトの名無しさん
2016/01/25(月) 22:37:19.56ID:1JcfbMU3 そんな甘い考えでやっちまったんだろうなあ
155片山博文MZ ◆T6xkBnTXz7B0
2016/01/29(金) 15:58:28.60ID:BQRaRgTF 与えられたテキストがUCS16に合致するか判定するアルゴリズムってある?
156デフォルトの名無しさん
2016/01/29(金) 16:42:21.91ID:aBCIPjTo iconvはルールが厳しいから
入ロクおかしければ変換失敗する
入ロクおかしければ変換失敗する
157片山博文MZ ◆T6xkBnTXz7B0
2016/01/30(土) 22:17:33.35ID:4i/PfDlC nkfは、ライブラリとしては中途半端なんだよな。
スタティックライブラリとして利用可能にしてほしい。
スタティックライブラリとして利用可能にしてほしい。
158デフォルトの名無しさん
2016/01/31(日) 00:56:53.78ID:1gNPM3q2 nkfって厳密さより何となく動くこと重視してるし
変換も自然とは言いがたい独自なのあるから注意
変換も自然とは言いがたい独自なのあるから注意
159デフォルトの名無しさん
2016/02/01(月) 00:21:45.94ID:AuVBRc/d ほええそういうものなのか
160デフォルトの名無しさん
2016/02/03(水) 21:14:57.17ID:uf0uQxAG シフトJISを作るときに2バイト目が0x00-7Fを避けるようにはできなかったのかな?
こうすればダメ文字問題も起こらないのに。
こうすればダメ文字問題も起こらないのに。
161デフォルトの名無しさん
2016/02/03(水) 21:41:36.87ID:Fx9BpiPG162デフォルトの名無しさん
2016/02/03(水) 21:50:14.56ID:mmJ5x1I8 >>161は会話のできないあすぺ
163デフォルトの名無しさん
2016/02/03(水) 21:58:17.93ID:mmJ5x1I8 できなくはなかっただろうな
FFと1バイト目の半角カナを避けても
63×127=8001文字は使える
FFと1バイト目の半角カナを避けても
63×127=8001文字は使える
164デフォルトの名無しさん
2016/02/03(水) 23:45:43.20ID:uf0uQxAG Unicodeがあるのに今さらという感じはするけど
半角文字は1バイト全角文字は2バイトのままで
2バイト目が00-7Fにならない新文字コードがあってもいいと思う。
半角文字は1バイト全角文字は2バイトのままで
2バイト目が00-7Fにならない新文字コードがあってもいいと思う。
165デフォルトの名無しさん
2016/02/03(水) 23:58:17.15ID:FE/plTpc そして三水四水を入れる領域が足りなくなり後のMSに恨まれると。
166デフォルトの名無しさん
2016/02/04(木) 12:35:29.01ID:NB0syLHO167デフォルトの名無しさん
2016/02/04(木) 13:06:32.74ID:dTOEAfAy >>164
もう全く必要ない
もう全く必要ない
168デフォルトの名無しさん
2016/02/04(木) 14:58:00.09ID:pUsIARbq シフトJISの反省の上に?作られたのが0x00-7FをASCIIにしか使わない日本語EUC(EUC-JP)なんだから
それでいいじゃんって気がするのだけど
そんなに半角カナが大事か
>>163
ISO/IEC 2022の94*94を47*188に変換するって分かりやすさ優先でこうなったんだっけ?
それでいいじゃんって気がするのだけど
そんなに半角カナが大事か
>>163
ISO/IEC 2022の94*94を47*188に変換するって分かりやすさ優先でこうなったんだっけ?
169デフォルトの名無しさん
2016/02/04(木) 16:01:14.78ID:dTOEAfAy170デフォルトの名無しさん
2016/02/04(木) 19:20:10.85ID:EFnVMbsO171デフォルトの名無しさん
2016/02/04(木) 23:06:09.90ID:WWqaejBP >>166
もっと昔からある EUC を処理するには 8ビットクリーンなプログラムであれば事足りる。
ISO 8859 もそうだ。だからコンパイラも特別な処理などしなかった。
シフトJISもそうできなかったのかという話じゃないのか?
もっと昔からある EUC を処理するには 8ビットクリーンなプログラムであれば事足りる。
ISO 8859 もそうだ。だからコンパイラも特別な処理などしなかった。
シフトJISもそうできなかったのかという話じゃないのか?
172デフォルトの名無しさん
2016/02/04(木) 23:35:33.23ID:gW2sFWg4 むしろ解釈できない文字コードを通すことがおかしい
たまたま問題が見つからなかった、コンパイラがエラーを出さずに処理を終えたからOKとするなんてアホ
たまたま問題が見つからなかった、コンパイラがエラーを出さずに処理を終えたからOKとするなんてアホ
173デフォルトの名無しさん
2016/02/05(金) 02:34:16.13ID:EN3ElRH3 >>171
8ビットクリーンならEUC-JPを問題なく使えるかというとそうでもなくて
上位バイトと下位バイトが別れちゃう問題は発生しうる
シフトjisの「表」のあとに\を入れるみたいなバッドノウハウが目立つのでシフトJISに
問題があるように見えるのかもしれないけど、本質的には対応してないものを
勝手に使って文句言ってるだけじゃないかな
8ビットクリーンならEUC-JPを問題なく使えるかというとそうでもなくて
上位バイトと下位バイトが別れちゃう問題は発生しうる
シフトjisの「表」のあとに\を入れるみたいなバッドノウハウが目立つのでシフトJISに
問題があるように見えるのかもしれないけど、本質的には対応してないものを
勝手に使って文句言ってるだけじゃないかな
174デフォルトの名無しさん
2016/02/05(金) 02:44:24.24ID:k2yclqL8 上位バイトと下位バイトが別れる件はダメ文字とは別件だから
最初の人の要求に対しては問題にならない
最初の人の要求に対しては問題にならない
175デフォルトの名無しさん
2016/02/06(土) 14:03:11.00ID:sR9TSGCJ176デフォルトの名無しさん
2016/02/06(土) 15:14:13.70ID:zVjqWScH 自分が間違ったやり方をしていたけど問題になったのはAだけだ
→だからAが悪い
まさにこういう発想がクソ
しかも自分の知っている文字コードが全てだと勘違いしていてたちが悪い
→だからAが悪い
まさにこういう発想がクソ
しかも自分の知っている文字コードが全てだと勘違いしていてたちが悪い
177デフォルトの名無しさん
2016/02/06(土) 15:45:39.28ID:P3+owK3w178デフォルトの名無しさん
2016/02/06(土) 18:59:39.30ID:Ps0oIAyd UTF-8なら漢字やかなに00-7Fは使わないけどな
って、そういう話をしてるわけじゃないのか。
って、そういう話をしてるわけじゃないのか。
179デフォルトの名無しさん
2016/02/06(土) 19:36:29.58ID:uSRKfZgb >>176
しかしShift JISはかなり質が悪い
しかしShift JISはかなり質が悪い
180デフォルトの名無しさん
2016/02/06(土) 19:41:15.78ID:MiOvJZDJ どうしてWindowsは出来の悪い方ばっかり選択するんだろうか
cp932といいUTF-16といい…
cp932といいUTF-16といい…
181デフォルトの名無しさん
2016/02/06(土) 20:34:21.53ID:sR9TSGCJ >>178
そういう話をしてるつもりだけど、そうでない人もいるようだ。
そういう話をしてるつもりだけど、そうでない人もいるようだ。
182デフォルトの名無しさん
2016/02/07(日) 08:00:22.03ID:+iI8pPYd エスケープシーケンスよりCP932の方がまだマシだし、
CP932よりUCS-2の方が多少はマシだったからでしょ
CP932よりUCS-2の方が多少はマシだったからでしょ
183デフォルトの名無しさん
2016/02/07(日) 13:34:15.00ID:COqNuXpv >>173
今更だけど、文字が分断される可能性についても公平を期すために触れておくよ。
単純にバイト数で分割する場合等を除けば、ほとんどはパターンマッチにおける誤マッチが原因だろう。
strchr や strstr 、あるいはもっと高度なライブラリを使った結果かもしれない。
探すパターンに [\100-\176] にマッチする文字が含まれているなら EUC では誤マッチは起こらない。
シフトJISではダメ文字のせいで誤マッチが起こりうる。
実際に問題になるのはほとんどがこのケース。
grep "\]"
などとやろうものなら悲惨なことになる。
探すパターンがマルチバイト文字だけなら EUC でもシフトJISと同程度には誤マッチが起こりうる。
しかし実際にはほとんど起こらない。
もちろん起こるときは起こるし対策も出来るが対策は速度の低下と引換だ。
30 年前の CPU クロックは 10MHz 程度だったので速度も重要だった。
ほとんど起こらない上に致命的でもないなら速度を犠牲にしてまで常に対策を講じる必要は無い。
ちなみに対策だが、EUC で grep する場合なら
egrep "^([\000-\177]|\216[\240-\337]|\217[\241-\376][\241-\376]|[\241-\376][\241-\376])*$pattern"
的なことをするプログラムを grep_euc とかそういう名前で作っておけばいい。
シフトJISの場合はこれに加えてシフトJISな部分を 8 進エスケープシーケンスに置き換える必要がある。
同じやり方で iso-2022-jp も処理できる。
シフトJISしか通さない grep など技術的には邪魔なだけだよ。
今更だけど、文字が分断される可能性についても公平を期すために触れておくよ。
単純にバイト数で分割する場合等を除けば、ほとんどはパターンマッチにおける誤マッチが原因だろう。
strchr や strstr 、あるいはもっと高度なライブラリを使った結果かもしれない。
探すパターンに [\100-\176] にマッチする文字が含まれているなら EUC では誤マッチは起こらない。
シフトJISではダメ文字のせいで誤マッチが起こりうる。
実際に問題になるのはほとんどがこのケース。
grep "\]"
などとやろうものなら悲惨なことになる。
探すパターンがマルチバイト文字だけなら EUC でもシフトJISと同程度には誤マッチが起こりうる。
しかし実際にはほとんど起こらない。
もちろん起こるときは起こるし対策も出来るが対策は速度の低下と引換だ。
30 年前の CPU クロックは 10MHz 程度だったので速度も重要だった。
ほとんど起こらない上に致命的でもないなら速度を犠牲にしてまで常に対策を講じる必要は無い。
ちなみに対策だが、EUC で grep する場合なら
egrep "^([\000-\177]|\216[\240-\337]|\217[\241-\376][\241-\376]|[\241-\376][\241-\376])*$pattern"
的なことをするプログラムを grep_euc とかそういう名前で作っておけばいい。
シフトJISの場合はこれに加えてシフトJISな部分を 8 進エスケープシーケンスに置き換える必要がある。
同じやり方で iso-2022-jp も処理できる。
シフトJISしか通さない grep など技術的には邪魔なだけだよ。
184デフォルトの名無しさん
2016/02/07(日) 13:49:06.41ID:GW5WZ8T2185デフォルトの名無しさん
2016/02/07(日) 15:37:08.80ID:F/ILMG/l186デフォルトの名無しさん
2016/02/07(日) 20:14:33.59ID:lDI02uIo grepはいつutf16対応してくれるんじゃぁ
ふだんLinux使ってるんだがwinのソースコードはなぜかutf16なんでいつも困っとるんじゃぁ
nkfで変換するのめんどいんじゃあ
ふだんLinux使ってるんだがwinのソースコードはなぜかutf16なんでいつも困っとるんじゃぁ
nkfで変換するのめんどいんじゃあ
187デフォルトの名無しさん
2016/02/07(日) 21:05:14.46ID:+iI8pPYd utf16のそーすとか見たこと無いな
188デフォルトの名無しさん
2016/02/08(月) 01:36:20.73ID:0XuKQtD5 >>180
UTF-16はそのころUCS-2しかなかったんだから仕方ないやろ
個人的にWindowsはAとWはそのままでもいいから
標準CライブラリとC++ライブラリはUTF-8を使ってくれるようにしてくれれば不満ないんだけどな。
UTF-16はそのころUCS-2しかなかったんだから仕方ないやろ
個人的にWindowsはAとWはそのままでもいいから
標準CライブラリとC++ライブラリはUTF-8を使ってくれるようにしてくれれば不満ないんだけどな。
189デフォルトの名無しさん
2016/02/08(月) 05:19:47.55ID:x/5r9wp6 >>188
全然仕方なくないどころか、むしろまた先走ってやっちまったとしか
全然仕方なくないどころか、むしろまた先走ってやっちまったとしか
190デフォルトの名無しさん
2016/02/08(月) 09:34:53.73ID:AxqrebA9 UTF-16固定とか基地外沙汰
ackやagもUTF-16は華麗にスルー
ackやagもUTF-16は華麗にスルー
191デフォルトの名無しさん
2016/02/08(月) 22:30:39.07ID:ti0XuUyR EUCは目糞鼻糞だし、当時の記録媒体でUTF-8とか頭おかしいレベルなのに
一体どうしたかったのか
一体どうしたかったのか
192デフォルトの名無しさん
2016/02/08(月) 22:35:16.47ID:HMUrPVh/ ただマイクロソフトを非難したいだけのキティGUYに何を。
こういうのは誰でもいいから攻撃対象を設けてガス抜きさせてやらないといかん。
こういうのは誰でもいいから攻撃対象を設けてガス抜きさせてやらないといかん。
193デフォルトの名無しさん
2016/02/08(月) 23:02:30.93ID:sawB/DI+ SHIFT_JISよりEUC-JPの方がマシ、UTF-16よりUTF-8の方がマシってだけでしょ
マイクロソフトを非難したいだけに見えるとしたら相当なバイアス掛かってると思うよ
マイクロソフトを非難したいだけに見えるとしたら相当なバイアス掛かってると思うよ
194デフォルトの名無しさん
2016/02/09(火) 00:48:21.70ID:TCPuRlam195デフォルトの名無しさん
2016/02/09(火) 05:16:13.78ID:K12Uxl59 UTF-8のRFCが出たのは2003年
その頃には80GBのHDDを一般人が変える時代
テキストの容量が問題になるとか無いわ
個人的にはいつまで経ってもsetlocaleでUTF-8を指定出来ない、代替の方法も用意されないWindowsは非難されて当然だと思うけどな。
その頃には80GBのHDDを一般人が変える時代
テキストの容量が問題になるとか無いわ
個人的にはいつまで経ってもsetlocaleでUTF-8を指定出来ない、代替の方法も用意されないWindowsは非難されて当然だと思うけどな。
196デフォルトの名無しさん
2016/02/09(火) 07:15:08.73ID:4WJVGAJH Windowsの今の文字コードの設計のベースは1991年か1992年に
Unicode1.0.0をもとに作られたはず
ちなみにその頃から「〜」はU+FF5Eに存在した
Unicode1.0.0をもとに作られたはず
ちなみにその頃から「〜」はU+FF5Eに存在した
197デフォルトの名無しさん
2016/02/09(火) 07:20:39.41ID:AjhTI0tJ 当時の記録媒体言ってるのはWindowsNTの時代な
その当時にUTF-8みたいな実装してもアホでしょ
それとUTF-8を率先して使用してる理由ってEUC環境が糞だったからでしょ
EUC環境の時代って外人様のソフトウェアで漢字の表示すらままならなかったよね
その当時にUTF-8みたいな実装してもアホでしょ
それとUTF-8を率先して使用してる理由ってEUC環境が糞だったからでしょ
EUC環境の時代って外人様のソフトウェアで漢字の表示すらままならなかったよね
198デフォルトの名無しさん
2016/02/09(火) 07:37:26.98ID:AjhTI0tJ まあなんにせよUnicodeでデータ交換できるようになって
EUCゴミ環境が消えテクノは良い事だわ
EUCありがとうバイバイ
EUCゴミ環境が消えテクノは良い事だわ
EUCありがとうバイバイ
199デフォルトの名無しさん
2016/02/09(火) 08:47:31.92ID:K12Uxl59 同じようにWindowsのCP932もさっさと消えてほしいんだけどな
200デフォルトの名無しさん
2016/02/09(火) 11:12:55.58ID:nhb546WZ 今でも新規作成の全文章を統計取ると、
cp932の方が多いんじゃないか。
結局全くプログラムかかないひとが
何の文字コード使ってるかが焦点で、
プログラム書く人間の文字コードなんざ焦点じゃないんだよね。
cp932の方が多いんじゃないか。
結局全くプログラムかかないひとが
何の文字コード使ってるかが焦点で、
プログラム書く人間の文字コードなんざ焦点じゃないんだよね。
201デフォルトの名無しさん
2016/02/09(火) 11:31:59.64ID:gJW4evIq202デフォルトの名無しさん
2016/02/09(火) 11:32:56.66ID:gJW4evIq MSは昔からAPIを移行改善していくのが下手
203デフォルトの名無しさん
2016/02/09(火) 22:21:12.66ID:K12Uxl59 電話用のWindowsもCP932とUTF16ならそのまま安らかに死んでほしいんだけどどうなん?
204デフォルトの名無しさん
2016/02/09(火) 22:44:37.32ID:AjhTI0tJ 死ぬことはないよ
生まれてすらいないからね
生まれてすらいないからね
205デフォルトの名無しさん
2016/02/10(水) 05:29:25.59ID:ShaMeiRT 産まれる前に死ぬってあると思うけど?
206デフォルトの名無しさん
2016/02/10(水) 20:10:05.19ID:NIAqtvX5 文字コードはUnicodeで統一されつつあるけど
改行コードが統一される動きはないよな
改行コードが統一される動きはないよな
207デフォルトの名無しさん
2016/02/10(水) 20:11:34.12ID:jTWkF3R0208デフォルトの名無しさん
2016/02/10(水) 20:14:06.58ID:DqOeVQNQ 何言ってんだこいつ
209デフォルトの名無しさん
2016/02/10(水) 20:19:14.56ID:urcLBA+T おまえはお馬鹿な発言する人にいつもくってかかるのか
210デフォルトの名無しさん
2016/02/10(水) 20:27:11.86ID:jTWkF3R0 >>208>>209
バカ乙
バカ乙
211デフォルトの名無しさん
2016/02/10(水) 20:58:07.57ID:DqOeVQNQ 絵に描いたような「バカと言う奴がバカ」
212デフォルトの名無しさん
2016/02/10(水) 22:46:23.85ID:MNP/EF3f 最近のMSVCはUTF-8のソースコード食ってくれるよ
新しくMSVCで読み込んだソースがUTF-8なのにBOMがないと自動判定に失敗して意味不明なコンパイルエラーになることも多いけど
新しくMSVCで読み込んだソースがUTF-8なのにBOMがないと自動判定に失敗して意味不明なコンパイルエラーになることも多いけど
213デフォルトの名無しさん
2016/02/11(木) 00:53:59.61ID:V6zkYN3z214デフォルトの名無しさん
2016/02/11(木) 21:55:56.34ID:xlY9kt9Q 1バイトの英数字を平仮名と同じ幅で表示するフォントがあれば
全角英数字は使わないと思うんだが全角英数字も互換性のためだけに残されていると考えていいのか
全角英数字は使わないと思うんだが全角英数字も互換性のためだけに残されていると考えていいのか
215デフォルトの名無しさん
2016/02/11(木) 23:11:32.22ID:e91ojKTo >>214
JIS X 0208は、ASCIIやJIS X 0201と併用せずに使うことも想定されてる
だから文字集合に英数記号が含まれるのは当然
併用する場合ISO 2022的には重複符号化禁止だから本来使っちゃいけない
けど運用では守られてなかったし、併用前提の文字コードもあった
Unicodeは過去の利用例をほぼ取り込むのが前提だから
互換文字として全角文字を取り込んだ
JIS X 0208は、ASCIIやJIS X 0201と併用せずに使うことも想定されてる
だから文字集合に英数記号が含まれるのは当然
併用する場合ISO 2022的には重複符号化禁止だから本来使っちゃいけない
けど運用では守られてなかったし、併用前提の文字コードもあった
Unicodeは過去の利用例をほぼ取り込むのが前提だから
互換文字として全角文字を取り込んだ
216デフォルトの名無しさん
2016/02/11(木) 23:19:16.34ID:sKuqfOHl ではU+3000が互換文字領域に無いのは何故なんだぜ
217デフォルトの名無しさん
2016/02/11(木) 23:22:30.10ID:e91ojKTo なんとか空白はどうしても入れたい奴があったから全部入れることにしたんじゃないのかね
最初から20種類くらいあったでしょ
最初から20種類くらいあったでしょ
218デフォルトの名無しさん
2016/02/12(金) 00:18:36.22ID:VRdJSDW+ つまり全角を貫いたおおたさん大勝利ってことだな
219デフォルトの名無しさん
2016/02/12(金) 14:58:04.35ID:E8URvzDX 空白もそうだけど横棒も統合せずに放り込んだのが多すぎ
U+2015 HORIZONTAL BARってどこから生えて来たんだろ
U+2015 HORIZONTAL BARってどこから生えて来たんだろ
220デフォルトの名無しさん
2016/02/12(金) 22:43:58.37ID:06flQvvq VERTICALなら生えてきそうだけどHORIZONTALに生えるイメージは無いな
221デフォルトの名無しさん
2016/02/13(土) 10:24:02.68ID:vrowrAaX ————
――――
――――
222デフォルトの名無しさん
2016/02/13(土) 21:46:29.51ID:UfGCg9+I223デフォルトの名無しさん
2016/02/13(土) 21:50:44.90ID:DWYdQVEl バカの考えること=お前の考えること
自分が何考えてるかもわかんないなら救いようがないな。清原と一緒に逮捕されてろ
自分が何考えてるかもわかんないなら救いようがないな。清原と一緒に逮捕されてろ
224デフォルトの名無しさん
2016/02/15(月) 00:32:04.19ID:ntkpNKWd >>212
もうすぐUpdate2で改善されるからそれまで待て
もうすぐUpdate2で改善されるからそれまで待て
225デフォルトの名無しさん
2016/02/15(月) 16:58:33.36ID:4pgZ8RvT226デフォルトの名無しさん
2016/02/16(火) 07:17:36.55ID:XdPvZNKx227デフォルトの名無しさん
2016/02/20(土) 22:49:46.68ID:2GCqu0fo MS-excelのcodeという関数の出力がShift-JISだと勘違いしていた初心者の俺。
あやうく大恥をかく前に気づいてセーフ。
あやうく大恥をかく前に気づいてセーフ。
228デフォルトの名無しさん
2016/02/24(水) 01:54:36.77ID:hnpOvXF7 UNICODEが年々キモくなるんですけど、新しいモジコードは開発されていますか(´・ω・`)?
229デフォルトの名無しさん
2016/02/24(水) 12:06:50.24ID:9rhAu1z5230デフォルトの名無しさん
2016/02/24(水) 17:55:57.73ID:zehZo7UI 完成してMicrosoftとAppleとGoogleとLinuxが採用したら知らせてくれ
231デフォルトの名無しさん
2016/02/24(水) 20:07:26.11ID:Tso1kbi5 バイトオーダーがややこしいから1byteを1bitにするか
逆に1byteを64bitなどの大きい値にしたらどうよ?
コンピューターの黎明期は1byteが8bit以外の物もあったんだから
それも不可能ではないだろう。
逆に1byteを64bitなどの大きい値にしたらどうよ?
コンピューターの黎明期は1byteが8bit以外の物もあったんだから
それも不可能ではないだろう。
232デフォルトの名無しさん
2016/02/24(水) 20:26:02.29ID:JXxoXIUe 馬鹿って馬鹿だよね
233デフォルトの名無しさん
2016/02/25(木) 00:25:47.28ID:loBITXzr >>231
コンピュータの黎明期はbyteと云う単位ではなくて、Wordという単位だったと
思いますよ。1word何byteとかいっていて、コンピュータによって、Wordのbit数が
違っていたように思います。
大体1短Wordが20bit+1符号bit,1長wordが短wordの2倍で40bit+1符号bitというのが
普通だったとおもいますが、CDCの3600は、1短wordが32bit、1長wordが64bitではなかった
かと思います。
なにしろ、1960年代のことなので、記憶違いがあるかもしれません。
コンピュータの黎明期はbyteと云う単位ではなくて、Wordという単位だったと
思いますよ。1word何byteとかいっていて、コンピュータによって、Wordのbit数が
違っていたように思います。
大体1短Wordが20bit+1符号bit,1長wordが短wordの2倍で40bit+1符号bitというのが
普通だったとおもいますが、CDCの3600は、1短wordが32bit、1長wordが64bitではなかった
かと思います。
なにしろ、1960年代のことなので、記憶違いがあるかもしれません。
234デフォルトの名無しさん
2016/02/25(木) 20:46:03.90ID:BzGy0Z9t Unicodeに何が追加されようと大半の日本語フォントはAdobe-Japan1-6準拠だから
ほとんど恩恵がない
AdobeはPanCJKなんて漢字マニアしか喜ばないものを作ってないで
そろそろAJ17に取り掛かってくれ
ほとんど恩恵がない
AdobeはPanCJKなんて漢字マニアしか喜ばないものを作ってないで
そろそろAJ17に取り掛かってくれ
235デフォルトの名無しさん
2016/02/26(金) 12:15:47.32ID:YTHIspbV Wordは今でも使うだろ普通に。
昔あったのはWord機、生き残りがByte機。
昔あったのはWord機、生き残りがByte機。
236デフォルトの名無しさん
2016/02/26(金) 17:03:45.40ID:iAHBb9xH237デフォルトの名無しさん
2016/02/26(金) 19:35:56.60ID:Ckpzri88238デフォルトの名無しさん
2016/02/26(金) 19:54:30.62ID:d58rhTQn キモはアルゴリズムでデータソースでしかないものに文句つけてもイチャモンでしかないだろう
知らんけど
知らんけど
239デフォルトの名無しさん
2016/02/26(金) 21:57:25.44ID:jlaESRTF アルゴリズムもバグってるみたいよ
240デフォルトの名無しさん
2016/02/27(土) 01:15:53.58ID:1kXiMiWp241デフォルトの名無しさん
2016/03/02(水) 11:22:17.92ID:5SSZmY+T カタカナが多すぎて頭こんがらんがってきた
242デフォルトの名無しさん
2016/03/02(水) 13:37:01.48ID:H2CN+/B0 トゥゲザーしようぜ
243デフォルトの名無しさん
2016/03/02(水) 13:52:03.06ID:Pi6Moa3o シェアしたいと思います
244デフォルトの名無しさん
2016/03/04(金) 11:07:29.81ID:aAJqKKxk 1文字に32bit使うなら一般的な組み合わせの合成文字は
全て合成済み文字にしてコードを割り当てても足りるんじゃないだろうか
そうして合成文字は外字のようなオプション的な扱いにしたらいいと思うんだけどね
全て合成済み文字にしてコードを割り当てても足りるんじゃないだろうか
そうして合成文字は外字のようなオプション的な扱いにしたらいいと思うんだけどね
245デフォルトの名無しさん
2016/03/04(金) 11:29:46.53ID:ex0V5X9T 何のいみがあるのかわからんなあ
246デフォルトの名無しさん
2016/03/04(金) 12:41:46.94ID:aAJqKKxk >>245
一般的な文字では32bit固定長にできる
一般的な文字では32bit固定長にできる
247デフォルトの名無しさん
2016/03/04(金) 13:27:03.56ID:qO6Wo8x7 「一般的な組み合わせ」が不変ならいいけど、現実にはいくらでも流動しちゃうのが問題じゃないかな。
これまでにも「今の用途ならこれだけあれば十分」って感覚で半端に作られた負の遺産がたくさんあるよね。
合成文字の仕組み自体を全廃・強制力付きで禁止するのならともかく、
オプションとして残すのなら新たに余計なものを作っただけで終わるのが見えてる。
これまでにも「今の用途ならこれだけあれば十分」って感覚で半端に作られた負の遺産がたくさんあるよね。
合成文字の仕組み自体を全廃・強制力付きで禁止するのならともかく、
オプションとして残すのなら新たに余計なものを作っただけで終わるのが見えてる。
248デフォルトの名無しさん
2016/03/04(金) 18:21:11.26ID:IERVyLvo ISO/IEC 6937対ISO/IEC 8859シリーズの戦いはもう勘弁
249デフォルトの名無しさん
2016/03/15(火) 10:56:22.12ID:ZYJuXZMf >>228
Unicodeで得られた知見を基に反省を活かして新しいのを作ってほしいね。
Unicodeもコンセプトは賛成だし規格に例外は付き物だけど、あまりにも継ぎ接ぎだらけでスパゲティコードみたいになってるのは清算したいね。
Unicodeで得られた知見を基に反省を活かして新しいのを作ってほしいね。
Unicodeもコンセプトは賛成だし規格に例外は付き物だけど、あまりにも継ぎ接ぎだらけでスパゲティコードみたいになってるのは清算したいね。
250デフォルトの名無しさん
2016/04/02(土) 13:20:35.07ID:raCNCQWh Unicodeはバージョンアップ時に精算するのが得意な方
切り捨てバンザイ主義
これ以上切り捨てたら誰も使ってはくれない
切り捨てバンザイ主義
これ以上切り捨てたら誰も使ってはくれない
251デフォルトの名無しさん
2016/04/06(水) 17:49:51.21ID:APP4s98L UTS #52: Unicode Emoji Mechanisms
http://www.unicode.org/reports/tr52/tr52-1.html
> 3.5 Hair Attribute
>
> Syntax
>
> Tag-Base Hair_Base
> Tag-Key Tag-H
> Tag-Value Exactly one of the following tag-valueChars:
> tag-valueChar Description
> Tag-k Black-haired
> Tag-s Blonde (also sandy-haired)
> Tag-b Brown (Brunette)
> Tag-r Redhead (Ginger)
> Tag-g Gray-haired
> Tag-n Bald (no hair)
漫画・アニメキャラ用に赤髪、ピンク髪、緑髪、青髪、水髪、紫髪なんかも加えるべきじゃないですかね。
http://www.unicode.org/reports/tr52/tr52-1.html
> 3.5 Hair Attribute
>
> Syntax
>
> Tag-Base Hair_Base
> Tag-Key Tag-H
> Tag-Value Exactly one of the following tag-valueChars:
> tag-valueChar Description
> Tag-k Black-haired
> Tag-s Blonde (also sandy-haired)
> Tag-b Brown (Brunette)
> Tag-r Redhead (Ginger)
> Tag-g Gray-haired
> Tag-n Bald (no hair)
漫画・アニメキャラ用に赤髪、ピンク髪、緑髪、青髪、水髪、紫髪なんかも加えるべきじゃないですかね。
252デフォルトの名無しさん
2016/04/06(水) 18:29:57.08ID:qW+LkY/S _人人人人人人人_
> Bald (no hair) <
 ̄Y^Y^Y^Y^Y^Y^Y ̄
> Bald (no hair) <
 ̄Y^Y^Y^Y^Y^Y^Y ̄
253デフォルトの名無しさん
2016/04/08(金) 13:36:54.32ID:9VpqQ38l Δ彡⌒ミΔ
ξ ・ェ・ ξ
ξ ξ
ξ ξ また髪の話してる。
ξ ξ
ξ 彡⌒ミ
ξ (´・ω・`)〇
ξ (| |)ξ
ξ (γ / ξ
uu〜〜〜し uu
ξ ・ェ・ ξ
ξ ξ
ξ ξ また髪の話してる。
ξ ξ
ξ 彡⌒ミ
ξ (´・ω・`)〇
ξ (| |)ξ
ξ (γ / ξ
uu〜〜〜し uu
254デフォルトの名無しさん
2016/04/09(土) 00:11:15.96ID:QiRGiLFx 毛の色と量は別のパラメータだよね
255デフォルトの名無しさん
2016/04/09(土) 00:17:51.71ID:EyctzspR 赤毛のつるっぱげと
黒髪のつるっぱげと
ブロンドのつるっぱげの
区別を付ける意味はあるのかなあ。
黒髪のつるっぱげと
ブロンドのつるっぱげの
区別を付ける意味はあるのかなあ。
256デフォルトの名無しさん
2016/04/09(土) 01:58:16.39ID:ncpORidQ 眉毛の色も変わるんじゃね
257デフォルトの名無しさん
2016/04/11(月) 18:05:35.93ID:qAYYUQ+e258デフォルトの名無しさん
2016/04/19(火) 18:55:29.59ID:y8aUhLXK コンソーシアムはアホばっか。
結局駆け引きとかゲーム楽しんでるだけじゃん。
結局駆け引きとかゲーム楽しんでるだけじゃん。
259デフォルトの名無しさん
2016/04/22(金) 16:03:00.18ID:20ytlDG9 ヘアスタイルや髪の色、眼鏡やら帽子やらはUnicodeの範囲の対象外だよとか言ってたのは何だったんだろう
260デフォルトの名無しさん
2016/04/28(木) 04:05:36.64ID:m6Hq/pUS 完全にMark Davisに振り回されてる
261デフォルトの名無しさん
2016/04/30(土) 16:00:17.78ID:Hd4l7uwV 禿は髪の色じゃなくてヘアスタイルだろ
てっぺん禿、後退禿、つるっ禿と種類もある
禿差別が凄い
てっぺん禿、後退禿、つるっ禿と種類もある
禿差別が凄い
262デフォルトの名無しさん
2016/04/30(土) 16:37:37.68ID:n4ETaU8X ちょんまげとか辮髪とかと同列のタグだよね
263デフォルトの名無しさん
2016/05/01(日) 09:46:27.59ID:w66eLaS8 イラストのための仕様拡張なんか合理的な理由が全くないわ
文字から切り離して絵のフォーマットにすればいいじゃん
文字から切り離して絵のフォーマットにすればいいじゃん
264デフォルトの名無しさん
2016/05/01(日) 11:04:17.70ID:tKi6j9CT 匿名通信(Tor、i2p等)ができるファイル共有ソフトBitComet(ビットコメット)みたいな、
BitTorrentがオープンソースで開発されています
言語は何でも大丈夫だそうなので、P2P書きたい!って人居ませんか?
Covenantの作者(Lyrise)がそういう人と話したいそうなので、よろしければツイートお願いします
https://twitter.com/Lyrise_al
ちなみにオイラはCovenantの完成が待ち遠しいプログラミングできないアスペルガーw
The Covenant Project
概要
Covenantは、純粋P2Pのファイル共有ソフトです
目的
インターネットにおける権力による抑圧を排除することが最終的な目標です。 そのためにCovenantでは、中央に依存しない、高効率で検索能力の高いファイル共有の機能をユーザーに提供します
特徴
Covenant = Bittorrent + Abstract Network + DHT + (Search = WoT + PoW)
接続は抽象化されているので、I2P, Tor, TCP, Proxy, その他を利用可能です
DHTにはKademlia + コネクションプールを使用します
UPnPによってポートを解放することができますが、Port0でも利用可能です(接続数は少なくなります)
検索リクエスト、アップロード、ダウンロードなどのすべての通信はDHT的に分散され、特定のサーバーに依存しません
v
BitTorrentがオープンソースで開発されています
言語は何でも大丈夫だそうなので、P2P書きたい!って人居ませんか?
Covenantの作者(Lyrise)がそういう人と話したいそうなので、よろしければツイートお願いします
https://twitter.com/Lyrise_al
ちなみにオイラはCovenantの完成が待ち遠しいプログラミングできないアスペルガーw
The Covenant Project
概要
Covenantは、純粋P2Pのファイル共有ソフトです
目的
インターネットにおける権力による抑圧を排除することが最終的な目標です。 そのためにCovenantでは、中央に依存しない、高効率で検索能力の高いファイル共有の機能をユーザーに提供します
特徴
Covenant = Bittorrent + Abstract Network + DHT + (Search = WoT + PoW)
接続は抽象化されているので、I2P, Tor, TCP, Proxy, その他を利用可能です
DHTにはKademlia + コネクションプールを使用します
UPnPによってポートを解放することができますが、Port0でも利用可能です(接続数は少なくなります)
検索リクエスト、アップロード、ダウンロードなどのすべての通信はDHT的に分散され、特定のサーバーに依存しません
v
265デフォルトの名無しさん
2016/05/18(水) 02:04:12.61ID:rFetSORz彡 ⌒ ミ
(´・ω・`)
U θ U
/ ̄ ̄T ̄ ̄\
|二二二二二二二|
| |
266デフォルトの名無しさん
2016/06/07(火) 17:21:48.18ID:zLlkZGBv267デフォルトの名無しさん
2016/06/08(水) 01:10:51.52ID:mh0+02By NAUSEATED FACEってなんや。
外人は体調悪くなるとみんな顔緑色になるんか。
外人は体調悪くなるとみんな顔緑色になるんか。
268デフォルトの名無しさん
2016/06/08(水) 11:35:15.41ID:XFtKz/Go この調子でどんどん絵文字を追加していくと
ついには新しい表意文字の体系が出来上がるよね
だけどコンピュータで扱う上では表音文字の方が合理的だったってことは
我々は痛いほどよくわかっているから、なんだかなーって気持ちになる
全ての物を一文字で表すのは大変なので
将来的に絵文字の熟語とか編み出されて
絵文字で会話するようになったらいやだなぁ
ついには新しい表意文字の体系が出来上がるよね
だけどコンピュータで扱う上では表音文字の方が合理的だったってことは
我々は痛いほどよくわかっているから、なんだかなーって気持ちになる
全ての物を一文字で表すのは大変なので
将来的に絵文字の熟語とか編み出されて
絵文字で会話するようになったらいやだなぁ
269デフォルトの名無しさん
2016/06/09(木) 11:33:55.71ID:QkRZyBjx270デフォルトの名無しさん
2016/06/20(月) 16:59:01.95ID:KYxI40Xs ttp://d.hatena.ne.jp/NAOI/20080623/1214211959
絵文字の人物の肌の色やら髪の色を区別するならこういうのも区別してほしいわ〜。
バケツ頭かそうでないかは重要、俺的に
絵文字の人物の肌の色やら髪の色を区別するならこういうのも区別してほしいわ〜。
バケツ頭かそうでないかは重要、俺的に
271デフォルトの名無しさん
2016/06/21(火) 12:33:04.97ID:hiJvGdgU unicode例示図形の画力の低さが光る
272デフォルトの名無しさん
2016/06/22(水) 14:24:00.61ID:veMK4+iv The Unicode Blog: Announcing The Unicode® Standard, Version 9.0
http://blog.unicode.org/2016/06/announcing-unicode-standard-version-90.html
Unicode 9.0.0
http://www.unicode.org/versions/Unicode9.0.0/
http://blog.unicode.org/2016/06/announcing-unicode-standard-version-90.html
Unicode 9.0.0
http://www.unicode.org/versions/Unicode9.0.0/
273デフォルトの名無しさん
2016/06/22(水) 16:17:18.06ID:VKcfRnsb なんか最近どんどん数字上がってね?Chromeみたい。
どんどんメジャーバージョン上げていく理由って何?
どんどんメジャーバージョン上げていく理由って何?
274デフォルトの名無しさん
2016/06/24(金) 07:30:00.72ID:DNjTkSpS275デフォルトの名無しさん
2016/06/24(金) 21:07:43.94ID:BJd4+ABn 本当、Unicode 1.X でやめとけば世の中平和だったのに。
276デフォルトの名無しさん
2016/06/26(日) 01:00:56.43ID:jrvEZcpa まあ、サロゲートペアは無くても結合文字があるんですけどね……。
277デフォルトの名無しさん
2016/07/04(月) 14:48:24.44ID:D0uzD5G8 ISO/IEC 10646:2014/Amd.2:2016がいつの間にか無料公開始まってたのな。
U+301C WAVE DASHの字形がISO/IEC 10646側でもやっと修正されたのか。
U+301C WAVE DASHの字形がISO/IEC 10646側でもやっと修正されたのか。
278デフォルトの名無しさん
2016/07/06(水) 10:23:17.77ID:lhUlUm2p 安岡センセイ荒れてるな
http://srad.jp/~yasuoka/journal/604190/
>UTF-8は、ASCIIコードに当たる部分は1バイトで表し、
>それ以外の文字を2〜6バイトの可変長で表します。
>しかし、UTF-8ではUCS-2の範囲の文字しか扱えません。
荒れるの当然か
http://srad.jp/~yasuoka/journal/604190/
>UTF-8は、ASCIIコードに当たる部分は1バイトで表し、
>それ以外の文字を2〜6バイトの可変長で表します。
>しかし、UTF-8ではUCS-2の範囲の文字しか扱えません。
荒れるの当然か
279デフォルトの名無しさん
2016/07/06(水) 11:21:22.67ID:X105+0ra これはひどい
280デフォルトの名無しさん
2016/07/06(水) 19:46:06.13ID:j7TfNCeT まじか。utf16採用してるwindows大勝利だな
(何度も言うがなんでutf8にしなかったんだよ。unixのツール使えなくてムカつくわ)
(何度も言うがなんでutf8にしなかったんだよ。unixのツール使えなくてムカつくわ)
281デフォルトの名無しさん
2016/07/06(水) 20:19:51.63ID:gBn7auOK >>280
表面はSJISだからだろ。
表面はSJISだからだろ。
282デフォルトの名無しさん
2016/07/06(水) 22:02:39.94ID:wyF/Ksyo 漢字を正確に言葉で伝えるにはコードで表現するのが最も手軽で確実だと思うのだが、
あいにく当方の職場では誰もそうしようとしない。
和文通話表もアルファベットのフォネティックコードも使わない。
何しろ管理職にそういう発想が全くないのだからどうしようもない。
今のジジババはもう駄目だ。これからの若い世代に期待したい。
コード関係者、教育関係者の皆様、文字コードの概念を広く普及させてくださいませ。
あいにく当方の職場では誰もそうしようとしない。
和文通話表もアルファベットのフォネティックコードも使わない。
何しろ管理職にそういう発想が全くないのだからどうしようもない。
今のジジババはもう駄目だ。これからの若い世代に期待したい。
コード関係者、教育関係者の皆様、文字コードの概念を広く普及させてくださいませ。
283デフォルトの名無しさん
2016/07/06(水) 22:43:23.48ID:7tNa29hq >>278
合ってるで
合ってるで
284デフォルトの名無しさん
2016/07/06(水) 23:02:26.86ID:73ByLRkJ 文字コードの話題で、他の規格に不寛容・攻撃的な人が多いのはなんでなんだろうねぇ?
mohtaの呪い?
mohtaの呪い?
285デフォルトの名無しさん
2016/07/07(木) 02:40:42.16ID:p2jZ7JSr たまにはEBSDICの事も思い出してあげてください
286デフォルトの名無しさん
2016/07/07(木) 04:21:45.52ID:iN/cSWGV ヱビス?
287デフォルトの名無しさん
2016/07/07(木) 07:50:53.33ID:zLr8XHI6 >285
エビスでなく、
EBCDIC
エビスでなく、
EBCDIC
288デフォルトの名無しさん
2016/07/07(木) 08:09:28.67ID:Xq4hCxWT 攻撃的はそうだけど、不寛容な人はあまり見かけないな。
それから、出所不明の誤ったことを自信満々に広めようとする人は多い。
それから、出所不明の誤ったことを自信満々に広めようとする人は多い。
289デフォルトの名無しさん
2016/07/07(木) 11:28:32.01ID:77RIzO9k >>284
半角カナ気違いのトラウマだろうね
半角カナ気違いのトラウマだろうね
290デフォルトの名無しさん
2016/07/07(木) 23:08:15.02ID:Fnd7xREL 昔、カナ漢字変換の機能が貧弱だった頃、第2水準漢字のほとんどは
コード直接入力じゃないと出せなかったらしい。
その時代を知っているジジババはむしろ若者よりもコードの知識があるかも。
コード直接入力じゃないと出せなかったらしい。
その時代を知っているジジババはむしろ若者よりもコードの知識があるかも。
291デフォルトの名無しさん
2016/07/08(金) 00:08:00.05ID:oeqNGrjL >>290
その時代にワープロを使っている人間が少なすぎる。
その時代にワープロを使っている人間が少なすぎる。
292デフォルトの名無しさん
2016/07/08(金) 09:37:59.75ID:RQ/bQ+xA いまでも第2水準の読めないような漢字が出ないのは一緒では。特にスマホとかでは
293デフォルトの名無しさん
2016/07/08(金) 12:53:57.37ID:+iCwFkYB Windowsはいい加減にCP932やめればいいのに
294デフォルトの名無しさん
2016/07/08(金) 13:56:23.18ID:SPYn5bNr295デフォルトの名無しさん
2016/07/08(金) 14:04:01.86ID:FG8sQouZ >>278
歴史的説明ならともかく今時6バイトって
歴史的説明ならともかく今時6バイトって
296デフォルトの名無しさん
2016/07/08(金) 23:17:05.68ID:5kBVrybZ 小学生向け漢字辞典にも文字コードが載っているのが唯一ある。三省堂のやつ。
しかしこれがJIS句点コードだけなのだ。こんな所にもJIS信者の陰謀が。
しかしこれがJIS句点コードだけなのだ。こんな所にもJIS信者の陰謀が。
297デフォルトの名無しさん
2016/07/09(土) 05:34:05.37ID:/Jgzrjn9 ふむ
298デフォルトの名無しさん
2016/07/09(土) 16:20:52.60ID:ZRZgi1xJ 三省堂は安岡センセイの牙城だからな
http://dictionary.sanseido-publ.co.jp/wp/author/yasuoka/
http://dictionary.sanseido-publ.co.jp/wp/author/yasuoka/
299デフォルトの名無しさん
2016/07/09(土) 16:24:06.20ID:chKLWi+d やっぱり三省堂がナンバーワン!
300デフォルトの名無しさん
2016/07/09(土) 18:40:43.19ID:J471aLuE301デフォルトの名無しさん
2016/07/09(土) 20:53:51.60ID:9etHa3qY >>300
何をする事がある
何をする事がある
302デフォルトの名無しさん
2016/07/09(土) 23:31:07.38ID:XNO4Gui5 >>300 スマンカッタ
句点と読点のそれぞれのJIS区点コードは……ってそういう話じゃないよね。
今時のオフィスでは漢字をコードで言い表さなくても、メール送って、
この字をコピペしろ、で話が済む。たいていの場合。
だがメールが使えないオフィスが存在するのだ。
ウィルス感染が怖い、個人情報の漏洩が怖い、と言ってごく一部以外のPCは
インターネットに繋がっていない。LANにすら繋がっていない。
穴だらけのXPを全くアップデートせずに使い続けている。
文字コードの知識云々以前にこっちの方が問題かも。
句点と読点のそれぞれのJIS区点コードは……ってそういう話じゃないよね。
今時のオフィスでは漢字をコードで言い表さなくても、メール送って、
この字をコピペしろ、で話が済む。たいていの場合。
だがメールが使えないオフィスが存在するのだ。
ウィルス感染が怖い、個人情報の漏洩が怖い、と言ってごく一部以外のPCは
インターネットに繋がっていない。LANにすら繋がっていない。
穴だらけのXPを全くアップデートせずに使い続けている。
文字コードの知識云々以前にこっちの方が問題かも。
303デフォルトの名無しさん
2016/07/10(日) 00:58:49.17ID:MJNrlAwo 十進法で1オリジンだから
十六進法で0オリジンが一般的なプログラミングの世界に持ってく時ちょっと戸惑う>区点コード
十六進法で0オリジンが一般的なプログラミングの世界に持ってく時ちょっと戸惑う>区点コード
304デフォルトの名無しさん
2016/07/10(日) 01:18:18.40ID:D0PozWsA 最初から JIS X 0208 で考えていれば違和感は無い。
305デフォルトの名無しさん
2016/07/10(日) 02:25:10.70ID:MUn32aUj 𩿎 この字をコピペしろ
で話が済まないこともあるから2面94区5点と書いてある方が親切なこともある
で話が済まないこともあるから2面94区5点と書いてある方が親切なこともある
2016/07/10(日) 19:18:33.41ID:Xe3UNHu3
パートのおばちゃんが「この字が出せない」と言っていたので、コードを調べて直接入力の方法を教えた。
そしたら、「そんな難しい方法じゃないと出ない字は出しません」と拒否。
管理職もそれでいいと思っている。
そしたら、「そんな難しい方法じゃないと出ない字は出しません」と拒否。
管理職もそれでいいと思っている。
2016/07/10(日) 19:28:45.85ID:Xe3UNHu3
ヒロユキのヒロは康煕字典の煕、ユキは王羲之の之、これで話が通じれは
コードの知識がなくても何とかなる。けどそういう言い方は全く通じない職場がある。
で、バカみたいにA4の紙にでかい字で「煕之」と書いてFAXで送っている。
時間と紙と通信料金の無駄。
コードの知識がなくても何とかなる。けどそういう言い方は全く通じない職場がある。
で、バカみたいにA4の紙にでかい字で「煕之」と書いてFAXで送っている。
時間と紙と通信料金の無駄。
308デフォルトの名無しさん
2016/07/10(日) 20:25:26.13ID:Vv5iaDQO >ヒロユキのヒロは康煕字典の煕、ユキは王羲之の之、これで話が通じれは
それで通じる職場ってすごくピンポイントなんじゃないか
それで通じる職場ってすごくピンポイントなんじゃないか
309デフォルトの名無しさん
2016/07/10(日) 23:34:57.25ID:Xe3UNHu3 >>308
字の間違いが決して許されない職場では自然にそうなりそうな気もするんだが。
だいたい職場に大漢和辞典も康煕字典も無いとはもう駄目だ。
鼎という字を「何か県に似ている難しい字」などと言っている。u+9F0Eとは決して言わない。
高校時代に漢文が苦手だった俺だって「鼎の軽重を問う」という故事ぐらい知っている。
高卒以下か。
字の間違いが決して許されない職場では自然にそうなりそうな気もするんだが。
だいたい職場に大漢和辞典も康煕字典も無いとはもう駄目だ。
鼎という字を「何か県に似ている難しい字」などと言っている。u+9F0Eとは決して言わない。
高校時代に漢文が苦手だった俺だって「鼎の軽重を問う」という故事ぐらい知っている。
高卒以下か。
310デフォルトの名無しさん
2016/07/11(月) 00:15:55.13ID:Oq6wujXh >>290
漢ROMには第一水準しか乗ってなかった
漢ROMには第一水準しか乗ってなかった
311デフォルトの名無しさん
2016/07/11(月) 00:42:20.21ID:TRcfwTqd u+9F0Eとは決して言わない。いや言わんだろw
312デフォルトの名無しさん
2016/07/11(月) 02:04:05.71ID:Y4y2Cs39 PC-9801初代とかE、F、Mの頃だな
313デフォルトの名無しさん
2016/07/11(月) 02:09:47.93ID:Y4y2Cs39 いや初代はJIS第1水準ROMも別売オプションだったか
314デフォルトの名無しさん
2016/07/11(月) 04:11:38.97ID:1UixPK66 そういう環境は区点でも出ないから今は話題にしてない
315デフォルトの名無しさん
2016/07/11(月) 04:53:41.27ID:heaUdTdc 鼎立(ていりつ)
316デフォルトの名無しさん
2016/07/11(月) 14:01:39.24ID:d9uyyk2v317デフォルトの名無しさん
2016/07/11(月) 14:48:05.83ID:czE7oCdB > しかし、UTF-8ではUCS-2の範囲の文字しか扱えません。そこで、UCS-2の範囲は2バイト、UCS-4の範囲は4バイト(31ビット)でエンコードする
> サロゲート・ペアと呼ばれる方法が考え出されました。このエンコード法をUTF-16(16-bit UCS Transformation Format)と呼びます。
まるでUTF-8を拡張したらUTF-16が生まれたみたいな書きっぷりなんだが。。。
> サロゲート・ペアと呼ばれる方法が考え出されました。このエンコード法をUTF-16(16-bit UCS Transformation Format)と呼びます。
まるでUTF-8を拡張したらUTF-16が生まれたみたいな書きっぷりなんだが。。。
318デフォルトの名無しさん
2016/07/11(月) 19:26:42.34ID:zdvynnCD dmcがL"\uXXXX"で5桁以上に対応してなかったでござるよ
319デフォルトの名無しさん
2016/07/11(月) 23:35:12.52ID:O+Gjjko5 あーあサイト閉鎖
http://www.asahi-net.or.jp/~ax2s-kmtn/
http://www.asahi-net.or.jp/~ax2s-kmtn/
320デフォルトの名無しさん
2016/07/12(火) 12:50:10.21ID:Z7lOs0LB サイト閉鎖させるとか文字コード関係者は傲慢
321デフォルトの名無しさん
2016/07/12(火) 14:22:38.54ID:jKILz9qy そもそも不正確だろうが整合性なかろうが
その旨明記しておけば問題ないのに
断定しちゃうからダメなんだよなぁ
自分用のメモとしても訳に立たんだろうに
その旨明記しておけば問題ないのに
断定しちゃうからダメなんだよなぁ
自分用のメモとしても訳に立たんだろうに
322デフォルトの名無しさん
2016/07/12(火) 16:29:11.31ID:/KovKhYj >>319
知らないなら解説しないでくださいうざいだけです
知らないなら解説しないでくださいうざいだけです
323デフォルトの名無しさん
2016/07/12(火) 16:34:35.95ID:/KovKhYj324デフォルトの名無しさん
2016/07/12(火) 22:47:59.76ID:iIVSUpVx325デフォルトの名無しさん
2016/07/13(水) 00:43:08.39ID:SuD222os https://web.archive.org/web/20160331090356/http://www.asahi-net.or.jp/~ax2s-kmtn/character/uni.html
まあ同一人物でなければ盗用だろうなってかんじ
まあ同一人物でなければ盗用だろうなってかんじ
326デフォルトの名無しさん
2016/07/13(水) 01:00:57.82ID:elchF/Ne 普通に考えたら同一人物だろ
上綱 秀治(かみつな しゅうじ) ⇒ s-kmtn
上綱 秀治(かみつな しゅうじ) ⇒ s-kmtn
327デフォルトの名無しさん
2016/07/13(水) 02:15:04.74ID:fhWupBlz くみたんじゃないのか。
328デフォルトの名無しさん
2016/07/13(水) 04:46:49.29ID:QAw5IbxT >>325
同一人物だね
http://web.archive.org/web/20160501170424/http://www.asahi-net.or.jp/~ax2s-kmtn/profile.html
同一人物だね
http://web.archive.org/web/20160501170424/http://www.asahi-net.or.jp/~ax2s-kmtn/profile.html
329デフォルトの名無しさん
2016/07/13(水) 09:20:59.26ID:6cXc/1BZ >>325
>UTF-8は、ASCIIコードに当たる部分はASCIIコードと同じコードで
>1バイトで表し、それ以外の文字を2〜6バイトの可変長で表します。
>しかし、UTF-8ではUCS-2の範囲の文字しか扱えません。
>そこで、UCS-2の範囲は2バイト、UCS-4の範囲は4バイトでエンコードする
>サロゲート・ペア(Surrogate Pair)と呼ばれる方法が考え出されました。
自分で書いた嘘を自分で信じ込んでしまったのか
>UTF-8は、ASCIIコードに当たる部分はASCIIコードと同じコードで
>1バイトで表し、それ以外の文字を2〜6バイトの可変長で表します。
>しかし、UTF-8ではUCS-2の範囲の文字しか扱えません。
>そこで、UCS-2の範囲は2バイト、UCS-4の範囲は4バイトでエンコードする
>サロゲート・ペア(Surrogate Pair)と呼ばれる方法が考え出されました。
自分で書いた嘘を自分で信じ込んでしまったのか
330デフォルトの名無しさん
2016/07/13(水) 13:48:05.15ID:5kGFdS9R >>325
あー、これは(アカン)
あー、これは(アカン)
331デフォルトの名無しさん
2016/07/13(水) 17:23:44.93ID:Zm0ukFfg332デフォルトの名無しさん
2016/07/13(水) 17:25:59.10ID:Zm0ukFfg >>325
おわってんな
おわってんな
333デフォルトの名無しさん
2016/07/13(水) 21:14:40.56ID:hX7/yWDM くみたん大人気
334デフォルトの名無しさん
2016/07/13(水) 23:46:02.63ID:g/v1wH4T335デフォルトの名無しさん
2016/07/13(水) 23:58:49.98ID:r/tNmXJO 天皇陛下が生前退位を望んでおられるらしいが
年号が変わったらまた組み文字のがUnicodeに登録されるんだろうか。
そしてNEC特殊文字の空き区点位置にも追加されたりするんだろうか?
年号が変わったらまた組み文字のがUnicodeに登録されるんだろうか。
そしてNEC特殊文字の空き区点位置にも追加されたりするんだろうか?
336デフォルトの名無しさん
2016/07/14(木) 14:43:57.97ID:QNDyLPqn >>334
文系のばかに多いよなそういうの
文系のばかに多いよなそういうの
337デフォルトの名無しさん
2016/07/14(木) 15:27:07.43ID:9OuGPMv3 ~順紫
338デフォルトの名無しさん
2016/07/14(木) 17:50:45.39ID:/KqsG61x339デフォルトの名無しさん
2016/07/14(木) 18:58:13.31ID:FxiZTBVJ Unicodeの組み文字はやたら多いんだよなあ
これ以上増やさないでいいと思うが
ARIBあたりは収録しそうだ
これ以上増やさないでいいと思うが
ARIBあたりは収録しそうだ
340デフォルトの名無しさん
2016/07/14(木) 19:04:28.88ID:QNDyLPqn そもそもどんな元号になるか機械学習で予想汁
341デフォルトの名無しさん
2016/07/15(金) 17:59:32.47ID:UYk8auDK 元号変わったら組み文字がJISやUnicodeに追加されるだろうか。
あれらはあくまで使用非推奨の互換用だけど平成迄あるのに
〇〇(新元号)は無いのはおかしいって文句言う人いそうだし。
そしてUnicodeに追加されるならBMP外になるのかな。
あれらはあくまで使用非推奨の互換用だけど平成迄あるのに
〇〇(新元号)は無いのはおかしいって文句言う人いそうだし。
そしてUnicodeに追加されるならBMP外になるのかな。
342デフォルトの名無しさん
2016/07/15(金) 18:35:42.95ID:VjVb35Nf JISは確実じゃろう
343デフォルトの名無しさん
2016/07/15(金) 19:47:06.41ID:hA/ek+uV 天皇陛下はさまざまな影響を考えて、数年後とおっしゃっている。
344デフォルトの名無しさん
2016/07/15(金) 21:22:13.08ID:6VjYEGCM 天皇陛下はさまざまな影響を考えて、(Unicodeへの追加は)数年後とおっしゃっている。
かと思った
かと思った
345デフォルトの名無しさん
2016/07/15(金) 23:56:20.80ID:sNlxveIP 明治〜平成がBMPなのに新元号がSMPなのは納得いかないって人出てくるだろう。
でもU+33xxのBMPのCJK互換文字領域は空いてない。
U+32xxの囲み文字等の領域だったら
U+32FFが空いてるけどそこは○ンの為にとっておくべきって理由で却下かも。
(ARIB外字の□デは当初そこで提案されてたがSMPに移された。)
U+321Fも空いてるけどそこはハングルの為に予約でダメかな。
2文字合わせて1字の漢字扱いでCJK統合漢字無印の末端部分に追加とかするかも。
でもU+33xxのBMPのCJK互換文字領域は空いてない。
U+32xxの囲み文字等の領域だったら
U+32FFが空いてるけどそこは○ンの為にとっておくべきって理由で却下かも。
(ARIB外字の□デは当初そこで提案されてたがSMPに移された。)
U+321Fも空いてるけどそこはハングルの為に予約でダメかな。
2文字合わせて1字の漢字扱いでCJK統合漢字無印の末端部分に追加とかするかも。
346デフォルトの名無しさん
2016/07/16(土) 00:01:26.24ID:5z5Xjrfb >>344
陛下はIT業界のことまで考えてくださっているんだぞ。
陛下はIT業界のことまで考えてくださっているんだぞ。
347デフォルトの名無しさん
2016/07/16(土) 00:14:15.53ID:32MvK4yp348デフォルトの名無しさん
2016/07/16(土) 00:24:24.28ID:gxGUgS9b 明治を廃止して新元号をそこに追加
349デフォルトの名無しさん
2016/07/16(土) 01:19:59.61ID:cSN7L73p ケチ臭いこと言わず大化から全部実現できるよう結合文字でやれ
350デフォルトの名無しさん
2016/07/16(土) 02:08:19.62ID:nOt6AvP3 >>348
それはない
それはない
351デフォルトの名無しさん
2016/07/16(土) 02:30:42.97ID:lwkaPYM/ 書類上は明治生まれもまだいっぱい生き残って年金もらってるんだろう?
352デフォルトの名無しさん
2016/07/16(土) 06:16:44.45ID:G3ZPSnBi 明治生まれって105歳くらいでそろそろ長寿ギネスを争う位置やで
ゴーストは知らんけど例の事件以降対策は取ってるはず
ゴーストは知らんけど例の事件以降対策は取ってるはず
353デフォルトの名無しさん
2016/07/16(土) 14:40:44.25ID:9Y22Kipm354デフォルトの名無しさん
2016/07/16(土) 14:43:32.66ID:9Y22Kipm >>349
それな+1
それな+1
355デフォルトの名無しさん
2016/07/16(土) 17:16:57.05ID:q/+YlM5I >>353
譲位もいまの日本の法律では規定されていない言葉。
譲位もいまの日本の法律では規定されていない言葉。
356デフォルトの名無しさん
2016/07/16(土) 20:48:48.31ID:lwkaPYM/ 譲位だと本人の意思が入るから、憲法との関係上無理だろうな。
357デフォルトの名無しさん
2016/07/16(土) 22:09:26.27ID:ngMcbYeI 間を取って、新元号を「譲位」にするのだ。
358デフォルトの名無しさん
2016/07/16(土) 23:20:32.22ID:DxYW1o4r Macの機種依存文字でUnicodeにない組み文字とかは
PUAのうち何個かのコードポイントを後続の複数文字を組み文字とみなすとかの制御文字にして
変換時はそれらを使ったシーケンスにしてるけど
それらを正式なUnicodeポイントに追加すればいいんじゃないかな。
BMPの末端部の特殊用途文字の領域空いてるよな。多くなったら14面使えばいいし。
PUAのうち何個かのコードポイントを後続の複数文字を組み文字とみなすとかの制御文字にして
変換時はそれらを使ったシーケンスにしてるけど
それらを正式なUnicodeポイントに追加すればいいんじゃないかな。
BMPの末端部の特殊用途文字の領域空いてるよな。多くなったら14面使えばいいし。
359デフォルトの名無しさん
2016/07/17(日) 07:52:07.09ID:x5VmunYw ゼロレングス結合何とかでいいだろ
年号
年号
360デフォルトの名無しさん
2016/07/17(日) 11:40:00.96ID:4VxhtWVI [組文字2字] ○ × みたいな組み合わせで組文字を出せれば、どんな元号だろうと対処できるんじゃね?
361デフォルトの名無しさん
2016/07/17(日) 12:03:06.58ID:OJhNugRE 立ちふさがる神護景雲
362デフォルトの名無しさん
2016/07/17(日) 19:57:53.09ID:SZ0VR+WQ 絵文字だと4人くっつけて家族にしてるから余裕だろ
363デフォルトの名無しさん
2016/07/18(月) 13:08:10.78ID:DeXLreOM 天平hogehogeも忘れないであげて
364デフォルトの名無しさん
2016/07/18(月) 14:35:50.20ID:xsPahNIS Unicode Consortium、人物を示す絵文字の大半で男女の切り替えを可能にする計画
http://it.srad.jp/story/16/07/17/1824252/
http://it.srad.jp/story/16/07/17/1824252/
365デフォルトの名無しさん
2016/07/18(月) 18:20:37.53ID:Al5nS1HD いらん
366デフォルトの名無しさん
2016/07/18(月) 20:01:39.34ID:V8MPLMCF 男のプリンセス👸みたいな
367デフォルトの名無しさん
2016/07/18(月) 20:49:35.27ID:nMdxdQ2m 結局タグ文字は止めてZWJでくっつけることにしたのか
まあ俺は要らんけど、Googleはやるんだろうな。
まあ俺は要らんけど、Googleはやるんだろうな。
368デフォルトの名無しさん
2016/07/19(火) 01:10:44.77ID:OzJr/LCv うんこと炎をくっつけて焼きカレー
369デフォルトの名無しさん
2016/07/20(水) 00:14:41.29ID:c9Lgaa22 俺なんでこんなの書いたんだろ
370デフォルトの名無しさん
2016/07/20(水) 16:25:57.26ID:uqKREUqt 元号の組み文字も平成の次からは
(1文字目) ZWJ (2文字目)
でいいだろう。元号に限らず他の組み文字もこのようなやり方で。
(1文字目) ZWJ (2文字目)
でいいだろう。元号に限らず他の組み文字もこのようなやり方で。
371デフォルトの名無しさん
2016/07/21(木) 22:48:02.74ID:9yJr9MXg L2/16-188 Revised Proposal of Hentaigana (with associated spreadsheet) Japan N.B. 2016-07-15
http://www.unicode.org/L2/L2016/16188-rev-hentaigana-rep.pdf
L2/16-189 Proposal to add a new character name alias to U+1B001 Japan N.B. 2016-07-15
http://www.unicode.org/L2/L2016/16189-n4731-alias-to-1B001.pdf
久しぶりに日本の提案書が来てた。
http://www.unicode.org/L2/L2016/16188-rev-hentaigana-rep.pdf
L2/16-189 Proposal to add a new character name alias to U+1B001 Japan N.B. 2016-07-15
http://www.unicode.org/L2/L2016/16189-n4731-alias-to-1B001.pdf
久しぶりに日本の提案書が来てた。
372デフォルトの名無しさん
2016/07/22(金) 00:45:15.53ID:9PI3Dwz3 HENTAIYAGANA!
同じ音価のやつどう名前つけるのかと思ってたら単純に番号振ったんか。
しっかしほぼ同じじゃないかってやつがいくつもあるな…
同じ音価のやつどう名前つけるのかと思ってたら単純に番号振ったんか。
しっかしほぼ同じじゃないかってやつがいくつもあるな…
373デフォルトの名無しさん
2016/07/22(金) 15:36:11.58ID:mXdhJl5k >http://www.unicode.org/L2/L2016/16189-n4731-alias-to-1B001.pdf
>※ HENTAIGANA LETTER E-1
当然のように「※」を使っちゃうあたり紛れもなくわが国のNBだな
>※ HENTAIGANA LETTER E-1
当然のように「※」を使っちゃうあたり紛れもなくわが国のNBだな
374デフォルトの名無しさん
2016/07/22(金) 18:46:03.53ID:30Ur4lVX 海外でHENTAIって言ったらエロ漫画のことなんだろ?
375デフォルトの名無しさん
2016/07/22(金) 23:40:37.75ID:ftmyXYU2 変態がな(´・ω・`)
376デフォルトの名無しさん
2016/07/23(土) 19:23:17.75ID:23ptH+Cg HENTAIGANAじゃなくてARCHAIC KANAにした方がいいかな。
377デフォルトの名無しさん
2016/07/23(土) 22:48:56.85ID:9DZF6Yvk 376ができるならそうしてほしい
378237
2016/07/24(日) 13:36:56.67ID:6r1nbUWl Wikipediaにも別称として載ってるitaiganaならまだしも、一般的でない訳語を増やすのはやめてくれ
379デフォルトの名無しさん
2016/07/24(日) 13:38:46.61ID:wdZTIji9 しらんがなも追加で
380デフォルトの名無しさん
2016/07/24(日) 14:21:52.39ID:KetOMPlM 痛い(>_<)がな
381デフォルトの名無しさん
2016/07/24(日) 18:14:24.67ID:jDvbVIvk しらんがな-1
しらんがな-2
しらんがな-3
どうでもいいレベルに応じて数字が上がっていくしらんがな
しらんがな-2
しらんがな-3
どうでもいいレベルに応じて数字が上がっていくしらんがな
382デフォルトの名無しさん
2016/07/25(月) 03:34:48.68ID:+HnBvISv しらんがな(´・ω・`)
383デフォルトの名無しさん
2016/07/27(水) 23:58:18.41ID:LlxcxPCX 漢字なんかもUnicodeではCJK Ideograph(日中韓の表意文字)という独特な表現なんだよな。
通常はChinese character(中国の文字)とか日本で使われるもの限定ならKanjiとかだけど、
中国語だけでなく日本語でも必要不可欠なことから中立的な観点でそうしたのかな。
通常はChinese character(中国の文字)とか日本で使われるもの限定ならKanjiとかだけど、
中国語だけでなく日本語でも必要不可欠なことから中立的な観点でそうしたのかな。
384デフォルトの名無しさん
2016/07/28(木) 00:49:49.72ID:5nmTx3N/ >>383
それUTF-16だろ。
それUTF-16だろ。
385デフォルトの名無しさん
2016/07/28(木) 01:46:29.52ID:0eJShhc0 ぇ?
386デフォルトの名無しさん
2016/07/28(木) 03:14:54.78ID:V4Cbn7HZ え?
387デフォルトの名無しさん
2016/07/28(木) 06:15:57.66ID:A01hQQOB ゑ?
388デフォルトの名無しさん
2016/07/28(木) 07:33:28.43ID:Gt2rQ6iY >>383
「漢字って言語圏ごとに登録したらとんでもない量になる。出自は同じだし統合すっか」
っていう混ぜ書き全否定な仕様にしたからな
統合したんだからKanjiっていう日本語読みじゃなくて「極東の表意文字」みたいな名前つけられるのは当然の成り行き
「漢字って言語圏ごとに登録したらとんでもない量になる。出自は同じだし統合すっか」
っていう混ぜ書き全否定な仕様にしたからな
統合したんだからKanjiっていう日本語読みじゃなくて「極東の表意文字」みたいな名前つけられるのは当然の成り行き
389デフォルトの名無しさん
2016/07/28(木) 08:14:34.00ID:tnN3Zull UCDのファイル名はUnihan(Unified-HAN)だろ
つまり韓国が起源
つまり韓国が起源
390デフォルトの名無しさん
2016/07/28(木) 09:47:39.76ID:V0F605Q9 繁字体の繁
391デフォルトの名無しさん
2016/07/28(木) 10:28:08.04ID:49cPLP5e そうはいっても迷惑かけている部分もあるからな
英語だったら高々数十個のアルファベットと幾つかの記号だけで済むところを
何万種類も必要になる方が悪いだろ、どう考えても
英語だったら高々数十個のアルファベットと幾つかの記号だけで済むところを
何万種類も必要になる方が悪いだろ、どう考えても
392デフォルトの名無しさん
2016/07/28(木) 10:52:38.11ID:765MMEfE >どう考えても
何をどう考えたらそんなキチガイの発想に至ったのか
何をどう考えたらそんなキチガイの発想に至ったのか
393デフォルトの名無しさん
2016/07/28(木) 13:16:07.78ID:V4Cbn7HZ 英国はアヘン戦争で清を滅亡させるべきだったし、
米国は太平洋戦争で日本を滅亡させるべきだったね。
米国は太平洋戦争で日本を滅亡させるべきだったね。
394デフォルトの名無しさん
2016/07/28(木) 13:20:15.08ID:xeepOtn0 幽霊文字が規格化される国だから反論できない
395デフォルトの名無しさん
2016/07/28(木) 14:16:22.55ID:ZhRv9dtO 勝手に新しい絵文字作り出してる現状なんだし気にするな
と思ったけど文字が少ない文化圏の連中はその反動なのかもしれないな
と思ったけど文字が少ない文化圏の連中はその反動なのかもしれないな
396デフォルトの名無しさん
2016/07/28(木) 19:12:45.37ID:O8Vfrh0P 将来再び毛沢東みたいなアホが出てきて新文字増やす可能性もないとはいえない
397デフォルトの名無しさん
2016/07/28(木) 23:10:34.74ID:+NfDBjt/398デフォルトの名無しさん
2016/07/28(木) 23:49:12.01ID:m+0rYuPE そういえばニホニウムの中国語表記はどうなるんだろう
399デフォルトの名無しさん
2016/07/29(金) 01:02:54.07ID:SETcyGJa 小日本素あたり?
400デフォルトの名無しさん
2016/07/29(金) 07:36:19.19ID:Lct7OLsq え?
401デフォルトの名無しさん
2016/07/29(金) 08:13:31.17ID:GYJuIIBJ402デフォルトの名無しさん
2016/07/29(金) 12:00:07.20ID:5X3dVFw4 原規格分離規則が無かったら更にカオスなことになってそう
403デフォルトの名無しさん
2016/07/29(金) 23:13:14.93ID:qPs+aDEn >>401
それは逆。
漢字文化を理解しない西洋人が規格化したからそうなってしまった。
康煕字典の「正字」がどのような経緯で成立したかほんの少し勉強すれば、それらが同字だと理解できる。
ついでに日本のバカな国語審議会がどんなふうにバカな国語国字改革を行ったかも知っておくべき。
それは逆。
漢字文化を理解しない西洋人が規格化したからそうなってしまった。
康煕字典の「正字」がどのような経緯で成立したかほんの少し勉強すれば、それらが同字だと理解できる。
ついでに日本のバカな国語審議会がどんなふうにバカな国語国字改革を行ったかも知っておくべき。
404デフォルトの名無しさん
2016/07/30(土) 00:36:36.04ID:GBcwIM/b 説と說の違いなどフォントの違いに過ぎない。
これを別字だと主張するのはGaramondのAとBodoniのAは別字だと主張する様なものだ。
これを別字だと主張するのはGaramondのAとBodoniのAは別字だと主張する様なものだ。
405デフォルトの名無しさん
2016/07/30(土) 01:00:50.77ID:nwxv/kKT IPAを食らうがよい
406デフォルトの名無しさん
2016/07/30(土) 02:27:38.51ID:VkFDbK5O フォントの違い?じゃあ別字で😁
A A 𐌀 𝐀 𝐴 𝑨 𝒜 𝓐 𝔄 𝔸 𝕬 𝖠 𝗔 𝘈 𝘼 𝙰
A A 𐌀 𝐀 𝐴 𝑨 𝒜 𝓐 𝔄 𝔸 𝕬 𝖠 𝗔 𝘈 𝘼 𝙰
407デフォルトの名無しさん
2016/07/30(土) 03:37:32.39ID:crIAC8Sk BOMを食らうが良い。
408デフォルトの名無しさん
2016/07/30(土) 05:58:51.63ID:7lrNNE5f409デフォルトの名無しさん
2016/07/30(土) 06:32:16.51ID:RG1Ilx1/ × 現規格
○ 原規格
○ 原規格
410デフォルトの名無しさん
2016/07/30(土) 13:16:26.02ID:NnN7Vre0 >>404
華と华は同じ字ですか?
華と华は同じ字ですか?
411デフォルトの名無しさん
2016/07/30(土) 13:17:35.16ID:NnN7Vre0 >>406
Уとyは同じ字ですか?
Уとyは同じ字ですか?
412デフォルトの名無しさん
2016/07/30(土) 21:48:28.00ID:dIHoRAg/ ソ
ン
ツ
シ
カタカナのヘ
ひらがなのへ
ン
ツ
シ
カタカナのヘ
ひらがなのへ
413デフォルトの名無しさん
2016/07/30(土) 21:55:31.23ID:cBq8SpsU :::::::::::/ ヽ::::::::::::
:::::::::::| ば じ き i::::::::::::
:::::::::::.ゝ か つ み ノ:::::::::::
:::::::::::/ だ に は イ:::::::::::::
::::: | な。 ゙i ::::::
\_ ,,-'
――--、..,ヽ__ _,,-''
:::::::,-‐、,‐、ヽ. )ノ _,,...-
:::::_|/ 。|。ヽ|-i、 ∠_:::::::::
/. ` ' ● ' ニ 、 ,-、ヽ|:::::::::
ニ __l___ノ |・ | |, -、::
/ ̄ _ | i ゚r ー' 6 |::
|( ̄`' )/ / ,.. i '-
`ー---―' / '(__ ) ヽ 、 >>1
====( i)==::::/ ,/ニニニ
:/ ヽ:::i /;;;;;;;;;;;;;;;;
:::::::::::| ば じ き i::::::::::::
:::::::::::.ゝ か つ み ノ:::::::::::
:::::::::::/ だ に は イ:::::::::::::
::::: | な。 ゙i ::::::
\_ ,,-'
――--、..,ヽ__ _,,-''
:::::::,-‐、,‐、ヽ. )ノ _,,...-
:::::_|/ 。|。ヽ|-i、 ∠_:::::::::
/. ` ' ● ' ニ 、 ,-、ヽ|:::::::::
ニ __l___ノ |・ | |, -、::
/ ̄ _ | i ゚r ー' 6 |::
|( ̄`' )/ / ,.. i '-
`ー---―' / '(__ ) ヽ 、 >>1
====( i)==::::/ ,/ニニニ
:/ ヽ:::i /;;;;;;;;;;;;;;;;
414デフォルトの名無しさん
2016/08/01(月) 17:17:15.79ID:JXVULl1x ソとンは微妙なのは判るが
ツとシは明らかに違う字だろ
ツとシは明らかに違う字だろ
415デフォルトの名無しさん
2016/08/01(月) 17:43:19.40ID:A0XjWkqP ( ツ )ノシ
416デフォルトの名無しさん
2016/08/01(月) 22:12:49.95ID:AzMK4PQ3 兌を部品として含む字は説の他にも色々ある。
脱 税 悦 など。これらは統合されている。
説は何故か康煕字典の正字(Big5,KS)と楷書通用字体(JIS,GB)の2種類に分裂している。
固有名詞の表記で揉め事になる字でもない。何かの手違いかと。
>>414
日本人にとっては明らかに違う字だが中国人、韓国人などには区別しづらいようだ。
アジアからの輸入品ではそういう誤植はよく見かける。ショートカット→ツョートカシト など。
レ、し の混同も多い。
脱 税 悦 など。これらは統合されている。
説は何故か康煕字典の正字(Big5,KS)と楷書通用字体(JIS,GB)の2種類に分裂している。
固有名詞の表記で揉め事になる字でもない。何かの手違いかと。
>>414
日本人にとっては明らかに違う字だが中国人、韓国人などには区別しづらいようだ。
アジアからの輸入品ではそういう誤植はよく見かける。ショートカット→ツョートカシト など。
レ、し の混同も多い。
417デフォルトの名無しさん
2016/08/01(月) 22:24:15.16ID:AzMK4PQ3 日本人にとってシンデレラとツンデレラは明らかに違う。外国人に(ry
418デフォルトの名無しさん
2016/08/01(月) 23:10:29.38ID:AzMK4PQ3 説と说はunicodeでは別字だった。
という事で訂正。JISは楷書通用字体、GBは簡体字。つまり3種類に分裂している。
スマンカッタ。
という事で訂正。JISは楷書通用字体、GBは簡体字。つまり3種類に分裂している。
スマンカッタ。
419デフォルトの名無しさん
2016/08/02(火) 02:07:22.57ID:1KCZrKLH >>418を通訳すると
「原規格分離などどうでもいい」
Windowsコードページ936(GBK)より
U+8AAC(説) = D568
U+8AAA(說) = D566
U+8BF4(说) = CBB5
「原規格分離などどうでもいい」
Windowsコードページ936(GBK)より
U+8AAC(説) = D568
U+8AAA(說) = D566
U+8BF4(说) = CBB5
420デフォルトの名無しさん
2016/08/02(火) 14:41:15.32ID:X69kNOq3421デフォルトの名無しさん
2016/08/02(火) 19:31:05.47ID:JwtZ9iAm422デフォルトの名無しさん
2016/08/02(火) 20:49:40.10ID:LBy6cWLg こうやって、タンクトップにショートパンツを貼り付けるんだお。
意味:デスクトップにショートカットを貼り付ける。
意味:デスクトップにショートカットを貼り付ける。
423デフォルトの名無しさん
2016/08/02(火) 23:35:51.72ID:zi+BVpwh ディスクトップのことをタンクトップというやつは見たことないな
424デフォルトの名無しさん
2016/08/02(火) 23:48:20.71ID:2l83Zpm1 円盤の上に
425デフォルトの名無しさん
2016/08/03(水) 00:17:44.35ID:4zWXrFMO426デフォルトの名無しさん
2016/08/03(水) 17:17:04.74ID:XuAWxec+ iOS 10では拳銃の絵文字が水鉄砲の絵文字に置き換えられる | スラド アップル
http://apple.srad.jp/story/16/08/03/0444222/
http://apple.srad.jp/story/16/08/03/0444222/
427デフォルトの名無しさん
2016/08/03(水) 18:29:34.34ID:mbys/AN5 わろた
428デフォルトの名無しさん
2016/08/03(水) 18:31:08.54ID:mbys/AN5 Aが牛刀かなんかで
JがJナイフだろ
JがJナイフだろ
429デフォルトの名無しさん
2016/08/03(水) 23:47:05.83ID:4zWXrFMO 森鴎外と書こうと森鷗外と書こうとどちらでも良い、というのが一般人の感覚。
これはそれほど不健全とは思えない。何しろ自筆原稿に「森鴎外」と書かれているんだから。
鴎は俗字だケシカラン、というのは一部の規範意識の強い正字正かな主義のキチガイ。
鷗はダメだ鴎と書け、というのはもっと訳のわからん国語改革主義のキチガイ。
こいつらがJISの83改定を行った為にカオスに。
これはそれほど不健全とは思えない。何しろ自筆原稿に「森鴎外」と書かれているんだから。
鴎は俗字だケシカラン、というのは一部の規範意識の強い正字正かな主義のキチガイ。
鷗はダメだ鴎と書け、というのはもっと訳のわからん国語改革主義のキチガイ。
こいつらがJISの83改定を行った為にカオスに。
430デフォルトの名無しさん
2016/08/04(木) 08:56:22.25ID:FjB5rL2o >>429
使いわけがされていない字体違いの漢字はまとめてしまおうというのは文字コードの問題ではない。
使いわけがされていない字体違いの漢字はまとめてしまおうというのは文字コードの問題ではない。
431デフォルトの名無しさん
2016/08/04(木) 12:12:59.75ID:8anV95gh 恵'
っていうのも流行ったけど
文字コードありますか?
っていうのも流行ったけど
文字コードありますか?
432デフォルトの名無しさん
2016/08/04(木) 17:09:02.57ID:TBSxpqkz U+6075 U+E101
433デフォルトの名無しさん
2016/08/04(木) 18:54:49.83ID:GAy76/a3 U+FA6B
U+6075 U+E103
でもいいのよ?
U+6075 U+E103
でもいいのよ?
434デフォルトの名無しさん
2016/08/04(木) 19:07:39.26ID:8anV95gh U+FA6B でいけましたありがとう
435デフォルトの名無しさん
2016/08/04(木) 19:32:46.16ID:Ki4RLkNz U+6075 U+FE00
でもいいぞ
でもいいぞ
436デフォルトの名無しさん
2016/08/05(金) 14:48:07.96ID:nIRHSvG0 この流れ、前にどこかで読んだ気がするなー、と思ったら
直井氏の「重複符号化四天王」だった。↓
ttp://d.hatena.ne.jp/NAOI/20130116/1358319668
直井氏の「重複符号化四天王」だった。↓
ttp://d.hatena.ne.jp/NAOI/20130116/1358319668
437デフォルトの名無しさん
2016/08/05(金) 14:56:27.37ID:9LvdmO9z ということは祇園もあれか
祗園と書くとやられるのか
祗園と書くとやられるのか
438デフォルトの名無しさん
2016/08/05(金) 14:58:22.57ID:LJe/qM3f julia> '\ufa6b'
'恵'
さすがだな
'恵'
さすがだな
439デフォルトの名無しさん
2016/08/05(金) 22:00:51.73ID:49rJvUnO >>436
最近更新されてないな
最近更新されてないな
440デフォルトの名無しさん
2016/08/05(金) 22:19:20.77ID:zXAznUbh >>430
いや、全く無関係ではあるまい。
鴎と鷗は使い分けがされていなかった、という点ではあなたも同意してくれるだろう。
原規格分離されていないのにUnicodeでは別字扱いになってしまった。
そもそも83改定を行ったJISと唆した国語審議会に元凶があったのだが、Unicodeにも責任の一端がある。
国語審議会は鷗を滅ぼして鴎に置き換えようとした。
本人に問い詰めて確認したわけではないが、多分そういう事だろう。
1000年以上にわたって使われ続けた字を滅ぼす事などそう簡単に出来る筈がない。
結局、国語審議会に滅ぼされる事なく生き残り、鴎と別の字になってしまった。
なお、最近見たベネッセの小学漢字辞典に鷗は載っていたが鴎は載っていなかった。
>>437
祇と祗は元々意味も読みも異なる別字。だが見た目が良く似ているので古くから混同される事が多かった。
「ぎおん」と入力して「祗園」と変換出来てしまうMS-IMEが悪い。
百歩譲ってその変換を認めるとしても、せめて「本来は誤用」ぐらいのメッセージは出してほしい。
いや、全く無関係ではあるまい。
鴎と鷗は使い分けがされていなかった、という点ではあなたも同意してくれるだろう。
原規格分離されていないのにUnicodeでは別字扱いになってしまった。
そもそも83改定を行ったJISと唆した国語審議会に元凶があったのだが、Unicodeにも責任の一端がある。
国語審議会は鷗を滅ぼして鴎に置き換えようとした。
本人に問い詰めて確認したわけではないが、多分そういう事だろう。
1000年以上にわたって使われ続けた字を滅ぼす事などそう簡単に出来る筈がない。
結局、国語審議会に滅ぼされる事なく生き残り、鴎と別の字になってしまった。
なお、最近見たベネッセの小学漢字辞典に鷗は載っていたが鴎は載っていなかった。
>>437
祇と祗は元々意味も読みも異なる別字。だが見た目が良く似ているので古くから混同される事が多かった。
「ぎおん」と入力して「祗園」と変換出来てしまうMS-IMEが悪い。
百歩譲ってその変換を認めるとしても、せめて「本来は誤用」ぐらいのメッセージは出してほしい。
441デフォルトの名無しさん
2016/08/05(金) 23:24:48.92ID:Ox1rQ2Fh442デフォルトの名無しさん
2016/08/06(土) 05:56:41.80ID:g/BBNoMH もう数字の「1」も漢数字の「一」と統合しろよ。
「一回」と「1回」みたいに使い分けされてないだろ。
「ひとつ を 1つ と書くのはけしからん」なんて言う奴はキチガイ。
「一回」と「1回」みたいに使い分けされてないだろ。
「ひとつ を 1つ と書くのはけしからん」なんて言う奴はキチガイ。
443デフォルトの名無しさん
2016/08/06(土) 06:01:39.31ID:e+VUV2JF 使う漢字を減らそうとして常用漢字を策定しているのにそれが気に入らないなら義務教育を否定しろよ。
444デフォルトの名無しさん
2016/08/06(土) 06:15:36.28ID:zLWUK7Cp445デフォルトの名無しさん
2016/08/06(土) 06:22:28.56ID:swGxqhgp つまり加藤1239段と書けと
446デフォルトの名無しさん
2016/08/06(土) 09:57:23.87ID:G90m6v3V >>444
見たことはないが、読みがわからん奴がそのうちやるだろう。
見たことはないが、読みがわからん奴がそのうちやるだろう。
447デフォルトの名無しさん
2016/08/06(土) 15:41:55.96ID:lXyGJ+4s 4国地方
9州地方
9州地方
448デフォルトの名無しさん
2016/08/06(土) 22:32:19.37ID:E3d0sLCL 16進数
449デフォルトの名無しさん
2016/08/06(土) 22:35:24.25ID:E3d0sLCL >>447
4は、ヨン、シ
よみかたがどうなるのか
時代と共によみかたもかわるそうだが、だからといって、よみかたは、どうでもいいとはいえない
辞書順にならべかえた場合、探しにくい
しじゅうきょく
しじゅうきょくもーめんと
四極子(しきょくし、英: quadrupole, quadrapole)または四重極とは、モーメントが等しい双極子
Wikipedia
4は、ヨン、シ
よみかたがどうなるのか
時代と共によみかたもかわるそうだが、だからといって、よみかたは、どうでもいいとはいえない
辞書順にならべかえた場合、探しにくい
しじゅうきょく
しじゅうきょくもーめんと
四極子(しきょくし、英: quadrupole, quadrapole)または四重極とは、モーメントが等しい双極子
Wikipedia
450デフォルトの名無しさん
2016/08/06(土) 23:28:50.16ID:e+VUV2JF 8日をはちにち、17日をじゅうななにちと口頭で言うなって感じだな。
特に8日と4日は聞き間違う可能性は低い。
特に8日と4日は聞き間違う可能性は低い。
451デフォルトの名無しさん
2016/08/07(日) 13:43:44.87ID:sg2m+nAp もうかなり前から小学校教育では
14日はじゅうよんにちだな
14日はじゅうよんにちだな
452デフォルトの名無しさん
2016/08/07(日) 15:24:00.14ID:62bJhx0K >>451
本当?
本当?
453デフォルトの名無しさん
2016/08/07(日) 16:16:16.92ID:9cSo/AxT 三重県よんにちいち市
454デフォルトの名無しさん
2016/08/07(日) 17:19:20.29ID:49wBLG90455デフォルトの名無しさん
2016/08/07(日) 23:09:39.81ID:W0a9UwyT >>445
そんなのは異体字セレクターか何かで何とかしろ
そんなのは異体字セレクターか何かで何とかしろ
456デフォルトの名無しさん
2016/08/07(日) 23:58:49.54ID:13NE3PeU 絵文字のピストル、本物っぽいデザインとおもちゃっぽいデザインのどっちがいい? | スラド IT http://it.srad.jp/story/16/08/06/2215228/
457デフォルトの名無しさん
2016/08/08(月) 00:42:12.05ID:h/269Flb 4様
458デフォルトの名無しさん
2016/08/17(水) 16:58:01.66ID:DacIS0G0 秀丸エディタで補助漢字入りEUC-JPのデータをいじってたら何か化ける
というか秀丸がいうEUCって普通のEUC-JPじゃなくてコードページ51932(+ JIS X 0212)なのか?
というか秀丸がいうEUCって普通のEUC-JPじゃなくてコードページ51932(+ JIS X 0212)なのか?
459デフォルトの名無しさん
2016/08/17(水) 18:00:48.77ID:KP9VFMD+ ではまずお前の思っている「普通のEUC-JP」「51932」の定義を言ってみろ
460デフォルトの名無しさん
2016/08/17(水) 18:48:59.59ID:DacIS0G0 コードページ51932は正直よく知らないんで何ともだが
「普通のEUC-JP」はGLにASCII、GRにJIS X 0208を最初からロッキングシフトしておいて
JIS X 0212を使いたい時はSS3で一文字づつ呼び出すやつ、という説明でいいのか?
「普通のEUC-JP」はGLにASCII、GRにJIS X 0208を最初からロッキングシフトしておいて
JIS X 0212を使いたい時はSS3で一文字づつ呼び出すやつ、という説明でいいのか?
461デフォルトの名無しさん
2016/08/17(水) 19:48:09.26ID:rsNvN518 まじかよ最悪だな禿丸
でも試しに8F B2 D1を読み込ませたらX 0212の18-49が表示されたぞ
よくわからん
でも試しに8F B2 D1を読み込ませたらX 0212の18-49が表示されたぞ
よくわからん
462デフォルトの名無しさん
2016/08/17(水) 21:43:57.03ID:q9L8GmQf CP51932の文字セットは932そのままじゃなかったかな?丸数字とか入ってる筈。補助漢字無し
unicode?51932の変換する時中で一旦932にするので注意だったような
unicode?51932の変換する時中で一旦932にするので注意だったような
463デフォルトの名無しさん
2016/08/17(水) 23:42:13.69ID:rsNvN518 Windows-31JとJIS X 0212に有ってShift_JISに無い文字(例:U+9A4E)を含むUTF-32ファイルを開いてEUC-JPで保存する時だな。
UTF-32(U+9A4E)→シフトJIS IBM拡張文字(FB FB)→シフトJIS NEC選定IBM拡張文字(EE DF)→JIS(7C 61)→CP51932(FC E1)
という経路で変換するんだろうな。
>>458が期待したのは
UTF-32(U+9A4E)→(69 51)→EUC-JP(8F E9 D1)
だったと。
JIS X 0212はよく知らんが、UTF-32とのマッピング表がobsoleteなんだから禿丸の動作は仕方なくね
UTF-32(U+9A4E)→シフトJIS IBM拡張文字(FB FB)→シフトJIS NEC選定IBM拡張文字(EE DF)→JIS(7C 61)→CP51932(FC E1)
という経路で変換するんだろうな。
>>458が期待したのは
UTF-32(U+9A4E)→(69 51)→EUC-JP(8F E9 D1)
だったと。
JIS X 0212はよく知らんが、UTF-32とのマッピング表がobsoleteなんだから禿丸の動作は仕方なくね
464デフォルトの名無しさん
2016/08/17(水) 23:54:23.01ID:9FJ+LbN2465デフォルトの名無しさん
2016/08/17(水) 23:58:51.50ID:9FJ+LbN2 >>463
そうそう、そういうことです!
補助漢字の前にコードページ932のNEC特殊文字/IBM拡張文字が優先なんですね……。
まあ最初からUTF-8かUTF-16にすればいいんだけど、うーん
長々とすみませんでした。
そうそう、そういうことです!
補助漢字の前にコードページ932のNEC特殊文字/IBM拡張文字が優先なんですね……。
まあ最初からUTF-8かUTF-16にすればいいんだけど、うーん
長々とすみませんでした。
466デフォルトの名無しさん
2016/08/19(金) 02:34:45.63ID:na9GQU+3 つーかWindowsで動くエディタで、CP932互換じゃないEUC-JPに変換するのあるの?
467デフォルトの名無しさん
2016/08/19(金) 08:11:13.46ID:R+gedXV1 932互換でも構わんがJISX0212使っといて一部はG1(X0208)とか頭おかしいだろ
シングルシフト3は無しにして別に「EUC(0212有)」みたいな文字コードを設けろって感じ
シングルシフト3は無しにして別に「EUC(0212有)」みたいな文字コードを設けろって感じ
468デフォルトの名無しさん
2016/08/19(金) 13:01:11.35ID:cXkrYKyS 文字コードは難しすぎますね
すべての文字列はUTF-32で統一されるべきでしたわ
すべての文字列はUTF-32で統一されるべきでしたわ
469デフォルトの名無しさん
2016/08/19(金) 16:44:17.07ID:MDjzAPUc >>466
「〜」でやられることは割とまじで良くあるな
「〜」でやられることは割とまじで良くあるな
470デフォルトの名無しさん
2016/08/21(日) 00:40:20.53ID:8CSn2PR2471デフォルトの名無しさん
2016/08/21(日) 01:09:58.00ID:y7QDjexr 0212のTILDEはU+FF5Eにすればいいのでは
472デフォルトの名無しさん
2016/08/22(月) 17:49:33.33ID:Rx9mnEUz 根拠のない俺マッピングですか
473デフォルトの名無しさん
2016/08/22(月) 19:04:01.72ID:1uqoHG7Z >>439
Twitter に鞍替えしちゃったからなあ
Twitter に鞍替えしちゃったからなあ
474デフォルトの名無しさん
2016/08/24(水) 18:34:55.31ID:LiadQQJo475デフォルトの名無しさん
2016/08/31(水) 19:23:24.63ID:ydwY4yt1 そう言えば昔、Unicodeのインディアンスレ?があったけど
スレは単発で終わったんだっけ
スレは単発で終わったんだっけ
476デフォルトの名無しさん
2016/08/31(水) 20:38:55.78ID:gNQCVbH8 >>475
👳❔
👳❔
477デフォルトの名無しさん
2016/08/31(水) 20:39:42.33ID:gNQCVbH8 (´・ω・`)
478デフォルトの名無しさん
2016/08/31(水) 21:34:59.28ID:oHNJUglq >>476
👳❔
👳❔
479デフォルトの名無しさん
2016/08/31(水) 22:07:21.28ID:eDoof1t5 インディアンの顔文字提案スレですね
480デフォルトの名無しさん
2016/08/31(水) 23:58:22.53ID:3OVWpwKX 10人のインディアンが一人づついなくなるのか
481デフォルトの名無しさん
2016/09/01(木) 01:10:12.45ID:lZ/6Z4Ol gとZWJで結合するのかな
482デフォルトの名無しさん
2016/09/02(金) 18:21:16.83ID:aYJKGs1c Unicodeオワットル
483デフォルトの名無しさん
2016/09/02(金) 23:20:06.03ID:24FH2nuP NFKD正規化って存在価値あるの?
オhルをオワットルに変換できた所で
何がうれしいのかよくわからん
オhルをオワットルに変換できた所で
何がうれしいのかよくわからん
484デフォルトの名無しさん
2016/09/03(土) 00:41:07.59ID:2+PqWpLf NFKDを検索したら𝐍𝐅𝐊𝐃も𝑁𝐹𝐾𝐷もマッチする方が嬉しいし
1月が㋀にマッチしたり株式会社が㍿にマッチしたら嬉しいから
俺はメリットがあると思うけど
1月が㋀にマッチしたり株式会社が㍿にマッチしたら嬉しいから
俺はメリットがあると思うけど
485デフォルトの名無しさん
2016/09/03(土) 02:21:27.68ID:0X4SIQFT 半角ABCで検索したら全角ABCがヒットしないFirefoxさん…
486デフォルトの名無しさん
2016/09/04(日) 17:57:17.34ID:t4IVeB0G487デフォルトの名無しさん
2016/09/04(日) 22:08:48.81ID:I3Tx/JDs その割に何十個もあるハイフン系は
NFKDでもまとまらないという
NFKDでもまとまらないという
488デフォルトの名無しさん
2016/09/05(月) 08:48:36.28ID:uKd9K+Pl >>487
それはNFKDの仕事じゃない
それはNFKDの仕事じゃない
489デフォルトの名無しさん
2016/09/06(火) 20:51:36.90ID:xwAMZRD2490デフォルトの名無しさん
2016/09/06(火) 21:18:50.81ID:zD4Ev6Rw そろそろポケモン来る?
491デフォルトの名無しさん
2016/09/07(水) 01:48:06.44ID:ebFGMU7R もう横棒類は全部 HYPHEN-MINUS に置き換えしとけ
492デフォルトの名無しさん
2016/09/07(水) 03:48:29.15ID:lO0k6I5n >>489
compatibilityがあるものだけ
何十個もcompatibilityのあるdash/hyphenはない
横棒っぽい文字を全部集めたら数十種類あると思うが
それを全部例えばhyphen-minusに変換したら
テキストの意味が変わってしまい
到底NORMALizationと呼べるようなものではない
勿論そういう変換が有効な応用ではそうしていい
compatibilityがあるものだけ
何十個もcompatibilityのあるdash/hyphenはない
横棒っぽい文字を全部集めたら数十種類あると思うが
それを全部例えばhyphen-minusに変換したら
テキストの意味が変わってしまい
到底NORMALizationと呼べるようなものではない
勿論そういう変換が有効な応用ではそうしていい
493デフォルトの名無しさん
2016/09/08(木) 20:41:13.60ID:vRujICD+ つまり「俺のcompatibility基準を満たしていないからダメだもん」
横棒類は全部 HYPHEN-MINUS に置き換えでいい
横棒類は全部 HYPHEN-MINUS に置き換えでいい
494デフォルトの名無しさん
2016/09/10(土) 02:47:21.06ID:J+ikgNSp グダグダ言ってるとユニコード貼るぞ
俺のユニコードでお前は瞬殺
俺のユニコードでお前は瞬殺
495デフォルトの名無しさん
2016/09/10(土) 12:24:25.95ID:fOA1OM1A ユニコードは犯罪だからやめてください!
496デフォルトの名無しさん
2016/09/12(月) 10:27:24.50ID:mOa6Tuog そこはユニコ-ドでしょ
497デフォルトの名無しさん
2016/09/12(月) 14:27:32.13ID:gUHt3FEA >>493
unicode character databaseと言うものがありましてねえ
unicode character databaseと言うものがありましてねえ
498デフォルトの名無しさん
2016/10/03(月) 15:40:21.15ID:KTjG7pFJ >>497
で?
で?
499デフォルトの名無しさん
2016/10/05(水) 18:49:51.38ID:zQFtnK8f 来年は JIS X 0201/0208/0213/0213/0218 の見直し時期だけど
果たして 0208 と 0213 の大統合計画は進んでいるのかしら。
果たして 0208 と 0213 の大統合計画は進んでいるのかしら。
500デフォルトの名無しさん
2016/10/05(水) 20:58:30.93ID:XMn6/PJL 大統領計画に見えた
501デフォルトの名無しさん
2016/10/05(水) 21:43:58.27ID:7xdnHvuf もうJISなんて誰も読んでないから更新するだけ無駄
502デフォルトの名無しさん
2016/10/06(木) 00:19:24.84ID:WcwEO0Cy なんだかんだいろいろな場から参照されるしUnicodeの中の人も読まざるを得ないから
うんこ絵文字のバリエーション大量に紛れ込ませてUnicodeにUnko Supplementとして収録させるチャンス
うんこ絵文字のバリエーション大量に紛れ込ませてUnicodeにUnko Supplementとして収録させるチャンス
503デフォルトの名無しさん
2016/10/06(木) 17:53:36.88ID:UZIumrjL ウンコはIVSの240まででお願いします
504デフォルトの名無しさん
2016/10/07(金) 16:27:31.20ID:a2swqPPf >>501
なわけないw
なわけないw
505デフォルトの名無しさん
2016/10/08(土) 04:31:56.90ID:Mitr01Lo ようやく変体仮名は投票に進むことになったのか
506デフォルトの名無しさん
2016/10/10(月) 18:05:59.46ID:YNNS+rUA >>501
刷りで字形変えるとか狂気の沙汰やで
刷りで字形変えるとか狂気の沙汰やで
507デフォルトの名無しさん
2016/10/10(月) 19:30:46.05ID:cMA/MPGG >>503
そういえば例の絵文字の肌色セレクターってうんちの健康状態セレクターにも使えそうな気がしてきた
そういえば例の絵文字の肌色セレクターってうんちの健康状態セレクターにも使えそうな気がしてきた
508デフォルトの名無しさん
2016/10/10(月) 22:58:01.80ID:M8ZVX+C6 うんこ色のカレーとうこん色のカレーを区別するのです
ケーキに黒っぽいVS付けたらチョコレートケーキとか
そういう汎用化は日本が提案したけど駄目だったんじゃなかったっけ?
肌の色が何とかなればいいんだってことで
ケーキに黒っぽいVS付けたらチョコレートケーキとか
そういう汎用化は日本が提案したけど駄目だったんじゃなかったっけ?
肌の色が何とかなればいいんだってことで
509デフォルトの名無しさん
2016/10/10(月) 23:51:20.73ID:Djs1tw8b モアイに色付けたら似てる人たくさんいるよな
510デフォルトの名無しさん
2016/10/11(火) 20:05:00.55ID:OtV2PYG6 カレー味のうんこ
うんこ味のカレー
の区別も必要(´・ω・`)
うんこ味のカレー
の区別も必要(´・ω・`)
511デフォルトの名無しさん
2016/10/11(火) 21:31:06.48ID:cObrH7jL 本来モアイじゃなくてモヤイだけどな
512デフォルトの名無しさん
2016/10/11(火) 21:50:29.29ID:V1jdw+of513デフォルトの名無しさん
2016/10/11(火) 22:41:02.94ID:rvdgZgux イースター島にあるのがモアイ、渋谷にあるのがモヤイだと思ってたw
514デフォルトの名無しさん
2016/10/12(水) 16:00:26.26ID:YOeAxYpE 本来はそれで合ってるはずなんだけどね
515デフォルトの名無しさん
2016/10/15(土) 23:01:11.77ID:D2M8VrAf ユニコードのUAX#29(文字・単語・段落の抽出)を久しぶりに読んでみたら
Grapheme clusterの仕様が絵文字のルールに汚染されていた。
何なんだこの絵文字推しは。
Grapheme clusterの仕様が絵文字のルールに汚染されていた。
何なんだこの絵文字推しは。
516デフォルトの名無しさん
2016/10/16(日) 12:53:03.20ID:OdRyVeWS517デフォルトの名無しさん
2016/10/16(日) 23:34:01.26ID:WgPd64pv この性別ってライオンのたてがみとか、人間以外にも使えるんだろうか
518デフォルトの名無しさん
2016/10/17(月) 16:48:56.72ID:aoY1HCI9 フィッツパトリック肌分類って6種類あるのに
何でUnicodeのEmoji Modifiersでは5つしか入れてないんだろう
"pale white skin"と"white skin"は区別しなくていいのか
何でUnicodeのEmoji Modifiersでは5つしか入れてないんだろう
"pale white skin"と"white skin"は区別しなくていいのか
519デフォルトの名無しさん
2016/10/17(月) 18:02:36.80ID:Mub28dKn フィッツパトリック肌分類に基づいた上で1と2を一つにまとめて5段階にした
と書かれているんだから区別しなくていいと判断したんだろう
根拠は不明だが
と書かれているんだから区別しなくていいと判断したんだろう
根拠は不明だが
520デフォルトの名無しさん
2016/10/17(月) 18:48:57.01ID:V2CfCREk そこらへんすごく謎。まとめていいんかいと思った。
521デフォルトの名無しさん
2016/10/17(月) 19:58:51.95ID:0j2VVc+B もうめちゃくちゃだよ
522デフォルトの名無しさん
2016/10/19(水) 07:22:54.68ID:2wj1sf6o 絵文字をざっくりしたシンボルじゃなくて
なまじリアルな絵で表現し始めちゃったのがそもそもの間違いなんだよな
なまじリアルな絵で表現し始めちゃったのがそもそもの間違いなんだよな
523デフォルトの名無しさん
2016/10/19(水) 18:20:20.85ID:+yhFT7Q1 コードポイントを追加するのはともかく
modifierみたいなコードポイント列の解釈についての
ルール追加はやめて欲しいものだ
modifierみたいなコードポイント列の解釈についての
ルール追加はやめて欲しいものだ
524デフォルトの名無しさん
2016/10/19(水) 19:21:02.82ID:z+7397V0525デフォルトの名無しさん
2016/10/27(木) 22:59:57.94ID:N8soLWiI もうBase64か何か使って直接画像のバイナリデータ埋め込めばいいのに
Unicodeのコードポイントとして登録したがるのは何で
Unicodeのコードポイントとして登録したがるのは何で
526デフォルトの名無しさん
2016/10/28(金) 00:02:59.53ID:JyUwGqf8527デフォルトの名無しさん
2016/10/28(金) 16:48:59.16ID:p0VbpbVf DoCoMoのiモード絵文字がNew York近代美術館のコレクションに | スラド モバイル
https://mobile.srad.jp/story/16/10/28/0416246/
The Original Emoji Set Has Been Added to The Museum of Modern Art’s Collection – MoMA – Medium
https://medium.com/moma/the-original-emoji-set-has-been-added-to-the-museum-of-modern-arts-collection-c6060e141f61#.cqv1mudi0
New York’s MoMA Acquires the First Ever (Very Pixelated) Emoji | WIRED
https://www.wired.com/2016/10/new-yorks-moma-acquires-first-ever-pixelated-emoji/
https://mobile.srad.jp/story/16/10/28/0416246/
The Original Emoji Set Has Been Added to The Museum of Modern Art’s Collection – MoMA – Medium
https://medium.com/moma/the-original-emoji-set-has-been-added-to-the-museum-of-modern-arts-collection-c6060e141f61#.cqv1mudi0
New York’s MoMA Acquires the First Ever (Very Pixelated) Emoji | WIRED
https://www.wired.com/2016/10/new-yorks-moma-acquires-first-ever-pixelated-emoji/
528デフォルトの名無しさん
2016/10/28(金) 18:45:52.85ID:TvQWNHir スレ違いレスを無言で貼るな低能
529デフォルトの名無しさん
2016/10/28(金) 20:49:51.94ID:fbqfS+Lz 絵文字がモノクロドット絵の頃は文字コード業界も平和だったのに
530デフォルトの名無しさん
2016/10/28(金) 23:17:41.58ID:oHvFUXop 自分たちでも扱える文字が増えたからって外人たちがはしゃぎすぎなんだよ
531デフォルトの名無しさん
2016/10/29(土) 03:01:41.79ID:V/VqPJHP 同じものを見てるとは限らないということを
ほとんどの利用者は知らずに誤解を生んでる
ほとんどの利用者は知らずに誤解を生んでる
532デフォルトの名無しさん
2016/10/29(土) 07:13:03.75ID:p4X+nISr \100
533デフォルトの名無しさん
2016/10/29(土) 10:42:34.24ID:hDIKHPTa どう転んでも表意文字とコンピュータは相性が悪いらしいな
まさか絵文字の肌の色が問題になるとは思わんかったわ
まさか絵文字の肌の色が問題になるとは思わんかったわ
534デフォルトの名無しさん
2016/10/29(土) 10:59:34.81ID:W9gQheBG ああいう指示は文字コードの範疇じゃないよな。
そのうちなし崩しで、ボールドにしろだのサンセリフ体にしろだのいう指示まで取り込んでしまいそうな。
そのうちなし崩しで、ボールドにしろだのサンセリフ体にしろだのいう指示まで取り込んでしまいそうな。
535デフォルトの名無しさん
2016/10/29(土) 11:11:13.16ID:SNFlkCRz まぁ間違いなくそのうちアニメーションさせようとか言い出すだろうな
国内では文字コード濫用形式の絵文字から、単なる画像添付のデコメ絵文字に移行してたのに
なぜわざわざ国際規格で文字コード濫用形式に戻してしまったのか
国内では文字コード濫用形式の絵文字から、単なる画像添付のデコメ絵文字に移行してたのに
なぜわざわざ国際規格で文字コード濫用形式に戻してしまったのか
536デフォルトの名無しさん
2016/10/29(土) 14:02:02.47ID:QoegAjAm 日本人がいろいろ工夫したものを、当の日本人自身がガラパゴスとか
言い出してダメにしちゃうから、問題点とかがきちんと伝承されないんだよ。
言い出してダメにしちゃうから、問題点とかがきちんと伝承されないんだよ。
537デフォルトの名無しさん
2016/10/30(日) 01:29:55.53ID:X0WLh33u EUCとかSJISとかISO2022とか揉めてる間にUTF8に持っていかれた感じ
538デフォルトの名無しさん
2016/10/30(日) 09:34:26.59ID:VFHN3+TL そこはべつにもめてない
539デフォルトの名無しさん
2016/10/30(日) 10:57:24.93ID:QmnxrLM3 UTF-8とUTF-32に統一したいのに
WindowsがシフトジスとUTF-16の呪いをかけたままだから困る
もうWindowsごと滅んでもらうしか無い
WindowsがシフトジスとUTF-16の呪いをかけたままだから困る
もうWindowsごと滅んでもらうしか無い
540デフォルトの名無しさん
2016/10/30(日) 18:49:52.12ID:K5Y8T0Gi よくわかってない人にありがちな見当違い発言
541片山博文MZ ◆T6xkBnTXz7B0
2016/10/30(日) 18:57:43.74ID:cdJKNnsC Windowsはメモ帳もオフィスもUTF-8ファイルに対応しているよ。
WideCharToMultiByteなどもCP_UTF8付ければ変換できる。
WideCharToMultiByteなどもCP_UTF8付ければ変換できる。
542デフォルトの名無しさん
2016/10/30(日) 19:06:13.90ID:d4hFjYHp 反論になってないし片山はやっぱりアホだな
Windowsがある限りUTF-16も生き残る、まさに呪いだな
Windowsがある限りUTF-16も生き残る、まさに呪いだな
543デフォルトの名無しさん
2016/10/30(日) 20:50:41.17ID:0D55JhhC いつも博文がクソレスで皆様を不愉快にさせて申し訳ございません
>>540のクソレスもいつものように博文がID変えた自演です
>>540のクソレスもいつものように博文がID変えた自演です
544デフォルトの名無しさん
2016/10/30(日) 20:53:09.96ID:0D55JhhC 結合文字はともかく土吉(U+20BB7)の文字列の
長さが2になるのはホント、ストレスたまるぜ
長さが2になるのはホント、ストレスたまるぜ
545デフォルトの名無しさん
2016/10/30(日) 23:02:05.66ID:qhy1bgov >>535
日本では絵文字は文字として運用実績があったからね
キャリアごとの独自絵文字をGmailで相互運用するために整理が必要だった
整理できてしまえばあとはUnicode.orgがどう考えるか
丸囲み合成文字辺りから考えると当然の帰結だったんじゃないか
日本では絵文字は文字として運用実績があったからね
キャリアごとの独自絵文字をGmailで相互運用するために整理が必要だった
整理できてしまえばあとはUnicode.orgがどう考えるか
丸囲み合成文字辺りから考えると当然の帰結だったんじゃないか
546デフォルトの名無しさん
2016/10/31(月) 04:36:11.15ID:jkUzecbb NIHON
HINOMOTO
HINOMOTO
547デフォルトの名無しさん
2016/10/31(月) 04:37:51.87ID:jkUzecbb char * -> UTF-8
wchar_t * -> UTF-16
UTF-32 は何使うの?
wchar_t * -> UTF-16
UTF-32 は何使うの?
548デフォルトの名無しさん
2016/10/31(月) 05:24:15.03ID:OEIemcR6 char16_t : UTF-16
char32_t : UTF-32
char32_t : UTF-32
549デフォルトの名無しさん
2016/10/31(月) 05:26:59.82ID:jkUzecbb dx
550デフォルトの名無しさん
2016/10/31(月) 16:40:00.60ID:up1CNSO3 日本の3大キャリアの絵文字を収録するのはまだいいとしてもその後の毎年山盛り追加はもう何がなんだかなあ・・・
551デフォルトの名無しさん
2016/10/31(月) 16:44:21.72ID:oRn+7MiJ KOREAの陰謀としか
552デフォルトの名無しさん
2016/10/31(月) 21:20:59.79ID:YB1o5gLr 以下、コレはまいったね禁止
553デフォルトの名無しさん
2016/10/31(月) 21:43:52.12ID:8iOXYzaz >>552
どういう意味?
どういう意味?
554デフォルトの名無しさん
2016/11/01(火) 08:59:37.54ID:f9g8VI31 親父ギャグ
555デフォルトの名無しさん
2016/11/01(火) 18:38:34.50ID:gPz02xlo >>550
最初の頃言ってた携帯メールの交換のためとか何だったんだろうね
最初の頃言ってた携帯メールの交換のためとか何だったんだろうね
556デフォルトの名無しさん
2016/11/01(火) 19:26:48.90ID:fE64ynNP 携帯絵文字は絶滅の危機
博物館で保護する必要がある
博物館で保護する必要がある
557デフォルトの名無しさん
2016/11/01(火) 20:47:25.98ID:E4vkOEuq MoMAに収蔵されたから大丈夫
558デフォルトの名無しさん
2016/11/01(火) 20:51:59.89ID:o060wXK0 MoMAって秘宝館レベルのものも集めてるイメージ
559デフォルトの名無しさん
2016/11/01(火) 22:32:57.89ID:SkcuWYL1 ゴミみたいな絵文字が増えるのはまだいい。
JPの2文字で日本の国旗、という
クソな絵文字を持ち込んだ奴は死刑でいい。
JPの2文字で日本の国旗、という
クソな絵文字を持ち込んだ奴は死刑でいい。
560デフォルトの名無しさん
2016/11/02(水) 01:14:19.91ID:FB0eoin4 MoMAに収蔵されたケータイ絵文字なんてほんの一部でしかないな
561デフォルトの名無しさん
2016/11/02(水) 02:56:25.72ID:pCipYitj >>556
オックスフォード辞典の「今年の言葉」の一つに選ばれてるくらい欧州でもインターネット上を絵文字が席巻してるんだぞ
オックスフォード辞典の「今年の言葉」の一つに選ばれてるくらい欧州でもインターネット上を絵文字が席巻してるんだぞ
562デフォルトの名無しさん
2016/11/02(水) 04:10:14.34ID:6UbvFxVg >>561
まさか Unicode Emoji と ケータイ絵文字の違いを知らない?
まさか Unicode Emoji と ケータイ絵文字の違いを知らない?
563デフォルトの名無しさん
2016/11/02(水) 04:27:56.03ID:pCipYitj564デフォルトの名無しさん
2016/11/02(水) 17:23:17.15ID:foEqKcGp >>563
560はそんな大雑把な話ではないでしょ
560はそんな大雑把な話ではないでしょ
565デフォルトの名無しさん
2016/11/03(木) 03:34:51.76ID:iYejUQc8 文字コードてすと
surströmming
surströmming
566デフォルトの名無しさん
2016/11/03(木) 19:21:23.08ID:SywuufG2567デフォルトの名無しさん
2016/11/04(金) 15:58:47.69ID:fFiZW1of568デフォルトの名無しさん
2016/11/04(金) 16:48:18.71ID:LPswLb4k >>567
え、なんだそれ。
てっきり1文字目用と2文字目用で別のポイントになってるのか、
あるいは始点か終点を示す符号があるんだと思ってた。
単に2文字続けば国、って仕様なのか。Unicodeも悪いな。
え、なんだそれ。
てっきり1文字目用と2文字目用で別のポイントになってるのか、
あるいは始点か終点を示す符号があるんだと思ってた。
単に2文字続けば国、って仕様なのか。Unicodeも悪いな。
569デフォルトの名無しさん
2016/11/04(金) 22:15:07.10ID:oa5V2Sux Unicode関係ないw
570デフォルトの名無しさん
2016/11/04(金) 22:48:05.41ID:z+k+W3df いや関係あるでしょ。
UTF-16のように1文字目と2文字目を分けておけばそんなことにはならなかった。
UTF-16のように1文字目と2文字目を分けておけばそんなことにはならなかった。
571デフォルトの名無しさん
2016/11/04(金) 23:05:51.48ID:uRr6P/SX TwitterがUnicodeに完全に対応してればそんなことにはならなかった。
572デフォルトの名無しさん
2016/11/04(金) 23:59:11.84ID:yGjCinWT573デフォルトの名無しさん
2016/11/05(土) 00:13:28.08ID:xEDyoPf+ 前後の区別がないと、SUSE とかのときどうするのか気になる。
単純に区切ると SU | SE で
[ソ連国旗] [スウェーデン国旗]
だけど、SU の国家は現存しない。
だとすると別の可能性として S | US | E 、つまり
[S] [米国国旗] [E]
もありえそう。
単純に区切ると SU | SE で
[ソ連国旗] [スウェーデン国旗]
だけど、SU の国家は現存しない。
だとすると別の可能性として S | US | E 、つまり
[S] [米国国旗] [E]
もありえそう。
574デフォルトの名無しさん
2016/11/05(土) 01:01:33.47ID:gWLGUGo0575デフォルトの名無しさん
2016/11/05(土) 01:16:57.65ID:mXzE/KRi どの2文字をペア扱いすべきかはISO国名コードの最新版に存在するかどうかを見ないと分からないってことか。ややこしいな。
576デフォルトの名無しさん
2016/11/05(土) 01:20:47.71ID:mXzE/KRi いや、最新版だけじゃだめなのか。過去のメールは送信当時のコード表を使わないと>>574みたいに半分ズレて別の国に化けるな。
577デフォルトの名無しさん
2016/11/05(土) 01:57:45.33ID:fdLm2JUj 既にGB-SCT(英国スコットランド)とか提案されてるし気にしても仕方ない
578デフォルトの名無しさん
2016/11/05(土) 04:17:16.49ID:fdfHcDbP >>572
偶数で切ることになっている
UAX#29
『Do not break within emoji flag sequences. That is, do not break between regional indicator (RI) symbols if there is an odd number of RI characters before the break』
『[^RI] (RI RI)* RI×RI』
UTS51
『A sequence of two Regional Indicator characters』
偶数で切ることになっている
UAX#29
『Do not break within emoji flag sequences. That is, do not break between regional indicator (RI) symbols if there is an odd number of RI characters before the break』
『[^RI] (RI RI)* RI×RI』
UTS51
『A sequence of two Regional Indicator characters』
579デフォルトの名無しさん
2016/11/05(土) 04:21:04.76ID:fdfHcDbP ↑の「×」はコードポイント列から一文字を抽出するときに
別の文字に切り離してはいけないという意味
別の文字に切り離してはいけないという意味
580デフォルトの名無しさん
2016/11/05(土) 07:07:22.79ID:r4TaQ56a581デフォルトの名無しさん
2016/11/05(土) 12:09:56.76ID:i7MWnHHH >>580
いい加減というか逆にめんどくさいことをわざわざって気がする
いい加減というか逆にめんどくさいことをわざわざって気がする
582デフォルトの名無しさん
2016/11/05(土) 14:59:08.75ID:vOTzCdKc >>577-578
GBSCTGBSCTと2つ並べるとGB SC TG BS CT に分解されそう(最後のCT以外全部あるっぽい)。
GBSCTGBSCTと2つ並べるとGB SC TG BS CT に分解されそう(最後のCT以外全部あるっぽい)。
583デフォルトの名無しさん
2016/11/05(土) 16:22:05.99ID:qKcyypJI DNAの塩基配列も文字コードになったんでしたっけ?
584デフォルトの名無しさん
2016/11/05(土) 16:44:27.42ID:9npC26KJ 絵とスタイルは別のフォーマットがあるんだからそっちに委ねるべきだよな
もともとそういう方針のはずだし
もともとそういう方針のはずだし
585デフォルトの名無しさん
2016/11/05(土) 17:02:26.62ID:9y8+ngHb >>577
GB-○○と同じ要領でJP-○○で都道府県旗も出せるようになるのかな、と思ったけど、
よく考えたらRIってアルファベットしかないから数字使うJP-○○は無理やん。欧米ずるい。
俺も神奈川県のおちんちんマーク出したい。
http://www.pref.kanagawa.jp/uploaded/image/700113.gif
GB-○○と同じ要領でJP-○○で都道府県旗も出せるようになるのかな、と思ったけど、
よく考えたらRIってアルファベットしかないから数字使うJP-○○は無理やん。欧米ずるい。
俺も神奈川県のおちんちんマーク出したい。
http://www.pref.kanagawa.jp/uploaded/image/700113.gif
586デフォルトの名無しさん
2016/11/05(土) 17:54:33.18ID:Cvv2kfJC iconvライブラリがマルチスレッド対応してない…。orz
587デフォルトの名無しさん
2016/11/05(土) 18:44:59.50ID:6heu2Wv+ ICUを使ってみては
588デフォルトの名無しさん
2016/11/05(土) 21:04:55.16ID:TjgsNfuE >>585
TK=東京とかKN=神奈川みたいなのを決めりゃいいじゃん
TK=東京とかKN=神奈川みたいなのを決めりゃいいじゃん
589デフォルトの名無しさん
2016/11/05(土) 21:24:55.77ID:BG7LImn0 絵文字のために3166-2:JPを更新するの?
590デフォルトの名無しさん
2016/11/05(土) 22:48:27.66ID:ALhaJQoB REGIONAL INDICATOR SYMBOLSってISO 3166-1の形式に従う必要はあったのだろうか
591デフォルトの名無しさん
2016/11/05(土) 23:08:08.40ID:BG7LImn0 従うというか、ISOに外部化しないとどの旗を収録するか(→どこを国家とみなすか)で揉めてしまう。
純粋に人任せにすることで「うちは政治的判断はしてませんよ」ってそ知らぬふりができる。
純粋に人任せにすることで「うちは政治的判断はしてませんよ」ってそ知らぬふりができる。
592デフォルトの名無しさん
2016/11/05(土) 23:31:17.53ID:Cvv2kfJC >>587
助言ありがとう。ICU、試してみます。
助言ありがとう。ICU、試してみます。
593592
2016/11/06(日) 15:59:49.80ID:0naNG629 iconvがマルチスレッド対応していないってのは私の勘違いだった。
icuとiconv、両方ともマルチスレッド対応していた。
Win32環境での文字コード変換の速度比は以下の通りになった。
Win32API は、WideCharToMultiByte() 等を使った。
Win32API : cygwin-iconv : cygwin-icu = 1 : 3 : 2
icuとiconv、両方ともマルチスレッド対応していた。
Win32環境での文字コード変換の速度比は以下の通りになった。
Win32API は、WideCharToMultiByte() 等を使った。
Win32API : cygwin-iconv : cygwin-icu = 1 : 3 : 2
594デフォルトの名無しさん
2016/11/06(日) 16:12:34.47ID:bCh//xB2 速度比?
時間比じゃなくて?
時間比じゃなくて?
595592
2016/11/06(日) 16:49:22.61ID:0naNG629596デフォルトの名無しさん
2016/11/06(日) 18:14:05.21ID:O2/niCOA597592
2016/11/06(日) 19:53:07.52ID:0naNG629 なぜiconvがマルチスレッド対応してないと思い込んでしまったかというと、
cygwinでC++11の thread クラスで work() と join() を使ったマルチスレッドの小さい勉強用プログラムを試しに書いたんだけど、
処理の所要時間を得るために、clock()で計時したんだけど、その数値がデタラメだったことが原因。
cygwinのclock()の戻り値の信頼性がここまで低いとは知らなかった。
>>596
了解。ハンドルを複数スレッドで使いまわすつもりは最初からなかったです。
ライブラリ関数内部で排他ロックしてるのかと思い込んだ私のミス。
処理速度・将来性・プロジェクトの活発さを考えると、iconvよりicuの方が有望に思える。
cygwinでC++11の thread クラスで work() と join() を使ったマルチスレッドの小さい勉強用プログラムを試しに書いたんだけど、
処理の所要時間を得るために、clock()で計時したんだけど、その数値がデタラメだったことが原因。
cygwinのclock()の戻り値の信頼性がここまで低いとは知らなかった。
>>596
了解。ハンドルを複数スレッドで使いまわすつもりは最初からなかったです。
ライブラリ関数内部で排他ロックしてるのかと思い込んだ私のミス。
処理速度・将来性・プロジェクトの活発さを考えると、iconvよりicuの方が有望に思える。
598デフォルトの名無しさん
2016/11/06(日) 20:21:34.70ID:t7rcT7E/ 次はmingwでもテストしてくれ
599592
2016/11/06(日) 23:12:19.37ID:0naNG629 mingw系は、GitやStrawberry Perlに付属のMINGWのbinがPATHに入り込んでいて、無事にmakeを貫徹することさえままならないので当分報告できない。あしからず。
600デフォルトの名無しさん
2016/11/06(日) 23:41:14.17ID:eMFucsGq プログラムを組むような人なら普通はPATHなんていくらでも変更出来るけど
ままならないなら仕方ない
ままならないなら仕方ない
601デフォルトの名無しさん
2016/11/07(月) 04:13:30.95ID:EaPQMBZD602デフォルトの名無しさん
2016/11/07(月) 15:01:03.67ID:/3CQ/LxZ これ以上片山に構わないで
603デフォルトの名無しさん
2016/11/07(月) 16:58:00.20ID:zyvBBkK2 >>582
マジレスしていいのかわからんがそれはISO 3166-1じゃなくてISO 3166-2だろと
マジレスしていいのかわからんがそれはISO 3166-1じゃなくてISO 3166-2だろと
604デフォルトの名無しさん
2016/11/07(月) 17:22:52.58ID:Tzo661xQ マジレスはいいが前後も読んだほうがより良い
605デフォルトの名無しさん
2016/11/07(月) 17:45:16.90ID:2+R9ECvu なお、3166-2のやつはRI使わない方向のようなのでほとんどの問題は解決されそう。
ただそうなるとますますあの不出来なRIって何だったのかって感じに。
ただそうなるとますますあの不出来なRIって何だったのかって感じに。
606592
2016/11/07(月) 22:27:59.51ID:6EByQkLc mingwでiconv, icuを試した。
iconvは、MINGW Installation Managerが提供するバイナリを使用した。
icuはバイナリは提供されていないのでソースからビルドした。
icuはそのままだとlocale関連のAPIが公開されていないMINGW版がビルドができないので、
_create_locale() と _free_locale() のダミー関数をソースに追記してビルドを通した。
所要時間の比は以下の通り。
MINGWだと、iconv、icuともWin32とあまり違いがないようだ。
Win32API : mingw-iconv : mingw-icu = 1 : 1.08 : 1.11
なお、>>593 でのcygwinは、iconv、icuともにcygwin用に提供されているバイナリを利用している。
iconvは、MINGW Installation Managerが提供するバイナリを使用した。
icuはバイナリは提供されていないのでソースからビルドした。
icuはそのままだとlocale関連のAPIが公開されていないMINGW版がビルドができないので、
_create_locale() と _free_locale() のダミー関数をソースに追記してビルドを通した。
所要時間の比は以下の通り。
MINGWだと、iconv、icuともWin32とあまり違いがないようだ。
Win32API : mingw-iconv : mingw-icu = 1 : 1.08 : 1.11
なお、>>593 でのcygwinは、iconv、icuともにcygwin用に提供されているバイナリを利用している。
607デフォルトの名無しさん
2016/11/08(火) 00:48:57.53ID:unHUC1CF cygwin1.dllとか軽油してるから遅いんだろ
608デフォルトの名無しさん
2016/11/08(火) 01:14:10.78ID:Q1ozlGt4 変換する文字列の長さが短すぎて
変換速度よりもsystem callの呼び出し速度のベンチになってない?
変換速度よりもsystem callの呼び出し速度のベンチになってない?
609デフォルトの名無しさん
2016/11/08(火) 09:16:34.50ID:WBfil5Sr 生の値(時間)を書くのが普通
比率という時点で何か隠してるようにみえる
比率という時点で何か隠してるようにみえる
610デフォルトの名無しさん
2016/11/08(火) 11:50:26.32ID:ZBAGJV1u するどいな
611592
2016/11/08(火) 20:34:22.36ID:qWOFxdzf 無駄な情報を捨てて必要な情報だけ提供した善意を、悪意を持って隠したと曲解する人がいて面白い。トランプ支持者っぽい。
テストプログラムやら実行環境やらまで公開して他の人が再現できるようにでもしない限り、生の実測時間を提示する意味はない。
テストプログラムやら実行環境やらまで公開して他の人が再現できるようにでもしない限り、生の実測時間を提示する意味はない。
612デフォルトの名無しさん
2016/11/08(火) 20:41:20.43ID:IHq5KhUT トランプ流れ弾
613デフォルトの名無しさん
2016/11/08(火) 22:32:50.94ID:HtqjUltN 同じ10倍でも例えばミリ秒のオーダーと秒のオーダーでは全然違う。
計測時間そのままコピペする方が楽だろうに、態々比率に直すのは、、、
パワポ資料作るお仕事の人と見た。
計測時間そのままコピペする方が楽だろうに、態々比率に直すのは、、、
パワポ資料作るお仕事の人と見た。
614デフォルトの名無しさん
2016/11/10(木) 16:00:00.53ID:UEg1zsO/ JIS X 0201/0208/0213がいつの間にか
> 2016-10-20 確認
になってる。
今回は特に何もなしか(あったらまた困るけど)
というか改正来年じゃなかったのか……。
> 2016-10-20 確認
になってる。
今回は特に何もなしか(あったらまた困るけど)
というか改正来年じゃなかったのか……。
615デフォルトの名無しさん
2016/11/10(木) 20:40:08.56ID:Ow2XdUNn 来年が色んな意味で楽しみだわ
616デフォルトの名無しさん
2016/11/11(金) 13:37:59.96ID:8vg+pXNE JISってそれぞれ何刷まで出てるんだっけ?
刷ごとの差分知りたい
刷ごとの差分知りたい
617デフォルトの名無しさん
2016/11/11(金) 15:58:27.67ID:Y1SxtmaI 0208の1978年版とか2012年版とかじゃなくて刷?
ttp://okazaki.sakuraweb.com/biboroku/78jis/78jis.html
によるとJIS C 6226-1978は少なくとも第7刷まで増刷されたらしいけど、
JSAとかJISCに問い合わせても多分当時の資料とか無いだろうな。
ttp://okazaki.sakuraweb.com/biboroku/78jis/78jis.html
によるとJIS C 6226-1978は少なくとも第7刷まで増刷されたらしいけど、
JSAとかJISCに問い合わせても多分当時の資料とか無いだろうな。
618デフォルトの名無しさん
2016/11/12(土) 15:38:19.16ID:q7jUFepj619デフォルトの名無しさん
2016/11/13(日) 13:47:22.48ID:ueOqX8wJ 78JIS以外は何刷でも内容一緒でしょ正誤票の反映はあるだろうけど
620デフォルトの名無しさん
2016/11/14(月) 16:40:47.78ID:nhwER5sG621デフォルトの名無しさん
2016/11/14(月) 16:57:09.25ID:YqiB904W なんでもかんでもZWJでいくなら最初から人間+魚でよかった。
そしてうっかり順番を入れ替えて魚+人間にすると……!!
そしてうっかり順番を入れ替えて魚+人間にすると……!!
622デフォルトの名無しさん
2016/11/14(月) 17:40:54.01ID:rIoU2mi1 マーパーソンwww
623デフォルトの名無しさん
2016/11/14(月) 17:48:16.83ID:rIoU2mi1 俺がもっとクールな新絵文字考えたぜつって、合字でオレオレ絵文字ZWJ実装するフォントが現れだして収集つかなくなりそう
624デフォルトの名無しさん
2016/11/14(月) 18:00:03.62ID:zlxXdLUF これはひどい
625デフォルトの名無しさん
2016/11/14(月) 18:50:06.09ID:YqiB904W >>623
うわありそうで怖い。
PUAと違って意味があるぶん、
大手が流行らせた合成絵文字はそのまま追認するしかない未来が見える。
例えばTwitterとか、Android OSとかがオレオレ絵文字実装したら
一般人が違いに気付かずに使って膨大な使用例ができるよね……
うわありそうで怖い。
PUAと違って意味があるぶん、
大手が流行らせた合成絵文字はそのまま追認するしかない未来が見える。
例えばTwitterとか、Android OSとかがオレオレ絵文字実装したら
一般人が違いに気付かずに使って膨大な使用例ができるよね……
626デフォルトの名無しさん
2016/11/15(火) 12:41:03.82ID:r6BgB6bM ZWJ方式は、合成されなくても意味は通じるってことでしょ
627デフォルトの名無しさん
2016/11/15(火) 13:27:53.08ID:U3Mmtdzs628デフォルトの名無しさん
2016/11/15(火) 21:17:34.07ID:gEiNDmpT ちゃんと色指定も加え入れろ〜
629デフォルトの名無しさん
2016/11/15(火) 21:50:35.83ID:PldPJ2O3 合成するぐらいなら
文字列の途中にエンコードしたビットマップを挟み込めるようにしろ
文字列の途中にエンコードしたビットマップを挟み込めるようにしろ
630デフォルトの名無しさん
2016/11/15(火) 21:55:34.62ID:cUgefh1P ─○○○
631デフォルトの名無しさん
2016/11/16(水) 02:59:36.67ID:zr+5k25B >>627
大きい丸自体が元をたどれば合成文字用なのが面白い
大きい丸自体が元をたどれば合成文字用なのが面白い
632デフォルトの名無しさん
2016/11/16(水) 02:59:39.09ID:fzskfnoe 談合三本
633デフォルトの名無しさん
2016/11/16(水) 03:01:10.13ID:fzskfnoe >>629
たしかに
たしかに
634デフォルトの名無しさん
2016/11/16(水) 16:58:25.31ID:uL/NV7s7 むしろ合成したいなら U+20DD COMBINING ENCLOSING CIRCLE なんじゃ
635デフォルトの名無しさん
2016/11/19(土) 01:04:22.83ID:/7Uc3cKm636デフォルトの名無しさん
2016/11/19(土) 21:24:14.40ID:h19DOfQp637デフォルトの名無しさん
2016/11/20(日) 03:55:56.72ID:pv3IyT3Y 古典の研究は資料の調査収集から始まる
638デフォルトの名無しさん
2016/11/24(木) 20:15:24.01ID:V+CGDzRP ーヲノイクゥ
イャサウクゥ
ケ篥ホクゥ
ケュナ邵ゥ
サースナクゥ
サウキチクゥ
ソキウ羣ゥ
タ鯱ユクゥ
タナイャクゥ
ツ郤衙ワ
ツ醋ャクゥ
トサシ雕ゥ
ナ郤ャクゥ
ニ猥ノクゥ
ニチナ邵ゥ
ニハフレクゥ
ノルサウクゥ
ハ。ー貂ゥ
ハ。イャクゥ
ハ。ナ邵ゥ
ハシクヒクゥ
ヒフウ、ニサ
マツイホサウクゥ
イャサウクゥ
ケ篥ホクゥ
ケュナ邵ゥ
サースナクゥ
サウキチクゥ
ソキウ羣ゥ
タ鯱ユクゥ
タナイャクゥ
ツ郤衙ワ
ツ醋ャクゥ
トサシ雕ゥ
ナ郤ャクゥ
ニ猥ノクゥ
ニチナ邵ゥ
ニハフレクゥ
ノルサウクゥ
ハ。ー貂ゥ
ハ。イャクゥ
ハ。ナ邵ゥ
ハシクヒクゥ
ヒフウ、ニサ
マツイホサウクゥ
639デフォルトの名無しさん
2016/11/25(金) 09:57:28.56ID:M66ENQJY 愛媛県
岡山県
高知県
広島県
三重県
山形県
新潟県
千葉県
静岡県
大阪府
大分県
鳥取県
島根県
奈良県
徳島県
栃木県
富山県
福井県
福岡県
福島県
兵庫県
北海道
和歌山県
岡山県
高知県
広島県
三重県
山形県
新潟県
千葉県
静岡県
大阪府
大分県
鳥取県
島根県
奈良県
徳島県
栃木県
富山県
福井県
福岡県
福島県
兵庫県
北海道
和歌山県
640デフォルトの名無しさん
2016/11/25(金) 12:21:36.58ID:n3LE76D7641デフォルトの名無しさん
2016/12/19(月) 05:55:33.94ID:rp7MwxOA さて
642デフォルトの名無しさん
2016/12/26(月) 16:22:22.18ID:dYEGDg58 ISO/IEC 10646:2016 (5th Edition)は2017になりそうだな。
643デフォルトの名無しさん
2016/12/26(月) 20:13:30.11ID:TRnwbnfO644デフォルトの名無しさん
2016/12/28(水) 05:19:29.60ID:cqk+d7uG コード?
645デフォルトの名無しさん
2016/12/28(水) 07:28:33.43ID:XevzpVey646デフォルトの名無しさん
2016/12/28(水) 07:35:34.89ID:XevzpVey >>160
昔の区点表現でいう2区毎にまとめて突っ込んだせいだろう。
昔の区点表現でいう2区毎にまとめて突っ込んだせいだろう。
647デフォルトの名無しさん
2016/12/28(水) 07:42:45.19ID:XevzpVey >>244
いわゆるハングルの大移動ですね。
いわゆるハングルの大移動ですね。
648デフォルトの名無しさん
2016/12/28(水) 09:58:25.05ID:aMFxqRcr 突然遠投大会始めるのやめてもらえます
649デフォルトの名無しさん
2016/12/28(水) 12:34:27.60ID:kFL7wfb2 >>644
50音カナで50進数にして管理してるんだと
50音カナで50進数にして管理してるんだと
650デフォルトの名無しさん
2016/12/28(水) 13:11:56.04ID:hpQZCApo カナって50個もあるの?
651デフォルトの名無しさん
2016/12/28(水) 13:14:02.87ID:45reyBmE もっとある
652デフォルトの名無しさん
2017/01/01(日) 20:44:48.93ID:4U7a/Vzr 明けましておめでとうございます
2017年の文字コード業界はどうなるやら
2017年の文字コード業界はどうなるやら
653デフォルトの名無しさん
2017/01/01(日) 21:18:20.53ID:9MvoRZrQ VCでUTF-8のBOM無し突っ込めると判ったのが2016の最大の収穫
654デフォルトの名無しさん
2017/01/06(金) 14:36:30.66ID:XtKi9eaG test
655デフォルトの名無しさん
2017/01/19(木) 22:54:33.86ID:xPn9j90t testだと?
656デフォルトの名無しさん
2017/01/19(木) 23:22:23.28ID:kAhgSygC ユニコードコンソーシアムのProposed New Charactersみてたら
HIRAGANA LETTER SMALL WI、HIRAGANA LETTER SMALL WE、HIRAGANA LETTER SMALL WO、
KATAKANA LETTER SMALL WI、KATAKANA LETTER SMALL WE、KATAKANA LETTER SMALL WO、
KATAKANA LETTER SMALL N
つまり小さい「ゐ」「ゑ」「を」「ヰ」「ヱ」「ヲ」「ン」があった。
小さい「こ」と「コ」は以前U+1B002とU+1B003に提案されてたが
そこは変体仮名が入ることになってU+1B127、U+1B128に変わってた。
変体仮名の数が多すぎてKana Supplementブロックに入り切らなかったから
その直後のU+1B100〜U+1B12FにKana Extended-Aブロックを作るんだな。
でU+1B100〜の予定だった女書は1B170〜にずれた。
HIRAGANA LETTER SMALL WI、HIRAGANA LETTER SMALL WE、HIRAGANA LETTER SMALL WO、
KATAKANA LETTER SMALL WI、KATAKANA LETTER SMALL WE、KATAKANA LETTER SMALL WO、
KATAKANA LETTER SMALL N
つまり小さい「ゐ」「ゑ」「を」「ヰ」「ヱ」「ヲ」「ン」があった。
小さい「こ」と「コ」は以前U+1B002とU+1B003に提案されてたが
そこは変体仮名が入ることになってU+1B127、U+1B128に変わってた。
変体仮名の数が多すぎてKana Supplementブロックに入り切らなかったから
その直後のU+1B100〜U+1B12FにKana Extended-Aブロックを作るんだな。
でU+1B100〜の予定だった女書は1B170〜にずれた。
657デフォルトの名無しさん
2017/01/19(木) 23:41:32.39ID:L5ppZzRV 荒らしは去れ
ここはトイレの落書きやお前の日記ではない
ここはトイレの落書きやお前の日記ではない
658デフォルトの名無しさん
2017/01/19(木) 23:58:14.21ID:xPn9j90t 佳那サプリメントでかいなあと思ってたのに足りなかったのか
659デフォルトの名無しさん
2017/01/20(金) 01:09:17.45ID:1c/0Zcpc >>656
女書ってなに?
女書ってなに?
660デフォルトの名無しさん
2017/01/20(金) 04:21:35.39ID:SuI25zgd 美乳
661デフォルトの名無しさん
2017/01/20(金) 08:06:23.41ID:B05iL6IP ↑いまだにEUC使ってる奴
662デフォルトの名無しさん
2017/01/20(金) 08:57:48.31ID:TRhLZIcU 芸柏l
663デフォルトの名無しさん
2017/01/20(金) 13:48:47.52ID:XOQ1SR2o 平成
664デフォルトの名無しさん
2017/01/20(金) 16:02:46.66ID:HZJT4SPy UTF-8と称しつつ実際はISO/IEC 8859-1(or Windows-1252)使ってるサイト早く絶滅しないかな〜。
665デフォルトの名無しさん
2017/01/20(金) 23:22:01.31ID:2XlTkpSB うむ
666デフォルトの名無しさん
2017/01/22(日) 23:54:36.79ID:I5eFmZgm シマンテックのインストーラー「Symantec? Veritas NetBackup?をインストールします」
俺「俺は今 何をインストールしているんだぜ…?」
俺「俺は今 何をインストールしているんだぜ…?」
667デフォルトの名無しさん
2017/01/23(月) 13:38:14.82ID:vFvi2mPp マカフィー()よりまし
668デフォルトの名無しさん
2017/01/25(水) 14:44:24.88ID:/N/oPPcM ©と®が化けるのはあるある
669デフォルトの名無しさん
2017/01/25(水) 15:54:19.97ID:O1e4fHbH Windows 2000あたりのセットアップ画面(ブルースクリーン)は左上に
ソソソソソソソ
みたいなのが並んでた気がするんだけどあれは何が化けていたんだろう。
ソソソソソソソ
みたいなのが並んでた気がするんだけどあれは何が化けていたんだろう。
671デフォルトの名無しさん
2017/01/25(水) 23:28:05.93ID:yhKKEJSl CP237?
672デフォルトの名無しさん
2017/02/03(金) 11:13:08.06ID:qUN7oehH >>669
頭にオがあったんじゃないかな
頭にオがあったんじゃないかな
673デフォルトの名無しさん
2017/02/03(金) 15:53:54.77ID:AImPimr2 ソじゃなくてヘだな
Windows 2000 Setup
ヘヘヘヘヘヘヘヘヘヘヘヘヘヘヘヘヘヘヘヘ
Windows 2000 Setup
ヘヘヘヘヘヘヘヘヘヘヘヘヘヘヘヘヘヘヘヘ
674デフォルトの名無しさん
2017/02/06(月) 16:58:49.11ID:1iv5Awq0 >>669-673
なるほど、
https://en.wikipedia.org/wiki/Code_page_437
https://ja.wikipedia.org/wiki/JIS_X_0201
最初は CP437 の 0xCD “═” だったのが
何かの拍子にシフトJISとして解釈されて
JIS X 0201 の 0xCD “ヘ” に化けたということか。
なるほど、
https://en.wikipedia.org/wiki/Code_page_437
https://ja.wikipedia.org/wiki/JIS_X_0201
最初は CP437 の 0xCD “═” だったのが
何かの拍子にシフトJISとして解釈されて
JIS X 0201 の 0xCD “ヘ” に化けたということか。
675デフォルトの名無しさん
2017/02/06(月) 21:27:31.96ID:oVOmv7r6676デフォルトの名無しさん
2017/02/19(日) 22:58:26.35ID:IU+vTkdD ISO/IEC 10646 - Information technology -- Universal Coded Character Set (UCS)
http://www.iso.org/iso/catalogue_detail.htm?csnumber=69119
ISO/IEC 10646:2017 (5th Edition) がいつの間にか published になってた。
Publicly Available Standards へ追加マダァ-? (・∀・ )っ/凵⌒☆チンチン
http://www.iso.org/iso/catalogue_detail.htm?csnumber=69119
ISO/IEC 10646:2017 (5th Edition) がいつの間にか published になってた。
Publicly Available Standards へ追加マダァ-? (・∀・ )っ/凵⌒☆チンチン
677デフォルトの名無しさん
2017/02/20(月) 22:24:53.34ID:coRAUu9w >いつの間にか published になってた
文盲ってどうしようもないですねホント
文盲ってどうしようもないですねホント
678デフォルトの名無しさん
2017/02/20(月) 23:48:25.19ID:SiY39E3I regional flagsって日本の都道府県旗も追加されんの?
東京の旗が銀杏か肛門かで揉めそう
東京の旗が銀杏か肛門かで揉めそう
679デフォルトの名無しさん
2017/02/21(火) 00:45:25.29ID:nlr0ZxeU ってか日本の都道府県旗ってJISか何かで規格化されてるんだろうか
されてないなら根拠になる個別の条例を探して判断することになるのか
されてないなら根拠になる個別の条例を探して判断することになるのか
680デフォルトの名無しさん
2017/02/21(火) 23:08:13.81ID:YiL5XD0V 東京のマンコマークと神奈川のチンチンびろーんは世界の恥
681デフォルトの名無しさん
2017/02/22(水) 03:17:26.03ID:4ggKEg2C 旗の形ではなく県章部分だけでグリフ作ってもらえたらいろいろ独創的な応用が利きそうだ。
682デフォルトの名無しさん
2017/02/22(水) 18:49:19.58ID:/iBgHjnm >>679
絵と絵文字は別物やで
絵と絵文字は別物やで
683デフォルトの名無しさん
2017/02/22(水) 21:52:33.48ID:h5L2bR5S684デフォルトの名無しさん
2017/02/22(水) 22:31:09.15ID:j43AF9m9 もう憲法とか国境の位置もJIS規格で管理しちゃえよ
685デフォルトの名無しさん
2017/02/23(木) 13:21:45.70ID:eG9NqkD/686デフォルトの名無しさん
2017/02/23(木) 13:22:51.89ID:eG9NqkD/ >>681
自分でやれ
自分でやれ
687デフォルトの名無しさん
2017/02/23(木) 18:33:49.17ID:g/wbAq9q >>683
仕様書読もうな
仕様書読もうな
688デフォルトの名無しさん
2017/02/23(木) 19:43:12.70ID:lh6GP4kZ 🏳️🌈
🏴☠️
🏴☠️
689デフォルトの名無しさん
2017/02/23(木) 23:02:08.28ID:Mc4LemLc690デフォルトの名無しさん
2017/03/02(木) 13:04:44.68ID:Dk3HQyow 仕様を読んだ上でそんなこと言ってるなら、読解力が足りないとしか言えないわ
691デフォルトの名無しさん
2017/03/02(木) 15:42:40.27ID:fgh+r4bY せっかく亀レスするならもうちょっと具体的に言えたほうがいいと思う
692デフォルトの名無しさん
2017/03/03(金) 19:38:34.87ID:r16C7uTR もういくつ寝るとunicode10
ゾンビとか吸血鬼とかせっそうなさすぎ
こんな絵文字使われるのかよ
ゾンビとか吸血鬼とかせっそうなさすぎ
こんな絵文字使われるのかよ
693デフォルトの名無しさん
2017/03/03(金) 22:57:47.99ID:m0VSWGlS もう幾つ寝るとISO 10646発売
あと一週間ぐらいで出るだろきっと
あと一週間ぐらいで出るだろきっと
694デフォルトの名無しさん
2017/03/04(土) 12:37:47.12ID:GRvQ2lmz695デフォルトの名無しさん
2017/03/04(土) 17:17:33.70ID:eGgxEr5u すべての文字を収めるが目的のはずが
新しいアイコンを作ろうになってるからな
新しいアイコンを作ろうになってるからな
696デフォルトの名無しさん
2017/03/04(土) 23:52:53.04ID:+pEijc2g 絵文字なんか作ったってフォントごとに微妙に変わるし不毛だよ
何種類用意したって満足ってことはないし、無駄な仕事が増えるだけ
それならむしろ、エンコードしたビットマップかベクタグラフィックを
文字列の途中に文字として挿入できるようにしたほうがマシだろ
何種類用意したって満足ってことはないし、無駄な仕事が増えるだけ
それならむしろ、エンコードしたビットマップかベクタグラフィックを
文字列の途中に文字として挿入できるようにしたほうがマシだろ
697デフォルトの名無しさん
2017/03/05(日) 00:03:46.99ID:xrJm/RDc 100種類用意しました
1000種類用意しました
10000種類用意しました
・・・
どこまでいってもこんなものは・・・
絵文字っていわゆるラインスタンプみたいな使われ方を想定しているんだろ?
すべてのラインスタンプに文字コードを割り振るみたいなものだ
時代に合ってない
文字列の途中にビットマップかベクタグラフィックを挟み込める方が絶対良いって
そうすると当然絵文字職人みたいな人たちが出てきてにぎわうだろうから
それをコピペして使えばよいのだ
標準化委員会みたいな中央で絵の形とコードを取り決めて・・・ってスタイルは時代遅れだよ
ラインスタンプを見ろよ
1000種類用意しました
10000種類用意しました
・・・
どこまでいってもこんなものは・・・
絵文字っていわゆるラインスタンプみたいな使われ方を想定しているんだろ?
すべてのラインスタンプに文字コードを割り振るみたいなものだ
時代に合ってない
文字列の途中にビットマップかベクタグラフィックを挟み込める方が絶対良いって
そうすると当然絵文字職人みたいな人たちが出てきてにぎわうだろうから
それをコピペして使えばよいのだ
標準化委員会みたいな中央で絵の形とコードを取り決めて・・・ってスタイルは時代遅れだよ
ラインスタンプを見ろよ
698デフォルトの名無しさん
2017/03/05(日) 23:06:39.70ID:nindsAFW たしかに
特定のコードとそれに続く何byteかでbitmap図形っていうのはありかもね
無駄多いけど
特定のコードとそれに続く何byteかでbitmap図形っていうのはありかもね
無駄多いけど
699デフォルトの名無しさん
2017/03/06(月) 08:18:41.33ID:n/Fv95sm 最近の追加は絵文字じゃなくて絵になってるからな
文字コードに色を定義したり芯のない継接ぎ仕様でやりたい放題だよな
文字コードに色を定義したり芯のない継接ぎ仕様でやりたい放題だよな
700デフォルトの名無しさん
2017/03/14(火) 14:00:09.20ID:+au4v4OR Unicode 10、変体仮名と縦書きレイアウト導入へ | マイナビニュース
http://news.mynavi.jp/news/2017/03/13/110/
http://news.mynavi.jp/news/2017/03/13/110/
701デフォルトの名無しさん
2017/03/15(水) 08:13:46.98ID:eV3tx5Ei 縦書きテキストレイアウトってまたおかしなことになってんな
変体仮名は文字情報基盤の範囲ならいいんじゃね
変体仮名は文字情報基盤の範囲ならいいんじゃね
702デフォルトの名無しさん
2017/03/15(水) 08:24:44.07ID:oPhy6OQw 縦書きレイアウトって前からあるこれのアップデートのことじゃないの?
http://www.unicode.org/reports/tr50/tr50-18.html#Modifications
「導入」ってのはその記事の誤認っぽい
http://www.unicode.org/reports/tr50/tr50-18.html#Modifications
「導入」ってのはその記事の誤認っぽい
703デフォルトの名無しさん
2017/03/15(水) 11:37:12.40ID:7YWEdixI |のカーニングがおかしいとか
704デフォルトの名無しさん
2017/03/15(水) 15:48:49.66ID:tq6fONxP 「導入」ってのは
> さらに、Unicode Vertical Text Layoutが標準の一部として取り込まれる点が注目される。
って本文に書いてあるんだから Unicode® Technical Report が Unicode® Standard Annex に昇格して
Unicode® Standard の一部になるってことでしょ。
> さらに、Unicode Vertical Text Layoutが標準の一部として取り込まれる点が注目される。
って本文に書いてあるんだから Unicode® Technical Report が Unicode® Standard Annex に昇格して
Unicode® Standard の一部になるってことでしょ。
705デフォルトの名無しさん
2017/03/28(火) 20:45:37.67ID:2V3Jlzjb おう吐・ゾンビ・授乳などUnicodeに新しい絵文字69種類が追加される
http://gigazine.net/news/20170328-69-new-emojis-announced/
http://gigazine.net/news/20170328-69-new-emojis-announced/
706デフォルトの名無しさん
2017/03/28(火) 22:50:13.41ID:ky5+niZ/ こんだけ増えてくると幾らアホなアメリカ人でも
UTF-16捨てたくなってくるだろ
UTF-16捨てたくなってくるだろ
707デフォルトの名無しさん
2017/03/29(水) 08:08:48.71ID:81RbfoHk こういう流行り廃りのあるものはMarkdown emojiのようなやり方で十分だしそっちの方が
便利だと思うがなぁ。そもそも欧米の連中、Unicode入力のためにIMEとか導入してるんだろうか?
便利だと思うがなぁ。そもそも欧米の連中、Unicode入力のためにIMEとか導入してるんだろうか?
708デフォルトの名無しさん
2017/03/29(水) 12:59:49.14ID:v2ySqvAX イングランド、スコットランド、ウェールズは入れたのに北アイルランドは入れなかったのか
しかし U+1F3F4 U+E0067 U+E0062 U+E0065 U+E006E U+E0067 U+E007F を一つの国旗として処理しろってそれは
しかし U+1F3F4 U+E0067 U+E0062 U+E0065 U+E006E U+E0067 U+E007F を一つの国旗として処理しろってそれは
709デフォルトの名無しさん
2017/03/29(水) 14:50:05.48ID:IUBNo9UW ほらもうこれ、いったい何に使うのっていう
ラインスタンプと比べるともはや・・・
まるで社会主義国家のようだし
今の時代の速度感と全然合ってないんですけど
ラインスタンプと比べるともはや・・・
まるで社会主義国家のようだし
今の時代の速度感と全然合ってないんですけど
710デフォルトの名無しさん
2017/03/29(水) 17:07:28.23ID:WAel0act >>706
UTF-8ならいいの?
UTF-8ならいいの?
711デフォルトの名無しさん
2017/03/29(水) 18:47:22.40ID:pMdWiHKE712デフォルトの名無しさん
2017/03/29(水) 21:14:02.55ID:81RbfoHk 「emojiが使えないUTF-16はオワコン」て意味かと思った。
713デフォルトの名無しさん
2017/03/30(木) 01:24:25.07ID:4z103Fgo iOS 10.3リリース、ファイルシステムがHFS+からAPFSに変更される
https://apple.srad.jp/story/17/03/29/0852227/
Apple、Unicode正規化(もどき)やめるってよ
https://apple.srad.jp/story/17/03/29/0852227/
Apple、Unicode正規化(もどき)やめるってよ
714デフォルトの名無しさん
2017/03/30(木) 07:57:02.00ID:HGkR55tR U+41 U+0307 U+0308と
U+41 U+0308 U+0307のファイルが同時に作成できるのかな
U+41 U+0308 U+0307のファイルが同時に作成できるのかな
715デフォルトの名無しさん
2017/03/31(金) 16:24:48.85ID:jxXitrEX716デフォルトの名無しさん
2017/03/31(金) 18:39:57.95ID:cAvSJqfg > 少なくとも検索に関しては、「ガ」と「ガ」を同じにみなす必要があり、
> <U+FF76 U+FF9E>とU+30ACと<U+30AB U+3099>とを、 全て同じだとみなす必要があるということでしょう。
安岡は何当たり前のこと言ってんだ
JIS信者のクセに慣れないUnicodeについて語るとこういった低レベルな恥ずかしい記事になる
> <U+FF76 U+FF9E>とU+30ACと<U+30AB U+3099>とを、 全て同じだとみなす必要があるということでしょう。
安岡は何当たり前のこと言ってんだ
JIS信者のクセに慣れないUnicodeについて語るとこういった低レベルな恥ずかしい記事になる
717デフォルトの名無しさん
2017/04/01(土) 22:40:22.15ID:7/71KzK1 濁点は独立したコードポイントを持っていても結合文字みたいなものだし、
U+30AB U+309B の場合も「ガ」と同じにみなすべきだろうね、検索の場合
U+30AB U+309B の場合も「ガ」と同じにみなすべきだろうね、検索の場合
718デフォルトの名無しさん
2017/04/01(土) 23:09:58.41ID:LH/rwisT Unicode(NFKD)的には
「ガ」=「ガ」≠「カ゛」=「カ ゙」
だな
「ガ」=「ガ」≠「カ゛」=「カ ゙」
だな
719デフォルトの名無しさん
2017/04/07(金) 00:08:24.84ID:qNFTJj2D U+10FFFFまで埋めないと死んじゃう病にでもかかってるのかね、粗製濫造してんのは
720デフォルトの名無しさん
2017/04/07(金) 16:00:25.62ID:3NFvJvaJ まだ丸々10面分空いてるからな
721デフォルトの名無しさん
2017/04/12(水) 14:45:57.95ID:jhOW+nqF 正規化が悪なんじゃなくて、正規化を表に出す事が悪なんだよ
パソコンを裸族で使う様なもんだ
素人にはオススメできない
パソコンを裸族で使う様なもんだ
素人にはオススメできない
722デフォルトの名無しさん
2017/04/13(木) 18:03:47.78ID:TzW03HI9723デフォルトの名無しさん
2017/04/25(火) 06:30:16.64ID:DObvS+Kg >>712
UTF-16で使えるじゃん?UCS-2と勘違いしてる?
UTF-16で使えるじゃん?UCS-2と勘違いしてる?
724デフォルトの名無しさん
2017/04/26(水) 12:16:19.33ID:im3ukcX1 そうじゃない
725デフォルトの名無しさん
2017/05/11(木) 08:21:06.84ID:49ESVgQe 多言語制定で見えてきた課題を一挙に解決してUnicode Neueでも立ち上げたらいいのに
バグをバグのまま残さなきゃいけないなんて仕様として不健全すぎるわ
バグをバグのまま残さなきゃいけないなんて仕様として不健全すぎるわ
726デフォルトの名無しさん
2017/05/11(木) 22:00:06.44ID:wyUnsmEB 何故ドイツ語
727デフォルトの名無しさん
2017/05/17(水) 12:41:42.49ID:EJfTNRw9 フォントでよく使うからね
728デフォルトの名無しさん
2017/05/20(土) 12:07:31.13ID:GVSnCE+6 ISO 10646って2月に発行フェーズ入ったのにまだ発行できてないのは
何やってんだ?
何やってんだ?
729デフォルトの名無しさん
2017/05/24(水) 16:48:47.75ID:u+M8iI76 ISO/IECの仕事が遅いのはいつものこと
730デフォルトの名無しさん
2017/05/26(金) 12:00:03.39ID:4g2o9CtM Unicode の Core Specification の日本の元号の説明(日付)が間違ってるのはいつ修正されるんだろう?
731デフォルトの名無しさん
2017/05/26(金) 17:54:06.19ID:RyqPFjFC >>730
知らんが参考までに説明箇所を教えて
知らんが参考までに説明箇所を教えて
732デフォルトの名無しさん
2017/05/26(金) 22:00:22.89ID:mIO9asAV733デフォルトの名無しさん
2017/05/27(土) 03:01:17.90ID:V3ffhZkY >>730-732
TZを間違って読んでるだけでは?
TZを間違って読んでるだけでは?
734デフォルトの名無しさん
2017/05/27(土) 03:15:47.09ID:hVyPua6a ヒカル TV出演「年間5億は稼ぐ勢いですね」
https://www.youtube.com/watch?v=G7qL6ftpets
第1回案件王ランキング!YouTuberで1番稼いでるのは誰だ!
https://www.youtube.com/watch?v=asF2wQ2xhjY&t=61s
ユーチューバーの儲けのカラクリを徹底検証!
https://www.youtube.com/watch?v=FUSb4erJSXE&t=504s
YouTuberになりたいのは馬鹿じゃない!YouTuberになる方法
https://www.youtube.com/watch?v=Fr0WXXZRMSQ
最高月収5000万円だとさ。年収じゃなくて「月収」な
おまえらもyoutubeに動画投稿したほうがいい
最低2年はやらないとここまではいかないだろうけど才能とアイデアと
企画力と継続力があればが大儲けできる可能性がなくもない
まだまだ他の職種に比べれば競争率は低いからオススメ
https://www.youtube.com/watch?v=G7qL6ftpets
第1回案件王ランキング!YouTuberで1番稼いでるのは誰だ!
https://www.youtube.com/watch?v=asF2wQ2xhjY&t=61s
ユーチューバーの儲けのカラクリを徹底検証!
https://www.youtube.com/watch?v=FUSb4erJSXE&t=504s
YouTuberになりたいのは馬鹿じゃない!YouTuberになる方法
https://www.youtube.com/watch?v=Fr0WXXZRMSQ
最高月収5000万円だとさ。年収じゃなくて「月収」な
おまえらもyoutubeに動画投稿したほうがいい
最低2年はやらないとここまではいかないだろうけど才能とアイデアと
企画力と継続力があればが大儲けできる可能性がなくもない
まだまだ他の職種に比べれば競争率は低いからオススメ
735デフォルトの名無しさん
2017/05/29(月) 19:03:28.51ID:K4hEGofc >>733
そうじゃないけど、定義としてTZは付与すべきだね
そうじゃないけど、定義としてTZは付与すべきだね
736デフォルトの名無しさん
2017/05/31(水) 17:05:54.16ID:uv8MtfX4 TZってちんちんズルムケの略?
737デフォルトの名無しさん
2017/06/01(木) 03:44:11.18ID:82KsO+uD time zone
738デフォルトの名無しさん
2017/06/01(木) 11:37:45.12ID:o/dQD8LP thin skin zone
739デフォルトの名無しさん
2017/06/02(金) 21:34:26.48ID:Hl9pjX1u740デフォルトの名無しさん
2017/06/03(土) 09:51:38.32ID:LcU0sJDm 寒いからもういいよ
741デフォルトの名無しさん
2017/06/04(日) 21:55:56.10ID:mjDwcbxw 正直旗イメージより「伊」「蘭」「仏」とかで表示してくれたほうがわかりやすい国もある
742デフォルトの名無しさん
2017/06/09(金) 22:09:35.50ID:PK+Q1cYY WG2 N4825によると1B130〜1B16FはSmall Kana Extensionにすることにしたらしい
でもreserved forなんてやるくらいなら、使用例があるものはとっとと入れちゃえばいいのに
でもreserved forなんてやるくらいなら、使用例があるものはとっとと入れちゃえばいいのに
743デフォルトの名無しさん
2017/06/09(金) 22:31:03.58ID:7OSi6V+4 何に使えるのかな
ちっちゃいウンコが書けるようになるぐらいしか思いつかなかった
ちっちゃいウンコが書けるようになるぐらいしか思いつかなかった
744デフォルトの名無しさん
2017/06/10(土) 01:15:56.46ID:g45QxHo0 http://www.unicode.org/wg2/docs/n4825-pdam2chart.pdf#page=15
annotationは消さない方がいいんじゃないかな…
annotationは消さない方がいいんじゃないかな…
745デフォルトの名無しさん
2017/06/11(日) 14:49:02.11ID:GyEdwZPX URLが2ちゃんねるアートだと?
746デフォルトの名無しさん
2017/06/21(水) 08:20:53.06ID:GaxJdSrE Announcing The Unicode Standard, Version 10.0
http://blog.unicode.org/2017/06/announcing-unicode-standard-version-100.html
http://blog.unicode.org/2017/06/announcing-unicode-standard-version-100.html
747デフォルトの名無しさん
2017/06/21(水) 10:16:00.01ID:bqANLNSg mage
まげ
まげ
748デフォルトの名無しさん
2017/06/21(水) 12:15:04.06ID:GUHwFNed もう月次のバージョンアップでいいからCore specificationとUCDの改版を分離してくれ
749デフォルトの名無しさん
2017/06/21(水) 16:48:48.95ID:Rg8XGBQ1 Unicode 10.0出たのね
CodeCharts.pdfが100MB超えして落とすの&開くのだるい
CodeCharts.pdfが100MB超えして落とすの&開くのだるい
750デフォルトの名無しさん
2017/06/23(金) 14:19:48.92ID:xOTwvtKW 例示字形でフォント作ってくれないかね
とりあえず表示できればいいっていう場面は意外と多いと思うんだけど
とりあえず表示できればいいっていう場面は意外と多いと思うんだけど
751デフォルトの名無しさん
2017/06/23(金) 14:44:56.43ID:0OdP20aK 2byte+任意の8x64byteみたいなbitmap造ってくれないかな
752デフォルトの名無しさん
2017/06/23(金) 18:53:47.09ID:m93LamaP >>750
Noto Fontって全部カバーしてるんじゃないの?
Noto Fontって全部カバーしてるんじゃないの?
753デフォルトの名無しさん
2017/06/23(金) 22:22:21.49ID:JgWE6lrM Googleはそのつもりなのかもしれないけど、実際にはカバーできてないよ
符号化済みの漢字だけで1フォントの収納限界グリフ数(65535)を超えちゃってるから
全部カバーしようと思ったら漢字フォントだけでも2つ以上に分けないといけない
それなのにNoto CJKは、PanCJKという思想で漢字だけじゃなく仮名やハングルまで
1フォントに押し込んでしまった
おかげでUnicode 10で符号化された変体仮名なんかも入れるスペースがない
符号化済みの漢字だけで1フォントの収納限界グリフ数(65535)を超えちゃってるから
全部カバーしようと思ったら漢字フォントだけでも2つ以上に分けないといけない
それなのにNoto CJKは、PanCJKという思想で漢字だけじゃなく仮名やハングルまで
1フォントに押し込んでしまった
おかげでUnicode 10で符号化された変体仮名なんかも入れるスペースがない
754デフォルトの名無しさん
2017/06/23(金) 23:32:51.59ID:vCpZUNAe 変体仮名がついにUnicodeに追加されたんだな。
戸籍名に変体仮名が含まれてる可能性のある世代が存命中に間に合ってよかった。
戸籍名以外でも店の看板とかに使われてる事もあって、
うなぎ屋で「うなぎ」の「な」が「ふ」の真ん中を「ち」に変えたようなの(U+1B081)
になってるのは割りと良く見かける。
戸籍名に変体仮名が含まれてる可能性のある世代が存命中に間に合ってよかった。
戸籍名以外でも店の看板とかに使われてる事もあって、
うなぎ屋で「うなぎ」の「な」が「ふ」の真ん中を「ち」に変えたようなの(U+1B081)
になってるのは割りと良く見かける。
755デフォルトの名無しさん
2017/06/25(日) 17:45:14.96ID:tWAgqwx7 筆記体をそのまま活字体にしちゃうって凄いよな
ハシゴ高もそうだけど
ハシゴ高もそうだけど
756デフォルトの名無しさん
2017/06/25(日) 18:02:05.37ID:gomAIGS/ ひらがな
757デフォルトの名無しさん
2017/06/25(日) 22:38:53.97ID:zF3XL20Z Unicodeに変体仮名が追加されても、使えるのはUnicode文書の中だけで
戸籍に使えるかは別
戸籍に使えるかは別
758デフォルトの名無しさん
2017/06/26(月) 00:33:59.69ID:fDlZrHxT とりあえずTwitterできもい絵文字の部品として使われることになるだろう
759デフォルトの名無しさん
2017/06/26(月) 02:51:52.22ID:rSD39/hr テスト
👲👲🏻👲🏼👲🏽👲🏾👲🏿
👲👲🏻👲🏼👲🏽👲🏾👲🏿
760デフォルトの名無しさん
2017/06/26(月) 03:23:15.72ID:gnk9fC9R 白黒絵文字だと昔のカルピスみたいになるな
761デフォルトの名無しさん
2017/06/26(月) 17:57:52.21ID:sAGGquQo 変体仮名収録のフォントがOSに標準で搭載されるのはまだ先になりそうだな。
2chやツイッター等使われるのはそれからだな。
2chやツイッター等使われるのはそれからだな。
762デフォルトの名無しさん
2017/06/26(月) 21:13:39.72ID:/feRpqyj そんな先なん?
763デフォルトの名無しさん
2017/06/26(月) 22:44:02.89ID:WlgsC+Eb ハンドルネームに変体仮名使う人出てきそう。
764デフォルトの名無しさん
2017/06/26(月) 23:10:27.44ID:Sqt2RVbj Winはゴシックの方は対応しそうな気がする
Macは基本的にAJ1-6にないものはスルーだろうな
Macは基本的にAJ1-6にないものはスルーだろうな
765デフォルトの名無しさん
2017/06/27(火) 00:41:43.27ID:GjRmAHNy Androidは
766デフォルトの名無しさん
2017/06/27(火) 14:32:14.63ID:41er5Tk4 スレタイに使う人はまだか
767デフォルトの名無しさん
2017/06/29(木) 19:09:37.83ID:iu0jBoKG Android 6.0以降はNoto Sansだしすぐ対応するんじゃね
768デフォルトの名無しさん
2017/06/30(金) 23:42:15.21ID:41SVCjyH 変体仮名には濁点や半濁点付きもあるけど、それらはやはり合成用濁点(U+3099)や半濁点(U+309A)を付けて表わせなのかな。
769デフォルトの名無しさん
2017/07/01(土) 10:27:57.00ID:hIU8+r86 http://www.unicode.org/Public/10.0.0/ucd/UnicodeData.txt
UnicodeData.txt の Decomposition_Mapping フィールドに対応が書いてないから駄目です。
UnicodeData.txt の Decomposition_Mapping フィールドに対応が書いてないから駄目です。
770デフォルトの名無しさん
2017/07/01(土) 15:51:26.25ID:YT5a66Js それは分解用じゃ…
771デフォルトの名無しさん
2017/07/01(土) 17:04:49.87ID:SORKQB4S 全然違ったか、スレ汚してすまん(´・ω・`)
772デフォルトの名無しさん
2017/07/01(土) 17:19:00.11ID:nV0voxDD Decomposition_Mappingは結合の目的も兼ねるので
むしろ「書いてないからこそ自分で結合」
むしろ「書いてないからこそ自分で結合」
773デフォルトの名無しさん
2017/07/01(土) 21:16:57.49ID:YT5a66Js >>772
結合先ないじゃん
結合先ないじゃん
774デフォルトの名無しさん
2017/07/02(日) 22:35:50.76ID:UYpoTCPe 合成先が定義されていないのでU+3099を用いて自分で結合
ではないだろうか
ではないだろうか
775デフォルトの名無しさん
2017/07/03(月) 14:09:44.66ID:AyrgAZeL 最初からそう言ってるけど
776デフォルトの名無しさん
2017/07/05(水) 11:51:24.01ID:Qpg00Afa このようにしてバベルの塔は進捗しております
777デフォルトの名無しさん
2017/07/06(木) 02:31:15.80ID:VUvDmuBp 絵文字をぶっ込んできたのは、神の御業ってことか
778デフォルトの名無しさん
2017/07/12(水) 08:29:42.86ID:pZQyr2Pt IVSとaj1、汎用の兼ね合いを聞くに、文字セットの粒度の違いって漢字に限らず全ての文字セットに共通の問題だな。
声の大きい人がいる漢字カテでしか語られないけど
声の大きい人がいる漢字カテでしか語られないけど
779デフォルトの名無しさん
2017/07/18(火) 12:07:21.65ID:Y15ZUQ7r アップル、年内追加の絵文字を公開--恐竜やゾンビ、シマウマも - CNET Japan
https://japan.cnet.com/article/35104330/
追加するのは良いけど、新規ばっかり注力してないで仕様バグ直す努力して欲しい
https://japan.cnet.com/article/35104330/
追加するのは良いけど、新規ばっかり注力してないで仕様バグ直す努力して欲しい
780デフォルトの名無しさん
2017/07/18(火) 19:43:33.65ID:cVXFU6mc 顔から緑のが出てるやつ、それ普通に吐いてる絵文字だったんだな
緑だから野菜嫌いな子供みたいな意味なのかなと思ってた。
緑だから野菜嫌いな子供みたいな意味なのかなと思ってた。
781デフォルトの名無しさん
2017/07/19(水) 22:46:24.80ID:vMGHf8tr 「外字」という言葉、使えなくなるかな。同音異義語の差別用語を連想するから。
これからは「ユーザ定義文字」や「ベンダ定義文字」、「私用文字」、「規格外文字」とかに置き換えるべきかな。
これからは「ユーザ定義文字」や「ベンダ定義文字」、「私用文字」、「規格外文字」とかに置き換えるべきかな。
782デフォルトの名無しさん
2017/07/19(水) 23:22:55.87ID:Zx0RLH/I プア
783デフォルトの名無しさん
2017/07/20(木) 03:43:36.69ID:Y+E7uZ+G >>781
外人は外人だろうになあ
外人は外人だろうになあ
784デフォルトの名無しさん
2017/07/20(木) 07:15:13.80ID:5rqzfieT >>781
変な言葉狩りやめろ
変な言葉狩りやめろ
785デフォルトの名無しさん
2017/07/20(木) 12:32:55.14ID:IUJJzkHn 「外字」という表記はそのままで、
読みを変えて「そとじ」と言うことにしよう。
読みを変えて「そとじ」と言うことにしよう。
786デフォルトの名無しさん
2017/07/20(木) 17:08:30.52ID:721tcuSC タト字
787デフォルトの名無しさん
2017/07/24(月) 19:30:26.36ID:SPeDMBVA ISO 10646が「Publication date : 2017-07」になっている
そろそろ本気だす頃?
そろそろ本気だす頃?
788デフォルトの名無しさん
2017/07/25(火) 23:23:42.52ID:LLM1ZCjk 「がいじ」と聞くと昔から文字コードヲタの自分はやっぱりまず、
各ユーザがエディタで自作して定義する文字や、ベンダが空き領域に独自に定義した文字等の
規格外の文字であることを示す「外字」が思い浮かぶ。
まさか同音の差別用語が生まれるとは思わなかった。今日では2chの至る所で見かけるし。
各ユーザがエディタで自作して定義する文字や、ベンダが空き領域に独自に定義した文字等の
規格外の文字であることを示す「外字」が思い浮かぶ。
まさか同音の差別用語が生まれるとは思わなかった。今日では2chの至る所で見かけるし。
789デフォルトの名無しさん
2017/07/26(水) 01:34:53.99ID:NnPMbS6q 外事と外耳のこともたまには思い出してください
790デフォルトの名無しさん
2017/07/26(水) 16:57:39.21ID:Pvb1ow9Q 外字フォント
791デフォルトの名無しさん
2017/07/26(水) 23:29:07.92ID:ctIBmsHN 最近は外字あまり使われないよな。文字コードに無いのは画像にして貼り付ける事が多いし。
792デフォルトの名無しさん
2017/07/27(木) 04:45:21.73ID:wpPsIhCe ガイジという言葉を知っていますか
Twitterでガイジという言葉を見かけました。
呟いていた方に聞いてみたら、大学生位の方が言っていたと。
果たして、言葉の意味を理解して使っていたのでしょうか。
ガイジとは、障害児を略した言葉です。障害児に対する、強烈な差別意識を感じさせる、悪意を持った言葉です。
この言葉を使えば、それだけで特定の人々、つまり障害を持つお子さんを差別したことになります。
障害児を略しただけだ、言葉の意味は変わらない、と言われる方もいらっしゃるかと思います。
違います。障害児は区別する言葉、ガイジは差別する言葉です。
Twitterでガイジという言葉を見かけました。
呟いていた方に聞いてみたら、大学生位の方が言っていたと。
果たして、言葉の意味を理解して使っていたのでしょうか。
ガイジとは、障害児を略した言葉です。障害児に対する、強烈な差別意識を感じさせる、悪意を持った言葉です。
この言葉を使えば、それだけで特定の人々、つまり障害を持つお子さんを差別したことになります。
障害児を略しただけだ、言葉の意味は変わらない、と言われる方もいらっしゃるかと思います。
違います。障害児は区別する言葉、ガイジは差別する言葉です。
793デフォルトの名無しさん
2017/07/27(木) 08:18:41.67ID:c6JgQN0e どこかに区点が入っている気がした
794デフォルトの名無しさん
2017/07/27(木) 12:52:52.60ID:OdPeHFfE795デフォルトの名無しさん
2017/07/28(金) 12:48:01.85ID:dbHFcG6T ISO/IEC 10646
前見た時はページ数
> Number of pages : 2697
だったのに今見たら
> Number of pages : 136
になってる? 何があった。
前見た時はページ数
> Number of pages : 2697
だったのに今見たら
> Number of pages : 136
になってる? 何があった。
796デフォルトの名無しさん
2017/07/28(金) 17:41:21.27ID:PaDDKq68 たんなる間違いじゃないの
Unicodeコア仕様書ですら1000ページあるのに
Unicodeコア仕様書ですら1000ページあるのに
797デフォルトの名無しさん
2017/07/28(金) 23:58:07.94ID:g7fuxxO4 可能性を推測するならコードチャートが本文のカウントから外されたとか
798デフォルトの名無しさん
2017/07/30(日) 21:43:07.30ID:PsllIOC5 チャート本体はUnicode X.0.0を参照せよ
とかだったりして
とかだったりして
799デフォルトの名無しさん
2017/08/02(水) 07:35:28.28ID:ka6IexAb 架空文字(スタートレックとか)は頑なに却下するくせに、絵文字はどんどん創作して追加してるのダブスタだよな
架空文字も絵文字として申請すれば良いのか?
架空文字も絵文字として申請すれば良いのか?
800デフォルトの名無しさん
2017/08/02(水) 22:31:37.76ID:3UX7sSkR ピカチュウとか申請したらドサクサに紛れていつの間にか入ってそう
801デフォルトの名無しさん
2017/08/03(木) 07:42:40.67ID:DjKC+R0J >>799
フィクションの文字はそうしちゃえばいいね
フィクションの文字はそうしちゃえばいいね
802デフォルトの名無しさん
2017/08/05(土) 08:17:17.76ID:de8G3D2Z Kangaroo, Softball, Frowning Poo Emojis Possible For 2018
http://blog.emojipedia.org/kangaroo-softball-frowning-poo-emojis-possible-for-2018/
http://blog.emojipedia.org/kangaroo-softball-frowning-poo-emojis-possible-for-2018/
803デフォルトの名無しさん
2017/08/05(土) 09:23:06.46ID:o5e6vDfw ウンコが増えるよ!やったね!
804デフォルトの名無しさん
2017/08/05(土) 11:54:11.90ID:WO/v0A2W はよう糞まみれになろうや
805デフォルトの名無しさん
2017/08/05(土) 16:21:53.87ID:NtivcnXJ 世界中の文字セットを1つに扱うのが目的であって、新しい文字を創作するのはおかしいのにね
806デフォルトの名無しさん
2017/08/06(日) 09:56:20.49ID:qWN01ODb807デフォルトの名無しさん
2017/08/06(日) 10:19:15.27ID:sla8IrYb 人の肌の色に対応するんだったら馬の毛色にも対応してほしい。
青毛、鹿毛、栗毛、芦毛とか。
青毛、鹿毛、栗毛、芦毛とか。
808デフォルトの名無しさん
2017/08/06(日) 19:19:25.07ID:q/iOXjTE ピカチュウ入れたら
「ドラクエのスライム入れろ」「FFのチョコボ入れろ」「マリオ入れろ」
とかになっちゃうがな。
「ドラクエのスライム入れろ」「FFのチョコボ入れろ」「マリオ入れろ」
とかになっちゃうがな。
809デフォルトの名無しさん
2017/08/06(日) 23:08:06.45ID:MiLcYytM いずれ世界中の民族衣装が採用されるんじゃまいか?
810デフォルトの名無しさん
2017/08/07(月) 12:31:51.02ID:eqFqtwmF >>808
キャラクターや商標やら他の権利で守られてるものは無理でしょ
キャラクターや商標やら他の権利で守られてるものは無理でしょ
811デフォルトの名無しさん
2017/08/07(月) 12:32:30.82ID:eqFqtwmF812デフォルトの名無しさん
2017/08/07(月) 13:23:43.13ID:9Mdxb5QD 絵文字は日本のケータイで使われていてベンダ間で
交換もされてたから入ったわけで、ポケモン等は意味不明
交換もされてたから入ったわけで、ポケモン等は意味不明
813デフォルトの名無しさん
2017/08/08(火) 20:54:41.14ID:PndXgq1K814デフォルトの名無しさん
2017/08/09(水) 11:28:24.84ID:q+cnFBMg あああ、もうめちゃくちゃだよ…
815デフォルトの名無しさん
2017/08/09(水) 18:15:40.27ID:5nByh/9q ピカチュウは
U+1F401 U+200D U+26A1(鼠、マウスの絵文字 + ZWJ + 高電圧、雷マーク)
で表す事にしよう。
U+1F401 U+200D U+26A1(鼠、マウスの絵文字 + ZWJ + 高電圧、雷マーク)
で表す事にしよう。
816デフォルトの名無しさん
2017/08/09(水) 22:53:31.39ID:bp2xq1i0 emojiがエジプト神聖文字のように言語化しつつある。
817デフォルトの名無しさん
2017/08/09(水) 23:10:01.92ID:d92boKtE >>807
サバトラとかキジトラ白とか三毛とか
サバトラとかキジトラ白とか三毛とか
818デフォルトの名無しさん
2017/08/10(木) 15:51:43.81ID:/ua5Aw52 現代の象形文字、それがEmoji。
819デフォルトの名無しさん
2017/08/10(木) 22:08:34.52ID:PKHYBccj >>815
ライチュウとかピチューとか区別できる?
ライチュウとかピチューとか区別できる?
820デフォルトの名無しさん
2017/08/10(木) 22:58:47.89ID:/XWrshI+821デフォルトの名無しさん
2017/08/16(水) 06:18:57.16ID:HvWTm0rv 上に何載せるかをセレクタにすべきだな
822デフォルトの名無しさん
2017/08/17(木) 14:19:45.83ID:vMvhQSc5 上にのせるものは結合文字でいい
幾つでものせてよし
もちろんホイップにイチゴは合成済み文字で
幾つでものせてよし
もちろんホイップにイチゴは合成済み文字で
823デフォルトの名無しさん
2017/08/17(木) 18:03:41.72ID:NZeYtWs8 >>822
真に受けんなよ
真に受けんなよ
824デフォルトの名無しさん
2017/08/18(金) 12:09:15.45ID:FcTfUvNw Jアラート訓練 メール電文が文字化けのトラブル
8月18日 11時51分
島根県で行われたJアラート=全国瞬時警報システムを使用した緊急情報の送受信訓練で、県の防災メールでテスト電文が配信されましたが、画面が文字化けして読めないというトラブルがありました。
島根県によりますと、防災メールにはおよそ1万5000人が登録しているということですが、どの程度の範囲で文字化けが起きたのかなど詳しい状況について確認を進めているということです。
島根県防災危機管理課は「きちんと情報が伝達できずに申し訳ない。現在、原因の究明を進めていて、今後こうしたことが起きないように努めたい」と話しています。
http://www3.nhk.or.jp/news/html/20170818/k10011103391000.html
8月18日 11時51分
島根県で行われたJアラート=全国瞬時警報システムを使用した緊急情報の送受信訓練で、県の防災メールでテスト電文が配信されましたが、画面が文字化けして読めないというトラブルがありました。
島根県によりますと、防災メールにはおよそ1万5000人が登録しているということですが、どの程度の範囲で文字化けが起きたのかなど詳しい状況について確認を進めているということです。
島根県防災危機管理課は「きちんと情報が伝達できずに申し訳ない。現在、原因の究明を進めていて、今後こうしたことが起きないように努めたい」と話しています。
http://www3.nhk.or.jp/news/html/20170818/k10011103391000.html
825デフォルトの名無しさん
2017/08/18(金) 12:25:20.77ID:eIpnBeVf MIMEエンコしてないとか
826デフォルトの名無しさん
2017/08/18(金) 12:42:20.53ID:FcTfUvNw827デフォルトの名無しさん
2017/08/18(金) 16:02:13.46ID:eIpnBeVf どうせrubyωで作ったとか
828デフォルトの名無しさん
2017/08/18(金) 16:20:36.62ID:RRX5RBja >>826 を見るとこんな感じに化けてる
$ echo '2017年08月' | iconv -f SJIS -t UTF-8
2017蟷エ08譛
つまり、メール送信システムはSJISのテキストを受理するように作られていて
誤ってUTF-8のテキストを入れてしまった。ってことかな
$ echo '2017年08月' | iconv -f SJIS -t UTF-8
2017蟷エ08譛
つまり、メール送信システムはSJISのテキストを受理するように作られていて
誤ってUTF-8のテキストを入れてしまった。ってことかな
829デフォルトの名無しさん
2017/08/18(金) 16:28:58.20ID:f8KfeV+E 「即時音声合成」
2017年08月18日11時00分
これは、Jアラートのテストです。
これで、テストを終了します。
対象地域:
鳥取県 島根県 岡山県 広島県 山口県 徳島県 香川県 愛媛県 高知県
↓
縲悟叉譎る浹螢ー蜷域・縲・
2017蟷エ08譛・8譌・11譎・0蛻・
縺薙l縺ッ縲゛繧「繝ゥ繝シ繝医・繝・せ繝医〒縺吶ゅ
縺薙l縺ァ縲√ユ繧ケ繝医r邨ゆコ・@縺セ縺吶ょ
蟇セ雎。蝨ー蝓滂シ夐
魑・蜿也恁縲蟲カ譬ケ逵後蟯。螻ア逵後蠎・ウカ逵後螻ア蜿」逵後蠕ウ蟲カ逵後鬥吝キ晉恁縲諢帛ェ帷恁縲鬮倡衍逵啓
か。
ヘッダとフッタが正常なのが泣ける
2017年08月18日11時00分
これは、Jアラートのテストです。
これで、テストを終了します。
対象地域:
鳥取県 島根県 岡山県 広島県 山口県 徳島県 香川県 愛媛県 高知県
↓
縲悟叉譎る浹螢ー蜷域・縲・
2017蟷エ08譛・8譌・11譎・0蛻・
縺薙l縺ッ縲゛繧「繝ゥ繝シ繝医・繝・せ繝医〒縺吶ゅ
縺薙l縺ァ縲√ユ繧ケ繝医r邨ゆコ・@縺セ縺吶ょ
蟇セ雎。蝨ー蝓滂シ夐
魑・蜿也恁縲蟲カ譬ケ逵後蟯。螻ア逵後蠎・ウカ逵後螻ア蜿」逵後蠕ウ蟲カ逵後鬥吝キ晉恁縲諢帛ェ帷恁縲鬮倡衍逵啓
か。
ヘッダとフッタが正常なのが泣ける
830デフォルトの名無しさん
2017/08/18(金) 17:06:27.71ID:eIpnBeVf iconvなんか使うなよ
831デフォルトの名無しさん
2017/08/19(土) 04:28:22.39ID:8wK5LPmg このスレに一般ニュースがかかわってくるとは珍しい
832デフォルトの名無しさん
2017/08/19(土) 15:21:07.32ID:vQyZjPpv 島根クオリティのruby
833デフォルトの名無しさん
2017/08/19(土) 21:29:17.88ID:PoJOAggC ruby漏れの
834デフォルトの名無しさん
2017/09/01(金) 18:44:22.34ID:kgVPWxeV Unicode絵文字はどうなるんだろうね
835デフォルトの名無しさん
2017/09/02(土) 00:16:19.15ID:jUAASW0y 絵文字はアラートにいるだろうか
836デフォルトの名無しさん
2017/09/05(火) 23:47:25.10ID:CxjNlFkm 花園明朝バージョンアップ来た。
漢字拡張Fや変体仮名が追加されてた。
漢字拡張Fや変体仮名が追加されてた。
837デフォルトの名無しさん
2017/09/13(水) 20:02:44.61ID:KWwY7/kL iPhoneXで動く絵文字Animojiまで出てきた
最初からUnicodeとは別の仕様作ってバリバリ仕様改変していけば良かったのにな
最初からUnicodeとは別の仕様作ってバリバリ仕様改変していけば良かったのにな
838デフォルトの名無しさん
2017/09/13(水) 23:58:47.08ID:i8DgB3mu IPAmj明朝はバージョンアップまだかな?
変体仮名が内部に含まれてるけどこのままじゃ使えない。
cmapテーブル改変すりゃ使えるけど公式で使えるようになるのはいつになるかな。
変体仮名が内部に含まれてるけどこのままじゃ使えない。
cmapテーブル改変すりゃ使えるけど公式で使えるようになるのはいつになるかな。
839デフォルトの名無しさん
2017/09/14(木) 20:00:42.99ID:olxB6Qiw Japan New Era Name Support Blog – 日本マイクロソフトの新元号 (和暦) 対応に関するサポート情報のブログです
https://blogs.technet.microsoft.com/jperablog/
こんなん作ってたのかマイクロソフト
https://blogs.technet.microsoft.com/jperablog/
こんなん作ってたのかマイクロソフト
840デフォルトの名無しさん
2017/09/15(金) 22:07:07.01ID:Eknhu6BK MS自身が符号化提案するつもりなのかな
場所はどこになるんだろう
場所はどこになるんだろう
841デフォルトの名無しさん
2017/09/17(日) 07:56:28.63ID:mseaw4po 新しい文字コード作るのか?
842デフォルトの名無しさん
2017/09/17(日) 17:45:38.08ID:HcLQ0vfz 色々考えてんね
843デフォルトの名無しさん
2017/09/17(日) 18:23:49.36ID:PNbDpzbo UTF-1Mとかはどうよ?
1文字1Mbyteで1024x1024のビットイメージで1文字を現す。
1文字1Mbyteで1024x1024のビットイメージで1文字を現す。
844デフォルトの名無しさん
2017/09/17(日) 22:48:01.62ID:bCKL0uvM Shift_JIS/CP932にも追加するんだろうか新元号
845デフォルトの名無しさん
2017/09/17(日) 23:39:25.78ID:f8iJT+1F Unicodeは組文字指示子でも作れよ
846デフォルトの名無しさん
2017/09/18(月) 07:57:38.05ID:Q2/IYiwb CP932の元号ってなんでつながってないの?
847デフォルトの名無しさん
2017/09/18(月) 11:14:04.62ID:pqj5nFKY 1文字目+ZWJ+2文字目でいいやん。
848デフォルトの名無しさん
2017/09/18(月) 14:47:22.52ID:/S27bRBH >>846
予め空けておくのは不敬罪
予め空けておくのは不敬罪
849デフォルトの名無しさん
2017/09/18(月) 16:48:59.00ID:ygz3rI3S >>846
後付けだからでは
いわゆるNEC特殊文字というのがいつ出来たか詳しく知らないけど1983年頃には使えたはずで
その頃は当然まだ昭和で平成は影も形もない
「~」が13区63点に入った理由もよく知らないけど一番外字で埋められてなさそうな端っこにしたとかだろうか
後付けだからでは
いわゆるNEC特殊文字というのがいつ出来たか詳しく知らないけど1983年頃には使えたはずで
その頃は当然まだ昭和で平成は影も形もない
「~」が13区63点に入った理由もよく知らないけど一番外字で埋められてなさそうな端っこにしたとかだろうか
850デフォルトの名無しさん
2017/09/18(月) 22:35:48.18ID:w6oSciVB >NEC特殊文字というのがいつ出来たか詳しく知らないけど1983年頃には使えたはず
そんな本当のことを言うと、NEC特殊文字が1997年の
Shift_JISの拡張と妄信してる先生の世界に矛盾が生じてしまうだろ
そんな本当のことを言うと、NEC特殊文字が1997年の
Shift_JISの拡張と妄信してる先生の世界に矛盾が生じてしまうだろ
851デフォルトの名無しさん
2017/09/19(火) 01:31:34.53ID:bjGHvQqi シフト符号化といわゆるShift-JISを混同すんな
852デフォルトの名無しさん
2017/09/19(火) 03:05:46.20ID:qsNfDhHd MSゴシック/MS明朝/メイリオとIPAって、
~は縦書きグリフでも横に並べたままなのね。
実際の使用現場では縦横どっちのほうが便利なんだろ。
~は縦書きグリフでも横に並べたままなのね。
実際の使用現場では縦横どっちのほうが便利なんだろ。
853デフォルトの名無しさん
2017/09/19(火) 05:07:32.07ID:33S+M35U 手元のフォントだと、~だと縦になるフォントと横のままのフォント両方あるけど、iとかは全部縦になる
ってことはデザイナーが意図して横のままにしてるんだろうな
ってことはデザイナーが意図して横のままにしてるんだろうな
854デフォルトの名無しさん
2017/09/19(火) 15:42:33.57ID:k8wd+zqV855デフォルトの名無しさん
2017/09/20(水) 03:22:20.33ID:LjqpwHID 使わないなら誰のために追加するんや…
856デフォルトの名無しさん
2017/09/20(水) 07:30:00.77ID:YPFC/x+p とりあえずPCで表示できればいいやっていう需要に応えるため
857デフォルトの名無しさん
2017/09/20(水) 07:34:34.62ID:ZYEvUxiN InDesignやIllustratorの縦中横機能を使えない一般ピーポーのための“貧者の縦中横”じゃないの?
858デフォルトの名無しさん
2017/09/22(金) 18:32:09.05ID:QCzCo6Xh そのアホと仕様化メンバーのアホがコラボしてUnicodeの属性がむちゃくちゃになったからな
859デフォルトの名無しさん
2017/09/26(火) 23:12:20.44ID:ZBZ84yRG Unicodeが独断で絵文字を追加して、SC2/WG2の投票を通さず勝手にUnicodeチャートを
アップデートしてることにアイルランドNBから文句がついた(WG2 N4888)
アップデートしてることにアイルランドNBから文句がついた(WG2 N4888)
860デフォルトの名無しさん
2017/09/27(水) 01:58:12.86ID:QltraNmZ そんなことしてたのか。
861デフォルトの名無しさん
2017/09/27(水) 22:27:48.19ID:CfAOIjZ1 アイルランド代表ってファックサインとバルカン式挨拶の絵文字入れた件の印象しか無いな
真面目?な仕事もしてるんだなさすがに
真面目?な仕事もしてるんだなさすがに
862デフォルトの名無しさん
2017/09/27(水) 22:55:01.58ID:PWLdOFze もう一生Unicodeなのかな…
863デフォルトの名無しさん
2017/09/28(木) 01:10:46.04ID:/8a1xhL4 Unicodeの代わりになる何かができたとして、
それには確実にUnicode互換文字がずらりと入っているはずだから一生Unicodeみたいなもんだ。
それには確実にUnicode互換文字がずらりと入っているはずだから一生Unicodeみたいなもんだ。
864デフォルトの名無しさん
2017/09/28(木) 02:44:35.32ID:VjJJSlDU >>862
俺は死ぬまでSJISと付き合うんだろうなあと思う。
俺は死ぬまでSJISと付き合うんだろうなあと思う。
865デフォルトの名無しさん
2017/09/28(木) 10:29:24.48ID:PJxaABWy 朝鮮クオリティ
866デフォルトの名無しさん
2017/09/28(木) 11:41:48.77ID:A+i/ub4B 大抵の人間はutf8で満足なんじゃないの?
867デフォルトの名無しさん
2017/09/28(木) 18:50:29.30ID:L3o6siGJ Unicodeで良いと思っちゃうんだよな
もし叶うならCJK周りを最適化したいね
もし叶うならCJK周りを最適化したいね
868デフォルトの名無しさん
2017/09/28(木) 19:38:34.40ID:yupWamhN 宇宙人との交信が普通になってくるとまたいろいろもめそう
869デフォルトの名無しさん
2017/09/28(木) 23:51:52.20ID:XJXTBf+J 肌色セレクタを増やさないといけないからな
870デフォルトの名無しさん
2017/09/29(金) 18:58:48.01ID:P52gO+TE >>859の結果
http://www.unicode.org/wg2/docs/n4903-ProcessAdHocReport.pdf
shouldなんで表現としては弱めな気もするけど、UTC議長のLisa Mooreも
同席してるから今後はUTCも好き勝手にはできないかも
http://www.unicode.org/wg2/docs/n4903-ProcessAdHocReport.pdf
shouldなんで表現としては弱めな気もするけど、UTC議長のLisa Mooreも
同席してるから今後はUTCも好き勝手にはできないかも
871デフォルトの名無しさん
2017/09/30(土) 02:49:12.29ID:R0O9XLNW Adobeは新グリフセットAdobe-KRを作ることにした模様
いつになったらAJ1-7に取り掛かるんだ…
いつになったらAJ1-7に取り掛かるんだ…
872デフォルトの名無しさん
2017/10/01(日) 23:26:06.97ID:0lGqZVhk >>869
そもそも顔絵文字なんかは表情を記号化したものであって特定の人種を表現したものではない
差別がなかったところにあえて差別を持ち込んで差別をなくす方法論を議論する事自体おかしい
特定の人種の特徴を持たせたいなら書体と同様にフォントなどでフォローすべき
そもそも顔絵文字なんかは表情を記号化したものであって特定の人種を表現したものではない
差別がなかったところにあえて差別を持ち込んで差別をなくす方法論を議論する事自体おかしい
特定の人種の特徴を持たせたいなら書体と同様にフォントなどでフォローすべき
873デフォルトの名無しさん
2017/10/02(月) 02:39:27.88ID:791wgfKq レゴも昔はそういう感じで全部黄色い人だったけど、
いつの間にかリアル人種に合わせた色がたくさん出るようになってしまった
いつの間にかリアル人種に合わせた色がたくさん出るようになってしまった
874デフォルトの名無しさん
2017/10/04(水) 22:07:29.50ID:VRsAqAhr 世相を反映するUnicode
875デフォルトの名無しさん
2017/10/05(木) 08:20:09.15ID:puXRBXzi876デフォルトの名無しさん
2017/10/06(金) 21:44:06.11ID:EeCF6Ukp なぜかPDAM2.2(n4904)から小書き"こ"が消えてるなあと思ったら
どうも日本NBが小書きのかな全般に文句つけたのが原因みたい(n4871)
調査するから一旦投票から外してほしいってことらしいが、コードポイントが
五十音順になるようreserveされてるんだから、順次追加していくのでも
問題ないだろうに日本NBは何が不満なんだか
どうも日本NBが小書きのかな全般に文句つけたのが原因みたい(n4871)
調査するから一旦投票から外してほしいってことらしいが、コードポイントが
五十音順になるようreserveされてるんだから、順次追加していくのでも
問題ないだろうに日本NBは何が不満なんだか
877デフォルトの名無しさん
2017/10/06(金) 23:21:55.38ID:FuaeRY5L 場合によってはそもそも作ってほしくないんじゃないの
878デフォルトの名無しさん
2017/10/07(土) 20:47:59.42ID:8fNRGep5 Amazonによるミニスーファミキャンセル騒動 - Togetterまとめ
https://togetter.com/li/1158390
豪快に文字化けワラタ
罫線ぽいのが混ざってるからCP437かな?
https://togetter.com/li/1158390
豪快に文字化けワラタ
罫線ぽいのが混ざってるからCP437かな?
879デフォルトの名無しさん
2017/10/08(日) 21:40:08.74ID:BAjE4UNz ガセかと思ったけどマジなんか
なんで誰も気付かなかったし
なんで誰も気付かなかったし
880デフォルトの名無しさん
2017/10/13(金) 23:48:07.78ID:K2R51jFQ881デフォルトの名無しさん
2017/10/14(土) 10:57:44.21ID:RYv3j8m+ ISO 10646:2014って開発失敗したんか?
もう出ないよな?
もう出ないよな?
882デフォルトの名無しさん
2017/10/14(土) 14:53:48.95ID:TG6KQnkb883デフォルトの名無しさん
2017/10/15(日) 20:24:02.01ID:wfF3NLsX884デフォルトの名無しさん
2017/10/18(水) 00:36:08.65ID:XwII08/d 2014出てるよ
http://standards.iso.org/ittf/PubliclyAvailableStandards/index.html
http://www.iso.org/standard/63182.html
もしdkuugが更新されていないことを見て言ってるならそこはもう放棄されてる
http://standards.iso.org/ittf/PubliclyAvailableStandards/index.html
http://www.iso.org/standard/63182.html
もしdkuugが更新されていないことを見て言ってるならそこはもう放棄されてる
885デフォルトの名無しさん
2017/10/24(火) 14:09:16.76ID:Jp5ETl7F886デフォルトの名無しさん
2017/10/24(火) 20:04:59.52ID:i5hhptUR 何で親子2人ずつの核家族なんだ
地域によっては大家族のサポートも求められるが
組み合わせ違いのグリフ全部作っていくのは天文学的になりそう
地域によっては大家族のサポートも求められるが
組み合わせ違いのグリフ全部作っていくのは天文学的になりそう
887デフォルトの名無しさん
2017/10/25(水) 18:01:51.97ID:TxCrr8Dz 絵文字じゃなくて絵と解釈してるから混乱する
そういう奴らからのツッコミポイントなくした絵文字作ればいいけど、現状は屈してバリエーション作っちゃうんだよな
そういう奴らからのツッコミポイントなくした絵文字作ればいいけど、現状は屈してバリエーション作っちゃうんだよな
888デフォルトの名無しさん
2017/10/25(水) 18:14:16.54ID:NxsNik2t 頭悪そう
889デフォルトの名無しさん
2017/10/25(水) 18:14:50.88ID:byKDMVHo だって例示図形が絵なんだもん
絵ではないと考えてほしかったのなら例示図形をもっと抽象的にするか、
あるいは例示さえせずに (マンガのようなおおげさなウンコ) みたいに言語表現にするべきだったな
絵ではないと考えてほしかったのなら例示図形をもっと抽象的にするか、
あるいは例示さえせずに (マンガのようなおおげさなウンコ) みたいに言語表現にするべきだったな
890デフォルトの名無しさん
2017/10/25(水) 18:41:48.33ID:sAsgJLsM カラーの時点で絵ではないは無理がある
絵ではないなら色は他のテキスト同様にテキストカラー使えよ
絵ではないなら色は他のテキスト同様にテキストカラー使えよ
891デフォルトの名無しさん
2017/10/30(月) 18:00:33.61ID:ZnP3Ol2c892デフォルトの名無しさん
2017/10/30(月) 18:57:12.83ID:KZpAr8Yx >>891
色指定IVSはなんなんだ
色指定IVSはなんなんだ
893デフォルトの名無しさん
2017/10/31(火) 12:58:58.32ID:KJARTkQB 色というより肌色(=人種)のセレクタじゃないの?
894デフォルトの名無しさん
2017/10/31(火) 14:17:24.66ID:MybAfan2 EMOJIはどこに向かおうとしているのか
How Do You Like Your Burger Emoji?
https://blog.emojipedia.org/how-do-you-like-your-burger-emoji/
How Do You Like Your Burger Emoji?
https://blog.emojipedia.org/how-do-you-like-your-burger-emoji/
895デフォルトの名無しさん
2017/11/02(木) 00:11:17.70ID:BZDz7XTE 具オーダーセレクターが誕生するフラグか
896デフォルトの名無しさん
2017/11/02(木) 04:52:42.22ID:S5CQdMtg 人工乳房の形成に常滑焼の鋳型が新技術に貢献(NHK)
897デフォルトの名無しさん
2017/11/02(木) 22:59:50.35ID:4h9B4mO8 ハンバーガーオーダーセレクタに使えそうなのは
U+1F345 TOMATO
U+1F952 CUCUMBER (PICKLE)
くらい?
最低でもバンズ、ハンバーグ、チーズ、レタスは登録しないとな。
U+1F345 TOMATO
U+1F952 CUCUMBER (PICKLE)
くらい?
最低でもバンズ、ハンバーグ、チーズ、レタスは登録しないとな。
898デフォルトの名無しさん
2017/11/03(金) 01:17:50.06ID:6SzVRupm フライドポテトとスマイルはすでに単独でオーダーできるな
899デフォルトの名無しさん
2017/11/03(金) 16:09:36.09ID:rOBRj+Zt 一部以外、元々人種・ジェンダーレスの文字だったのに声の大きい人達のせいで見せかけの平等を捻じ込まれてホント嫌悪感しかないわ
900デフォルトの名無しさん
2017/11/03(金) 20:20:46.51ID:HuwGCmuD うむ
901デフォルトの名無しさん
2017/11/04(土) 16:12:16.61ID:hsDfLASV >>899
そうやって仕様がめちゃくちゃになっていくんだろうな
そうやって仕様がめちゃくちゃになっていくんだろうな
902デフォルトの名無しさん
2017/11/04(土) 21:28:22.44ID:NJtYjjHJ そもそも今までどこにも使われていなかった「文字」を創り始めた時点でもう
903デフォルトの名無しさん
2017/11/06(月) 08:58:06.05ID:jmQIkdel Google makes the "Android Burger" a reality for its employees
https://www.neowin.net/news/google-makes-the-android-burger-a-reality-for-its-employees
https://www.neowin.net/news/google-makes-the-android-burger-a-reality-for-its-employees
904デフォルトの名無しさん
2017/11/06(月) 16:14:18.07ID:Oz+5QplX 現実のほうで辻褄を合わせていくスタイル
905デフォルトの名無しさん
2017/11/08(水) 21:11:00.50ID:OtipW7Ea うんこ絵文字追加提案に異議あり
https://srad.jp/story/17/11/08/0528217/
https://srad.jp/story/17/11/08/0528217/
906デフォルトの名無しさん
2017/11/08(水) 21:44:31.71ID:7S3fHwbe それよりも1F3E2 OFFICE BUILDINGとZWJでつなげてSHITAMACHIを表現したい
907デフォルトの名無しさん
2017/11/08(水) 23:35:22.51ID:3K3ujviI uncode
908デフォルトの名無しさん
2017/11/09(木) 09:24:07.69ID:UInw5/Yz これを貼れと言われた気がするので
ttp://cdn-ak.f.st-hatena.com/images/fotolife/n/noir555/20120325/20120325193503.jpg
ttp://cdn-ak.f.st-hatena.com/images/fotolife/n/noir555/20120325/20120325193503.jpg
909デフォルトの名無しさん
2017/11/09(木) 21:26:42.48ID:p3pQfTpt 方角からして裏のマンションはうんこに日が沈むのか
910デフォルトの名無しさん
2017/11/11(土) 10:21:56.51ID:6gNjPSTt すばらしい
911デフォルトの名無しさん
2017/11/12(日) 01:32:45.14ID:H7C5gFJ5912デフォルトの名無しさん
2017/11/12(日) 08:41:00.21ID:e5xLDhIK 全てがウンコ色に輝いている。
すばらしい。
すばらしい。
913デフォルトの名無しさん
2017/11/14(火) 20:01:47.04ID:rcEwUB0d こんじきうんこ
914デフォルトの名無しさん
2017/11/22(水) 16:48:22.55ID:g+mfhWNq Unicode 10.0 の仕様読んでて思ったんだけど
Core Specification のCJK統合漢字の数字、間違ってない?
20,902+69+6,582+42,711+4,149+222+5,762+7,473+1,014
= 88,884
にしかならないんだけど……。
仕様の合計↓では 88,932 らしいんだが。その差48、何だそれ。
The Unicode® Standard
Version 10.0 – Core Specification
Appendix D
Version History of the Standard
http://www.unicode.org/versions/Unicode10.0.0/appD.pdf#page=6
Core Specification のCJK統合漢字の数字、間違ってない?
20,902+69+6,582+42,711+4,149+222+5,762+7,473+1,014
= 88,884
にしかならないんだけど……。
仕様の合計↓では 88,932 らしいんだが。その差48、何だそれ。
The Unicode® Standard
Version 10.0 – Core Specification
Appendix D
Version History of the Standard
http://www.unicode.org/versions/Unicode10.0.0/appD.pdf#page=6
915デフォルトの名無しさん
2017/11/22(水) 16:52:42.86ID:TZAtmSaI win10
IME で 「こっき」 って変換すると
☪☭☫✡
日の丸出てこないぞ
IME で 「こっき」 って変換すると
☪☭☫✡
日の丸出てこないぞ
916デフォルトの名無しさん
2017/11/22(水) 17:44:22.62ID:gB9u/pWI ってかその4つこっきか?
917デフォルトの名無しさん
2017/11/23(木) 10:17:38.60ID:h7MW0ffb >>915
IME捨てろ
IME捨てろ
918デフォルトの名無しさん
2017/11/23(木) 12:20:50.57ID:eO5S+uX/ >>916
トルコ、ソ連、イラン、イスラエルか?
トルコ、ソ連、イラン、イスラエルか?
919デフォルトの名無しさん
2017/11/23(木) 22:58:49.58ID:stYe0Oux ISO/IEC 10646 - Information technology -- Universal Coded Character Set (UCS)
https://www.iso.org/standard/69119.html
Publication date : 2017-12
Number of pages : 2693
に更新されてた。
https://www.iso.org/standard/69119.html
Publication date : 2017-12
Number of pages : 2693
に更新されてた。
920デフォルトの名無しさん
2017/11/24(金) 00:48:54.85ID:O5myFoBo921デフォルトの名無しさん
2017/11/25(土) 15:25:35.45ID:unmm6CwQ チョンも入れたれ
922デフォルトの名無しさん
2017/11/27(月) 00:57:53.51ID:NURIqS8t >>921
おまえは他所行ってな
おまえは他所行ってな
923デフォルトの名無しさん
2017/11/29(水) 14:53:47.04ID:UhXC0KGu Googleのハンバーガー絵文字、Android 8.1でチーズの位置を修正
http://www.itmedia.co.jp/news/articles/1711/29/news078.html
http://www.itmedia.co.jp/news/articles/1711/29/news078.html
924デフォルトの名無しさん
2017/11/29(水) 23:06:09.33ID:CvPoQMbr 🍔食べたい
925デフォルトの名無しさん
2017/11/29(水) 23:54:56.29ID:tk9E5aVC なんで最近はハンバーガー押したらメニューが出てくるんだ
メニューから注文するんだから順序が逆じゃないか
メニューから注文するんだから順序が逆じゃないか
926デフォルトの名無しさん
2017/12/06(水) 08:48:45.84ID:6rXadv4l ユニコードコンソーシアム、来年に追加予定の新しい絵文字の最新の候補リストを公開
ttps://taisy0.com/2017/12/06/89650.html
ttps://taisy0.com/2017/12/06/89650.html
927デフォルトの名無しさん
2017/12/06(水) 10:23:15.11ID:LlbO+WJR もういいっ、もう休めっ
928デフォルトの名無しさん
2017/12/06(水) 14:03:58.50ID:TJabUNNS 昔はUnicodeへの絵文字導入はガラパゴス国のデンワへの後方互換性のため仕方なくやってくれたんだと思ってました
ほんとは自分のおもちゃがほしかったんですね…
ほんとは自分のおもちゃがほしかったんですね…
929デフォルトの名無しさん
2017/12/06(水) 17:30:16.47ID:oBvdSzU/ これはひどい
930デフォルトの名無しさん
2017/12/07(木) 05:23:32.91ID:4IlO+z0O もう認識が絵文字じゃなくて絵だよね
931デフォルトの名無しさん
2017/12/07(木) 08:08:48.43ID:jxDfrp/1 悲しいウンチは候補リストからはずされたのか。
932デフォルトの名無しさん
2017/12/07(木) 14:11:28.75ID:U5wmuQTN ある意味今の状況を一番表している絵だったのに
933デフォルトの名無しさん
2017/12/08(金) 13:03:34.59ID:0lzANth5 ホント糞だな
934デフォルトの名無しさん
2017/12/08(金) 13:40:05.51ID:6WtIjESa >>931-932
他の物を通すための囮だったかもな
他の物を通すための囮だったかもな
935デフォルトの名無しさん
2017/12/15(金) 12:23:55.99ID:Mjdx4Jdk No20のカップケーキがだいぶうんち
936デフォルトの名無しさん
2017/12/21(木) 22:04:29.07ID:Pje/kUoS ISO/IEC 10646:2017 - Information technology -- Universal Coded Character Set (UCS)
https://www.iso.org/standard/69119.html
やっと Published になった。
最初2016だったのが2017になったけど2018になるのはギリギリ避けられたか。
https://www.iso.org/standard/69119.html
やっと Published になった。
最初2016だったのが2017になったけど2018になるのはギリギリ避けられたか。
937デフォルトの名無しさん
2017/12/22(金) 15:14:29.35ID:exw3lv6k Android民「iPhone民から♂♀とか性別のアピールが送られてくるのはなぜ?」「流行りかと思った」
https://togetter.com/li/1182276
https://togetter.com/li/1182276
938デフォルトの名無しさん
2017/12/22(金) 16:48:24.80ID:5h4hYzog L2/17-429
Request to reserve the code point for square Japanese new era name (SC2 N4577)
Japan NB
2017-12-18
http://www.unicode.org/L2/L2017/17429-sc2-n4577-japan-new-era.pdf
"We noticed some legacy solutions still only support BMP."が泣ける。
Request to reserve the code point for square Japanese new era name (SC2 N4577)
Japan NB
2017-12-18
http://www.unicode.org/L2/L2017/17429-sc2-n4577-japan-new-era.pdf
"We noticed some legacy solutions still only support BMP."が泣ける。
939デフォルトの名無しさん
2017/12/23(土) 00:06:09.91ID:fYRtLYYp https://twitter.com/luka_tarot/status/943831841420713984
仕事関係の方からのメール、時々うんこマークの絵文字(これ→💩)が付いてくるので1年くらいモヤモヤしてやました。
今日初めてググってみたら、DOCOMOからSOFT BANKにメールを送ると、音符マークがうんこに変換されるようです…‼
︎ DOCOMOの方、音符の絵文字にはくれぐれもご注意くださいね
仕事関係の方からのメール、時々うんこマークの絵文字(これ→💩)が付いてくるので1年くらいモヤモヤしてやました。
今日初めてググってみたら、DOCOMOからSOFT BANKにメールを送ると、音符マークがうんこに変換されるようです…‼
︎ DOCOMOの方、音符の絵文字にはくれぐれもご注意くださいね
940デフォルトの名無しさん
2017/12/23(土) 17:51:33.27ID:tY6TFHQG 禿の嫌がらせωω
941デフォルトの名無しさん
2017/12/24(日) 20:51:23.00ID:fAY4pJin コンピューターで全漢字使用可に 6万字コード化
https://www3.nhk.or.jp/news/html/20171224/k10011270111000.html
https://www3.nhk.or.jp/news/html/20171224/k10011270111000.html
942デフォルトの名無しさん
2017/12/24(日) 21:03:24.97ID:czMQ2Cnw 文字情報基盤の追加IVD登録と変体仮名の入った10646が出たことをもって
「完了した」ってことかな
「完了した」ってことかな
943デフォルトの名無しさん
2017/12/24(日) 22:27:08.09ID:G1OevDef つちよしって2001年のCJK統合漢字拡張Bから使えるのでは……(U+20BB7)
Jソースが無いから日本の漢字じゃないとかそういう話?
Jソースが無いから日本の漢字じゃないとかそういう話?
944デフォルトの名無しさん
2017/12/25(月) 14:28:26.87ID:vAchG11E マスゴミ記者が間に入ると情報が可笑しくなる例
945デフォルトの名無しさん
2017/12/25(月) 16:08:58.35ID:PLr6J7k5 プレス発表 「文字情報基盤整備事業」で推進していた漢字6万文字の国際規格化が完了:IPA 独立行政法人 情報処理推進機構
https://www.ipa.go.jp/about/press/20171225.html
>>941のIPA発表
https://www.ipa.go.jp/about/press/20171225.html
>>941のIPA発表
946デフォルトの名無しさん
2017/12/25(月) 16:39:31.09ID:od7irzxW マイナ開始する前に完了させとけよ
947デフォルトの名無しさん
2017/12/25(月) 21:26:50.34ID:bsx5SElH PCで扱える漢字 6万文字に
http://www.itmedia.co.jp/news/articles/1712/25/news071.html
http://www.itmedia.co.jp/news/articles/1712/25/news071.html
948デフォルトの名無しさん
2017/12/25(月) 22:01:22.03ID:QOFkYfoX itmediaのこの見出しはアウトだな
949デフォルトの名無しさん
2017/12/26(火) 06:17:01.01ID:HWfT7fYR >>942
それを知らない人に伝えるにはこう言うしかないかもね
それを知らない人に伝えるにはこう言うしかないかもね
950デフォルトの名無しさん
2017/12/27(水) 15:43:36.55ID:RCW7nLI3 サヨク並みにアホ
951デフォルトの名無しさん
2017/12/27(水) 18:58:01.47ID:pTOpkpNU952デフォルトの名無しさん
2017/12/27(水) 21:38:26.15ID:K+2IikmJ >>951
勝手に誤解して悲しがってるあなたのほうが悲しいが
勝手に誤解して悲しがってるあなたのほうが悲しいが
953デフォルトの名無しさん
2017/12/28(木) 00:39:28.23ID:ieNYico0 存在自体が見えないZWJじゃなくて
非対応の組み合わせでは+マークを表示するルールの新結合文字作ったほうがよかったんじゃないかね
非対応の組み合わせでは+マークを表示するルールの新結合文字作ったほうがよかったんじゃないかね
954デフォルトの名無しさん
2017/12/30(土) 18:56:44.40ID:Ugth+Qnu 漢字6万字て、馬鹿か。
取るに足りない些細な違いをもって同じ文字と認めない。
最う駄目だ。
取るに足りない些細な違いをもって同じ文字と認めない。
最う駄目だ。
955デフォルトの名無しさん
2017/12/30(土) 23:54:24.56ID:8RkbD7fK >945
まあ、異字体を丹念に拾ってくれるのはありがたいけれど、
漢文をTeXで扱う場合に、Adobe Japan 1-5(20313字)にない
文字が時々出てくる(例えば『列子』など)時など、IPAMJに
その文字があると、助かる。
出来れば、中国の古典籍に出てくる文字を積極的に
IPAMJに収録するようにしてもらいたいとおもっている。
もっとも、戸籍用の文字を収録することは、行政上から
いえば、最優先事項であることは理解できるのだが。
まあ、異字体を丹念に拾ってくれるのはありがたいけれど、
漢文をTeXで扱う場合に、Adobe Japan 1-5(20313字)にない
文字が時々出てくる(例えば『列子』など)時など、IPAMJに
その文字があると、助かる。
出来れば、中国の古典籍に出てくる文字を積極的に
IPAMJに収録するようにしてもらいたいとおもっている。
もっとも、戸籍用の文字を収録することは、行政上から
いえば、最優先事項であることは理解できるのだが。
956デフォルトの名無しさん
2017/12/31(日) 10:25:58.42ID:rHg6Qc+M 超漢字で17万文字
957デフォルトの名無しさん
2017/12/31(日) 10:27:32.66ID:hZnZn3Kf958デフォルトの名無しさん
2017/12/31(日) 11:52:08.16ID:KA+WHx0L やったから、なに?
959デフォルトの名無しさん
2017/12/31(日) 11:54:37.82ID:BxTIUPKK >956
「超漢字」というのは東大で開発したGTフォントなのですが、
ただ、いかんせん。フォントが綺麗でないので、
例えば本文を「ヒラギノ」や「小塚明朝」で組んだ時に
GTフォントを入れると、かなり違和感を感じるので、
現在は、Adobe Japan 1-5やIPAMJにない字は、
Adobe Illustratorで作字している
「超漢字」というのは東大で開発したGTフォントなのですが、
ただ、いかんせん。フォントが綺麗でないので、
例えば本文を「ヒラギノ」や「小塚明朝」で組んだ時に
GTフォントを入れると、かなり違和感を感じるので、
現在は、Adobe Japan 1-5やIPAMJにない字は、
Adobe Illustratorで作字している
960デフォルトの名無しさん
2018/01/01(月) 13:59:19.71ID:Yzi7nKjn テキストエンコードに詳しい方、教えてください
下記リンクは日本語サイトの日本語テキストファイルですが
「ファイル名」が文字化けして文字コードが不明です(ファイルの本文は Shift_JIS でした)
「正しいファイル名」および「ファイル名の言語」(外国語?)が分かれば教えてください
また言語不明のファイル名を簡単に判別する方法があれば教えてください
http://www.monzen.org/doc/fonts/free/all/%e3%81%a6%e3%81%82%e3%81%a8%e3%82%8b%ef%bc%91%ef%bc%96/%e9-%e9%e1%e9%e3%e9%da%e9P%e9U.TTF%e9+%e9-%e9%f3%e9-.txt
下記リンクは日本語サイトの日本語テキストファイルですが
「ファイル名」が文字化けして文字コードが不明です(ファイルの本文は Shift_JIS でした)
「正しいファイル名」および「ファイル名の言語」(外国語?)が分かれば教えてください
また言語不明のファイル名を簡単に判別する方法があれば教えてください
http://www.monzen.org/doc/fonts/free/all/%e3%81%a6%e3%81%82%e3%81%a8%e3%82%8b%ef%bc%91%ef%bc%96/%e9-%e9%e1%e9%e3%e9%da%e9P%e9U.TTF%e9+%e9-%e9%f3%e9-.txt
961デフォルトの名無しさん
2018/01/01(月) 23:24:57.94ID:x9zbFP4w 明けましておめでとうございます
2018年の文字コード業界はどうなるやら(去年の使い回し)
2018年の文字コード業界はどうなるやら(去年の使い回し)
962デフォルトの名無しさん
2018/01/02(火) 12:20:49.37ID:Y/4ObyK1963デフォルトの名無しさん
2018/01/02(火) 12:36:54.34ID:Y/4ObyK1 http://www.monzen.org/doc/fonts/free/all/てあとる16/
ここの中身見たけどファイルが5個あって
1)てあとる16/てあとる16.TTFについて.txt
2)てあとる16/てあとる16.TTF
3)てあとる16/(化けてる).TTF(化けてる).txt
4)てあとる16/(化けてる)16.TTF
5)てあとる16/Theatres16.zip
たぶん (3) をダウンロードしたんだと思うけど
zip の中をみると (1) と (2) しかないから
サイズも同じだし (1)-(3) と (2)-(4) は同じ名前(文字列)なんだろうね
ここの中身見たけどファイルが5個あって
1)てあとる16/てあとる16.TTFについて.txt
2)てあとる16/てあとる16.TTF
3)てあとる16/(化けてる).TTF(化けてる).txt
4)てあとる16/(化けてる)16.TTF
5)てあとる16/Theatres16.zip
たぶん (3) をダウンロードしたんだと思うけど
zip の中をみると (1) と (2) しかないから
サイズも同じだし (1)-(3) と (2)-(4) は同じ名前(文字列)なんだろうね
964デフォルトの名無しさん
2018/01/02(火) 12:49:17.66ID:Y/4ObyK1 コード見ると
てあとる: e92de9e1e9e3e9da
16: e950e955
について: e92be92de9f3e92d
なんだろうけど
e92d が「て」だけじゃなくて「つ」と思われる部分にも使われてるのが謎
てあとる: e92de9e1e9e3e9da
16: e950e955
について: e92be92de9f3e92d
なんだろうけど
e92d が「て」だけじゃなくて「つ」と思われる部分にも使われてるのが謎
965デフォルトの名無しさん
2018/01/02(火) 13:15:02.16ID:Y/4ObyK1 あとは「てあとる」をどっかの言語のコードページとかで適当に変換してみて「e92de9e1e9e3e9da」のバイト純になるものを探せ
http://docs.python.jp/3/library/codecs.html#standard-encodings
http://docs.python.jp/3/library/codecs.html#standard-encodings
966デフォルトの名無しさん
2018/01/02(火) 22:57:59.20ID:5gV1mnpW 「16」の部分がE950 E955なのはShift_JISから来たのかなと思うけど(Shift_JISでは8250 8255)
「てあとる」「について」は謎だな
「てあとる」「について」は謎だな
967デフォルトの名無しさん
2018/01/03(水) 04:10:39.66ID:v5sFvWN4968デフォルトの名無しさん
2018/01/03(水) 12:59:16.54ID:j114ZuXB (>>967の続き)
あと素人臭い質問ですいませんが、下記テキストファイルをWindows環境で表示する方法はありますか?
同ディレクトリにあるotf(お試しフォント)はDLできるのですがテキストファイル3個は表示もDLもできませんでした
http://www.monzen.org/doc/fonts/free.next/%e3%83%a2%e3%83%88%e3%83%a4%e3%81%8a%e8%a9%a6%e3%81%97/UD%e3%83%a2%e3%83%88%e3%83%a4%e6%98%8e%e6%9c%9d2B/ntnum2bmst/%e6%96%87%e5%ad%97%e7%a8%ae%e4%b8%80%e8%a6%a7.txt
あと素人臭い質問ですいませんが、下記テキストファイルをWindows環境で表示する方法はありますか?
同ディレクトリにあるotf(お試しフォント)はDLできるのですがテキストファイル3個は表示もDLもできませんでした
http://www.monzen.org/doc/fonts/free.next/%e3%83%a2%e3%83%88%e3%83%a4%e3%81%8a%e8%a9%a6%e3%81%97/UD%e3%83%a2%e3%83%88%e3%83%a4%e6%98%8e%e6%9c%9d2B/ntnum2bmst/%e6%96%87%e5%ad%97%e7%a8%ae%e4%b8%80%e8%a6%a7.txt
969デフォルトの名無しさん
2018/01/04(木) 01:19:32.08ID:gDBGL8Zs 欧文環境かなんかで文字化けしたままzipばらしたっぽいな
970デフォルトの名無しさん
2018/01/04(木) 01:35:20.16ID:1mKOov/G971デフォルトの名無しさん
2018/01/04(木) 09:46:56.03ID:GKignaEj972デフォルトの名無しさん
2018/01/04(木) 20:41:42.26ID:LRBrKk4Y >>967
元はShift_JISで書かれたサイトっぽいけど「webサーバー側」の文字コード設定が間違ってて
HTMLとしてすでに正しくない文字コードというかバイト列が出力されてしまってる感じで
さらにfirefoxが文字コード検出を間違ったまま表示してる感じがする
ちなみに文字化けしたままでもfirefoxでマウスオーバーしたときに左下に出て来る日本語はたまに正常たったりする
文字化けにも色々あるけど文字通り壊れたバイト列だともうどうしようもない
元はShift_JISで書かれたサイトっぽいけど「webサーバー側」の文字コード設定が間違ってて
HTMLとしてすでに正しくない文字コードというかバイト列が出力されてしまってる感じで
さらにfirefoxが文字コード検出を間違ったまま表示してる感じがする
ちなみに文字化けしたままでもfirefoxでマウスオーバーしたときに左下に出て来る日本語はたまに正常たったりする
文字化けにも色々あるけど文字通り壊れたバイト列だともうどうしようもない
973デフォルトの名無しさん
2018/01/04(木) 21:05:29.96ID:LRBrKk4Y >>968
サーバー側の設定が間違ってると間違った文字コードでリクエストしてファイルは存在してても
違うバイト列だからファイルシステム上に見つからないとかいう状態になってそうなので
あとはだめもとでHTML側のURLを使わずに
判ってる方のファイル名
www.monzen.org/doc/fonts/free.next/モトヤお試し/UDモトヤ明朝2B/ntnum2bmst/文字種一覧.txt
を自分でURLエンコードしてリクエストしてみるとか
サーバー側の設定が間違ってると間違った文字コードでリクエストしてファイルは存在してても
違うバイト列だからファイルシステム上に見つからないとかいう状態になってそうなので
あとはだめもとでHTML側のURLを使わずに
判ってる方のファイル名
www.monzen.org/doc/fonts/free.next/モトヤお試し/UDモトヤ明朝2B/ntnum2bmst/文字種一覧.txt
を自分でURLエンコードしてリクエストしてみるとか
974デフォルトの名無しさん
2018/01/04(木) 22:02:18.09ID:LUbaT8ef 上の階層のntnum2bmst.zipなら落とせた。
975デフォルトの名無しさん
2018/01/04(木) 23:05:06.84ID:7OOzLizu >>972-974
ありがとうございます
該当のテキストがどうしても読みたいというよりも
<何故こういう現象が起きてるのか?>のほうに興味があって質問させていただきました
文字コードの世界って本当に奥が深いですね
文字フォントについても色々疑問があるのですが、それはフォントスレで質問するべきですね
(PCにインストールしていいフォント数の上限とか)
ありがとうございます
該当のテキストがどうしても読みたいというよりも
<何故こういう現象が起きてるのか?>のほうに興味があって質問させていただきました
文字コードの世界って本当に奥が深いですね
文字フォントについても色々疑問があるのですが、それはフォントスレで質問するべきですね
(PCにインストールしていいフォント数の上限とか)
976デフォルトの名無しさん
2018/01/05(金) 00:49:01.50ID:76HunQx1 ためになるスレだなあ
977デフォルトの名無しさん
2018/01/05(金) 17:51:46.56ID:GkCjRoy7 無理やり読ませるとそれなりの割合の人間に急性ショック症状を起こすスレでもある・・・
978デフォルトの名無しさん
2018/01/08(月) 12:30:50.80ID:6qORCJqP 今年でJIS漢字制定40周年なんだな。
979デフォルトの名無しさん
2018/01/08(月) 13:20:24.34ID:g3wGVkXu 40cmくらいのウンコード出た
長過ぎて一回で流れなかった
5回目くらいでやっと視界から消えた
長過ぎて一回で流れなかった
5回目くらいでやっと視界から消えた
980デフォルトの名無しさん
2018/01/09(火) 07:25:31.13ID:4jYqaTLN ウンコ駆動ですね判ります
981デフォルトの名無しさん
2018/01/09(火) 11:13:21.97ID:SxMgaYrJ ためになるスレだなあ
982デフォルトの名無しさん
2018/01/11(木) 01:29:58.58ID:8ozacBxV 【しつもん@A】
@Windowsで同一フォルダ内に全く同じファイル名+拡張子があって不審に思い
ファイル名をメモ帳にコピペしても瓜二つ
でもWordにコピペすると片方は「ジ」や「ペ」の後ろに空白文字が出てくる
Aニコニコ動画をDLしてるとたまに「グ」が「ク_ 」に文字化けする
@Aの発生原因は分りますか? (どれもネットから落としたファイルです)
@Windowsで同一フォルダ内に全く同じファイル名+拡張子があって不審に思い
ファイル名をメモ帳にコピペしても瓜二つ
でもWordにコピペすると片方は「ジ」や「ペ」の後ろに空白文字が出てくる
Aニコニコ動画をDLしてるとたまに「グ」が「ク_ 」に文字化けする
@Aの発生原因は分りますか? (どれもネットから落としたファイルです)
983デフォルトの名無しさん
2018/01/11(木) 01:41:04.05ID:0E6TKJI8 Wordを持ってるならその空白文字の後ろでAlt+Xしてみ
そしたら文字コードに変換されるから何がついてるか分かる
そしたら文字コードに変換されるから何がついてるか分かる
984デフォルトの名無しさん
2018/01/11(木) 02:16:47.71ID:8ozacBxV >>983 ありがトン
@「ジ 」が「シ3099」に変わった
A「ク_ 」が「ク005F」に変わった
@は↓の「Unicode正規化」ってやつですかね? Aは分らないけど
http://tech.albert2005.co.jp/501/
@「ジ 」が「シ3099」に変わった
A「ク_ 」が「ク005F」に変わった
@は↓の「Unicode正規化」ってやつですかね? Aは分らないけど
http://tech.albert2005.co.jp/501/
985デフォルトの名無しさん
2018/01/11(木) 12:49:11.03ID:F0gXla1d 2は、ダウンロードするソフトがファイル名に使えなさそうな文字をアンダースコアに変えてるのでは
986デフォルトの名無しさん
2018/01/11(木) 16:02:48.08ID:rE/gsUWL 合成済み文字と結合文字列の違いは
Windowsとmacでデータのやりとりをしていると稀によくある
Windowsとmacでデータのやりとりをしていると稀によくある
987デフォルトの名無しさん
2018/01/11(木) 17:06:01.77ID:WekjUxUo >>985-986 ありがトン
A ニコニコ動画の無料アニメ2本 上の「グルグル」は文字化けしないが、下のは化ける
http://www.nico video.jp/watch/1499326505
魔法陣グルグル PV
http://www.nico video.jp/watch/1500538647
魔法陣ク?ルク?ル 第1話「旅立ち!ジミナ村!」
下の動画タイトルをWordにコピペ&Alt+Xすると「ク3099」なので、上とは違った文字コードで書かれてる模様
ブラウザ上では見分けがつかないが、DLすると「ク_ 」=「ク005F」に化ける
ニコ動はブラウザで見ることを前提にしてるのでクレームをつけるわけにもいかないが
バラバラの文字コードで書かれるとモヤッとする
A ニコニコ動画の無料アニメ2本 上の「グルグル」は文字化けしないが、下のは化ける
http://www.nico video.jp/watch/1499326505
魔法陣グルグル PV
http://www.nico video.jp/watch/1500538647
魔法陣ク?ルク?ル 第1話「旅立ち!ジミナ村!」
下の動画タイトルをWordにコピペ&Alt+Xすると「ク3099」なので、上とは違った文字コードで書かれてる模様
ブラウザ上では見分けがつかないが、DLすると「ク_ 」=「ク005F」に化ける
ニコ動はブラウザで見ることを前提にしてるのでクレームをつけるわけにもいかないが
バラバラの文字コードで書かれるとモヤッとする
988デフォルトの名無しさん
2018/01/13(土) 18:28:46.68 >>987
「魔法陣グルグル 」だけを抜き出してみると
魔法陣グルグル PV
¥u9b54¥u6cd5¥u9663¥u30b0¥u30eb¥u30b0¥u30eb¥u3000
魔法陣グルグル 第1話「旅立ち!ジミナ村!」
¥u9b54¥u6cd5¥u9663¥u30af¥u3099¥u30eb¥u30af¥u3099¥u30eb¥u3000
下の方は半角カナ(グルグル)から変換したとかかなあ
ウェブブラウザでは一見区別が付かないのも困りものだ
「魔法陣グルグル 」だけを抜き出してみると
魔法陣グルグル PV
¥u9b54¥u6cd5¥u9663¥u30b0¥u30eb¥u30b0¥u30eb¥u3000
魔法陣グルグル 第1話「旅立ち!ジミナ村!」
¥u9b54¥u6cd5¥u9663¥u30af¥u3099¥u30eb¥u30af¥u3099¥u30eb¥u3000
下の方は半角カナ(グルグル)から変換したとかかなあ
ウェブブラウザでは一見区別が付かないのも困りものだ
989デフォルトの名無しさん
2018/01/13(土) 19:15:50.63ID:kgVvsCNy MacとかiPhoneとか、Apple製品は濁点を結合文字列で扱うのがデフォだったはず
990デフォルトの名無しさん
2018/01/13(土) 19:16:22.00ID:bGec8C/6 半角カナから単純に変換したのであればク゛(30af 309b)になってそうだけど
991デフォルトの名無しさん
2018/01/14(日) 06:16:21.53ID:piPpz4p9 ものかのとかいう奴がそんな訳語を提唱してたっけw
992デフォルトの名無しさん
2018/01/16(火) 16:24:03.09ID:gClSSJeQ Combining Character Sequence
公式日本語訳の「結合文字の並び」は何だか使いにくいし
公式日本語訳の「結合文字の並び」は何だか使いにくいし
993デフォルトの名無しさん
2018/01/16(火) 21:25:09.69ID:LbNJCNQU 単一の文字を表すくせに文字列と呼ぶのもいまいちだし悩ましいところだな
994デフォルトの名無しさん
2018/01/16(火) 21:58:19.78 「結合文字列」って、「合州国」みたいなもんか
995デフォルトの名無しさん
2018/01/17(水) 15:56:04.49ID:9Sws3XK1 合衆国の誤字だっけ
996デフォルトの名無しさん
2018/01/20(土) 12:33:26.67ID:4AOaXNlF997デフォルトの名無しさん
2018/01/21(日) 14:15:27.16ID:zFm0SEQ6 ttp://ufcpp.net/blog/2018/1/getunicodecategory/
ASCII 圏の人、ほんとに Unicode 追加面を知らない
・「こんなのほっといてもすぐに追加されるだろう」とか甘い
・たぶん、日本人か中国人が言い出さないと進まない
ASCII 圏の人、ほんとに Unicode 追加面を知らない
・「こんなのほっといてもすぐに追加されるだろう」とか甘い
・たぶん、日本人か中国人が言い出さないと進まない
998デフォルトの名無しさん
2018/01/21(日) 22:23:53.16ID:b31s5s8Q Unicodeはただの絵文字コードに成り下がったよ
999デフォルトの名無しさん
2018/01/22(月) 02:43:08.18ID:NUz81bxR ユニコードにきちんと対応してほしいフリーソフトは多い
IrfanView
Lhaz
FileSum
IrfanView
Lhaz
FileSum
1000デフォルトの名無しさん
2018/01/22(月) 02:44:17.64ID:NUz81bxR ついでに埋め
次スレが立ったらまたよろしく
次スレが立ったらまたよろしく
10011001
Over 1000Thread このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 830日 6時間 15分 17秒
新しいスレッドを立ててください。
life time: 830日 6時間 15分 17秒
10021002
Over 1000Thread 5ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。
───────────────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────
会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。
▼ プレミアム会員登録はこちら ▼
https://premium.5ch.net/
▼ 浪人ログインはこちら ▼
https://login.5ch.net/login.php
運営にご協力お願いいたします。
───────────────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────
会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。
▼ プレミアム会員登録はこちら ▼
https://premium.5ch.net/
▼ 浪人ログインはこちら ▼
https://login.5ch.net/login.php
レス数が1000を超えています。これ以上書き込みはできません。
ニュース
- 日本の立場説明へ…外務省局長が北京到着 “台湾有事”首相答弁に中国反発 ★3 [煮卵★]
- 国内ホテル、既にキャンセルも 訪日客関連業界、事態見守る ★2 [蚤の市★]
- NHK、受信料の未払い世帯に督促強化へ 民事手続きの新組織を設置 差し押さえなどの強制執行も [1ゲットロボ★]
- 橋下徹氏「この喧嘩は日本の完敗」 台湾有事答弁めぐる外務省局長訪中で指摘「中国に怒られてご説明に伺った日本と見られる」 [muffin★]
- 【日本大使館】中国在留邦人は安全確保を [ぐれ★]
- 【外交】日中関係悪化、長期化の様相 2012年には自動車輸出80%減も ロイター★2 [1ゲットロボ★]
- 高市早苗の中国問題、「オーバーツーリズムが解消されてウザい中国人が消えるから日本の勝ち」という風潮になってしまう [562983582]
- 「稼ぐのよ!」高市が電話でガチャ切り😱鈴木農水大臣に伝えたこと… [993451824]
- 愛国者ナザレンコ「左翼は自己中な差別主義者で偽善者。日本人ファーストを叩いておいて台湾人が死んでも知らな〜いでしょ。中露の犬」 [856698234]
- 【悲報】有名ウヨ論客、「現実的に考えて中国と仲直りするしかなくね?」と言ったら野良ウヨから総叩きにあう [856698234]
- 【高市悲報】経団連会長、高市と面談「おい!ちゃんと中国と対話しろよ!😨」 [359965264]
- 【悲報】女性初の総理大臣 高市早苗氏、安倍晋三さんが積み上げてきたものを一瞬でぶっ壊してしまう😱wwwwwwwwwwwwwwwwwwwwww [871926377]
