前スレ
C++相談室 part156
https://mevius.5ch.net/test/read.cgi/tech/1621389313/
探検
C++相談室 part157
レス数が1000を超えています。これ以上書き込みはできません。
2021/08/09(月) 10:57:31.60ID:JaaB5Egp
966デフォルトの名無しさん
2021/11/13(土) 21:14:20.03ID:aIrFEHKz 自分はHTML5の仕様に従って変換してます!
967デフォルトの名無しさん
2021/11/14(日) 08:24:14.02ID:gLhea8X6 >>959
結合文字列があるから、結局コードポイントに必ず1文字が対応しているとは限らないし、
何使ってもUnicodeは闇じゃないか。
まあ、UTF32使えばコードポイントがぶっ壊れることは避けられるけれども。
結合文字列があるから、結局コードポイントに必ず1文字が対応しているとは限らないし、
何使ってもUnicodeは闇じゃないか。
まあ、UTF32使えばコードポイントがぶっ壊れることは避けられるけれども。
968デフォルトの名無しさん
2021/11/14(日) 09:14:46.42ID:ybz8bu8o この場合同じコードポイントでの変換なわけだし一文字がどうとか関係ないが。
969デフォルトの名無しさん
2021/11/14(日) 10:38:12.94ID:G9ajtZXw >>948
Perl/Ruby/JSなんかで正規表現を使って置換する場合でも、
同じようなアルゴリズムを使ってるはずだから、これが
特に非効率なわけではないし、代わりになるアルゴリズムで
これよりトータルで効率の良いものも恐らく存在しない。
1.例えば、0x0aと0x09の出現回数を最初に数えれば、必要な
dstのバイト数を見積もることは可能だが、その場合は、
二回もパースが必要になるし、プログラムも分かりにくくなる。
二回パースすることによる速度低下も有る。
2.dstのサイズはsrcのサイズの2倍を越えないので、単純に
dstの内部バッファをsrcのバイト数の2倍として予約しておけば
メモリ確保は一回で済むが、srcが巨大な時、メモリを圧迫し、
余り良いアルゴリズムとは言えない。
Perl/Ruby/JSなんかで正規表現を使って置換する場合でも、
同じようなアルゴリズムを使ってるはずだから、これが
特に非効率なわけではないし、代わりになるアルゴリズムで
これよりトータルで効率の良いものも恐らく存在しない。
1.例えば、0x0aと0x09の出現回数を最初に数えれば、必要な
dstのバイト数を見積もることは可能だが、その場合は、
二回もパースが必要になるし、プログラムも分かりにくくなる。
二回パースすることによる速度低下も有る。
2.dstのサイズはsrcのサイズの2倍を越えないので、単純に
dstの内部バッファをsrcのバイト数の2倍として予約しておけば
メモリ確保は一回で済むが、srcが巨大な時、メモリを圧迫し、
余り良いアルゴリズムとは言えない。
970デフォルトの名無しさん
2021/11/14(日) 10:52:13.79ID:G9ajtZXw >>951
文字列のバッファは、不足すると2倍、2倍、・・・で確保されていくので
確保される回数は、最終的な文字列のバイト数を N としたとき、大体、
log2(N) 回程度となり、バッファがコピーされるトータルのバイト数は、
b = a + a*2 + a*2^2 + a* 2^3 + ... + a* 2^k
k = log2(N) 程度
a = 文字列クラスの内部バッファの初期バイト数。
となり、大体で言えば、2N を越えない。
1 + 2 + 2^2 + 2^3 + ... + 2^k
は 2進数で考えれば、全てのビットが 1 に成っている整数で、
2^{k+1} = 2*2^k = 2*2^{log2(N)} = 2 * N
であることに注意する。
ただし、bの値は大体で書いたので、厳密には少し違うだろう。
文字列のバッファは、不足すると2倍、2倍、・・・で確保されていくので
確保される回数は、最終的な文字列のバイト数を N としたとき、大体、
log2(N) 回程度となり、バッファがコピーされるトータルのバイト数は、
b = a + a*2 + a*2^2 + a* 2^3 + ... + a* 2^k
k = log2(N) 程度
a = 文字列クラスの内部バッファの初期バイト数。
となり、大体で言えば、2N を越えない。
1 + 2 + 2^2 + 2^3 + ... + 2^k
は 2進数で考えれば、全てのビットが 1 に成っている整数で、
2^{k+1} = 2*2^k = 2*2^{log2(N)} = 2 * N
であることに注意する。
ただし、bの値は大体で書いたので、厳密には少し違うだろう。
971デフォルトの名無しさん
2021/11/14(日) 10:59:39.62ID:G9ajtZXw >>970
1 + 2 + 2^2 + 2^3 + ... + 2^k
= Σ_{i=0}^k 2^i
= (1 - 2^{k+1}) / (1 - 2)
= 2^{k+1} - 1
である。途中、等比数列の和の公式:
等比数列の和 = 初項 * ( 1 - 公比^項数) - ( 1 - 公比 )
を用いた。
1 + 2 + 2^2 + 2^3 + ... + 2^k
= Σ_{i=0}^k 2^i
= (1 - 2^{k+1}) / (1 - 2)
= 2^{k+1} - 1
である。途中、等比数列の和の公式:
等比数列の和 = 初項 * ( 1 - 公比^項数) - ( 1 - 公比 )
を用いた。
972デフォルトの名無しさん
2021/11/14(日) 11:04:20.53ID:G9ajtZXw973デフォルトの名無しさん
2021/11/14(日) 12:08:34.21ID:p964tW2k 俺は数年前業を煮やして自前のstringクラスを作ってしまった(´・ω・`)
・sjis/utf8/utf16/utf32対応で比較・代入などどの組み合わせでも問題なく動く
・どの文字コードでも同じハッシュ値を生成する
・char型がsjisなのかutf8なのかはdefineで決める
・テンプレートベースのformatを用意してprintfを置き換え
みたいな
・sjis/utf8/utf16/utf32対応で比較・代入などどの組み合わせでも問題なく動く
・どの文字コードでも同じハッシュ値を生成する
・char型がsjisなのかutf8なのかはdefineで決める
・テンプレートベースのformatを用意してprintfを置き換え
みたいな
974デフォルトの名無しさん
2021/11/14(日) 12:57:01.80ID:hL5WeBkj >>973
保持するときのエンコードは?
保持するときのエンコードは?
975デフォルトの名無しさん
2021/11/14(日) 12:58:38.01ID:p964tW2k >>974
文字コードの種類に1バイト用意して、後はそれぞれの文字コードで直接保存している
文字コードの種類に1バイト用意して、後はそれぞれの文字コードで直接保存している
976デフォルトの名無しさん
2021/11/14(日) 13:30:12.63ID:mwYTHPjW えー
コンストラクタで各種文字コードのバイト列を受け取れるようにして内部保持形式はUTF32でよくない?
コンストラクタで各種文字コードのバイト列を受け取れるようにして内部保持形式はUTF32でよくない?
977デフォルトの名無しさん
2021/11/14(日) 13:42:53.43ID:p964tW2k それだと大きめのテキストファイルを開いたときなどいちいち変換が入って遅くなりそうだから…といっても実際にはどっちが効率良いのかまでは比べてないけど
異なる文字コード同士比較する時なんかはコードポイント単位で読み出して結局utf32ベースで処理するしな…
異なる文字コード同士比較する時なんかはコードポイント単位で読み出して結局utf32ベースで処理するしな…
978デフォルトの名無しさん
2021/11/14(日) 13:44:30.36ID:E00roTgy >dstのサイズはsrcのサイズの2倍を越えない
しね
しね
979デフォルトの名無しさん
2021/11/14(日) 13:59:19.66ID:5aeLrxCA プログラマーは3種類しかいない
文字コードが分からない一般プログラマー
文字コードを理解したと勘違いしている地雷プログラマー
そして人類が文字コードを理解するのは不可能だと悟った上でなんとか事故が起こらないように心を砕く真の専門家だ
文字コードが分からない一般プログラマー
文字コードを理解したと勘違いしている地雷プログラマー
そして人類が文字コードを理解するのは不可能だと悟った上でなんとか事故が起こらないように心を砕く真の専門家だ
980デフォルトの名無しさん
2021/11/14(日) 14:17:19.40ID:p964tW2k >>976
あーあとは、これのstring_viewバージョンがあって、関数のパラメータをconst mystring_view& strみたいに受けると、どんな対応してる文字なら(リテラルや対応してるクラス含めて)なんでも参照として受け付けるから便利なんだよね
あーあとは、これのstring_viewバージョンがあって、関数のパラメータをconst mystring_view& strみたいに受けると、どんな対応してる文字なら(リテラルや対応してるクラス含めて)なんでも参照として受け付けるから便利なんだよね
981デフォルトの名無しさん
2021/11/14(日) 14:59:21.42ID:WpZMPVn+ それconst&いるんか?
982デフォルトの名無しさん
2021/11/14(日) 15:13:11.67ID:p964tW2k 実質的にはほとんどなにも変わらないと思うけど、無駄なコピーが減る場合もあるので付けておくに越したことはないと思う
983デフォルトの名無しさん
2021/11/14(日) 15:45:24.64ID:p964tW2k まぁ、でも参照もコストゼロってわけじゃないから、場合によっては遅くなることもあるか…
984デフォルトの名無しさん
2021/11/14(日) 16:54:05.80ID:tkHjD9h1 const って伝播するから嫌い
付けるのは反対ではないが
付けるのは反対ではないが
985デフォルトの名無しさん
2021/11/14(日) 17:26:15.73ID:CXUBNW9m 伝播ってどういうこと?
986はちみつ餃子 ◆8X2XSCHEME
2021/11/14(日) 17:38:21.62ID:A4GQ1/1N 参照で受け取るときには const を付けないと右辺値を受け取れないんだよ。
&& にしたら逆に右辺値しか受け取れないし、
テンプレートにするのも面倒くさいし、
const 参照で不都合がないならまずそれを選ぶのが常道になってる。
積極的にそうする必要はなくても手癖でやるよね。
&& にしたら逆に右辺値しか受け取れないし、
テンプレートにするのも面倒くさいし、
const 参照で不都合がないならまずそれを選ぶのが常道になってる。
積極的にそうする必要はなくても手癖でやるよね。
987はちみつ餃子 ◆8X2XSCHEME
2021/11/14(日) 17:44:17.95ID:A4GQ1/1N >>985
const 無しから const 付きの参照へは暗黙の型変換が許されるがその逆はない。
const 付きにしたらそれがずっと伝わっていくってことだ。
元のオブジェクトが const でないなら const_cast で const を剥がして書き換えるのは一応は有りなはずだが、
かなり行儀が悪いしな。
const 無しから const 付きの参照へは暗黙の型変換が許されるがその逆はない。
const 付きにしたらそれがずっと伝わっていくってことだ。
元のオブジェクトが const でないなら const_cast で const を剥がして書き換えるのは一応は有りなはずだが、
かなり行儀が悪いしな。
988デフォルトの名無しさん
2021/11/14(日) 17:59:13.06ID:CXUBNW9m スコープ限定のconstを欲するひとがいるとは思わんかった
989デフォルトの名無しさん
2021/11/14(日) 18:02:00.71ID:nLCz7RQY 責任ベースのconstは有り得るのでは?
privateが在るんだから。
privateが在るんだから。
990デフォルトの名無しさん
2021/11/14(日) 18:05:38.66ID:leu9kbhs というか伝播しなかったら困るのでは?
お行儀悪くconst_castしない前提なら
ある関数の引数がconstだったら、その関数が呼び出す関数もまたconstであるという保証は大切だろうし
お行儀悪くconst_castしない前提なら
ある関数の引数がconstだったら、その関数が呼び出す関数もまたconstであるという保証は大切だろうし
991デフォルトの名無しさん
2021/11/14(日) 18:45:07.42ID:nLCz7RQY もちろんそれは大切ですよ。
伝搬しなかったら意味ないし。
伝搬しなかったら意味ないし。
992ハノン ◆QZaw55cn4c
2021/11/14(日) 19:45:46.13ID:5CSGBVhH K&R2 にも const はありますが全然使わなかったなあ…volatile 同様キワモノだとおもっていました(爆)
993デフォルトの名無しさん
2021/11/14(日) 22:33:34.47ID:oUoND4t/ C++20からコルーチン入るけどコルーチンの返り値に関数内の変数の参照返すの問題になるかな?
hoge& test(){
hoge tmp;
for(int i=0;i<10;++i){
co_yield tmp;
}
}
//返り値は実際はgeneratorとかになるかもしれない
hoge& test(){
hoge tmp;
for(int i=0;i<10;++i){
co_yield tmp;
}
}
//返り値は実際はgeneratorとかになるかもしれない
994デフォルトの名無しさん
2021/11/14(日) 22:35:39.21ID:PetPaRNq yeild使えるようになるのか
995デフォルトの名無しさん
2021/11/15(月) 01:03:02.10ID:tPLK0GqY viewは値渡しが基本だよ
996デフォルトの名無しさん
2021/11/15(月) 06:05:50.61ID:Rt8JG1Np 何かのリミッタが外れた感じだね
無差別にぶち込むようになった
無差別にぶち込むようになった
997デフォルトの名無しさん
2021/11/15(月) 06:11:48.42ID:Rt8JG1Np 江添が逃げた理由も察しがつく
998デフォルトの名無しさん
2021/11/15(月) 15:55:33.66ID:Ux5WoKB6 更新してないよね
999デフォルトの名無しさん
2021/11/15(月) 16:41:30.12ID:i/3H6iLT hage
1000デフォルトの名無しさん
2021/11/15(月) 16:42:03.92ID:i/3H6iLT 10^3
10011001
Over 1000Thread このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 98日 5時間 44分 33秒
新しいスレッドを立ててください。
life time: 98日 5時間 44分 33秒
レス数が1000を超えています。これ以上書き込みはできません。
ニュース
- 【野球】大谷翔平、佐々木朗希、山本由伸らがWBC辞退なら広がる不協和音… 『過去イチ盛り上がらない大会』になる可能性も★2 [冬月記者★]
- 【国際】ロシアはすでに戦争準備段階――ポーランド軍トップが警告 [ぐれ★]
- 【news23】小川彩佳アナ「ここまでの広がりになるということを、高市総理はどれだけ想像できていたんでしょうね」 日中問題特集で [冬月記者★]
- 「町中華」の“息切れ倒産”が増加 ブームにも支えられ職人技で踏ん張ってきたが… 大手チェーンは値上げでも絶好調 [ぐれ★]
- 毛寧(もう・ねい)報道官「中国に日本の水産品の市場は無い」 高市首相の国会答弁に「中国民衆の強い怒り」 ★2 [ぐれ★]
- 立民・岡田氏の質疑「不適切」 維新・藤田氏、台湾有事答弁巡り [蚤の市★]
