統計解析R たぶんpart3くらい

**デフォルトの名無しさん** · 2018/02/14(水) 19:42:52.67

データをこねくり回してグラフ書くにはexcelより融通が利いてしかも早い

ような気がする

**デフォルトの名無しさん** · 2018/02/14(水) 22:01:38.62

>>175
そりゃそうでしょうね
Excelはこねくり回さないで使うためのツールだから

**デフォルトの名無しさん** · 2018/02/14(水) 23:37:10.00

グラフはggplot2が強力だよね
facetとかはExcelだと大変

デフォルトのテーマが少し古くさいけど

**デフォルトの名無しさん** · 2018/02/14(水) 23:51:00.08

R使い出してから色々と試すのが簡単なんで面白いわ

**デフォルトの名無しさん** · 2018/02/15(木) 01:24:08.19

機械学習とかビッグデータとかPythonと何かの組み合わせに圧倒されててRとかどマイナーになってしもうた

**デフォルトの名無しさん** · 2018/02/15(木) 06:34:31.40

適材適所でしょうね。
元々設計自体がデカいメモリーがあったあらと言う前提で
設計者にとっては作りが楽だけど、大容量で使う利用者が
対処しないといけないという安易なつくりなんですよね。

その代り少量データを対象とした統計手法研究などには
楽なんで。

**デフォルトの名無しさん** · 2018/02/15(木) 12:27:10.58

Rにはなんといってもtidyverseがあるからなあ
dplyrとかpurrrとか簡単で強力だから解析やるならR

まあ適材適所で、ベイズならstanだし、機械学習や文字ならPythonが優勢、事務処理ならExcelVBAってとこ

**デフォルトの名無しさん** · 2018/02/19(月) 19:54:51.25

>>171
統計って回帰分析から急に難解になる
それにじっと耐える生徒さんは偉い
R初心者の私にはとっても役立つ講義だ

**デフォルトの名無しさん** · 2018/02/22(木) 18:00:01.85

何かいいエディタないかな
Rに最初からついてるエディタ使ってるけど不便

**デフォルトの名無しさん** · 2018/02/22(木) 19:41:30.41

RStudioのエディタじゃだめかい？

**デフォルトの名無しさん** · 2018/02/23(金) 17:28:14.29

>>182
紫布さんかわいい

**デフォルトの名無しさん** · 2018/02/23(金) 20:13:41.57

>>184
RStudioは2,3回インストールしてみたけど良く分からないし重いしですぐ消してしまってたんだよね
慣れると便利なの？

**デフォルトの名無しさん** · 2018/02/23(金) 21:18:49.28

RStudioのエディタは入力補完機能が凄い便利。パッケージの関数だけでなく自分で作った変数や関数も補完してくれる。
関数のヘルプもキー一つで表示できるし、ノートブック機能を使えばエディタ内で実行結果を表示してくれる。

その他、パッケージ管理とかプロジェクト管理とか便利だと思う。

**デフォルトの名無しさん** · 2018/02/25(日) 16:50:33.30

具体的な話を聞くと便利そうな気がしてくる
やっぱりRStudioがベストなのかもね
しばらく使ってみようかな、ありがとう

**デフォルトの名無しさん** · 2018/02/26(月) 12:53:30.71

補完機能なしでプログラミングするのって、武器を持たずに福岡の街を歩くようなものだよ。

**デフォルトの名無しさん** · 2018/02/26(月) 18:57:28.32

こえぇぇぇ

**デフォルトの名無しさん** · 2018/03/03(土) 09:23:09.96

初心者には
Rコマンダーは便利だが
基本が理解するのが課題

**デフォルトの名無しさん** · 2018/03/14(水) 02:41:29.02

R version 3.4.3 でR consoleを起動した直後に乱数を発生させると
set.seedで指定していないのに前回起動時と同じ乱数が出てしまいます。たとえば
runif(5)だと
[1] 0.3108217 0.4556531 0.2194121 0.6496887 0.2677915
が毎回出てきます。
そういのものなのでしょうか？

**デフォルトの名無しさん** · 2018/03/14(水) 02:55:44.49

>>192
R x64 3.4.1（windows10）ではそれを再現できなかった
そういうものではないと思う

**デフォルトの名無しさん** · 2018/03/14(水) 13:07:49.78

>>193　ありがとうございます。そうなんですか。自分の環境はwin7sp1 64bit で
Rは5年前にインストールしその後何度か上書きインストールしたまに使っててたんですが
何らかの理由でRの中の設定が変更されたか破壊されてるんですかね
原因がわかったらまた書きます。

**デフォルトの名無しさん** · 2018/03/14(水) 14:55:10.28

>>192
R3.4.3@Win10だけどそういう状態にはならないねえ。RStudioとかVSCodeとかでも何度かやってみたけど全て違う値。
事前にhtmlwidgetとか使ってない？

**デフォルトの名無しさん** · 2018/03/14(水) 16:28:52.83

>>192です
試しに別のフォルダに新規インストールして何度か起動を繰り返して確認してみたら
正常に毎回違う乱数がでました。
なのでもう新規インストールで実行することにしました。
でも、どこに問題があるのか特定しないとまた起きそうなので少しづつパッケージを削除しつつ確認中・・・
>>195
ありがとうございます。
htmlwidgetsって何？って感じなんですが入ってました。
いつ何のために入れたのかもわからないのですが(笑)

**デフォルトの名無しさん** · 2018/03/14(水) 17:15:01.96

>>192です。
パッケージの問題ではなくて、パッケージの作者の方々疑ってごめんなさい

どうも>>195さんの指摘どおり事前になにかが読み込まれてること気づきました
起動直後にカーソルの↑を押すとなぜか
昔コンソールで打ち込んだコマンドが未だに出てきちゃうんです
たとえば、
> source('~/R/test.r')　

**デフォルトの名無しさん** · 2018/03/14(水) 17:57:53.40

.Rhistoryがおかしくなっちゃったのかな？まあ、原因が分かってなにより？

**デフォルトの名無しさん** · 2018/03/14(水) 18:20:45.09

>>192です。
原因がわかりました。
[Previously saved workspace restored]と出てることに今気づきまして
以前マイドキュメントに保存していたワークスペースが自動で読み込まれるためでした。
でもなぜか、"test.RData"の名前で保存したものは自動で読み込まれず
".RData"のように拡張子のみのファイル名が存在するとそれが読み込まれるようです。

新規インストールのRではがあっても読み込まれないのですが、
試しにC:\Program Files\R\R-3.4.3\bin\x64のフォルダ内にコピペしたら起きるようなので
変な名前やいけない場所には保存しては駄目ってことですね

ありがとうございました。

**デフォルトの名無しさん** · 2018/03/14(水) 18:21:46.77

.Rhistoryでset.seed()使ってるってことなのか

**デフォルトの名無しさん** · 2018/03/14(水) 18:55:36.14

>>200
うちのマシーンの環境がめちゃくちゃの可能性もありますが、
新規インストール直後のコンソールで保存したワークスペースをそれで読み込んでも
同じ乱数が再現されるので
保存した時のその後の乱数生成パターンも復元されると解釈しちゃいました。

**デフォルトの名無しさん** · 2018/03/14(水) 18:58:12.34

はぇ～
そういや最近出たブルーバックスのRの本が売れてるみたいだね

**デフォルトの名無しさん** · 2018/03/14(水) 19:38:47.73

>>201
環境の自動復旧は無効にしておいた方がいいよ。ググれば無効にする方法が見かるハズ…

>>202
あの本、ブログか何かで宣伝してたよ。センセーショナルな見出しだったな。

**デフォルトの名無しさん** · 2018/03/14(水) 19:42:24.61

この記事だ
ttps://lab-on.jp/article/23

**デフォルトの名無しさん** · 2018/03/20(火) 10:02:37.61

その本を買ってＰＣで真似してます
Ｒコマンダーのお陰で敷居は下がりました
Ｒの壁は
出力データの読み方、意味するところの理解
質のよいデータはあるので頑張る

**デフォルトの名無しさん** · 2018/03/20(火) 11:50:41.25

敷居が高いと思ってる人のためのセミナーが明日、白金台の明学で開催されるよ

http://www.socialpsychology.jp/seminar/seminar2.html

**デフォルトの名無しさん** · 2018/03/20(火) 12:11:32.56

共立出版のRで学ぶデータサイエンスシリーズの15巻とか16巻は
ずっと欠けてるけどいつ出るのですか？

**デフォルトの名無しさん** · 2018/03/21(水) 13:46:02.45

>>204
jupyter notebook と pandas 最強だな

**デフォルトの名無しさん** · 2018/03/27(火) 23:23:26.50

エクセルソルバーのGRGみたいな非線形最適化制約有りをやりたいんだけど、Ｒでもできる？

**デフォルトの名無しさん** · 2018/03/29(木) 21:47:07.36

>>205です
読み終えた、とても勉強になりました
困難さはRではなく統計学でしたが
これは実践するしかないですね
気になったとこは頭に入れておきます
P112の3次元散布図ですが
Microsoft R Open version3.4(64bit)では
作図が表示されませんでした

**デフォルトの名無しさん** · 2018/03/30(金) 15:16:43.56

おめ

**デフォルトの名無しさん** · 2018/05/17(木) 10:20:38.86

Rをかじっても
やはり、考え方がわかってないとだめだね
ということで、
「入門はじめての分散分析と多重比較」を読んでる

**デフォルトの名無しさん** · 2018/05/17(木) 17:50:52.94

Rだけとりあえず使えても、統計学がわかるわけじゃないからねｗ
しかし慣れるとデータ扱うだけでも便利だなぁ。
でもちょっと不安なのが、変数が隠せないから自分で書いた変数とパッケージ内の関数が
偶然だぶったりしないもんなのかな・・・ってところ。
どうなん？

**デフォルトの名無しさん** · 2018/05/17(木) 18:14:17.63

そのあたりは「名前空間」で調べて見るといいよ

**デフォルトの名無しさん** · 2018/05/17(木) 21:17:22.96

ふむ。
ありがとう。

**デフォルトの名無しさん** · 2018/05/19(土) 07:34:08.00

ダブっても問題無いんじゃない？
パッケージの変数を上書きしてしまう理由として考えられるのは
1. 知らずに上書きしてしまう 2. 知っててあえて上書きする
だけど、どちらの場合も元の変数を使わないだけの気がする
安心するには実際にパッケージを壊してみるのも手かも
理由は異なるけど変数スコープの問題でwithを使ってる

my = list (`%>%` = purrr::`%>%`, json = jsonlite::toJSON, id = function (x, ...) x);
my = with (my, {
id (1 : 10) %>% json %>% print; # my環境の変数を使う
rocal = 123; rocal %>% print; # rocalは外から見えない
my $ environment = function (...) 'hello world'; # 勧められないけど無問題
my $ try = tryCatch; # あえて上書き
my;
});
with (my, {
try (typeof (rocal), error = function (ex) 'rocal is local') %>% print;
environment (try) %>% print; # hello world
base::environment (try) %>% print; # my$tryの環境はbase
base::environment (try) = base::environment (); # my$tryの環境をmyに変更
tryCatch (try (stop ('try'), error = function (ex) 'catch') %>% print
, error = id) %>% print; # my$tryが壊れた my$environmentが悪さ
base::try (stop ('try')) %>% print; # base::tryは無傷
base::environment (try) = parent.env (base::environment ()); # my$tryの修理
try (stop ('try'), error = function (ex) 'catch') %>% print; # my$tryの復活
});

てな感じ
多くのサンプルでwithにデータフレームを代入してるけどリストでもオケー
小さな計算をいくつもする時にお手軽だと思う

**デフォルトの名無しさん** · 2018/05/19(土) 09:59:21.70

今から学ぶならJuliaにせい
Rよりずっと速い、書きやすい

**デフォルトの名無しさん** · 2018/05/19(土) 11:12:53.58

うむ

**デフォルトの名無しさん** · 2018/05/19(土) 13:40:20.91

まあ、rocalとか書いちゃうのが

**デフォルトの名無しさん** · 2018/05/23(水) 19:12:36.38

僕の知り合いの知り合いができたパソコン一台でお金持ちになれるやり方
役に立つかもしれません
グーグルで検索するといいかも『ネットで稼ぐ方法　モニアレフヌノ』

6O1Q6

**デフォルトの名無しさん** · 2018/05/24(木) 10:36:25.46

6O1Q6

**デフォルトの名無しさん** · 2018/06/03(日) 23:20:33.44

>>136 あるよ

``` {python}
def joking (a, b):
while True: a, b = b, a + b; yield b;
```

``` {r}
with (new.env (), {
obj = reticulate::py $ joking (0, 1);
sapply (1 : 10, function (...) reticulate::iter_next (obj));
});
```

もっとマシというより楽しい解答はこれかな　読んでないけど

* [Python-like generators in R ・ GitHub](https://gist.github.com/klmr/d10623a0b4c7e1e9a6523eebee4913d1)

で、最終的な答えは「ない」だと思う

技術的な問題というより文化的なところに理由がある気がする
pythonにパイプ演算子がないのと同じ理由
実用的なyieldを実装しようとすると文法の修正が必要になると思う
言語仕様の複雑化という投資が必要になるので
それなりの需要が見込めないと導入には踏み切れないかもね

フィボナッチ数列ではyieldの有り難みは見えないけど
自動微分とは比較にならないほど汎用性の高い有り難い機能だと思う
だけど自動微分と似ているところがあって
どんな複雑なニューラルネットも泣けば自前で微分できるし
どんな複雑な関数のyieldも泣けば自前でイテレーターを作れる

**デフォルトの名無しさん** · 2018/07/04(水) 22:35:50.56

Y4M

**デフォルトの名無しさん** · 2018/07/05(木) 12:07:37.96

fib = lambda n: int(((1+sqrt(5))/2)**n/sqrt(5) + .5)

**デフォルトの名無しさん** · 2018/07/05(木) 13:10:49.78

>>217
初めてききました。

調べたら6年前につくられてるようですが
書籍はほとんどないようですね。
なんで普及してないのでしょうか。

**デフォルトの名無しさん** · 2018/07/05(木) 13:11:04.45

>>217
初めてききました。

調べたら6年前につくられてるようですが
書籍はほとんどないようですね。
なんで普及してないのでしょうか。

**デフォルトの名無しさん** · 2018/07/05(木) 19:49:27.60

Juliaのこと？
本屋では単行本は１冊しか見かけないな。
あと、「データサイエンティスト養成読本 R活用編」というムック本の中に若干の記事があるくらいかな。
他にある？

たぶん書籍が少ないのと、蓄積されたノウハウとか他人の作った関数とか少ないから
まだみんな食いつかないんじゃないかな。
自分もなんか良さげではあると思いつつRで済ましてるしｗ

**デフォルトの名無しさん** · 2018/08/19(日) 22:19:39.16

>>218

http://blogimg.goo.ne.jp/user_image/45/bc/b6502c7b8c0d62a058342de43d82770b.jpg

**デフォルトの名無しさん** · 2018/08/20(月) 13:18:00.41

JuliaはFORTRANっぽくて嫌い

**デフォルトの名無しさん** · 2018/10/13(土) 00:57:54.92

盛り上がっていたので貼っとく
読んでないけど
Faster R with FastR | Hacker News
https://news.ycombinator.com/item?id=18193557
FastRを使う人は少ないかもしれないけど
中のおしゃべりは楽しめるかも

**デフォルトの名無しさん** · 2018/10/21(日) 20:53:08.73

個人的にはRotaさんの名前がここで出てきたことに驚き
こういうところがHNの面白さかも
Deriving the Normal Distribution | Hacker News
https://news.ycombinator.com/item?id=18261892

正規分布からの連想で
コメントにあるインタラクティブなデモに感心
A tutorial on Principal Component Analysis | Hacker News
https://news.ycombinator.com/item?id=18256048

ブログの最後に書いてあるけど
現状はインタラクティブを実現するには
鬼プログラミングが必要なのかもしれない

インタラクティブからの連想で
Distill ― Latest articles about machine learning
https://distill.pub/

**デフォルトの名無しさん** · 2018/10/21(日) 21:25:09.40

ggmap使えなくなってた
Googleにクレカ登録が必須なのか

**デフォルトの名無しさん** · 2018/10/21(日) 21:51:09.06

ggmapってなんだか知らないけどこの辺の話かな？

Change in Google Geocoding API billing Issue #227 dkahle/ggmap GitHub
https://github.com/dkahle/ggmap/issues/227

お買い上げありがとう御座います

**デフォルトの名無しさん** · 2018/11/17(土) 16:28:05.14

>>39
20年後になりそう

**デフォルトの名無しさん** · 2018/11/18(日) 12:04:28.90

もう5年経ったか
機械学習データマイニングω流行ってるのに1/4スレも消費していない
次の3/4スレは15年じゃまだ余るだろう

**デフォルトの名無しさん** · 2018/11/23(金) 11:50:10.19

数学板のRスレのほうが賑わってるのがRらしい

**デフォルトの名無しさん** · 2018/11/23(金) 12:00:16.91

過疎ってるな

**デフォルトの名無しさん** · 2018/11/23(金) 12:05:27.19

数学板って基地外が多いので嫌いｗ

**デフォルトの名無しさん** · 2018/11/23(金) 12:29:41.52

基地外かどうかは知らんがほぼ全員コミュ障

**デフォルトの名無しさん** · 2018/11/23(金) 12:44:03.46

そしてリアルの理学部数学科の雰囲気に非常によく似ている。

**デフォルトの名無しさん** · 2018/11/23(金) 19:08:15.85

Rのマニアルを見たら関数のパラメータがやから多くてびびった

**デフォルトの名無しさん** · 2018/12/02(日) 00:14:30.40

Rは難しいね
=と<-が違うとか、forループ使うなとか

**デフォルトの名無しさん** · 2018/12/02(日) 00:17:55.74

Rは簡単やろ？forは禁止されてなく使っても構わない。
けどベクトル演算に持ち込んだほうが圧倒的に速い処理があるってだけの話。

**デフォルトの名無しさん** · 2018/12/02(日) 00:57:29.97

プログラミングの基礎がないから、データフレームをnestしてmutateからのmap_dblという教科書的な処理すら少したつと忘れてしまうわ

**デフォルトの名無しさん** · 2018/12/02(日) 02:04:11.19

それは難しいやつや

**デフォルトの名無しさん** · 2018/12/03(月) 00:40:44.81

コンパイラー以外では余り語られないかもしれないパーサーの話
The new pqR parser, and R’s “else” problem
https://www.r-bloggers.com/the-new-pqr-parser-and-rs-else-problem/
elseはC言語もしくはもっと古い言語の理論的バグと言ってもいいかも
Dangling else - Wikipedia
https://en.wikipedia.org/wiki/Dangling_else
yacc/bisonの問題にエラーメッセージが理解不能なことがある
Yacc is dead
https://arxiv.org/abs/1010.5023
yaccそのものというよりbisonとの間で情報の欠落が起きるらしい
Yacc is Not Dead (2010) | Hacker News
https://news.ycombinator.com/item?id=8782218
パーサーを自動生成するのは人間がプログラミングするには複雑過ぎるからだけど
複雑 in 理解不能 out
あれ？何処かで見たような

おまけ：現在のニューラルネットの興隆は彼との対話が起点らしい
Geoff Hinton Facts
http://yann.lecun.com/ex/fun/

**デフォルトの名無しさん** · 2018/12/14(金) 21:02:39.08

>232 斜め読みできる分量ではないけどオーサムらしい
Free online book: Geocomputation with R, a book on geographic data analysis, visualization and modeling : rstats
https://www.reddit.com/r/rstats/comments/a5tmht/free_online_book_geocomputation_with_r_a_book_on/
Geocomputation with R - the afterword | R-bloggers
https://www.r-bloggers.com/geocomputation-with-r-the-afterword/
各トピック毎に使えるソフトウェアの紹介があるので乗り換えの参考になるかも
中に書いてあるようにギットハブにもリソースがある
GitHub - Robinlovelace/geocompr: Open source book: Geocomputation with R
https://github.com/Robinlovelace/geocompr#geocomputation-with-r
Geocomputation with R
https://geocompr.github.io/

**デフォルトの名無しさん** · 2018/12/15(土) 11:21:36.85

>>247
ありがとう
こんな良さげな資料が公開されてたとは
でもggmapのように地図(日本語)に図形やテキストをプロットした画像を出力する手法は載ってないみたいで残念

**デフォルトの名無しさん** · 2018/12/16(日) 00:23:14.49

こういう話ではないと思うけど

``` {r}
leaflet::leaflet () %>% leaflet::addTiles () %>% leaflet::addMarkers (
lng = 174.768, lat = -36.852, popup = 'The birthplace of R'
) %>% leaflet::addLabelOnlyMarkers (
lng = 174.768 + 0.01, lat = -36.852, label = '此処は何処ですか？'
, labelOptions = leaflet::labelOptions (
noHide = T, textOnly = T, opacity = 1, style = list (
'font-size' = '2ex', 'color' = 'red'
)
)
) %>% leaflet::addRectangles (
lng1 = 174.768 - 0.02, lat1 = -36.852 - 0.02
, lng2 = 174.768 + 0.02, lat2 = -36.852 + 0.02
)
```

**デフォルトの名無しさん** · 2018/12/16(日) 18:28:48.34

leafletではさすがに希望には合わないかな
仕事で自分のクレカ使うのも嫌だし、こういう有料化は困る

**デフォルトの名無しさん** · 2019/02/02(土) 18:39:54.09

タイトル勝ち - envのハッシュテーブルとしての使い方
Hash Me If You Can | R-bloggers
https://www.r-bloggers.com/hash-me-if-you-can/
分散の占有率は考えたことがなかった
Principal Component Analysis (PCA) 101, using R : rstats
https://www.reddit.com/r/rstats/comments/akytig/principal_component_analysis_pca_101_using_r/

PCAネタでOjaの学習則 - ご本人による解説
Oja learning rule - Scholarpedia
http://www.scholarpedia.org/article/Oja_learning_rule
スティーフェル多様体上の勾配
The Geometry of Algorithms with Orthogonality Constraints
https://arxiv.org/abs/physics/9806030
動機と出発点は異なるが同一の微分方程式を導き出してる

対称行列の大きい方の固有ベクトルを求める問題は次のようにも書ける
given M: (n,n)対称行列, to be found X: (n,k)行列
argmax <X, M X> subject to <X, X> = 1, where <A, B> := tr (A^T, B)
subject to ...の部分がスティーフェル多様体の定義になっている
特に、k=1の場合は(n-1)次元単位球面になる
身近にある多様体の例になっていると思う

**デフォルトの名無しさん** · 2019/02/02(土) 19:02:21.25

間違え　subject to X^T X = (k,k)単位行列

**デフォルトの名無しさん** · 2019/02/22(金) 22:52:15.13

``` {Rcpp}
#include <Rcpp.h> // 「rcpp 参照渡し」で検索すると出てくる話題
// [[Rcpp::plugins(cpp14)]]
// [[Rcpp::export]]
SEXP unsafe_negate (SEXP out) { // コピーなしを確実にするために面倒だがSEXP
switch (TYPEOF (out)) { // 思いつく残りのキーワード: Rtools on Windows,
case REALSXP: { // knitr::all_rcpp_labels, RCPP_MODULE, Rcpp/dispatch.h.
Rcpp::NumericVector a (out); // RCPP_MODULE = boost::python
std::transform (a.begin (), a.end (), a.begin (), std::negate <double> ());
return out; // https://wiki.python.org/moin/boost.python/HowTo
} break; default: { // R 3.5以上で動くかわからない
throw std::runtime_error ("unsupported type");
} break; // https://purrple.cat/blog/2018/10/14/altrep-and-cpp/
} // デビアン系だけかもしれないけど、Rstudioの環境下ではC++が超お手軽
}
// [[Rcpp::export]]
Rcpp::NumericVector safe_negate (Rcpp::NumericVector inn) {
Rcpp::NumericVector out = Rcpp::no_init (inn.size ());
std::transform (inn.begin (), inn.end (), out.begin (), std::negate <double> ());
return out;
}
```

**デフォルトの名無しさん** · 2019/02/22(金) 22:55:11.29

残りを貼り忘れた

``` {r}
a = 1.0;
b = safe_negate (a);
cat (a, '->', b); # 1 -> - 1
a = 1.0;
b = unsafe_negate (a);
cat (a, '->', b); # - 1 -> - 1
```

**デフォルトの名無しさん** · 2019/02/24(日) 02:20:59.21

統計使ってオプションの自動売買したいんですけど
これ使えばできるようになりますかね？

**デフォルトの名無しさん** · 2019/02/24(日) 13:00:49.75

もう30年近く前からいっぱい使われてるよ。
それより統計知識と業務知識が先にないとあかんよ。

**デフォルトの名無しさん** · 2019/03/16(土) 22:01:31.43

最近ハマったRの文法
``` {r}
tryCatch ({
f = function (x) {
x + 1;
} + 1;
cat (f (1));
}, error = function (ex) {
cat (ex);
});
```
落とし穴というより他のプログラミング言語からの固定観念に縛られていた
jsと対比してみる
<pre id = 'dump'></pre>
``` {js}
$ (window).on ('load', function () {
try {
const f = function (x) {
x + 1;
} + 1;
$ ('#dump').html (f (1));
} catch (ex) {
$ ('#dump').html (ex);
}
});
```

**デフォルトの名無しさん** · 2019/03/21(木) 11:09:31.67

仕事で急遽Rを勉強している者です。
rvestを用いたスクレイピングについて解る方
いらっしゃいましたらご教授願います。

①下記ページを参考に rvest html_sessionで「次へ」のリンクを辿ってURLを抜き出し
http://estrellita.hatenablog.com/entry/2015/11/11/084310
②そのURLをリストに追加して
③read_html をかけようとしてるんですが
④no applicable method for 'xml_find_all' applied to an object of class "list" 　とエラーが出てしまいます。

無知で申し訳ないのですが、原因と解決法わかりますでしょうか？

**デフォルトの名無しさん** · 2019/03/21(木) 23:21:26.63

わかる人が来るまでのつなぎ - ３０年以内に来ればラッキーだと思うけど
* ['rvest::html' is deprecated, but rvest::read_html doesn't exist. Issue #191 tidyverse/rvest GitHub](https://github.com/tidyverse/rvest/issues/191)
* [rvest package | R Documentation](https://www.rdocumentation.org/packages/rvest/versions/0.3.2)
``` {r}
with (list (`%>%` = purrr::`%>%`, size = length, null = NULL), {
home = 'https://stackoverflow.com';
depth = 0;
done = list ();
todo = list ('/questions/28863775/scraping-linked-html-webpages-by-looping-the-rvestfollow-link-function');
while (0 < size (todo) & depth < 2) {
depth = depth + 1;
done = c (done, todo);
todo = purrr::reduce (.init = null, .x = todo, .f = function (out, path) {
url = paste0 (home, path);
text = xml2::read_html (url);
nodes = rvest::html_nodes (text, css = '.related a.question-hyperlink');
purrr::reduce (.init = out, .x = nodes, function (out, node) {
path = rvest::html_attr (node, 'href');
if (path %in% done) {
cat ('what a small world:', path, '\n');
out;
} else {
cat ('i am going to stalk:', rvest::html_text (node), '\n');
c (out, path);
}
});
});
}
});
```

**デフォルトの名無しさん** · 2019/03/21(木) 23:54:04.09

no applicable method for 'xml_find_all' applied to an object of class "list"

あちこちの変数をデバッグすれば？
まず、エラーの場所を特定するべき！

スクレイピングには、Ruby, Nokogiri, Selenium WebDriver が良い

**デフォルトの名無しさん** · 2019/03/22(金) 12:52:49.39

なんで、こういうツールってDOMでのスクレイピングじゃないの?
覚えるの面倒なんだ。

**デフォルトの名無しさん** · 2019/03/22(金) 22:45:06.06

バグ修正
if (path %in% done | path %in% out) {
cat ('what a small world:', path, '\n');
out;
} else {
cat ('i am going to stalk:', rvest::html_text (node), '\n');
c (out, path);
}

**デフォルトの名無しさん** · 2019/03/24(日) 22:07:13.75

楽しいライブラリ

* [Lego Mosaics Using R | Hacker News](https://news.ycombinator.com/item?id=19469142)

ライブラリの階層としては
[rgl](https://github.com/cran/rgl)/
[rayshader](https://github.com/tylermorganwall/rayshader)/
[brickr](https://github.com/ryantimpe/brickr)/
という感じかな？
Rのライブラリというと変化球勝負というイメージを持っているのだけど
rglは豪速球な気がする

**デフォルトの名無しさん** · 2019/03/26(火) 19:24:08.41

誰でも頭が良くなる、プログラムが書けるようになる方法が発見される 81137
https://you-can-program.hatenablog.jp

**デフォルトの名無しさん** · 2019/04/13(土) 23:21:10.50

* [TF-IDF in a nutshell](https://www.reddit.com/r/LanguageTechnology/comments/bb5bcr/tfidf_in_a_nutshell/)

[TF-IDF](https://en.wikipedia.org/wiki/Tf%E2%80%93idf)
が覚えられないので
[PMI](https://en.wikipedia.org/wiki/Pointwise_mutual_information)
と関連付けてみる

\newcommand{\nwd}[2]{\sharp\left\{{#1}\to{#2}\right\}}
$X$を単語の有限集合、$Y$を文書の有限集合とする
データを単語から文書への
[二部グラフ](https://en.wikipedia.org/wiki/Bipartite_graph)として見て
辺の統計を考える

| 記号 | 日本語の記号 |
|:--|:----------------------------------|
| $\nwd{x}{y}$ | 単語$x$の文書$y$での出現頻度 |
| $\nwd{x}{*} := \sum_{y\in Y}\nwd{x}{y}$ | 単語$x$の全文書での出現頻度 |
| $\nwd{*}{y} := \sum_{x\in X}\nwd{x}{y}$ | 文書$y$の長さ |
| $\nwd{*}{*} := \sum_{x\in X,\; y\in Y}\nwd{x}{y}$ | 全文書の長さ |

$$
\frac{P(x,y)}{P(x,*)P(*,y)}
:= \frac{\cfrac{\nwd{x}{y}}{\nwd{*}{*}}}
{\cfrac{\nwd{x}{*}}{\nwd{*}{*}}\cfrac{\nwd{*}{y}}{\nwd{*}{*}}}
= \underbrace{\frac{\nwd{x}{y}}{\nwd{*}{y}}}_{\approx\mathtt{TF}}
\underbrace{\frac{\nwd{*}{*}}{\nwd{x}{*}}}_{\approx\mathtt{IDF}}.
$$

**デフォルトの名無しさん** · 2019/04/28(日) 22:29:54.86

* [March: "Top 40" New CRAN Packages](https://www.r-bloggers.com/march-2019-top-40-new-cran-packages/)

[lenses](https://cran.r-project.org/web/packages/lenses/index.html)
というライブラリが入っている
ゲット/セットのペアからスタートする
[nlab](https://ncatlab.org/nlab/show/lens+%28in+computer+science%29)
ではプットと書かれているがセットと同じ
[イントロ](https://cfhammill.github.io/lenses/index.html)
も簡潔な説明だと思う
「てか、`iris $ Sepal.Length [3]`という書き方で何も困っていないし」
と思うかもしれないけどそれは正常な感覚だと思う

[この例](https://ncatlab.org/nlab/show/Grothendieck+group)
はもっとビミョーな気分になるかもしれない
「ここで小麦粉を$1/3$カップ入れます」の$1/3$という書き方は
[随伴](https://ncatlab.org/nlab/show/adjoint+functor)を表している
正の自然数からスタートした場合、Haskell風の書き方をして
直積に同値関係`Bunsu (a, b) == Bunsu (c, d) = a * d == b * c`を定義すると
単位射が`return a = Bunsu (a, 1)`で
積射が`join (Bunsu (Bunsu (a, b), Bunsu (c, d))) = Bunsu (a * d, b * c)`の
モナドになる

[この例](https://en.wikipedia.org/wiki/Simplicial_set)
はRの`list (list (0 : 0), list (0 : 1), ..., list (0 : n))`という
リストがつくる圏からスタートする
UMAPの土台に使われているらしい

* [UMAP](https://cran.r-project.org/web/packages/umap/vignettes/umap.html)
* [How UMAP Works](https://umap-learn.readthedocs.io/en/latest/how_umap_works.html)

**デフォルトの名無しさん** · 2019/05/12(日) 09:01:18.88

Rで正規表現を使って文字列から数値だけ抽出するにはどう書きますか？

**デフォルトの名無しさん** · 2019/05/12(日) 12:36:17.67

Ruby では、\d で数字を、+ で1文字以上、to_i で整数型に変換する

p ary = "1a23bc04".scan( /\d+/ ).map( &:to_i )
#=> [1, 23, 4]

ただし、これでは、負数を処理できない。
負数を処理するには、- を、? で、0か1文字

p ary = "-1a23bc-04".scan( /-?\d+/ ).map( &:to_i )
#=> [-1, 23, -4]

小数点や、e 表記は、もっと難しい。
これらは正規表現じゃなく、ライブラリを探すべき！

**デフォルトの名無しさん** · 2019/05/12(日) 19:02:18.45

どんな文字列か分からんけど単に数字を取り出すなら
stringr::str_extract_allで[[:digits:]+]を指定すりゃいいのでは？
パターンによってはreadr::parse_numberでいけるけど

**デフォルトの名無しさん** · 2019/05/13(月) 08:08:42.07

>>269
ありがとうございます。無事目的を果たすことが出来ました。

**デフォルトの名無しさん** · 2019/05/13(月) 11:34:06.46

>>270
[[:digit:]+]だったね。いつも間違える。

最終的にどうやったか書いてくれると同じように困ってる人が助かるよ

**デフォルトの名無しさん** · 2019/05/13(月) 11:40:45.50

>>271
そうですね、では貼っておきます。

str <- "10.5万人"
res <- as.numeric(stringr::str_extract_all(str,pattern = "[0-9.]+"))

**デフォルトの名無しさん** · 2019/05/25(土) 22:50:11.34

[The first web site](https://news.ycombinator.com/item?id=13356062)
まで行くと古すぎだけど
[Static Web - Back to the Roots](https://news.ycombinator.com/item?id=20006850)
knitrでHTMLを作るときMathJaxをSVGに変換したくなることもある
nodejsが動くようだと[MathJax-node](https://github.com/mathjax/MathJax-node)が簡単

Webネタで
[Helping One Million Developers Exit Vim (2017)](https://news.ycombinator.com/item?id=19069526)
Rを境に上位はWebのフロントエンドで下位は汎用プログラミング言語
つまり`R = (JQuery + Ruby) / 2`
ウソだけどどんなウソにも真実がある気もする

**デフォルトの名無しさん** · 2019/05/25(土) 23:01:34.12

＞＞２６８
ま、Rubyで統計解析しなくてもいいんじゃね？
今のところ、信頼性保証できないでしょ

**デフォルトの名無しさん** · 2019/05/26(日) 04:23:56.29

PerlからRuby覚えてかなり気に入っていたけど、最近の機械学習ブームで
完全にPythonに負けた感があるな

今から始める人にRubyやれとは言えなくなった
Python一択の時代

**デフォルトの名無しさん** · 2019/05/26(日) 15:12:58.29

わかればよろしい

**デフォルトの名無しさん** · 2019/05/27(月) 02:00:14.95

大学最後の2ヶ月で、元彼、好きだった人、女友達、男友達の合計500人の特性を全てデータ化して、関係の継続年数と好き度合いをアウトプットにして、Rでモデル組んだの。
それに結婚候補者の10人のデータいれて、1番結果良かったのが今の旦那で、付き合って結婚したの。本当に統計学は最強の学問。

**デフォルトの名無しさん** · 2019/06/09(日) 01:58:16.45

[so]{#so}: [Showing existence of a diffeomorphism preserving volume forms](https://math.stackexchange.com/questions/2731058)

一次元だと積分表が使えるので絵を描いてみる [so-1]{#so-1}

``` {r}
big_data = list (`%>%` = purrr::`%>%`, add = rlist::list.append
, size = length, null = NULL, true = T, false = F, na = NA);
big_data = with (c (big_data, xa = 0, sa = 0.1, db = 1, sbm = 0.3
, sbp = 0.2), { pa = function (x) { dnorm (x, mean = xa, sd = sa); };
pb = function (x) { 0.5 * (dnorm (x, mean = - db, sd = sbm) + dnorm (x
, mean = db, sd = sbp)); }; Pa = function (x) { pnorm (x, mean = xa
, sd = sa); }; Pb = function (x) { 0.5 * (pnorm (x, mean = - db, sd = sbm)
+ pnorm (x, mean = db, sd = sbp)); }; ra = function (n) { rnorm (n
, mean = xa, sd = sa); }; rb = function (n) { sample (c (rnorm (n
, mean = - db, sd = sbm) , rnorm (n, mean = db, sd = sbp)), n); };
x = 3 * seq (- 1, 1, len = 1e+3); ya = pa (x); yb = pb (x); plot (range (x)
, range (ya, yb), type = 'n'); lines (x, ya, col = 'blue'); lines (x, yb
, col = 'red'); add (big_data, pa = pa, pb = pb, ra = ra, rb = rb, Pa = Pa
, Pb = Pb); }); no_plot = function (text = 'space') { plot (c (0, 1), c (0
, 1), ann = F, bty = 'n', type = 'n', xaxt = 'n', yaxt = 'n'); text (
x = 0.5, y = 0.5, text);};
```

**デフォルトの名無しさん** · 2019/06/09(日) 01:59:10.30

青の分布を赤の分布に連続的に変形させる [so-2]{#so-2}

``` {r}
big_data = with (c (big_data, nx = 2e+3, nt = 1e+3, alim = 2, blim = 4), {
vec = function (x, t) { (Pa (x) - Pb (x)) / ((1 - t) * pa (x) + t * pb (x));
}; t = seq (0, 1, len = nt); dt = diff (t) %>% mean; x = ra (nx); x = x0 =
x [which (abs (x) <= alim)]; x = purrr::map (t, function (t) { x <<- x +
dt * vec (x, t); }) %>% do.call (what = rbind); draw = function (t, x,
nbin = 20 , vector = null) { xlim = range (x, na.rm = true); plot ( xlim,
range (t), type = 'n', main = 'trajectories', xlab = 'x', ylab = 't');
purrr::map ( sample (1 : ncol (x), 50), function (j) { x = x [, j]; if (
all ( is.finite (x))) { lines (x, t); } else { points (x, t); }; }); if (
is.function (vector)) { no_plot (); }; doit = function (ind) { t = t [ind];
x = x [ind, ]; if (is.null (nbin)) { nbin = 'scott'; }; msg = sprintf (
'at the time %.1e', t); msg = c (msg, sprintf ('%d / %d', sum ( xlim [1] <=
abs (x) & abs (x) <= xlim [2], na.rm = true), size (x))); hist (x, breaks =
nbin, freq = false, xlim = xlim, main = msg); x = seq ( xlim [1], xlim [2],
len = 1e+3);
# lines (x, pa (x), col = 'blue');
lines (x, pb (x), col = 'red'); if (is.function (vector)) { x = seq (min (
xlim), max (xlim), len = 1e+5); plot (x, vector (t, x) %>% abs (), type =
'l', log = 'y', main = msg); }; }; for (i in c (1, size (t) / 2, size (
t))) { doit (i); } }; x = rbind (x0, x [- nrow (x), ]); x [which (blim <
abs (x))] = na; fix_bin = function (x, lim) { max (sum (abs (x [nrow (x)
, ]) <= lim , na.rm = true) / 50, 10) %>% as.integer (); }; draw (t, x
, nbin = fix_bin (x, blim), vector = vec); add (big_data, x0 = x0, t = t
, dt = dt , nt = nt, nx = nx, vec = vec, draw = draw, fix_bin = fix_bin
, alim = alim, blim = blim);});
```

**デフォルトの名無しさん** · 2019/06/09(日) 02:00:21.38

逆方向に変形させてみる [so-3]{#so-3}

``` {r}
with (c (big_data), {
wec = function (x, t) {
- vec (x, 1 - t);
};
x = rb (nx);
x = x0 = x [which (abs (x) <= blim)];
x = purrr::map (t, function (t) {
x <<- x + dt * wec (x, t);
}) %>% do.call (what = rbind);
x = rbind (x0, x [- nrow (x), ]);
x [which (blim < abs (x))] = na;
draw (t, x, nbin = fix_bin (x, blim), vector = wec);
});
```

おしまい

**デフォルトの名無しさん** · 2019/06/16(日) 06:52:42.48

[so-2](#so-2)のバグ：誤: `vector (t, x)` 正: `vector (x, t)`
でも誤の方が素直 - 数式上は`vector :: Time -> (Position -> Vector)`

$$\newcommand{\calM}{\mathcal{M}}\DeclareMathOperator*{\arginf}{arg\,inf}$$
$\calM$を多様体とし、その上の
[経験分布](https://en.wikipedia.org/wiki/Empirical_distribution_function)
$p:\calM\to(0,1)$が与えられた時、モデル$q:\Theta\to(\calM\to(0,1))$を
[KL距離](https://en.wikipedia.org/wiki/Kullback%E2%80%93Leibler_divergence)
$D$を使って、$\theta_*:=\arginf_{\theta\in\Theta}D(p,q_\theta)$と
フィッティングするというのが典型的なパターンだと思う。[so](#so)では、
初期分布$\alpha:=q_0$と推定した分布$\beta:=q_{\theta_*}$を繋ぐ座標変換の
集合$\phi_t:\calM\to\calM$を具体的に作っている。写像$\phi_t$で$\alpha$が
$q_t$になったとすると、粒子数が保存すべしという要請は次のように
書かれる。$$\int_{x\in\phi_t(D)} q_t(x) = \int_{x\in D} \alpha(x)
\quad\text{for all}\quad D\subseteq\clM.$$$\phi_t(x)$が$x$について微分できる
ことを仮定すれば、この式は$\phi_t^*q_t=\alpha$という形にまとめられ、
$q_t$を$\phi_t$で
[プルバック](https://en.wikipedia.org/wiki/Pullback_(differential_geometry))
すると$\alpha$になると読む。$\phi_t(x)$が$t$について微分できることと、
$x$について可逆なことを仮定すると、次の式が得られる。$$(\partial_t
+d\iota_{X_t})q_t = 0\quad\text{with}\quad\phi_t^*q_t = \alpha\eqtag{adv}$$
導出の経緯から、この式は頻出問題になっていて、
[移流](https://en.wikipedia.org/wiki/Advection)という名前がついているが、
あまりに頻出過ぎて、多くの分野で名無しになっていると思う。問題は、
$q_1=\beta$となる$\eqref{eq:adv}$の解があるか？ということになる。
[so](#so)では、Moserのトリックを使って、そのような解があることを示している。
もう少し続ける。

**デフォルトの名無しさん** · 2019/06/16(日) 06:54:12.80

Moserのトリックの副産物として、$\eqref{adv}$は
[ガウスの法則](https://en.wikipedia.org/wiki/Gauss%27s_law)になる。
$\calM$が一次元の場合、電場$\iota_{X_t}q_t$が
[CDF](https://en.wikipedia.org/wiki/Cumulative_distribution_function)に、
クーロンポテンシャルがCDFの積分に対応する。CDFのような単調増加関数を
[シグモイド関数](https://en.wikipedia.org/wiki/Sigmoid_function)で近似する
ことは自然なことだろう。同じことだが、
[LogSumExp](https://en.wikipedia.org/wiki/LogSumExp)でCDFの積分を近似する
ことも自然なことだろう。さらに、コードのように、初期分布と推定した分布が
局在化している場合は、局在箇所にシグモイドを対応させることで、効率的に
良い近似が得られる。

コードでバグったのはベクトル場$X_t$をプロットしているところだが、$X_t$の
プロットは、動作確認にはなるが、変化が激し過ぎて挙動の理解には向いていない。
$X_t$の計算では、性質上、ゼロ割に近い状況が発生することが避けらない。コード
では、そのケアに追われている。一方、Moserのトリックのおかげで、電場は時刻に
依存しない。シミュレーションを通して成り立つ大雑把な挙動の把握には電場の方が
向いている。

神経にできることは森にもお隣さんにもベイズにも安藤モアにもできる、多分。
逆も真なり。これにガウスにもできるが加わっただけかもしれないが、
今まで気が付かなかった。
[ありがとう](https://www.youtube.com/watch?v=Fd3_uMxG608)、
[いきものがかり](https://arxiv.org/abs/1806.07366)
おしまい

**デフォルトの名無しさん** · 2019/06/29(土) 21:01:18.10

[ggwaterfall](https://www.reddit.com/r/rstats/comments/c3rf6m/ggwaterfall_a_package_for_drawing_density_and/)
を[DFT行列](https://en.wikipedia.org/wiki/DFT_matrix)をネタに使ってみる
[参考](https://en.wikipedia.org/wiki/Chebotarev_theorem_on_roots_of_unity)

``` {r}
with (c (big_data, n = 17, N = 1e+3), {
out = outer (1 : n, 1 : n, function (i, j) {
ij = (i * j) %% n;
k = pracma::gcd (ij, n);
angle = 2 * pi * (ij %/% k) / (n %/% k);
complex (real = cos (angle), imaginary = sin (angle));
});
print (eigen (Conj (out) %*% out, only = true) $ value / n);
out = purrr::map ((n - 2) : 2, function (k) {
purrr::map (1 : N, function (.) {
out = out [sample.int (n, k), sample.int (n, k)] %>% eigen (only = true);
# prod (out $ values);
prod (out $ values) / sqrt (k);
}) %>% unlist ();
});
`%.%` = function (f, g) function (x) f (g (x));
purrr::map (out, log %.% Mod) %>% ggwaterfall::waterfall_ft ();
# purrr::map (out, log %.% Mod) %>% ggwaterfall::waterfall_density ();
});
```

**デフォルトの名無しさん** · 2019/06/30(日) 21:38:18.30

DFT行列のチェックのバグ修正+testthat+lenses

``` {r}
with (c (big_data, n = 17, N = 1e+3, get = lenses::view, set = lenses::set), {
`%.%` = function (f, g) function (x) f (g (x));
values_l = lenses::index ('values');
square = function (a) (t %.% Conj) (a) %*% a;
out = outer (1 : n, 1 : n, function (i, j) {
ij = (i * j) %% n;
k = pracma::gcd (ij, n);
angle = 2 * pi * (ij %/% k) / (n %/% k);
complex (re = cos (angle), im = sin (angle));
});
testthat::test_that ('dft', {
# testthat::expect_equal (square (out), n * pracma::eye (n));
testthat::expect_equal ((Re %.% square) (out), n * pracma::eye (n));
testthat::expect_equal ((Im %.% square) (out), pracma::zeros (n));
});
k = (n - 2) : 2;
out = purrr::map (k, function (k) {
purrr::map (1 : N, function (.) {
out = out [sample.int (n, k), sample.int (n, k)];
out = eigen (out, only = true) %>% get (values_l);
(sum %.% log) (out) - 1 / 2 * log (k);
}) %>% get (lenses::unlist_l);
}) %>% set (lenses::names_l, k);
testthat::test_that ('det', purrr::map (out, function (out) {
testthat::expect_true ((all %.% is.finite) (out));
}));
purrr::map (out, Re) %>% ggwaterfall::waterfall_ft (show.labels = true);
});
```

**デフォルトの名無しさん** · 2019/07/06(土) 00:11:27.48

バグ修正
誤：(sum %.% log) (out) - 1 / 2 * log (k);
正：(sum %.% log) (out) - k / 2 * log (k);

正規化の方法を修正する必要があるが
DFT行列を[直交行列](https://en.wikipedia.org/wiki/Orthogonal_matrix)
に変えても似た挙動をする
関係ははっきりしないが
[この話](https://www.r-bloggers.com/two-interesting-facts-about-high-dimensional-random-projections/)
を思い出した

新たにバグを生み出した可能性が高いがレンズの話

可逆な行列$M$でパラメトライズされたゲットを$\mathtt{get}_M(x):=Mx$とすると
レンズ則を満たすセットが$\mathtt{set}_M(x,y)=M^{-1}y$と一意に定まる
[レンズの可逆性](https://www.twanvl.nl/blog/haskell/isomorphism-lenses)
の例になっていると思う
レンズ則をチェックしてみる [setup]{#setup}

**デフォルトの名無しさん** · 2019/07/06(土) 00:12:22.12

``` {r}
big_data = list ( `%>%` = purrr::`%>%` , add = rlist::list.append , size = length , null = NULL , true = T , false = F , na = NA);

big_data = with (c (big_data, get = lenses::view, set = lenses::set, why = T), {
plain = function (M) {
if (why) { # avoid lazy evaluation
if (is.matrix (M) != true | nrow (M) != ncol (M)) {
stop ('parameter must be an invertible matrix.');
}
}
lenses::lens (
view = function (state) {
as.vector (M %*% state);
}, set = function (state, value) {
as.vector (solve (M, value));
}
);
};
value_l = lenses::index ('value');
make_state = function (value) {
list (hello = 'world') %>% set (value_l, value);
};
make_lens = function (M) {
lenses::`%.%` (value_l, plain (M));
};
add (big_data, make_state = make_state, make_lens = make_lens, get = get, set = set);
});
```

**デフォルトの名無しさん** · 2019/07/06(土) 00:13:08.47

``` {r, cache = F}
with (c (big_data, nx = 3, nt = 1e+3), {
normalize = function (x) x / sqrt (sum (x * x));
testthat::test_that ('lens', purrr::map (1 : nt, function (.) {
a = pracma::randortho (nx) %>% make_lens ();
s = rnorm (nx) %>% normalize () %>% make_state ();
x = rnorm (nx) %>% normalize ();
y = rnorm (nx) %>% normalize ();
testthat::expect_equal (s %>% set (a, s %>% get (a)), s);
testthat::expect_equal (s %>% set (a, x) %>% get (a), x);
testthat::expect_equal (s %>% set (a, x) %>% set (a, y), s %>% set (a, y));
}));
});
```

[setup](#setup)で`why`を`F`にするとテストが通らない
どこにバグがあるかわからないが
遅延評価のチェインで露呈したバグになっている
おしまい

**デフォルトの名無しさん** · 2019/07/06(土) 22:48:27.03

上のバグの再現
バージョンによるかもしれないし仕様なのかもしれない

``` {r}
library (purrr);
f_plain <- function (x) {
function (y) {
x + y;
};
};
f_guard <- function (x) {
x <- x;
function (y) {
x + y;
};
};
tryCatch ({
x <- 1 %>% f_plain ();
cat (x (2), 'success piped-plain\n');
}, error = function (msg) {
cat ('failed piped-plain:\n');
print (msg);
});
tryCatch ({
x <- 1 %>% f_guard ();
cat (x (2), 'success piped-guard\n');
}, error = function (msg) {
cat ('failed piped-guard:\n');
print (msg);
});
```

**デフォルトの名無しさん** · 2019/07/22(月) 01:06:05.12

[イーガン予想](https://golem.ph.utexas.edu/category/2019/07/the_riemann_hypothesis_says_50.html)
[嘘だけど](https://en.wikipedia.org/wiki/Greg_Egan)

小説の上手い数学の研究者もいれば
哲学の上手いPandocの開発者もいる
いろいろな人がいる

**デフォルトの名無しさん** · 2019/07/22(月) 17:11:16.93

me too

**デフォルトの名無しさん** · 2019/09/01(日) 16:49:02.42

RstudioからSSHでポートフォアードさせてDBに繋ぎたいのですがどのように記述すれば良いのでしょうか

**デフォルトの名無しさん** · 2019/09/01(日) 17:44:01.65

ググればすぐ出る

**デフォルトの名無しさん** · 2019/09/01(日) 18:54:34.52

分からないならレスしないでくれる？

**デフォルトの名無しさん** · 2019/09/01(日) 18:56:27.67

情報の小出し禁止

**デフォルトの名無しさん** · 2019/09/02(月) 20:31:45.73

わからないけどレスしてみました

**デフォルトの名無しさん** · 2019/09/03(火) 09:50:55.31

君が本気で情報を得たいのであれば
今やるべきことは煽ることではない
足りない情報を出すことだ

**デフォルトの名無しさん** · 2019/09/03(火) 19:32:29.06

わかりました

**デフォルトの名無しさん** · 2019/09/13(金) 20:17:09.23

## Configuration over Configuration
$$
\require{TeX/extpfeil}\require{TeX/AMScd}
\newcommand{\eqtag}[1]{\tag{#1}\label{#1}}
\newcommand{\isa}[1]{\mathinner{\left[\!\left[{#1}\right]\!\right]}}
\DeclareMathOperator{\bbR}{\mathbb{R}}
\DeclareMathOperator{\ecdf}{\mathtt{ecdf}}
\DeclareMathOperator{\ebdf}{\mathtt{ebdf}}
\DeclareMathOperator{\relu}{\mathtt{relu}}
\DeclareMathOperator{\lure}{\mathtt{lure}}
$$
``` {r}
big_data = list ( size = length , add = rlist::list.append , test = testthat::test_that
, lty_none = 0 , lty_line = 1 , lty_dash = 2 , lty_dot = 3);

prelu = function (...) pmax (..., 0);
plure = function (...) pmin (..., 0);
```
続く

**デフォルトの名無しさん** · 2019/09/13(金) 20:17:51.16

## Convex on Rails
多分、[村人の定理](https://en.wikipedia.org/wiki/Mathematical_folklore)
同値な関数達
``` {r}
ebdf_0 = function (xi) {
n = length (xi); qi = cumsum (sort (xi));
function (x) { purrr::reduce (.init = 0, .x = 1 : n, .f = function (out, j) {
pmax (out, j * x - qi [j]); }) / n; }; }; ebdf_1 = function (xi) {
n = length (xi); function (x) {
purrr::reduce (.init = 0, .x = xi, .f = function (out, xi) {
out + prelu (x - xi); }) / n; }; }; ebdf_huge = function (xi) {
n = length (xi); function (x) {
purrr::reduce (.init = 0, .x = 1 : n, .f = function (out, j) {
purrr::reduce (.init = out, .x = combn (1 : n, j, simplify = F), function (out, js) { pmax (out, j * x - sum (xi [js])); }); }) / n; }; };
ebdf_2 = function (xi) { n = length (xi); xi = sort (xi); qi = cumsum (xi);
function (x) { purrr::reduce (.init = n * x - qi [n], .x = n : 1, .f = function (out, j) {
out - plure ((out + qi [j]) / j - xi [j]); }) / n; }; };
dog_data = with (big_data, {
equal = testthat::expect_equal; xi = c (- 1, 0, 2, 3); test ('ebdf', {
doit = function (xi) { bdf_0 = ebdf_0 (xi); bdf_1 = ebdf_1 (xi);
bdf_2 = ebdf_2 (xi); bdf_huge = ebdf_huge (xi);
x = seq (min (xi) - 1, max (xi) + 1, len = 1e+3);
equal (bdf_0 (x), bdf_1 (x)); equal (bdf_0 (x), bdf_2 (x));
if (size (xi) < 5) { equal (bdf_0 (x), bdf_huge (x)); } }; doit (xi);
n = 10; doit (c (rnorm (n, - 1, 1), rnorm (n, 1, 2))); });
add (big_data, xi = xi, equal = equal); });
```
続く

**デフォルトの名無しさん** · 2019/09/13(金) 20:18:38.86

Rの関数`ecdf`は次のように定義されている。 $$ \begin{split}
\ecdf(x) &:= \ecdf_\xi(x) := \frac{1}{n} \sum_{j=1}^n \isa{x \ge \xi_j}, \\
\isa{\operatorname{expr}} &:= \begin{cases}
1, & \text{ iff } \operatorname{expr} = \mathtt{true}, \\
0, & \text{ otherwise}. \end{cases} \end{split} \eqtag{eq:ecdf}
$$ ここで、$\xi_1<\cdots<\xi_n\in\bbR$を観測された値とする。
これを次のように積分したものを$\ebdf$と書くことにする。
$$ \ebdf(x) := \ebdf_\xi(x) := \int_{y=-\infty}^x \ecdf(x)
= \frac{1}{n} \sum_{j=1}^n \relu(x - \xi_j). \eqtag{eq:ebdf} $$
`ebdf_1`はこの式を、`ebdf_0, ebdf_huge, ebdf_2`は式変形したものを実装している。
``` {r}
with (dog_data, {
plot (ecdf (xi)); x = seq (min (xi) - 1, max (xi) + 1, len = 1e+3);
bdf = ebdf_2 (xi); plot (x, bdf (x), type = 'l', main = 'ebdf');
points (xi, bdf (xi)); lines (x, prelu (x - mean (xi)), lty = lty_dash); });
```
コードを見ると、`ebdf_2`は、
[ReLU](https://en.wikipedia.org/wiki/Rectifier_(neural_networks))を
[活性化関数](https://en.wikipedia.org/wiki/Activation_function)とする
[ResNet](https://en.wikipedia.org/wiki/Residual_neural_network)に
なっていることがわかる。さらに、`ebdf_2`を微分すると、ReLUとシグモイドが
混在したResNetになる。
``` {r}
ecdf_2 = function (xi) { n = length (xi); xi = sort (xi);
qi = cumsum (xi); function (x) {
purrr::reduce (.init = cbind (n * x - qi [n], n), .x = n : 1, .f = function (out, j) { f = out [, 1]; d_f = out [, 2]; g = (f + qi [j]) / j - xi [j];
cbind (f - plure (g), d_f - (g < 0)); }) / n; }; };
```
続く

**デフォルトの名無しさん** · 2019/09/13(金) 20:19:21.78

``` {r}
with (dog_data, { test ('resnet-cdf', { doit = function (xi) {
cdf = ecdf (xi); cdf_2 = ecdf_2 (xi); x = seq (min (xi) - 1, max (xi) + 1, len = 1e+3);
equal (cdf (x), cdf_2 (x) [, 2]); };
doit (xi); n = 10; doit (c (rnorm (n, - 1, 1), rnorm (n, 1, 2))); }); });
```
何が嬉しいのかはさておき、$\eqref{eq:ecdf}$がResNetで書けたことになる。
おしまい

**デフォルトの名無しさん** · 2019/09/21(土) 00:43:04.47

## Zigzag on Rails

[ブログ](http://blog.mirkoklukas.com/finite-sample-expressivity/)の内容を
実装してみる。

``` {r}
zigzag_on_rails = function (xi, yi) {
js = order (xi); xi = xi [js]; yi = yi [js]; y0 = yi [1];
ai = diff (c (0, diff (yi) / diff (xi), 0));
f = function (x) {
purrr::reduce (.init = y0, .x = seq_along (xi), .f = function (out, j) {
out + ai [j] * prelu (x - xi [j]);
});
};
big_data $ add (big_data, xi = xi, yi = yi, y0 = y0, ai = ai, zigzag = f);
};

dog_data = with (dog_data, {
yi = c (2, 0, - 1, 1); rails = zigzag_on_rails (xi, yi);
x = seq (min (xi) - 1, max (xi) + 1, len = 1e+3);
plot (x, rails $ zigzag (x), type = 'l');
points (xi, yi); add (dog_data, yi = yi);
});
```

観測値からの外延の仕方がブログとは異なると思うが、こんな感じじゃないかと
思う。[区分線形関数](https://en.wikipedia.org/wiki/Piecewise_linear_function)
を式にすると、自然とReLUの和が現れる。折れ線の変化`ai`を正と負の成分に
分けると、それぞれが凸 on Railsに乗る。
続く

**デフォルトの名無しさん** · 2019/09/21(土) 00:44:03.23

``` {r}
convex_on_rails = function (xi, ai) {
js = order (xi); xi = xi [js]; ai = ai [js]; bi = cumsum (ai);
ci = cumsum (ai * xi); f = function (j, x) bi [j] * x - ci [j];
d_f = function (j, x) ai [j] * (x - xi [j]);
i_f = function (j, x) (x + ci [j]) / bi [j];
convex = function (x) { js = seq_along (xi);
purrr::reduce (.init = 0, .x = js, .f = function (out, j) {
pmax (out, f (j, x)); }); };
resnet = function (x) { js = rev (seq_along (xi));
purrr::reduce (.init = f (js [1], x), .x = js, .f = function (out, j) {
out - plure (d_f (j, i_f (j, out))); }); };
list (convex = convex, resnet = resnet);
};

resnet_on_rails = function (xi, yi) {
out = zigzag_on_rails (xi, yi); with (out, {
xi = out $ xi; ai = out $ ai; js = which (ai > 0);
fp = convex_on_rails (xi [js], ai [js]); js = which (ai < 0);
fm = convex_on_rails (xi [js], - ai [js]);
convex = function (x) y0 + fp $ convex (x) - fm $ convex (x);
resnet = function (x) y0 + fp $ resnet (x) - fm $ resnet (x);
add (out, convex = convex, resnet = resnet);
});
};
```

続く

**デフォルトの名無しさん** · 2019/09/21(土) 00:44:40.99

``` {r}
with (dog_data, {
rails = resnet_on_rails (xi, yi);
x = seq (min (xi) - 1, max (xi) + 1, len = 1e+3);
plot (x, rails $ resnet (x), type = 'l');
points (xi, yi);
doit = function (xi, yi) {
rails = resnet_on_rails (xi, yi);
x = seq (min (xi) - 1, max (xi) + 1, len = 1e+3);
equal (rails $ zigzag (xi), rails $ convex (xi));
equal (rails $ zigzag (xi), rails $ resnet (xi));
};
doit (xi, yi);
n = 10;
doit (c (rnorm (n, 0, 1), rnorm (n, 2, 3)), c (rnorm (n, 0, 2), rnorm (n, 0, 1)));
});
```

区分線形関数は二本のResNet with ReLUの
[アフィン写像](https://en.wikipedia.org/wiki/Affine_transformation)で
書けたことになる。
おしまい

**デフォルトの名無しさん** · 2019/09/21(土) 00:50:33.16

と思ったけどバグを見つけた
誤:
equal (rails $ zigzag (xi), rails $ convex (xi));
equal (rails $ zigzag (xi), rails $ resnet (xi));
正:
equal (rails $ zigzag (x), rails $ convex (x));
equal (rails $ zigzag (x), rails $ resnet (x));

**デフォルトの名無しさん** · 2019/09/29(日) 13:30:24.02

スクリプトの質問してもいいですか？

**デフォルトの名無しさん** · 2019/10/05(土) 00:13:35.53

いいと思う
だけどここは過疎を通り越して廃墟なので返事は期待できないと思うよ

**デフォルトの名無しさん** · 2019/10/05(土) 00:54:38.98

r-eakalangへ行くのがよろしいかと

**デフォルトの名無しさん** · 2019/10/05(土) 00:55:04.71

r-wakalangでした

**デフォルトの名無しさん** · 2019/10/05(土) 09:12:52.51

マルチで質問すればいいよ

**デフォルトの名無しさん** · 2019/10/05(土) 10:20:23.41

>>307
タイムスタンプ >>1 が20年くらい前かと思ったが
意外と新しくて驚いた

**デフォルトの名無しさん** · 2019/10/19(土) 23:50:11.63

素晴らしい
[dataAnim](https://github.com/chrk623/dataAnim)

``` {r}
with (list (), {
no_thanks = function (...) data.frame (..., stringsAsFactors = F);
j = 1 : 3;
a = no_thanks (name = LETTERS [j], a = j, b = letters [j]);
j = j + 1;
b = no_thanks (name = LETTERS [j], a = j, c = letters [j]);
dataAnim::join_anim (join_type = "left", speed = 1
, x = a, y = b, by = 'name', show_msg = T);
});
```

**デフォルトの名無しさん** · 2019/11/01(金) 23:50:53.61

[JavaScript const in R](https://colinfay.me/js-const-r/)
やってみる
``` {js}
$ (window).on ('load', function () { const out = new Map ();
out.hello = 'world'; $ ('#const-here').html (JSON.stringify (out)); });
```
<pre id='const-here'></pre>
``` {r}
with (list (), { your_name = function (x) deparse (substitute (x));
out = new.env (); lockBinding (your_name (out), environment ());
tryCatch ({ out $ hello = 'world'; }, error = function (ex) {
assign ('hello', toString (ex), env = out); });
jsonlite::toJSON (as.list (out), auto = T); });
```
``` {Rcpp}
#include <Rcpp.h>
// [[Rcpp::export]]
void kossori (Rcpp::List out, Rcpp::String key, Rcpp::RObject val) {
out [key] = val; }
```
``` {r}
with (list (), { your_name = function (x) deparse (substitute (x));
out = list (hello = ''); lockBinding (your_name (out), environment ());
tryCatch ({ out $ hello = 'world'; }, error = function (ex) {
kossori (out, 'hello', toString (ex)); });
jsonlite::toJSON (out, auto = T); });
```
仕様上は、`env`に対する`$`でのセッターは、たとえ`lockBinding`が
施されていても無問題と思うが、実際は、弾くようにしている。
何か理由があるのかな？

**デフォルトの名無しさん** · 2019/11/08(金) 05:13:38.65

>>309
Slackのこと？

**デフォルトの名無しさん** · 2019/11/09(土) 01:49:31.14

[ブログ](https://colinfay.me/js-const-r/)の
[続き](https://twitter.com/_ColinFay/status/1176425719653642242)
必要があれば[R Online](https://srv.colinfay.me/r-online)で試せる
ストーカーの有無によっても変わる

``` {r}
with (list (), {
a <- list (x = 1);
lockBinding ('a', environment ());
tryCatch (a $ x <- 999, error = print);
a;
});
with (list (), {
a <- list (x = 1);
lockBinding ('a', environment ());
stalker <- a;
tryCatch (a $ x <- 999, error = print);
a;
});
```
https://twitter.com/5chan_nel (5ch newer account)

**デフォルトの名無しさん** · 2019/11/17(日) 16:00:34.19

Rでリストをつくってデータフレームを組むと

X <- c(A, B, C)
Y <- c(1, 2, 3)
df <- data.Frame(X, Y)
df

A 1
B 2
C 3

って出てくると思ったら

ABC123

って出てきます。これはどうしたらいいのでしょうか？

**デフォルトの名無しさん** · 2019/11/17(日) 20:19:12.60

これで、ちゃんとデータフレームになるけど？

X <- c("A", "B", "C")
Y <- c(1, 2, 3)
df <- data.frame(X, Y)
df

X Y
1 A 1
2 B 2
3 C 3

**デフォルトの名無しさん** · 2019/11/23(土) 18:54:17.63

[mathjax-node-page](https://github.com/pkra/mathjax-node-page)
を使って`knitr`が作ったMathJaxの数式をsvgに変換する

工具ディレクトリ`$(tool)`に`mathjax-node-page`をインストールする
~~~ {.bash}
cd $(tool)
npm install mathjax-node-page
~~~
ディレクトリ`$(tool)/node_modules/`ができる
ファイル`$(tool)/page.js`を作る
~~~ {.js}
const fs = require ('fs'); const path = require ('path');
const mathjax = require ('mathjax-node-page'); const argv = process.argv;
const usage = () => {
return ['[usage]', path.basename (argv [0]), path.basename (argv [1]), '<input-html-file>'].join (' ');
}; if (argv.length !== 3) { console.log (usage ()); process.exit (1);
}; const encoding = {encoding: 'utf-8'}; const inn_file = argv [2];
const inn = fs.readFileSync (inn_file, encoding);
mathjax.mjpage (inn, {format: ['TeX']}, {svg: true}, (out) => {
process.stdout.write (out); });
~~~
よっこらしょ
~~~ {.bash}
nodejs $(tool)/page.js R/a.html > html/a.html
~~~
オフラインでも読めるようになる
もっと賢い方法があるかも

**デフォルトの名無しさん** · 2019/11/23(土) 21:12:46.09

Electron = Chromium(ブラウザ) + Node.js(サーバー・ローカルPC にアクセス) + V8(JavaScript エンジン)

**デフォルトの名無しさん** · 2019/11/30(土) 22:37:46.15

Electronが想像どおりのものだとすると
アプリケーションを作る際には良い選択肢の一つだと思う
ただ上でやろうとしていることに対しては真逆な方向に進んでしまうと思う

HTMLをオフラインで読めるようにするにはRmdのYAMLを設定すれば良い
[HTML document](https://bookdown.org/yihui/rmarkdown/html-document.html)
~~~ {.yaml}
output:
html_document:
mathjax: local
self_contained: false
~~~
この方法で作ったHTMLをディレクトリごと配布すれば問題ない
しかし完結した一枚のHTMLにまとめられればそれに越したことはない
このちっさい野望を叶えるために
Pandocは`self-contained`というオプションを用意している
この行く手を拒むのがMathJaxになっている
この話題は誰も興味がないと思うのでもう少し続ける

**デフォルトの名無しさん** · 2019/11/30(土) 22:40:42.19

Pandocのフィルターを使う手もある
[mathjax-pandoc-filter](https://github.com/lierdakil/mathjax-pandoc-filter)
~~~ {.yaml}
output:
html_document:
pandoc_args: [--filter, $(tool)/node_modules/.bin/mathjax-pandoc-filter]
~~~
フィルターが確実に動作する限りはベストだと思う
多分`mathjax-node-page`より実行速度が早い
多分ブラウザ内でMathJaxを動作させるより実行速度が早い
ただしフィルターにバグがあってPandocが解釈できないjsonを返すと
HTMLが出力されない

ちなみに最近のPandocではipynbも出力できる
次のように書いておけばipynbのコードブロックに変換してくれる
~~~ code
(lambda who: print ('hello ' + who)) ('Jupyter');
~~~
逆にipynbをマークダウンに変換もしてくれる
使い方はいろいろだと思う
おしまい

**デフォルトの名無しさん** · 2019/12/25(水) 19:59:31.70

整然データって実験条件とかはどのように格納するべきですか？

1.　実験条件ファイル

expDescr101.csv
氏名　　性別　年齢　室温　モニタ解像度　問題数　問題パターン　・・・
TaroSat　M　　32　　　32　　　　1920　　　　　　29　　　A　　　　　　　　・・・

2.　実験データファイル

時刻　　反応A　反応B
1011　　　1　　　　0
1020　　　0　　　　1
1100　　　0　　　　0
以下続く

1の実験条件ファイルの条件が50個ぐらいあり、横にすごく長くなってしまうんですが、
1のファイル形式としてはこれで適切なのでしょうか？

**デフォルトの名無しさん** · 2019/12/25(水) 22:05:09.08

それだけじゃなんとも言えんが、ぱっと見て条件データと実験データってどうやって紐付けんの？とは思った。

**デフォルトの名無しさん** · 2019/12/25(水) 22:15:54.96

>>323
1. 〇〇Descr.csv
2. 〇〇Data.csv
というファイル名にしてファイル名で紐付けしようと思ってました。
Rだと1,2は同一ファイルに記載するものなのでしょうか？

**デフォルトの名無しさん** · 2019/12/25(水) 23:26:47.21

エクセルとかなら横の数気にするけど、
Ｒになるとどうでもいい感じｗ

**デフォルトの名無しさん** · 2019/12/25(水) 23:31:05.68

>>324
後からどうとでもなるけど、同一の方が楽だろうね。

**デフォルトの名無しさん** · 2020/03/30(月) 22:33:20.98

検査者間信頼性としてICCを求めたいのですが、
ICC(1,1)
(1,k)～（3,k)まで6この下位モデルすべて求められる一般的なパッケージってありませんか？

調べたところ改変Rコマンダーってのがあるんですけど、
これって論文とかに使って問題ないでしょうか？

**デフォルトの名無しさん** · 2020/04/01(水) 00:16:57.07

グリーンベレーだと？　オレはコマンドーだ

**デフォルトの名無しさん** · 2020/06/01(月) 08:52:13.43

ubuntu20.04のxfce環境だとRstudioのプルダウンメニューがマウスで開けない・・・・・
仕方ないからキーボードでやってるけど同様の症状の人いる？

**デフォルトの名無しさん** · 2020/07/21(火) 10:53:07.89

Windowsだとファイル名のパスが通らないライブラリが多くて困る

**デフォルトの名無しさん** · 2020/10/01(木) 16:37:41.79

R OPEN 4.0.2が来てる

**デフォルトの名無しさん** · 2020/11/25(水) 16:21:59.80

collapseとかいうライブラリーすごく速くていいな

**デフォルトの名無しさん** · 2020/11/26(木) 02:20:14.29

崩壊しそう

**デフォルトの名無しさん** · 2020/11/29(日) 22:33:58.23

良さそだね
ただ、ライブラリ名は検索する時につらいかも
https://html.duckduckgo.com/html?q=!sor collapse

**デフォルトの名無しさん** · 2020/12/08(火) 22:26:28.66

以前書いたプルルのパイプのバグ（？）はフィックスしている。
[Tidyverse](https://www.tidyverse.org/blog/2020/11/magrittr-2-0-is-here/)
いつフィックしたのかはわからないが、magrittrを2.0にアップデートしたら
動くようになっていた。次の記事を見て、新しく導入されるっぽい関数宣言の
短縮形を試していた際に気がついた。
[R adds native pipe and lambda syntax](https://news.ycombinator.com/item?id=25316608)
Rockerさまさま。というわけでJSネタ。
[A Modern JavaScript Tutorial](https://news.ycombinator.com/item?id=25333350)
JSのプロミス（Rのプロミスとは別)を勉強した時に、素人目線の注意書きが
ところどころにあって、とても助かった記憶がある。皆さんを心地よい睡眠へ
誘う渾身のプレゼン資料を作る時に役立つかもしれない。

**デフォルトの名無しさん** · 2021/01/23(土) 18:19:52.83

[[r-hub/r-minimal: Minimal Docker images for R](https://github.com/r-hub/r-minimal)

`rocker`のイメージとサイズを比べてみる。

~~~ {.bash}
REPOSITORY TAG SIZE
rhub/r-minimal devel 35.3MB
rocker/r-ver devel 813MB
rocker/tidyverse devel 2.31GB
~~~

`rhub/r-minimal`にRのライブラリをインストールしようとすると、
`gcc`などのシステムのライブラリが必要になる。それを調べて
インストールする手間を考えると、初めから全込みのイメージを
ダウンロードした方が手っ取り早いかもしれない。それでも、
`r-minimal`から始めたくなる場面がしばしばあると思う。特に、
初めてDockerを使う場合は、まずは、`r-minimal`で試してみる価値が
あると思う。金は時なり。

**デフォルトの名無しさん** · 2021/03/07(日) 00:01:20.86

マイクロソフトがMicrosoft365Rというパッケージを公開してる
365(Office365)をRから操作できるらしい

**デフォルトの名無しさん** · 2021/03/11(木) 05:52:16.51

rvestのバージョンがついに1.0.0になったみたいよ
追加されたhtml_text2()はどんななんだろ

**デフォルトの名無しさん** · 2021/03/12(金) 21:46:02.66

タイトル勝ちと思ったけど...

[The Hintons in your Neural Network](https://www.reddit.com/r/MachineLearning/comments/m2qo5p)

物理では粒子をトン付で呼ぶ習慣がある。エレクトロン、フォトン、等。
で、[ヒントン](https://en.wikipedia.org/wiki/Geoffrey_Hinton)
redditではこの渾身のオヤジギャグが通じていないっぽい。

**デフォルトの名無しさん** · 2021/03/13(土) 15:48:43.66

物理の人って〇〇効果って言葉も好きだよね。

**デフォルトの名無しさん** · 2021/03/13(土) 22:20:23.19

気になって調べてみた。

[List of effects](https://en.wikipedia.org/wiki/List_of_effects)

分野別に見ると、物理が最も多いかもね。
ただし、数年のライフタイムまで含めると、物理以外が多くなる気がする。

* [ストライサンド効果](https://en.wikipedia.org/wiki/Streisand_effect)
* [シャンシャン効果](https://www.youtube.com/watch?v=_mNwkyxtHiw)
* [藤井効果](https://www.nikkei.com/article/DGXMZO24677330V11C17A2000000/)
* [シブコ効果](https://sportiva.shueisha.co.jp/clm/golf/golf/2019/09/01/post_5/)
* [グーグル効果](https://en.wikipedia.org/wiki/Google_effect)
* [ブルウィップ効果](https://en.wikipedia.org/wiki/Bullwhip_effect)
* [レゲエ効果](https://www.youtube.com/watch?v=TtKTW0HCBRA)
* 安藤もあ

いろんな人が〇〇効果って言葉が好きな気がする。

一般に、少数の特徴量が掴めたときに限り、〇〇効果という言葉が使われる
ように見える。だとすると、〇〇効果という言葉が使える状況は幸せなこと
だと思う。

**デフォルトの名無しさん** · 2021/03/13(土) 22:40:45.53

Effective Java 第3版とかか。

**デフォルトの名無しさん** · 2021/03/13(土) 23:24:01.37

物理現象だと因果がはっきりしてるから○○エフェクトってなりやすいんだろうね
心理の場合でもプラシーボ効果やカリギュラ効果みたいに因果が明確なものは○○効果だね

**デフォルトの名無しさん** · 2021/03/14(日) 11:25:25.93

バタフライ効果はバタフライエフェクトと言われがちなのはなんなのだろう

**デフォルトの名無しさん** · 2021/03/14(日) 17:18:34.03

多分バタフライエフェクトって有名な映画の影響

**デフォルトの名無しさん** · 2021/03/16(火) 19:04:00.31

RStudioで普通に日本語入力できるようになってるんだね
以前は変換確定するまで数文字しか表示されなかったのに

**デフォルトの名無しさん** · 2021/04/03(土) 13:40:09.03

下表のようにある職種米にあｑるskillに対する得点を計測し平均値を表にしました。
この得点からスキルをABCの３つにクラスタリングしています。
　　　　　　　医師看護　介護クラスタ
skill1 　　0.8 0.4 0.2　　　A
skill2 0.3 0.5 0.1 B
skill3 0.2 0.3 03 C
skill4 0.1 0.3 03 C
・・・
skill15 0.1 0.2 0.8 B

で、クラスタAに対する医師・看護・介護の得点をボックスプロットしたいのですが、
なにかいい方法ありませんでしょうか？

**デフォルトの名無しさん** · 2021/04/03(土) 13:41:25.14

下表のようにある職種米にあｑるskillに対する得点を計測し平均値を表にしました。
この得点からスキルをABCの３つにクラスタリングしています。
　医師看護　介護クラスタ
skill1 0.8 0.4 0.2　A
skill2 0.3 0.5 0.1 　B
skill3 0.2 0.3 03 　C
skill4 0.1 0.3 03 　C
・・・
skill15 0.1 0.2 0.8 B

で、クラスタAに対する医師・看護・介護の得点をボックスプロットしたいのですが、
なにかいい方法ありませんでしょうか？

**デフォルトの名無しさん** · 2021/04/03(土) 13:41:46.87

表ズレ訂正しました

**デフォルトの名無しさん** · 2021/04/03(土) 20:04:53.80

宿題かなんか？

医師・看護・介護が水準になるtidy data形式にしてから描けばいいんじゃ？

**デフォルトの名無しさん** · 2021/04/03(土) 23:54:26.19

>>348
tidyverseは使えますか？
データフレーム名をdfとすれば大枠は以下でいけますよ

library(tidyverse)
df %>% filter(クラスタ == "A") %>%
pivot_longer(-クラスタ) %>%
ggplot(aes(name, value)) + geom_boxplot()

**デフォルトの名無しさん** · 2021/04/04(日) 06:55:51.01

上の回答が答えになっていると思う。以下はおまけ。
``` {r nasdaq}
df = "
CEO, COO, CTO, cluster
0.8, 0.4, 0.2, A
0.3, 0.5, 0.1, B
0.2, 0.3, 03, C
0.1, 0.3, 03, C
0.1, 0.2, 0.8, B
";
df = read.csv (text = df, colClasses = c ("numeric", "numeric", "numeric", "character"), strip.white = T);
print (df);
```
tidy無し版
``` {r plain, dependson = 'nasdaq'}
for (clazz in unique (df $ cluster)) {
go = subset (df, cluster == clazz, select = - cluster);
print (go);
boxplot (go, xlab = 'role', ylab = 'skill', main = sprintf ('cluster = %s', clazz));
}
```
続く

**デフォルトの名無しさん** · 2021/04/04(日) 06:56:59.64

パイプ無し版
``` {r tidy, dependson = 'nasdaq'}
for_plot = tidyr::pivot_longer (df, - cluster, names_to = "role", values_to = "skill");
print (for_plot);
for (clazz in unique (for_plot $ cluster)) {
go = dplyr::filter (for_plot, cluster == clazz);
print (go);
. = ggplot2::ggplot (go);
. = . + ggplot2::aes (x = role, y = skill);
. = . + ggplot2::geom_boxplot ();
. = . + ggplot2::labs (
title = sprintf ('cluster = %s', clazz)
);
print (.);
}
```
プロットを並べる。
``` {r arrange_plot, dependson = 'tidy', fig.width = 4 * 2, fig.height = 4}
. = ggplot2::ggplot (for_plot);
. = . + ggplot2::aes (x = role, y = skill);
. = . + ggplot2::geom_boxplot ();
. = . + ggplot2::facet_wrap (~ cluster);
print (.);
```
箱を並べる。
``` {r arrange_box, dependson = 'tidy', fig.width = 4 * 2, fig.height = 4}
. = ggplot2::ggplot (for_plot);
. = . + ggplot2::aes (x = role, y = skill, fill = cluster);
. = . + ggplot2::geom_boxplot ();
print (.);
```
おしまい

**デフォルトの名無しさん** · 2021/04/04(日) 21:35:04.47

色々とご親切にありがとうございます
自分のつたいないコードよりスッキリ問題解決しました
m(_ _)m

**デフォルトの名無しさん** · 2021/04/05(月) 22:30:05.95

白状すると、検索してコピペして動いたコードを貼っただけ。
`boxplot`自体使ったことがなかった。

**デフォルトの名無しさん** · 2021/04/05(月) 23:42:08.67

箱ひげ図は義務教育で教えるようになってからじわじわ市民権を得つつある感じ
10年前はほとんど誰も知らなくて見せてもなんだコレだったけど

**デフォルトの名無しさん** · 2021/04/06(火) 00:00:45.57

ですよねー
株式のロウソクは知ってたけどｗ

**デフォルトの名無しさん** · 2021/04/07(水) 13:13:10.36

箱ひげ図はいつのまにかエクセルにも搭載されてるね

**デフォルトの名無しさん** · 2021/04/11(日) 23:30:00.60

箱ひげ危機一髪！

**デフォルトの名無しさん** · 2021/04/12(月) 12:23:35.50

また髪の話してる・・・

**デフォルトの名無しさん** · 2021/05/05(水) 21:34:32.08

RでJIS丸めじゃない四捨五入ってどうやればいいの？
round(0.285,2)が0.28じゃなく0.29になるような

**デフォルトの名無しさん** · 2021/05/06(木) 00:06:44.67

恐らくコード組むしかないかと

**デフォルトの名無しさん** · 2021/05/06(木) 02:20:37.06

書き方はぐぐればすぐ見つかるみたいよ。

**デフォルトの名無しさん** · 2021/05/06(木) 13:42:22.67

検索して出てきたコードをいくつか試したけど2進数のせいか
どれもround2(0.285,2)が0.28になってしまう
このぐらいの桁数の丸めは需要ないのかな

**デフォルトの名無しさん** · 2021/05/06(木) 14:35:10.89

ググって出てきた最初のコード試して見たけどJIS丸めと同じ結果だね。

**デフォルトの名無しさん** · 2021/05/07(金) 12:10:57.72

結局きちんと動作するコードは見つからなかったよ
少し驚いたな
四捨五入は簡単なようでいて落とし穴のある難問なのかもね

**デフォルトの名無しさん** · 2021/05/07(金) 19:03:46.29

そうなのかｗ
驚いた。

**デフォルトの名無しさん** · 2021/05/09(日) 03:07:28.88

0.285 には以下の通り2進数に起因する誤差があるから、
内部的には 0.284999..... 扱いなんだろうね

> 29 - (0.285*100 + 0.5)
[1] 3.552714e-15

**デフォルトの名無しさん** · 2021/05/09(日) 09:52:41.68

確認には直接フォーマット系の関数を使った方が簡単だと思う。
``` {r}
sprintf ('%.64f', 0.15);
```

多くの四捨五入の実装は`10`を掛ける演算を使っているが、注意が必要になる。
C99の標準関数を使えば、`round (x, digit = 0)`に相当する四捨五入は得られる。
``` {Rcpp}
#include <Rcpp.h>
#include <cmath>
// [[Rcpp::plugins(cpp17)]]
// [[Rcpp::export]]
double std_round (double x) {
return std::round (x);
}
```
`std_round`を使って`round (x, digit = 1)`に相当することをやろうとして、
次のようなコードを書くと、オワコンがやって来る。
``` {r}
sprintf ('%.64f', std_round (0.15 * 10) / 10);
```
数値計算と表示との整合性がとれていないにも関わらず、通常のプリント文を
見ている限り気が付きにくい厄介なバグになる。敗因は次の計算にある。
``` {r}
sprintf ('%.64f', 0.15 * 10);
```
四捨五入のスマートな実装方法は思いつかない

**デフォルトの名無しさん** · 2021/05/09(日) 13:08:43.31

>>364
>>366
内部レジスタの値は正しく丸められてても
表示でこけてるだけって可能性もあるからな
疑うのは大事だけど
自分が勘違いしてないことを確認することも大事

**デフォルトの名無しさん** · 2021/05/09(日) 15:07:00.86

>>370
デフォルト環境で0.29が0.28と表示されるわけないわ

**デフォルトの名無しさん** · 2021/05/09(日) 17:31:33.95

以下のページでRの丸めについて英語で説明してるね
ttps://cran.r-project.org/web/packages/round/vignettes/Rounding.html
最終的に多倍長演算ライブラリ gmp の使用を推奨してる

library(gmp)
myround <- function(x, digits){ return(as.numeric((x*10^digits+0.5)/(10^digits))) }
val <- as.bigq(285, 1000) # 0.285 を 285/1000 と分数指定
myround(val, digits=2)

**デフォルトの名無しさん** · 2021/05/09(日) 23:08:26.19

そういえばPython2と3でなんかそんな問題があったような・・・
2ではできたのに3ではできなくなったみたいな。

**372** · 2021/05/10(月) 02:45:27.57

>>372
myround に floor (負の扱いによっては trunc) 付け忘れてた
補完して解釈してください