統計解析R たぶんpart3くらい
googlabilityの低さだけでRは唾棄するに値する。 >>111
そうだね。
$ R --vanilla
[snip]
> search()
[1] ".GlobalEnv" "package:stats" "package:graphics"
[4] "package:grDevices" "package:utils" "package:datasets"
[7] "package:methods" "Autoloads" "package:base"
でも、
> ls(envir = .GlobalEnv)
character(0)
だよ。 なお、起動時にライブラリが自動読み込みされるのが嫌なら、
~/.Rprofileなどで、
options(defaultPackages="")
とでもしておけばよいのでは。 なにバッドノウハウひけらかしてドヤ顔してんのww
Rが低能向けゴミ言語であることの証左にしかならんね。 じゃあフリーでLinuxでもWindowsでも使える
R以上の統計解析言語教えてくれ >>116
コンピュータ言語だと思うから、そのような感想が出てくるのでは?
統計ソフトウェアのマクロ機能と認識したらいい。 すみません、質問です。Rの教科書をめくりながら、length(grep("^[0-9]{8}", code))
というのを理解しようとしているのですが、"^[0-9]{8}"というのはどういうことですか? ^[0-9]{8}
^ は行頭。
[0-9]は、0〜9のうちのどれか、つまり数字。
{8}は、直前の文字が、8回繰り返す
つまり、行頭に、8桁の数字がある行にマッチする ありがとうございます、正規表現でぐぐって勉強しました。 striptimeで、時刻型に変換したデータを横軸にトレンドグラフをplotしています
このグラフに縦線を入れたいのですが、可能でしょうか?
date = c(20151101235959 , 20151103235959)
value = c(10 , 20)
plotdate = striptime(date , "%Y%m%d%H%M%S")
plot(plotdate , value , type="l")
ここまでは可能でした。
x軸に縦線を入れたいのですが、ablineでの描き方がわかりません
どなたかご教示いただけないでしょうか >>123
縦線って
> for(i in seq(from=plotdate[1], to=plotdate[2], length.out=10)){abline(v=i)}
こんな感じのものを求めているの? すみません、どうしてもわからなくて質問です。
a<-1:10
b<-1:10
for(i in 1:10){
for(j in i+1:10){
if(a[i]!=b[j]) print( すみません、どうしてもわからなくて質問です。
a<-1:10
b<-1:10
for(i in 1:10){
for(j in i+1:10){
if(a[i]!=b[j]) print("hello") }}
これを実行したらif文の所にエラーが出るんです。どうしたら解決できますか。教えてください、お願いします。 「i+1:10」のところの演算子で、+よりも:が優先されるから。
「(i+1):10」とすればよい。 ありがとうございます。聞かないと分かりませんでした。 R言語徹底入門、初版は何箇所か誤訳があるので購入は様子見。 増刷がかかるか
誤訳が修正されるか
と考えると買っちまうかな、「徹底入門」じゃなくて「徹底解説」。 増刷かかるほど売れないと思う。
でも仮に誤りがあったとしても得られるものは少なくないと思う。
岩波のWEBサイトで数ページPDFで読める。
R言語徹底解説
http://www.kyoritsu-pub.co.jp/bookdetail/9784320123939 Pythonのyieldに相当するものってないの? 書泉ブックタワーで一刷が山積みになってたから
各種の誤りが訂正された二刷が出るのは当分先になるのかな? 技術書なんて誤訳だらけだろ。校正してるのは文系なんだから。
ほとんどがマイナー、専門すぎてサイトに修正一覧出て初版で終わりだよ。
買いそびれたら最後、ボッタクリ価格でアマゾンで買うことになる。
手に入らないと途端に、誤植もなく、素晴らしい書籍とかデタラメなレビューが書かれて価格が釣り上がる。 過去に散々酷い目にあったよ。一番酷いのはPrograming C++の糞訳本だったかな。
あと確率統計の本で題名詐欺の本もあったよ。まじみんな気をつけたほうがいいよ。アマゾンのレビューだけは。 >>142
今日もあっちこっちで馬鹿レスしてるなおまえってw >>141
最近のアマゾンのレビューはほんと嘘だらけ。 R言語徹底解説
八重洲ブックセンターで第三刷があった。
平積みの方は第一刷だったけどw できるよ
でも今なら Julia がおすすめでっせ 過疎しているときに申し訳なくお聞きしたいのですが、
N(10,0.5^2)の,7.5以上の上側確率をRで一発で求めるコマンドはないでしょうか? すいません自己解決しました
pnorm(-(7.5-10.0)/0.5)でした
スレ汚しすいませんでした Rを使っている人ならわかる人もいると思うので
GNU科学技術計算ライブラリ リファレンス・マニュアル
https://ja.wikipedia.org/wiki/GNU_Scientific_Library
のどの関数を使って、どの関数を数値積分すればよいのか、
教えてほしい。
γ関数 https://ja.wikipedia.org/wiki/%E3%82%AC%E3%83%B3%E3%83%9E%E9%96%A2%E6%95%B0 を
使って ControlChartConstant2Double = gsl_sf_gamma(InSizeDouble / 2) * Sqr(2 / (InSizeDouble - 1)) * gsl_sf_gammainv((InSizeDouble - 1) / 2)
とすると、管理図用定数 c4 が得られる。
d2, d3 を求めるための
http://excelshogikan.com/qc/qc11/controlchartconstant.html
φなんたらが、GSLのどの関数なのか、数値積分のどの関数を使うのか、
がわからない。
積分は、わからなければ台形公式でエィヤーとやってしまうけど。
n20位までは数値表があるのだが、nをちょっと大きくして、24時間ことのn24とかやろうとすると、のっていない。
1回計算してしまえば、数値表を使って参照するだけなのでRで処理で切ると思う。 羽鳥の本は英語ならたいていpdfで無料で読めるから、文句いう人は英語で読めばよいと思うの 使い始めて1ヶ月
未だにエクセルより便利な場面に出会いませぬ
回帰分析程度じゃ意味ないかな まずは、セルでチェックできる程度の規模のデータか、あるいはもっと大きいのかによるんじゃないかな。
そして作業として簡単なものなら、多少表計算ソフトに歩があると思う。
でもこっちに慣れるとぜんぶこっちでやっちゃうけどねw
欠点としてはライブラリの秩序のなさかなw RMarkdownを使い始めると分析とレポート作成が同時にできるので便利さを感じると思うけどな なるほどと思ったブログがあったから貼っとくよ
yhat | R for Excel Users
http://shotwell.ca/blog/post/r_for_excel_users
ある特定の環境での成功体験が新たな環境への適応の障害となるのは
エクセルからRに限ったことではないと思う 上限100%の上部90%以上カットしたらそうなるわ >>167
それは仕方ないと思うよ
統計解析手法開発用には向いているソフトだけど
統計解析を利用した処理アプリで使うのに向いている
ソフトウエアというわけじゃなく
無償なんで大学でも採用して広まっているという話だから。 >>157
Rになった
S-plusやってたTIBCOもRの別実装始めたくらい >>168
右肩上がりなのはとても良いこと
純粋なプログラミング言語じゃないから増えてるだけで御の字なのかねえ データをこねくり回してグラフ書くにはexcelより融通が利いてしかも早い
ような気がする >>175
そりゃそうでしょうね
Excelはこねくり回さないで使うためのツールだから グラフはggplot2が強力だよね
facetとかはExcelだと大変
デフォルトのテーマが少し古くさいけど 機械学習とかビッグデータとかPythonと何かの組み合わせに圧倒されててRとかどマイナーになってしもうた 適材適所でしょうね。
元々設計自体がデカいメモリーがあったあらと言う前提で
設計者にとっては作りが楽だけど、大容量で使う利用者が
対処しないといけないという安易なつくりなんですよね。
その代り少量データを対象とした統計手法研究などには
楽なんで。 Rにはなんといってもtidyverseがあるからなあ
dplyrとかpurrrとか簡単で強力だから解析やるならR
まあ適材適所で、ベイズならstanだし、機械学習や文字ならPythonが優勢、事務処理ならExcelVBAってとこ >>171
統計って回帰分析から急に難解になる
それにじっと耐える生徒さんは偉い
R初心者の私にはとっても役立つ講義だ 何かいいエディタないかな
Rに最初からついてるエディタ使ってるけど不便 >>184
RStudioは2,3回インストールしてみたけど良く分からないし重いしですぐ消してしまってたんだよね
慣れると便利なの? RStudioのエディタは入力補完機能が凄い便利。パッケージの関数だけでなく自分で作った変数や関数も補完してくれる。
関数のヘルプもキー一つで表示できるし、ノートブック機能を使えばエディタ内で実行結果を表示してくれる。
その他、パッケージ管理とかプロジェクト管理とか便利だと思う。 具体的な話を聞くと便利そうな気がしてくる
やっぱりRStudioがベストなのかもね
しばらく使ってみようかな、ありがとう 補完機能なしでプログラミングするのって、武器を持たずに福岡の街を歩くようなものだよ。 初心者には
Rコマンダーは便利だが
基本が理解するのが課題 R version 3.4.3 でR consoleを起動した直後に乱数を発生させると
set.seedで指定していないのに前回起動時と同じ乱数が出てしまいます。たとえば
runif(5)だと
[1] 0.3108217 0.4556531 0.2194121 0.6496887 0.2677915
が毎回出てきます。
そういのものなのでしょうか? >>192
R x64 3.4.1(windows10)ではそれを再現できなかった
そういうものではないと思う >>193 ありがとうございます。そうなんですか。自分の環境はwin7sp1 64bit で
Rは5年前にインストールしその後何度か上書きインストールしたまに使っててたんですが
何らかの理由でRの中の設定が変更されたか破壊されてるんですかね
原因がわかったらまた書きます。 >>192
R3.4.3@Win10だけどそういう状態にはならないねえ。RStudioとかVSCodeとかでも何度かやってみたけど全て違う値。
事前にhtmlwidgetとか使ってない? >>192です
試しに別のフォルダに新規インストールして何度か起動を繰り返して確認してみたら
正常に毎回違う乱数がでました。
なのでもう新規インストールで実行することにしました。
でも、どこに問題があるのか特定しないとまた起きそうなので少しづつパッケージを削除しつつ確認中・・・
>>195
ありがとうございます。
htmlwidgetsって何?って感じなんですが入ってました。
いつ何のために入れたのかもわからないのですが(笑) >>192です。
パッケージの問題ではなくて、パッケージの作者の方々疑ってごめんなさい
どうも>>195さんの指摘どおり事前になにかが読み込まれてること気づきました
起動直後にカーソルの↑を押すとなぜか
昔コンソールで打ち込んだコマンドが未だに出てきちゃうんです
たとえば、
> source('~/R/test.r') .Rhistoryがおかしくなっちゃったのかな?まあ、原因が分かってなにより? >>192です。
原因がわかりました。
[Previously saved workspace restored]と出てることに今気づきまして
以前マイドキュメントに保存していたワークスペースが自動で読み込まれるためでした。
でもなぜか、"test.RData"の名前で保存したものは自動で読み込まれず
".RData"のように拡張子のみのファイル名が存在するとそれが読み込まれるようです。
新規インストールのRではがあっても読み込まれないのですが、
試しにC:\Program Files\R\R-3.4.3\bin\x64のフォルダ内にコピペしたら起きるようなので
変な名前やいけない場所には保存しては駄目ってことですね
ありがとうございました。 .Rhistoryでset.seed()使ってるってことなのか >>200
うちのマシーンの環境がめちゃくちゃの可能性もありますが、
新規インストール直後のコンソールで保存したワークスペースをそれで読み込んでも
同じ乱数が再現されるので
保存した時のその後の乱数生成パターンも復元されると解釈しちゃいました。 はぇ〜
そういや最近出たブルーバックスのRの本が売れてるみたいだね >>201
環境の自動復旧は無効にしておいた方がいいよ。ググれば無効にする方法が見かるハズ…
>>202
あの本、ブログか何かで宣伝してたよ。センセーショナルな見出しだったな。 この記事だ
ttps://lab-on.jp/article/23 その本を買ってPCで真似してます
Rコマンダーのお陰で敷居は下がりました
Rの壁は
出力データの読み方、意味するところの理解
質のよいデータはあるので頑張る 共立出版のRで学ぶデータサイエンスシリーズの15巻とか16巻は
ずっと欠けてるけどいつ出るのですか? >>204
jupyter notebook と pandas 最強だな エクセルソルバーのGRGみたいな非線形最適化制約有りをやりたいんだけど、Rでもできる? >>205です
読み終えた、とても勉強になりました
困難さはRではなく統計学でしたが
これは実践するしかないですね
気になったとこは頭に入れておきます
P112の3次元散布図ですが
Microsoft R Open version3.4(64bit)では
作図が表示されませんでした Rをかじっても
やはり、考え方がわかってないとだめだね
ということで、
「入門はじめての分散分析と多重比較」を読んでる