統計解析R たぶんpart3くらい

2012/06/22(金) 13:33:12.40
あっても良さそうなんですが,需要ないの?

過去スレのうちのひとつ
統計解析R
http://toro.2ch.net/test/read.cgi/tech/1285597198/
2023/07/23(日) 03:41:51.31ID:SQtd3M8i
結構何年か前にRは結構古臭いし、言語仕様もわかりづらいし衰退するのでは、と書いているのを
読んだことがあるけど、逆に今だと他の商用統計パッケージが廃れる勢いなのにRって立場が盤石な
気がする
なんで?
530デフォルトの名無しさん
垢版 |
2023/07/24(月) 10:46:27.45ID:uQbqJHBb
AIブームでPythonに全部もってかれると思ったけどそうでもなかったね
先発優位で統計屋や大学教授が昔からRユーザーってのもあるのかも?

ユーザー視点からだとtidyverseの存在が大きいと思う
505のように地味に手間がかかりそうな処理が関数ひとつでひょいと処理できるとかすごい
2023/07/24(月) 12:50:03.13ID:IaCKgEWP
ど〜も〜!ご存じオナニーマン チン太郎でーす!
2023/07/25(火) 14:51:45.41ID:iTChcdyR
>>529
今でもC/C++が盤石なのと同じ理由な気がする
2023/07/25(火) 22:12:29.13ID:KSU0u1F8
とくに大学の研究室とかは、同じような機能のプログラムを別言語に
コンバートする作業は雑用でしかないので誰も積極的にはやらない。
RでできるのならこのままRでいいじゃん、もしくはフォートランでもw
みたいな感じ
やったところでなにか新しい知見が得られるわけもなし。
2023/07/26(水) 14:36:34.35ID:/vrstjVu
昔の医学分野の統計処理はSASがデフォだったけど
COVID-19で疫学の人(西浦先生とか)がRガンガン使ってるの見て疫学以外でもRが広がってる
学会行くとggplotで書いたグラフいっぱい見る
535デフォルトの名無しさん
垢版 |
2023/07/30(日) 15:01:13.36ID:/zgOfttX
ggplot2のデフォルトテーマは微妙なので変えているけどいつも悩む
ggthemesをもとにそこから装飾することが多い
2023/07/31(月) 13:12:54.07ID:sgBBFIN2
>>533
むしろ結果が違ってたらωωω
537デフォルトの名無しさん
垢版 |
2023/08/08(火) 23:42:45.27ID:D9D8OCal
Rしばらく使ってないから忘れそう
538デフォルトの名無しさん
垢版 |
2023/08/23(水) 14:24:09.90ID:LaIh/7Co
ついにExcelでPython使えるようになるらしい
マイクロソフトはRのベンダー買収してMRANとかやってたのに時代の流れかな
2023/08/24(木) 07:11:35.29ID:UfAeCzV0
Pythonでexcel弄るのは
15年以上前から出来てるのを今更
excel上のpythonで実行する方が遅い可能性まである
540デフォルトの名無しさん
垢版 |
2023/08/25(金) 13:03:41.78ID:8Z9WZ/AE
PythonからExcelをいじることとExcelでPythonが動くことは全く違う
541デフォルトの名無しさん
垢版 |
2023/08/25(金) 13:58:38.54ID:5+gJach+
くりゃうどω
2023/08/25(金) 14:03:48.50ID:HPTKrBcu
pythonは何故かPCでJupyter notebookが不具合で使えなくてな
導入時点でコケるとその言語をやる気失くす…Rはその点、導入が簡単で良かった
2023/08/27(日) 01:44:38.85ID:VsjIkj4j
Excelも最近はTidydata志向で、パワークエリやパワーピボットで再現性のある加工や分析が
できるようになってきているけど、使い始めはなかなかいいかな、と思ったがちょっと凝ると
やっぱり複雑化してメンテできないVBAみたいになっちゃうなw

ま、RやPythonだからメンテ性がいいというわけでもない気はするけどw
544デフォルトの名無しさん
垢版 |
2023/08/27(日) 20:22:33.62ID:RTNKd3te
Excelマクロ禁止してきた企業はPython機能も禁止しそう
Rを社員が使うケースなんてのはもうレア度SSRなんだろうね
2023/08/28(月) 13:50:39.79ID:62AYCckx
Rで学ぶなんとか分析とかいう本いっぱい出ているし、結構個人でやる気のあるやつは覚えるんじゃね?
R人口増えている印象。
546デフォルトの名無しさん
垢版 |
2023/08/28(月) 13:57:24.90ID:3YABDYXJ
昨日の統数研のワークショップ見て、大学や企業によってはライブラリのインストールに制限あったりでデフォルトで解析できるのがRが多言語に置き換わらない理由の一つなのかもなと思った
今後も「選択と集中」続けるどころか懸賞金型推進するようだから商用に金払うのも辛くなるとこも出てきそうね
547デフォルトの名無しさん
垢版 |
2023/08/29(火) 18:08:36.20ID:vrxlGHM5
数が増えてることと数が少ないこととは違う
これ混同する人は結構多い
2023/08/30(水) 15:28:57.25ID:zHni/Vbc
当社比200%
元が少なかっただけやろ
みたいな
549デフォルトの名無しさん
垢版 |
2023/09/01(金) 21:33:15.97ID:T0/12uyc
自分は今の部署にいる間だけは統計解析するけど異動したらもう解析なんてしないからRのモチベは低いな
人事の巡り合わせでいつかまた今の部署に戻るかもしれないけど
2023/09/02(土) 10:50:19.16ID:aOHtbbKy
隙あらばどうでもいい自分語り
551デフォルトの名無しさん
垢版 |
2023/09/02(土) 14:49:02.94ID:DQO4DB1k
過疎スレでその煽りは馬鹿じゃねえの
2023/09/02(土) 15:24:55.18ID:mCX3wjBN
本人だろ age てるのは
553デフォルトの名無しさん
垢版 |
2023/09/02(土) 15:27:52.78ID:DQO4DB1k
ageを最近知ったみたいに強調してる馬鹿ww
554デフォルトの名無しさん
垢版 |
2023/11/26(日) 13:47:18.77ID:TX3Gb+56
[プッシュアウト](https://en.wikipedia.org/wiki/Pushout_%28category_theory%29)
について書いてみた。
[JSFiddle](https://jsfiddle.net/zLpqd9mj/show)
集合の圏でのプッシュアウトは
[等価ジョイン](https://en.wikipedia.org/wiki/Join_%28SQL%29#Equi-join)
の圏論的双対にあたる。
555デフォルトの名無しさん
垢版 |
2023/11/26(日) 19:19:27.89ID:fOcIWwuE
おーまんちょー!
556デフォルトの名無しさん
垢版 |
2023/12/02(土) 19:24:46.52ID:UAUVJeJE
前回のおーまんちょーでは一部のコードで途中から行番号が表示されるようになっていた。
多分、JSFiddleのエディターで`tidy`というボタンを押してしまったからだと思う。
実は、`prettydoc::html_pretty`で行番号が表示されないのを直したいと思っていた。
しかし、どこから手を付けたら良いかわからなかった。それが、ハプニングのおかげで
手の入れ場所がわかった。多分、HTMLとしては不整合な状況になっているが、
意図した通りに表示されるようになった。
[ありがとう、おーまんちょー](https://jsfiddle.net/105nohbq/show)
2023/12/15(金) 00:55:03.28ID:KmwBi9fF
group_by()はmap()と組み合わせて使えないんだね
558デフォルトの名無しさん
垢版 |
2023/12/17(日) 12:11:13.68ID:j39jK9SN
一般的な意味では、そんなことないと思うよ。
状況によってはgroup_byとmapを組み合わせると上手く行くことがあると思う。
ぐるぐる図のくだりでグダグダなところがあったので、
[修正した](https://jsfiddle.net/6z7u3d09/show)。
アップした後にタイポを見つけたが、覆水盆に返らず。
2023/12/17(日) 23:02:11.11ID:/RmbQ2uq
多変数の時系列データをクラスタリングするpackageをご存知であれば教えていただけますか…?
560デフォルトの名無しさん
垢版 |
2023/12/18(月) 00:40:20.74ID:+7hNKB64
知らない。
人がいれば、意味のない返事はしない方が良いかもしれないが、過疎だからね。
2023/12/18(月) 23:51:29.23ID:t5S7JJTy
あなたは地球上で何日過ごしてますか?
という問いに答えるRのスクリプト

干支と誕生日(月日)から今日が生まれて何日めか計算

eto=("ひつじ")
tag="10-17"
Eto=c("子(ね=ねずみ)","丑(うし)","寅(とら)","卯(う=うさぎ)","辰(たつ=龍(りゅう))","巳(み=へび)","午(うま)","未(ひつじ)","申(さる)","酉(とり=にわとり)","戌(いぬ)","亥(い=いのしし)")
# Eto
i=grep(eto,Eto)
this_year=as.numeric(strsplit(as.character(Sys.Date()),'-')[[1]][1])
j=this_year%%12 - 3
age=12*(0:9) + j-i
age=age[18<=age][1:5]
age
AD=paste0(this_year-age,"-",tag)
days=\(x) as.numeric(Sys.Date() - as.Date(x))
rbind(age,days=sapply(AD,days))

あってますか?
562デフォルトの名無しさん
垢版 |
2023/12/19(火) 00:23:50.21ID:jHCQnODd
[Eto'o](https://en.wikipedia.org/wiki/Samuel_Eto%27o)はもう引退しました。
563デフォルトの名無しさん
垢版 |
2023/12/19(火) 00:58:14.13ID:jHCQnODd
マジで聞いているんなら、テストツールの使い方を覚えた方が建設的だと思う。
個人的には、Haskellからの流れで
[quickcheck](https://github.com/RevolutionAnalytics/quickcheck)
しか経験したことがないが、他にもあると思う。

コードが合っているかどうかわからないが、パット見問題なさそうに見える。
問題があったとしても、デバッグで十分対応できるように見える。
[リーナスの法則](https://en.wikipedia.org/wiki/Linus%27s_law):
あたなが十分な暇人ならばバグはいずれ塞がれる。
2023/12/19(火) 08:05:39.46ID:5FW9R46b
>>563
サンクス
565デフォルトの名無しさん
垢版 |
2023/12/20(水) 23:21:30.67ID:H48HUSxu
ChatGPTはなんていい奴なんだろう。

クソ野郎: I'd like to test the following code:

``` r
拝借
```

* The code is written in the programming language R.
* "子", "丑", ..., are the Chinese / Japanese zodiac called Eto in Japanese.

This code have to calculate the age for given birth date in Eto, e.g.
`eto = "ひつじ", tag = date = "10-17"`. Are there any advice to test this code?

ChatGPT: Certainly! To test the provided R code, you can follow these steps:

1. Understand the Code:
* Make sure you understand the logic of the code and how it calculates age based on the Eto and birthdate information.
1. Run the Code:
* Copy and paste the code into an R script or R console.
* Ensure that there are no syntax errors or issues when running the code.
1. Test Cases:
* Define several test cases with different combinations of Eto, birthdate (tag), and current date.
* For example, you can use different values for eto and tag, and verify the calculated age against your expectations.
1. Expected Results:
* Manually calculate the expected age for each test case based on the provided Eto information and current date.
* Compare the manually calculated age with the age calculated by the R code.
1. Edge Cases:
* Test the code with edge cases, such as birthdates close to the boundary of age ranges, to ensure the code handles them correctly.
566デフォルトの名無しさん
垢版 |
2023/12/21(木) 22:26:55.69ID:Jt1+wTI1
出禁になった。書けるかな?
てなわけで、ちゃっとじーぴーてーの残りの部分は割愛する。

意地悪クソ野郎と親切じーぴーてーにも共通することろがあって、
最後の締めはやっぱりリーナスの法則になる。言い方が全然違うけど。

親切じーぴーてーが例に挙げたテストコードがテストの基本形になると思う。
くいっくちぇっくのようなテストツールでは、テストケースをランダムに発生させるが、
そうしたテストツールが使えない場合も多々ある。テストツールが使えない場合は、
親切じーぴーてーが示したようなベタな方法で行くしかない。
2023/12/21(木) 22:41:24.08ID:6SaY/e5W
>>566
書き込めるかどうか判らぬままに
黙々とその低能感溢れる文章を書いている姿を想像すると泣けてくる

書き込めてよかったな
568デフォルトの名無しさん
垢版 |
2023/12/22(金) 00:02:15.06ID://WOG+3q
親切じーぴーてーとの会話を見返すと、関数を細分化して、(ナウ、干支、月日)
という三つ組を引数とする関数を作るのもありかな?という気がしてきた。
このように関数を細分化すると、テストケースが作りやすくなる。
2023/12/22(金) 15:14:15.66ID:BVAe/0CV
かけるかな
2024/01/04(木) 21:13:27.82ID:r+ggAGcN
クラスタリングとか次元削減に関する教科書的な本ってありますか?
571デフォルトの名無しさん
垢版 |
2024/01/05(金) 00:08:11.56ID:Cbq0Hg0X
かけるかな

統計の人でも機械学習の人でもないので、返事を書くのは心苦しいものがあるが、
過疎なのでしょうがない。統計処理と機械学習の区別がつかないぐらいの素人だよ。
ありきたりだけど:

* [朱鷺の杜Wiki](http://ibisforest.org/index.php?FrontPage)

グーグルとアヒルで検索してみたけど、この検索については英語の方が情報が取りやすいと思った。
英語でも日本語でも本屋の広告が多くなるが、英語の方が俺が推薦図書はこれだ!
みたいなのが多いような気がした。検索で見つけた本だけど非売品と商品の両方がある。

* [Modern Dimension Reduction](https://arxiv.org/abs/2103.06885)
* [Modern Dimension Reduction](https://www.cambridge.org/core/elements/abs/modern-dimension-reduction/D1506D1D7D51CC4EF375E4633D54F377)

このようなケースでは立ち読みしてから買うこともできる。時々、非売品と商品の
両方が用意されていることがあるので、注意した方が良いかもしれない。
殊、次元削減で言えば、線形代数みないなもので、ありとあらゆる場所で使われるので、
俺の次元削減にジャストフィットするものを探すのは難しいかもしれない。

ちなみに、専門的には、学校の教室で研究会を開くのが統計で、リゾート地で
国際会議を開くのが機械学習らしい。
2024/05/02(木) 14:41:31.88ID:9naKJa9o
統計解析向けのプログラミング言語「R」の実装に欠陥、任意コード実行のおそれ
https://forest.watch.impress.co.jp/docs/news/1588724.html
573デフォルトの名無しさん
垢版 |
2024/07/06(土) 23:18:34.28ID:dmyvQpwi
書けるかな?
[Rのリサイクル規則](https://jsfiddle.net/c617uwp9)
中にも書いたが、polyfill.ioはシリアスな案件なので、外だししておく。
[polyfill.io問題のQuarto・R Markdownへの影響](https://zenn.dev/yutannihilation/articles/252c7795433429)
2024/07/17(水) 11:23:25.89ID:jPCMTQ1M
ubuntu24.04対応のRstudio来ねーな・・・
2024/08/20(火) 00:42:46.77ID:c8o+ygTe
こねーなw
難航してるのかな。
576デフォルトの名無しさん
垢版 |
2024/09/10(火) 01:06:21.09ID:SFqXDqGn
参考になるかな?

* [RStudio fails to run on Ubuntu 24.04 - Issue #14336 - rstudio/rstudio - GitHub](https://github.com/rstudio/rstudio/issues/14336)

他人事なら正論が吐ける。Dockerで試すのが吉。
実際には面倒なのでなかなかDockerで試してからとはいかないが、
他人事なら何でも言える。
577デフォルトの名無しさん
垢版 |
2024/09/24(火) 00:03:09.15ID:B2G5MWgw
Hacker-Newsネタ

1. [React for R | Hacker News](https://news.ycombinator.com/item?id=41554193)
2. [Why wordfreq will not be updated | Hacker News](https://news.ycombinator.com/item?id=41578483)
3. [Data Science Agent and Code Transformation | Hacker News](https://news.ycombinator.com/item?id=41622080)
4. [Terence Tao on O1 | Hacker News](https://news.ycombinator.com/item?id=41540902)
5. [Brainfuck Enterprise Solutions | Hacker News](https://news.ycombinator.com/item?id=41620198)
6. [What happened to the Japanese PC platforms? | Hacker News](https://news.ycombinator.com/item?id=41612984)

一年に一本くらいRについての投稿があるような気がする。
2番目は、個人的には、考えさせられる内容になっている。
3番目と4番目は夢のある話で、5番目は楽しい話になっている。
6番目はCPU業界栄枯盛衰の物語としても読むことができる。
Intelの運命や如何に。
2024/09/30(月) 19:17:21.97ID:87Zg0Lej
Rstudio ubuntu24版キタ
2024/09/30(月) 19:32:04.73ID:87Zg0Lej
とりあえず騒がれてた起動の不具合は解消されてるみたいだね
580デフォルトの名無しさん
垢版 |
2024/10/10(木) 01:08:17.58ID:Q3cGnE1w
* [Nobel Prize in Physics awarded to John Hopfield and Geoffrey Hinton | Hacker News](https://news.ycombinator.com/item?id=41775463)

ノーベル物理学賞が機械学習系のお二方に決まった。
業績から言って文句なしのお二方だが、それが物理学賞?という疑問が湧く。
話に聞いていた物理学賞の選考基準は「物理現象の新発見」だった。
これが理由でarxivの作者が物理学賞を受賞しないと思っていた。
理数系の研究におけるarxivの貢献は過去10年分の物理学賞と化学賞と
フィールズ賞とチューリング賞を全て合わせたより大きいかもしれない。
個人的には次の2点が引っかかる。

* 何故、このタイミングで?
* お二方とも高名である。

こんなことを考えているうちに化学賞も似たようなことになった。
おいくら兆円?が頭をよぎる。
AI関連の投資への呼び水として利用されている疑念が拭えない。
もちろん、何事も変わらなければ消えてしまうし、変わりすぎても消えてしまう。
物理学や化学の定義も時代と共に変わっていくものだと思う。
ノーベル賞の選考基準も時代と共に変わっていくものだろう。
しかし、今回のノーベル賞は偶然の一致の度合いが大きすぎる気がする。
2024/10/10(木) 12:14:46.24ID:bwO1aVtU
数学症も無いし
CS賞部門も増設すべきだよな
2024/10/11(金) 14:00:28.70ID:W/ZPwHBO
放送大学の秋山先生の講座ってどうなの?
583デフォルトの名無しさん
垢版 |
2025/01/21(火) 21:45:31.47ID:Q1AkQbXB
Rには関係ないが、資料として置いておく。

* [PCAST Reports (2020-2025)](https://www.erichorvitz.com/PCAST_reports_2020-2025.htm)
* [Documents & Reports | PCAST | The White House](https://web.archive.org/web/20250116064747/https://www.whitehouse.gov/pcast/documents-reports/)

中身は全く読んでいないが、次の討論会を見る限り、政治色はないと思う。

* [PCAST: Discussion of Artificial Intelligence (AI) Enabling Science and AI Impacts on Society - YouTube](https://www.youtube.com/watch?v=gZb7Yr4C8po)
584デフォルトの名無しさん
垢版 |
2025/02/04(火) 00:46:14.41ID:V6kAFtDi
この話題は政治色抜きでは語れないと思うが、それを抜きにして、
アメリカ政府の発行したデータを使っている人がいれば、注意が必要になると思う。

* [Backing Up US Federal Databases | The n-Category Cafe](https://golem.ph.utexas.edu/category/2025/02/backing_up_us_federal_database.html)
* [CDC data are disappearing | Hacker News](https://news.ycombinator.com/item?id=42897696)
585デフォルトの名無しさん
垢版 |
2025/02/15(土) 21:36:58.32ID:jpL9Lr/5
次の動画の音声だけ聞いていたところ、只者でない気配を感じた。訳者の腕もあると思う。

* [GPT解説2 アテンションの仕組み (Attention, Transformer) | Chapter6, 深層学習 - YouTube](https://www.youtube.com/watch?v=j3_VgCt18fA)

そこで、動画を見ると、丁寧なアニメが動いているじゃありませんか。
手練が作っていると思うが、それでも相当制作時間がかかっていると思う。

おまけだが、声質やゆったりさ加減がiPadの広島弁の解説に似ているように感じた。
あんたあ中国新聞読むじゃろ。あんたが数学に合わせる必要はないんよ。
数学の方があんたのええように合わせるけえ。だといいね。

外のホームページでは、カテゴリ分けされているので、外の方が番組を選びやすいかもしれない。

* [3Blue1Brown](https://www.3blue1brown.com/#lessons)
586デフォルトの名無しさん
垢版 |
2025/03/10(月) 01:40:13.55ID:trsagf4Z
0. [I'll be back](https://www.youtube.com/watch?v=kw41Yyfyh_0)
1. [Public health data disappeared. RestoredCDC.org is bringing it back | Hacker News](https://news.ycombinator.com/item?id=43248610)
CDC was back.
続報
2. [Introduction to Stochastic Calculus | Hacker News](https://news.ycombinator.com/item?id=43160779)
伊藤さん is ubiquitously back.
3. [Differentiable Logic Cellular Automata | Hacker News](https://news.ycombinator.com/item?id=43286161)
車輪の大発明 will be back again and again.
[量子解析学](https://en.wikipedia.org/wiki/Quantum_calculus)
の言い出しっぺはオイラーやヤコビらしいが、これは
[Brzozowski微分](https://en.wikipedia.org/wiki/Brzozowski_derivative)
と通常の微分を結ぶ。読んでいないが、おそらく、記事では、
何らかの活性化関数の極限として論理式が再現するようにしているんじゃないかと思う。
量子力学は、ポアソン括弧の構造を保つように、ニュートン力学を変形する。
プランク定数がゼロの極限でニュートン力学になる。
量子解析学は、ライプニッツ則の構造を保つように、微分を差分に書き直す。
変形パラメータqがゼロの極限でBrzozowski微分になる。
587デフォルトの名無しさん
垢版 |
2025/05/22(木) 01:15:55.60ID:+HZBQ7+B
RStudioを更新したらreticulateが動作しなくなった。
* [Release reticulate 1.41.0 - rstudio/reticulate - GitHub](https://github.com/rstudio/reticulate/releases/tag/v1.41.0)
今までどうやって動作させてたんだ?記憶にございません。
というわけで、一からやり直した。ワイのPython環境:
* システムにPython via sudo apt
* ユーザーにもPythonパッケージ via pip3
ワイの処方箋:
* in .Rprofile: Sys.setenv (RETICULATE_PYTHON = "/usr/bin/python3")
Pythonのvenvを使う場合は、Sys.setenv (RETICULATE_PYTHON_ENV = path-to-venv)でいける。
似た話題で、
* [Show HN: Rv, a Package Manager for R | Hacker News](https://news.ycombinator.com/item?id=44006735)
レスを投稿する

5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況