統計解析R たぶんpart3くらい

**デフォルトの名無しさん** · 2012/06/22(金) 13:33:12.40

あっても良さそうなんですが,需要ないの？

過去スレのうちのひとつ
統計解析R
http://toro.2ch.net/test/read.cgi/tech/1285597198/

**デフォルトの名無しさん** · 2023/08/08(火) 23:42:45.27

Rしばらく使ってないから忘れそう

**デフォルトの名無しさん** · 2023/08/23(水) 14:24:09.90

ついにExcelでPython使えるようになるらしい
マイクロソフトはRのベンダー買収してMRANとかやってたのに時代の流れかな

**デフォルトの名無しさん** · 2023/08/24(木) 07:11:35.29

Pythonでexcel弄るのは
15年以上前から出来てるのを今更
excel上のpythonで実行する方が遅い可能性まである

**デフォルトの名無しさん** · 2023/08/25(金) 13:03:41.78

PythonからExcelをいじることとExcelでPythonが動くことは全く違う

**デフォルトの名無しさん** · 2023/08/25(金) 13:58:38.54

くりゃうどω

**デフォルトの名無しさん** · 2023/08/25(金) 14:03:48.50

pythonは何故かPCでJupyter notebookが不具合で使えなくてな
導入時点でコケるとその言語をやる気失くす…Rはその点、導入が簡単で良かった

**デフォルトの名無しさん** · 2023/08/27(日) 01:44:38.85

Excelも最近はTidydata志向で、パワークエリやパワーピボットで再現性のある加工や分析が
できるようになってきているけど、使い始めはなかなかいいかな、と思ったがちょっと凝ると
やっぱり複雑化してメンテできないVBAみたいになっちゃうなｗ

ま、RやPythonだからメンテ性がいいというわけでもない気はするけどｗ

**デフォルトの名無しさん** · 2023/08/27(日) 20:22:33.62

Excelマクロ禁止してきた企業はPython機能も禁止しそう
Rを社員が使うケースなんてのはもうレア度SSRなんだろうね

**デフォルトの名無しさん** · 2023/08/28(月) 13:50:39.79

Rで学ぶなんとか分析とかいう本いっぱい出ているし、結構個人でやる気のあるやつは覚えるんじゃね？
R人口増えている印象。

**デフォルトの名無しさん** · 2023/08/28(月) 13:57:24.90

昨日の統数研のワークショップ見て、大学や企業によってはライブラリのインストールに制限あったりでデフォルトで解析できるのがRが多言語に置き換わらない理由の一つなのかもなと思った
今後も「選択と集中」続けるどころか懸賞金型推進するようだから商用に金払うのも辛くなるとこも出てきそうね

**デフォルトの名無しさん** · 2023/08/29(火) 18:08:36.20

数が増えてることと数が少ないこととは違う
これ混同する人は結構多い

**デフォルトの名無しさん** · 2023/08/30(水) 15:28:57.25

当社比200%
元が少なかっただけやろ
みたいな

**デフォルトの名無しさん** · 2023/09/01(金) 21:33:15.97

自分は今の部署にいる間だけは統計解析するけど異動したらもう解析なんてしないからRのモチベは低いな
人事の巡り合わせでいつかまた今の部署に戻るかもしれないけど

**デフォルトの名無しさん** · 2023/09/02(土) 10:50:19.16

隙あらばどうでもいい自分語り

**デフォルトの名無しさん** · 2023/09/02(土) 14:49:02.94

過疎スレでその煽りは馬鹿じゃねえの

**デフォルトの名無しさん** · 2023/09/02(土) 15:24:55.18

本人だろ age てるのは

**デフォルトの名無しさん** · 2023/09/02(土) 15:27:52.78

ageを最近知ったみたいに強調してる馬鹿ww

**デフォルトの名無しさん** · 2023/11/26(日) 13:47:18.77

[プッシュアウト](https://en.wikipedia.org/wiki/Pushout_%28category_theory%29)
について書いてみた。
[JSFiddle](https://jsfiddle.net/zLpqd9mj/show)
集合の圏でのプッシュアウトは
[等価ジョイン](https://en.wikipedia.org/wiki/Join_%28SQL%29#Equi-join)
の圏論的双対にあたる。

**デフォルトの名無しさん** · 2023/11/26(日) 19:19:27.89

おーまんちょー！

**デフォルトの名無しさん** · 2023/12/02(土) 19:24:46.52

前回のおーまんちょーでは一部のコードで途中から行番号が表示されるようになっていた。
多分、JSFiddleのエディターで`tidy`というボタンを押してしまったからだと思う。
実は、`prettydoc::html_pretty`で行番号が表示されないのを直したいと思っていた。
しかし、どこから手を付けたら良いかわからなかった。それが、ハプニングのおかげで
手の入れ場所がわかった。多分、HTMLとしては不整合な状況になっているが、
意図した通りに表示されるようになった。
[ありがとう、おーまんちょー](https://jsfiddle.net/105nohbq/show)

**デフォルトの名無しさん** · 2023/12/15(金) 00:55:03.28

group_by()はmap()と組み合わせて使えないんだね

**デフォルトの名無しさん** · 2023/12/17(日) 12:11:13.68

一般的な意味では、そんなことないと思うよ。
状況によってはgroup_byとmapを組み合わせると上手く行くことがあると思う。
ぐるぐる図のくだりでグダグダなところがあったので、
[修正した](https://jsfiddle.net/6z7u3d09/show)。
アップした後にタイポを見つけたが、覆水盆に返らず。

**デフォルトの名無しさん** · 2023/12/17(日) 23:02:11.11

多変数の時系列データをクラスタリングするpackageをご存知であれば教えていただけますか…？

**デフォルトの名無しさん** · 2023/12/18(月) 00:40:20.74

知らない。
人がいれば、意味のない返事はしない方が良いかもしれないが、過疎だからね。

**デフォルトの名無しさん** · 2023/12/18(月) 23:51:29.23

あなたは地球上で何日過ごしてますか？
という問いに答えるRのスクリプト

干支と誕生日（月日）から今日が生まれて何日めか計算

eto=("ひつじ")
tag="10-17"
Eto=c("子(ね＝ねずみ)","丑(うし)","寅(とら)","卯(う＝うさぎ)","辰(たつ＝龍(りゅう))","巳(み＝へび)","午(うま)","未(ひつじ)","申(さる)","酉(とり＝にわとり)","戌(いぬ)","亥(い＝いのしし)")
# Eto
i=grep(eto,Eto)
this_year=as.numeric(strsplit(as.character(Sys.Date()),'-')[[1]][1])
j=this_year%%12 - 3
age=12*(0:9) + j-i
age=age[18<=age][1:5]
age
AD=paste0(this_year-age,"-",tag)
days=\(x) as.numeric(Sys.Date() - as.Date(x))
rbind(age,days=sapply(AD,days))

あってますか？

**デフォルトの名無しさん** · 2023/12/19(火) 00:23:50.21

[Eto'o](https://en.wikipedia.org/wiki/Samuel_Eto%27o)はもう引退しました。

**デフォルトの名無しさん** · 2023/12/19(火) 00:58:14.13

マジで聞いているんなら、テストツールの使い方を覚えた方が建設的だと思う。
個人的には、Haskellからの流れで
[quickcheck](https://github.com/RevolutionAnalytics/quickcheck)
しか経験したことがないが、他にもあると思う。

コードが合っているかどうかわからないが、パット見問題なさそうに見える。
問題があったとしても、デバッグで十分対応できるように見える。
[リーナスの法則](https://en.wikipedia.org/wiki/Linus%27s_law):
あたなが十分な暇人ならばバグはいずれ塞がれる。

**デフォルトの名無しさん** · 2023/12/19(火) 08:05:39.46

>>563
サンクス

**デフォルトの名無しさん** · 2023/12/20(水) 23:21:30.67

ChatGPTはなんていい奴なんだろう。

クソ野郎: I'd like to test the following code:

``` r
拝借
```

* The code is written in the programming language R.
* "子", "丑", ..., are the Chinese / Japanese zodiac called Eto in Japanese.

This code have to calculate the age for given birth date in Eto, e.g.
`eto = "ひつじ", tag = date = "10-17"`. Are there any advice to test this code?

ChatGPT: Certainly! To test the provided R code, you can follow these steps:

1. Understand the Code:
* Make sure you understand the logic of the code and how it calculates age based on the Eto and birthdate information.
1. Run the Code:
* Copy and paste the code into an R script or R console.
* Ensure that there are no syntax errors or issues when running the code.
1. Test Cases:
* Define several test cases with different combinations of Eto, birthdate (tag), and current date.
* For example, you can use different values for eto and tag, and verify the calculated age against your expectations.
1. Expected Results:
* Manually calculate the expected age for each test case based on the provided Eto information and current date.
* Compare the manually calculated age with the age calculated by the R code.
1. Edge Cases:
* Test the code with edge cases, such as birthdates close to the boundary of age ranges, to ensure the code handles them correctly.

**デフォルトの名無しさん** · 2023/12/21(木) 22:26:55.69

出禁になった。書けるかな？
てなわけで、ちゃっとじーぴーてーの残りの部分は割愛する。

意地悪クソ野郎と親切じーぴーてーにも共通することろがあって、
最後の締めはやっぱりリーナスの法則になる。言い方が全然違うけど。

親切じーぴーてーが例に挙げたテストコードがテストの基本形になると思う。
くいっくちぇっくのようなテストツールでは、テストケースをランダムに発生させるが、
そうしたテストツールが使えない場合も多々ある。テストツールが使えない場合は、
親切じーぴーてーが示したようなベタな方法で行くしかない。

**デフォルトの名無しさん** · 2023/12/21(木) 22:41:24.08

>>566
書き込めるかどうか判らぬままに
黙々とその低能感溢れる文章を書いている姿を想像すると泣けてくる

書き込めてよかったな

**デフォルトの名無しさん** · 2023/12/22(金) 00:02:15.06

親切じーぴーてーとの会話を見返すと、関数を細分化して、(ナウ、干支、月日)
という三つ組を引数とする関数を作るのもありかな？という気がしてきた。
このように関数を細分化すると、テストケースが作りやすくなる。

**デフォルトの名無しさん** · 2023/12/22(金) 15:14:15.66

かけるかな

**デフォルトの名無しさん** · 2024/01/04(木) 21:13:27.82

クラスタリングとか次元削減に関する教科書的な本ってありますか？

**デフォルトの名無しさん** · 2024/01/05(金) 00:08:11.56

かけるかな

統計の人でも機械学習の人でもないので、返事を書くのは心苦しいものがあるが、
過疎なのでしょうがない。統計処理と機械学習の区別がつかないぐらいの素人だよ。
ありきたりだけど：

* [朱鷺の杜Wiki](http://ibisforest.org/index.php?FrontPage)

グーグルとアヒルで検索してみたけど、この検索については英語の方が情報が取りやすいと思った。
英語でも日本語でも本屋の広告が多くなるが、英語の方が俺が推薦図書はこれだ！
みたいなのが多いような気がした。検索で見つけた本だけど非売品と商品の両方がある。

* [Modern Dimension Reduction](https://arxiv.org/abs/2103.06885)
* [Modern Dimension Reduction](https://www.cambridge.org/core/elements/abs/modern-dimension-reduction/D1506D1D7D51CC4EF375E4633D54F377)

このようなケースでは立ち読みしてから買うこともできる。時々、非売品と商品の
両方が用意されていることがあるので、注意した方が良いかもしれない。
殊、次元削減で言えば、線形代数みないなもので、ありとあらゆる場所で使われるので、
俺の次元削減にジャストフィットするものを探すのは難しいかもしれない。

ちなみに、専門的には、学校の教室で研究会を開くのが統計で、リゾート地で
国際会議を開くのが機械学習らしい。

**デフォルトの名無しさん** · 2024/05/02(木) 14:41:31.88

統計解析向けのプログラミング言語「R」の実装に欠陥、任意コード実行のおそれ
https://forest.watch.impress.co.jp/docs/news/1588724.html

**デフォルトの名無しさん** · 2024/07/06(土) 23:18:34.28

書けるかな？
[Rのリサイクル規則](https://jsfiddle.net/c617uwp9)
中にも書いたが、polyfill.ioはシリアスな案件なので、外だししておく。
[polyfill.io問題のQuarto・R Markdownへの影響](https://zenn.dev/yutannihilation/articles/252c7795433429)

**デフォルトの名無しさん** · 2024/07/17(水) 11:23:25.89

ubuntu24.04対応のRstudio来ねーな・・・

**デフォルトの名無しさん** · 2024/08/20(火) 00:42:46.77

こねーなｗ
難航してるのかな。

**デフォルトの名無しさん** · 2024/09/10(火) 01:06:21.09

参考になるかな？

* [RStudio fails to run on Ubuntu 24.04 - Issue #14336 - rstudio/rstudio - GitHub](https://github.com/rstudio/rstudio/issues/14336)

他人事なら正論が吐ける。Dockerで試すのが吉。
実際には面倒なのでなかなかDockerで試してからとはいかないが、
他人事なら何でも言える。

**デフォルトの名無しさん** · 2024/09/24(火) 00:03:09.15

Hacker-Newsネタ

1. [React for R | Hacker News](https://news.ycombinator.com/item?id=41554193)
2. [Why wordfreq will not be updated | Hacker News](https://news.ycombinator.com/item?id=41578483)
3. [Data Science Agent and Code Transformation | Hacker News](https://news.ycombinator.com/item?id=41622080)
4. [Terence Tao on O1 | Hacker News](https://news.ycombinator.com/item?id=41540902)
5. [Brainfuck Enterprise Solutions | Hacker News](https://news.ycombinator.com/item?id=41620198)
6. [What happened to the Japanese PC platforms? | Hacker News](https://news.ycombinator.com/item?id=41612984)

一年に一本くらいRについての投稿があるような気がする。
2番目は、個人的には、考えさせられる内容になっている。
3番目と4番目は夢のある話で、5番目は楽しい話になっている。
6番目はCPU業界栄枯盛衰の物語としても読むことができる。
Intelの運命や如何に。

**デフォルトの名無しさん** · 2024/09/30(月) 19:17:21.97

Rstudio ubuntu24版ｷﾀ

**デフォルトの名無しさん** · 2024/09/30(月) 19:32:04.73

とりあえず騒がれてた起動の不具合は解消されてるみたいだね

**デフォルトの名無しさん** · 2024/10/10(木) 01:08:17.58

* [Nobel Prize in Physics awarded to John Hopfield and Geoffrey Hinton | Hacker News](https://news.ycombinator.com/item?id=41775463)

ノーベル物理学賞が機械学習系のお二方に決まった。
業績から言って文句なしのお二方だが、それが物理学賞？という疑問が湧く。
話に聞いていた物理学賞の選考基準は「物理現象の新発見」だった。
これが理由でarxivの作者が物理学賞を受賞しないと思っていた。
理数系の研究におけるarxivの貢献は過去10年分の物理学賞と化学賞と
フィールズ賞とチューリング賞を全て合わせたより大きいかもしれない。
個人的には次の2点が引っかかる。

* 何故、このタイミングで？
* お二方とも高名である。

こんなことを考えているうちに化学賞も似たようなことになった。
おいくら兆円？が頭をよぎる。
AI関連の投資への呼び水として利用されている疑念が拭えない。
もちろん、何事も変わらなければ消えてしまうし、変わりすぎても消えてしまう。
物理学や化学の定義も時代と共に変わっていくものだと思う。
ノーベル賞の選考基準も時代と共に変わっていくものだろう。
しかし、今回のノーベル賞は偶然の一致の度合いが大きすぎる気がする。

**デフォルトの名無しさん** · 2024/10/10(木) 12:14:46.24

数学症も無いし
CS賞部門も増設すべきだよな

**デフォルトの名無しさん** · 2024/10/11(金) 14:00:28.70

放送大学の秋山先生の講座ってどうなの？

**デフォルトの名無しさん** · 2025/01/21(火) 21:45:31.47

Rには関係ないが、資料として置いておく。

* [PCAST Reports (2020-2025)](https://www.erichorvitz.com/PCAST_reports_2020-2025.htm)
* [Documents & Reports | PCAST | The White House](https://web.archive.org/web/20250116064747/https://www.whitehouse.gov/pcast/documents-reports/)

中身は全く読んでいないが、次の討論会を見る限り、政治色はないと思う。

* [PCAST: Discussion of Artificial Intelligence (AI) Enabling Science and AI Impacts on Society - YouTube](https://www.youtube.com/watch?v=gZb7Yr4C8po)

**デフォルトの名無しさん** · 2025/02/04(火) 00:46:14.41

この話題は政治色抜きでは語れないと思うが、それを抜きにして、
アメリカ政府の発行したデータを使っている人がいれば、注意が必要になると思う。

* [Backing Up US Federal Databases | The n-Category Cafe](https://golem.ph.utexas.edu/category/2025/02/backing_up_us_federal_database.html)
* [CDC data are disappearing | Hacker News](https://news.ycombinator.com/item?id=42897696)

**デフォルトの名無しさん** · 2025/02/15(土) 21:36:58.32

次の動画の音声だけ聞いていたところ、只者でない気配を感じた。訳者の腕もあると思う。

* [GPT解説2 アテンションの仕組み (Attention, Transformer) | Chapter6, 深層学習 - YouTube](https://www.youtube.com/watch?v=j3_VgCt18fA)

そこで、動画を見ると、丁寧なアニメが動いているじゃありませんか。
手練が作っていると思うが、それでも相当制作時間がかかっていると思う。

おまけだが、声質やゆったりさ加減がiPadの広島弁の解説に似ているように感じた。
あんたあ中国新聞読むじゃろ。あんたが数学に合わせる必要はないんよ。
数学の方があんたのええように合わせるけえ。だといいね。

外のホームページでは、カテゴリ分けされているので、外の方が番組を選びやすいかもしれない。

* [3Blue1Brown](https://www.3blue1brown.com/#lessons)

**デフォルトの名無しさん** · 2025/03/10(月) 01:40:13.55

0. [I'll be back](https://www.youtube.com/watch?v=kw41Yyfyh_0)
1. [Public health data disappeared. RestoredCDC.org is bringing it back | Hacker News](https://news.ycombinator.com/item?id=43248610)
CDC was back.
続報
2. [Introduction to Stochastic Calculus | Hacker News](https://news.ycombinator.com/item?id=43160779)
伊藤さん is ubiquitously back.
3. [Differentiable Logic Cellular Automata | Hacker News](https://news.ycombinator.com/item?id=43286161)
車輪の大発明 will be back again and again.
[量子解析学](https://en.wikipedia.org/wiki/Quantum_calculus)
の言い出しっぺはオイラーやヤコビらしいが、これは
[Brzozowski微分](https://en.wikipedia.org/wiki/Brzozowski_derivative)
と通常の微分を結ぶ。読んでいないが、おそらく、記事では、
何らかの活性化関数の極限として論理式が再現するようにしているんじゃないかと思う。
量子力学は、ポアソン括弧の構造を保つように、ニュートン力学を変形する。
プランク定数がゼロの極限でニュートン力学になる。
量子解析学は、ライプニッツ則の構造を保つように、微分を差分に書き直す。
変形パラメータqがゼロの極限でBrzozowski微分になる。

**デフォルトの名無しさん** · 2025/05/22(木) 01:15:55.60

RStudioを更新したらreticulateが動作しなくなった。
* [Release reticulate 1.41.0 - rstudio/reticulate - GitHub](https://github.com/rstudio/reticulate/releases/tag/v1.41.0)
今までどうやって動作させてたんだ？記憶にございません。
というわけで、一からやり直した。ワイのPython環境:
* システムにPython via sudo apt
* ユーザーにもPythonパッケージ via pip3
ワイの処方箋:
* in .Rprofile: Sys.setenv (RETICULATE_PYTHON = "/usr/bin/python3")
Pythonのvenvを使う場合は、Sys.setenv (RETICULATE_PYTHON_ENV = path-to-venv)でいける。
似た話題で、
* [Show HN: Rv, a Package Manager for R | Hacker News](https://news.ycombinator.com/item?id=44006735)