【まず1嫁】くだすれPython(超初心者用) その55

**デフォルトの名無しさん** · 2021/10/01(金) 15:46:47.17

当スレに★Python以外のプログラミング言語での回答類を書くべからず★
派生言語はそれぞれ専スレがある（この板にあるとは限らない）ので、そっち池。
「Ruby」「Rails」「某言語では」「クソチョンw」をNGワード登録推奨。荒らしは、完全スルー放置が一番きらいです。

このスレッドは「お勉強」スレのほうには書き込めない超低レベル、
もしくは質問者自身何が何だか分からない質問を、勇気を持って書き込むスレッドです。
へび使いが優しくコメントを返しますので、お礼は Python の布教と初心者の救済をお願いします。

★エラーを解決したい場合★は、
　　表示されたエラーの全文（勝手に省略やスクショうｐ等の横着クソ行為禁止）と、
　　実行環境（Pythonのバージョン・OSとIDEの種類およびバージョン）をシッカリ書くこと。

Pythonの★ソースコードをそのまま５ちゃんに貼るとインデントが崩れてチヌ★
【【【複数の連続半角スペースはなにもなかったことにされる＆タブは普通には入れられない】】】掲示板の仕様なので、
プログラム文は↓等の、いわゆるコードうｐ用サイトに貼ってこいください。
ttps://techiedelight.com/compiler/　　Run Code機能あり。
ttp://ideone.com/　　　　　　デフォ設定はC用のため、言語選択ボタン押下がﾋﾟｺ手間かも。
ttp://codepad.org/　　　　　ほぼ直感的に使える。Run codeボタンあり。
ttp://pastebin.com/　　　　　まずまずシンプル。
ttp://dpaste.com/　　　　　　とてもシンプル。消えるまでの日数は十分長ーく指定のこと。

◇Python公式◇ http://www.python.org/
◇まとめwiki◇ ttp://python.rdy.jp/wiki.cgi

〇前スレ〇　【まず1嫁】くだすれPython(超初心者用) その54
https://mevius.5ch.net/test/read.cgi/tech/1623240344/

次スレたては >>985 あたりが挑戦する。
### END OF TEMPLATE ###

**デフォルトの名無しさん** · 2021/11/19(金) 11:20:04.92

たぶんそれ人違いで殺してる

**デフォルトの名無しさん** · 2021/11/19(金) 19:16:34.09

df = df.values.tolist()
print(df)
を実行すると[[a1,b1],[a2,b2],[a3,b3]]のような形でデータを取得できますが、
これをタプルで取得する方法ってありますか？
下記みたいな感じで取得死体です
[(a1,b1),(a2,b2),(a3,b3)]

**デフォルトの名無しさん** · 2021/11/19(金) 19:37:02.12

[tuple(x) for x in df.values]

**デフォルトの名無しさん** · 2021/11/19(金) 21:02:22.10

>>742
できました！ありがとうございます。

ちなみにpsycopg2で[(a1,b1),(a2,b2),(a3,b3)]のデータを
テーブルに入れるにはどうしたらいいんだ？

import psycopg2
from psycopg2 import extras
conn = psycopg2.connect('host=localhost port=5432 dbname=db user=db password=db')
c = conn.cursor()
insert_list = [(a1,b1),(a2,b2),(a3,b3)]
extras.execute_values(c, "INSERT INTO table values %s", insert_list)
c.commit()
調べたら上記でいけるかと思いましたがだめでした

**デフォルトの名無しさん** · 2021/11/20(土) 04:07:01.58

プログラミング自体が初めて2週間ほどなので幼稚な質問をお許しください。

目的：読み込まれたリストから複数の条件で項目を除外する

testlist = ['月A','月B','火A','火B','','水A','水B','','月C','月D']
boxlist = list(map(str, testlist))

というところまで書いた時に、例えばこのリストから
「'月'が含まれている物全て」と「""(空行)」を消したいんです。
（特に空行はどうしても発生する物なので除去必須です）

たとえば『list(filter(lambda...』というのが使えるらしい事は調べたものの
文法がよく分からず何度やってもエラーが出てしまいました。
他の方法でもいいのでなにとぞ複数条件の除去が可能なコードなりを教えてもらえると助かります。

**デフォルトの名無しさん** · 2021/11/20(土) 04:49:44.14

簡単なところから徐々にステップアップしていけよ
とりあえず超初心者本買って読め
今の調子じゃ一から十まで全部聞くハメになるぞ

newlist = []
for data in testlist:
__if data:
____if '月' not in data:
________newlist.append(data)

これならわかるだろ
lambdaとかfilterは、まずこれが書ける人が次の段階で覚えろ

**デフォルトの名無しさん** · 2021/11/20(土) 06:00:34.25

初めて2週間でそんな所まで行くって凄いな
上の奴の言う通りだけどあえて書いてみるならば

testlist = ['月A','月B','火A','火B','','水A','水B','','月C','月D']

a = list(filter(lambda x: x and x[0] != '月', testlist))

filterやmapは高階関数と言うよ
第一引数に関数を取る
第二引数にイテラブルな型のオブジェクトを取る

上記の例ではtestlistから順番に一つずつvalueを:の左のxという引数に取り出して自分で書いたlambda関数内で処理して条件に合うvalueをメモリ領域に一時保存しているよ
そんでtestlistの全てのvalueを取り出し終えたらメモリ上に保存しておいたvalueをlist型に変換してaに代入している

testlist[0]の部分はスライス

**デフォルトの名無しさん** · 2021/11/20(土) 07:17:36.90

Ruby では色々な書き方ができるが、メソッドチェーンを使うのが、バグらない書き方。
Linux のパイプみたいな感じ。
各フィルターで処理を分けて、実行していく

最後の2つは、処理が複雑

ary_1 = [ "A月A", "", "火B", "", "月C" ]

# 配列から、空文字列を除去する
p ary_2 = ary_1.reject( &:empty? ) #=> ["A月A", "火B", "月C"]

# ary_2 から、月を含む文字列を除去する
p res_1 = ary_2.reject { |str| str.include? "月" } #=> ["火B"]

# 上の2つの処理をメソッドチェーンでつなげる
p res_2 = ary_1.reject( &:empty? ).
reject { |str| str.include? "月" } #=> ["火B"]

# 空文字列か、月を含む文字列を除去する
p res_3 = ary_1.reject { |str| str.empty? || str.include?( "月" ) } #=> ["火B"]

# 上の処理を、lambda にする
lambda_1 = ->( str ){ str.empty? || str.include?( "月" ) }
p res_4 = ary_1.reject{ |str| lambda_1.call( str ) } #=> ["火B"]

**デフォルトの名無しさん** · 2021/11/20(土) 08:38:43.30

複数のpythonファイルを順に実行する方法ってないですか？

zikkou.py
1.py
2.py
3.py
ってファイルがあった場合にzikkou.pyを実行すると1.py→2.py→3.pyの順で処理してくれる感じです。

import osかimport subprocessでできますか？

**デフォルトの名無しさん** · 2021/11/20(土) 08:43:20.89

rubyのアタマがバグってるやつはおいといて
今回の件は
news=[dat for dat in olds if '月' in dat]
だけでいいんじゃ～
forの実直ループ覚えたら内包表記覚えて
そのあと高階関数とpandas行くのだぞ
やりたいことの範囲はopenpyxlぽいけど

**デフォルトの名無しさん** · 2021/11/20(土) 09:12:28.20

>>748
subprocessでできると思うけど、結局コマンドプロンプトのコマンドを実行するわけだから
zikkou.pyじゃなくてbatファイルで1.py, 2.py, 3.pyを呼び出した方がいいんじゃないかな？

**デフォルトの名無しさん** · 2021/11/20(土) 09:22:38.89

>>748
でけた！
for pyfile in ['1.py', '2.py', '3.py']:
____subprocess.call(f'python {pyfile}')

**デフォルトの名無しさん** · 2021/11/20(土) 13:43:03.64

>>744
最初の考え方としては `boxlist.filter(空行以外).filter(‘月’が含まれてない)` みたいに2回filterしてやるのでもいいよ

↑をpythonで愚直に実装すると
list(filter(lambda x: '月' not in x, filter(lambda x: x != ‘’, boxlist)))

↑pythonの場合は2回filterするとオーバーヘッドが大きくなるだけなので1回にまとめて
list(filter(lambda x: x != ‘’ and ’月’ not in x, boxlist))

↑pythonではmapやfilterの代わりに内包表記を使うのが一般的なので
[ x for x in boxlist if x != ‘’ and ’月’ not in x ]

↑空行以外のfalsy値(0やNone)も除外してよければ
[ x for x in boxlist if x and ’月’ not in x ]

2回filterしても最適化されてオーバーヘッドかからない言語もあるので
アルゴリズム的な考え方と特定言語での実装とを分けて捉えるようにしておくと後々役に立つ

**デフォルトの名無しさん** · 2021/11/20(土) 15:32:34.01

>>750
ありがとう！
ちょっとやってみます

**デフォルトの名無しさん** · 2021/11/20(土) 15:34:29.98

pandasの列のデータ型をnumpy.int64からpythonのintにするにはどうしたらいいんや？
列名["count"]の場合にdf["count"].astype(int)でいけるのかと思ったらできなかった

**デフォルトの名無しさん** · 2021/11/20(土) 17:05:24.67

>>744です。
帰ってきたら想像してた以上に色んなやり方を書いてもらえててなんか感動してます。

実は超初心者向けとされている本は読んでいて、>>745さんが書かれてる通りリストやfor inを使う範囲で出来そうな
単純な内容の1000行とかになる記録簿の整理なら覚えた範囲で可能そう、かつ超便利と思ったのがきっかけなんです。
ただ、’月’とかの単語を指定しての除去だけならそれで出来たんですが、同時に空行の除去をしようとすると
ろくに作動しなくなってしまったために色々調べてfilterに行き着いたという流れでした・・・。

特に、というと序列を付けてるみたいで違うのですが、>>745さんのコードが目からうろこでした。
さっきまでどうして空行が除去出来てるのか理解できずググりまくったんですが、さんざん見てたはずの.appendの特性の応用で
正直色々空行の除去についてググってた時に見た色んなコードよりスマートに思えました。

他の皆さんのコードもかなり学び甲斐があってほんと頭が下がりました。
今からまた一個一個調べて見直しますが、かなり成長出来そうなので楽しみです。

・・・ちなみになんですが、こういう引数の知識は基礎の基礎と思うのですが、
その一通りが日本語でまとめてあるような本やサイトってあるんでしょうか？

**デフォルトの名無しさん** · 2021/11/20(土) 17:42:34.55

pythonの勉強を1ヶ月位してるけど、ここ1ヶ月何度も解いてる問題がノーヒントだと解けない
たとえばこういうやつ

>>
文字列 str1 と str2 が引数として与えられたとき、 str2 が str1 を部分文字列として含むかどうか判定する関数 simple_match を作成してください。
具体的には、str2 を含む場合、その部分文字列が開始される str1 のインデックスを返値として返してください。
str2 を含まない場合、 -1 を返してください。ただし、simple_match の中で文字列のメソッドやモジュール（正規表現など）を使ってはいけません。
<<
以下コード
https://techiedelight.com/compiler/?~simple_match

局所的な部分は分かるんだけど、全体を把握してきれいな回答が作れない
こういうアルゴリズムはどっからとっかかりを作って組み立てていくの？

**デフォルトの名無しさん** · 2021/11/20(土) 18:00:04.82

個人的にそんな問題が解けることになんの価値があるのか理解不能だけど
スライスを使うと簡単に書けるよ

**デフォルトの名無しさん** · 2021/11/20(土) 18:01:23.71

スライスを知ってるかどうかはアルゴリズムというより言語の知識の話だよな
アルゴリズムを数知ってるよりググる能力が高い方が
十把一絡げレベルのプログラマならよほど当てになると思う

**デフォルトの名無しさん** · 2021/11/20(土) 18:17:57.11

こういう練習問題をすぐ解けないからって定期的にやり直すより
どんどん先へ勉強を進めてしまった方が良いのか？

**デフォルトの名無しさん** · 2021/11/20(土) 18:31:09.23

>>756
典型的な2重ループのアルゴリズムの問題

s1 を、1文字ずつ処理していく。
s2 の先頭文字と一致したら、s1のインデックスを保存して、
1文字目の意味で、1も保存する

s1を1文字進めて、s2も1文字進めて、また一致すれば、
2文字目も一致したので、2も保存する

s1を1文字進めて、s2も1文字進めて、また一致すれば、
3文字目も一致したので、3も保存する

この数字が、s2の文字数と一致するまで増加したら、s2がs1に含まれる

スライスを使うと、もっと簡単に書けるのか？

**デフォルトの名無しさん** · 2021/11/20(土) 18:32:51.76

アルゴリズム系の問題は、図を描いて、考えた方がよい

**デフォルトの名無しさん** · 2021/11/20(土) 19:11:39.87

>>761
その図を書くってのを教えて欲しい
出来ればPCやスマホ上で出来るようなツールない？

**デフォルトの名無しさん** · 2021/11/20(土) 20:00:29.61

俺はこれは問題のための問題
クソ問だと思う
特に-1返すとか、モジュールはともかく、文字列メソッド使用不可とかバカの極み
クイズは無視してやりたいことを追え

**デフォルトの名無しさん** · 2021/11/20(土) 20:01:36.80

せっかくだからKMP法まで勉強しろ

**デフォルトの名無しさん** · 2021/11/20(土) 20:17:33.74

>>762
一番メジャーの方法はUML
ググるといっぱいツールが出てくる
有料なのも多いけど

**デフォルトの名無しさん** · 2021/11/20(土) 20:26:19.53

文字列をスライスするのって文字列のメソッド使ってるよね？

**デフォルトの名無しさん** · 2021/11/20(土) 20:54:17.15

> str2 が str1 を部分文字列として含むかどうか
> str2 を含む場合
逆転してね？

**デフォルトの名無しさん** · 2021/11/20(土) 21:36:08.75

>>759
そりゃそうだろ
そもそも大半のプログラマーは競技プログラミングなんか興味ない

**デフォルトの名無しさん** · 2021/11/20(土) 22:02:54.27

>>768
いや、これ初心者向けの教材なんだよ
だからこの問いの答えがぱっと出て来なきゃいけないのかと思ったんだ

**デフォルトの名無しさん** · 2021/11/20(土) 22:05:42.97

>>769
普通にググればいいよどうしても自力でやりたいなら組み込み関数のソースコード読んでパクればいいんじゃねやったことないけど

**デフォルトの名無しさん** · 2021/11/20(土) 22:16:28.52

>>756
自分でやるときどうする？
例えば location と cat なら

location
cat → 合わない
location
_cat → 合わない
location
__cat → お、合った、2個ずらしたから 2 を返せばいいんだな

って言うようにずらしながら比較していくよね
って言うところからやればいいんじゃね

**デフォルトの名無しさん** · 2021/11/20(土) 23:00:40.68

>>766
それが文字列のメソッドに該当するならインデックスアクセスもできねえだろｗ
解なしになっちまうよ

**デフォルトの名無しさん** · 2021/11/20(土) 23:03:09.18

まあ、スライスがいい回答だとは思わないけど
小学校の教材ならたぶん0点つけてくる教師がいる回答

**デフォルトの名無しさん** · 2021/11/21(日) 00:27:58.17

構文などの書き方が分からないってなら仕方無いと思うけど
この程度のアルゴリズムを思い付けないってならヤバいだろ
池沼疑われるレベル

**デフォルトの名無しさん** · 2021/11/21(日) 00:38:15.47

アルゴリズムとか使わないから
知能検査は別スレだろ

**デフォルトの名無しさん** · 2021/11/21(日) 01:16:28.56

KMP法とかsuffix arrayの話？

**デフォルトの名無しさん** · 2021/11/21(日) 08:44:34.82

>>772
そんなこと言っても文字列のメソッド使ってるじゃん
使っちゃダメだから

**デフォルトの名無しさん** · 2021/11/21(日) 09:58:00.66

アスペって生き辛そう…

**デフォルトの名無しさん** · 2021/11/21(日) 11:02:45.04

def simple_match(str1, str2):
____for idx, _ in enumerate(str1):
________if str1[idx:idx+len(str2)] == str2:
____________return idx
____return -1

**デフォルトの名無しさん** · 2021/11/21(日) 11:15:39.23

さらに速く高機能にした

def simple_match(str1, str2):
____len_str1 = len(str1)
____len_str2 = len(str2)
____if ret := [idx for idx in range(len_str1) if str1[idx:idx+len_str2]==str2]:
________return ret
____else:
________return -1

simple_match('location', 'cat')
[2]
simple_match('soccer', 'cat')
-1
simple_match('locationcat', 'cat')
[2, 8]

**デフォルトの名無しさん** · 2021/11/21(日) 12:37:43.77

__getitem__も__iter__も文字列のメソッドなのでその回答だと0点ですね

**デフォルトの名無しさん** · 2021/11/21(日) 12:40:01.89

__len__も使ってたか

**デフォルトの名無しさん** · 2021/11/21(日) 15:17:06.09

列"B1FD24"は存在しませんになって行のデータが取得できません。
解決策おしえてください。

import psycopg2

conn = psycopg2.connect('host=localhost port=5432 dbname=goya user=goya password=goya1395CCC')
c = conn.cursor()

#練習用のテーブル作成
c.execute('''
CREATE TABLE IF NOT EXISTS info_test(
"A_code" text unique,
"weight(g)" integer,
"item_name" text
)
''')
data = [("B1FD24",int(566),"ハンマー"),("B6DE49",None,"空気"),("B4XB21",int(823),"米")]
for d in data:
c.execute(f'INSERT INTO info_test ("A_code","weight(g)","item_name") VALUES(%s,%s,%s) on conflict ("A_code") do nothing',d)
conn.commit()

#練習
c.execute(f'SELECT "A_code" FROM info_test')
a_code_list = [row[0] for row in c.fetchall()]
for a_code in a_code_list:
c.execute(f'SELECT * FROM info_test WHERE "A_code"="{a_code}"')
d = [row for row in c.fetchall()]
print(d)

**デフォルトの名無しさん** · 2021/11/21(日) 15:24:19.44

行データを一行ずつ取得したいのですが、できませんでした。
書き込み時にインデントが消えてしまいましたので再度投下します。
import psycopg2

conn = psycopg2.connect('host=localhost port=5432 dbname=goya user=goya password=ksfdkjwoe')
c = conn.cursor()

#練習用のテーブル作成
c.execute('''
CREATE TABLE IF NOT EXISTS info_test(
____"A_code" text unique,
____"weight(g)" integer,
____"item_name" text
)
''')
data = [("B1FD24",int(566),"ハンマー"),("B6DE49",None,"空気"),("B4XB21",int(823),"米")]
for d in data:
____c.execute(f'INSERT INTO info_test ("A_code","weight(g)","item_name") VALUES(%s,%s,%s) on conflict ("A_code") do nothing',d)
conn.commit()

#練習
c.execute(f'SELECT "A_code" FROM info_test')
a_code_list = [row[0] for row in c.fetchall()]
for a_code in a_code_list:
____c.execute(f'SELECT * FROM info_test WHERE "A_code"="{a_code}"')
____d = [row for row in c.fetchall()]
____print(d)

c.execute(f'SELECT * FROM info_test WHERE "A_code"="{a_code}"')
の部分をc.execute(f'SELECT * FROM info_test WHERE "weight(g)"=566')にすると行データを取れるのでどうしていいかわかりません

**デフォルトの名無しさん** · 2021/11/21(日) 15:36:48.25

a_codeを%sにすりゃいいだけちゃう
fと%sの使いどころの問題では

**デフォルトの名無しさん** · 2021/11/21(日) 15:43:34.67

>>785
今%sにしてみましたが、
not all arguments converted during string formatting
がでてきてしまいました

**デフォルトの名無しさん** · 2021/11/21(日) 16:48:00.01

>>754
df["count"].astype(long)

**デフォルトの名無しさん** · 2021/11/21(日) 17:07:50.01

"weight(g)"=None
になってる行があるから
insert に失敗してるんだろ

**デフォルトの名無しさん** · 2021/11/21(日) 17:18:17.35

>>788
#練習の上の行に下記を入れると表示されるのでinsertは成功してると思います
import pandas as pd
df = pd.read_sql(sql=f'SELECT * FROM info_test;', con=conn)
print(df)

A_code weight(g) item_name
0 B1FD24 566.0 ハンマー
1 B6DE49 NaN 空気
2 B4XB21 823.0 米

**デフォルトの名無しさん** · 2021/11/21(日) 17:53:07.18

f'SELECT * FROM info_test WHERE "A_code"=\'{a_code}\''
f"SELECT * FROM info_test WHERE \"A_code\"='{a_code}'"
SQL文字列リテラルはSQL標準ではシングルクォート。

**デフォルトの名無しさん** · 2021/11/21(日) 18:18:28.27

Warning
Never, never, NEVER use Python string concatenation (+) or string parameters interpolation (%) to pass variables to a SQL query string. Not even at gunpoint.

f-stringも同じこと

**デフォルトの名無しさん** · 2021/11/21(日) 18:22:31.92

>>790
できた！できました！！！
ありがとうございます！！！！！！

**デフォルトの名無しさん** · 2021/11/21(日) 19:25:01.44

>>791 をスルーするのが今日の流れっぽい

**デフォルトの名無しさん** · 2021/11/21(日) 19:40:20.97

実験や習作だと思うけどprepared statement使うのが筋だし
f-stringで教えるアホは業界去った方がいい

**デフォルトの名無しさん** · 2021/11/21(日) 20:19:01.83

すまん、791はwarningって書いてあったからよくみてなかった。
初心者すぎてよくわからんのですが、f-stringとprepared statementってどっちがどっちですか?
①f"{a}"のやつ
②(%),aのやつ
結果が同じでも処理に違いがある感じですか?

**デフォルトの名無しさん** · 2021/11/21(日) 20:23:30.97

791google翻訳してみましたが、よくわからん。

警告
変数をSQLクエリ文字列に渡すために、
Python文字列連結（+）または文字列パラメーター補間（％）を使用しないでください。
銃を突きつけても。

(%),aではなくf"{a}"がいいですよってこと？

**デフォルトの名無しさん** · 2021/11/21(日) 20:45:52.97

>>791はpsycopg2の公式ドキュメントから引用
https://www.psycopg.org/docs/usage.html#sql-injection

**デフォルトの名無しさん** · 2021/11/21(日) 20:48:25.93

>>797
ありがとう。
ブクマして少しずつ読んで見る

**デフォルトの名無しさん** · 2021/11/21(日) 21:16:22.28

基本、Ruby on Rails などのウェブ開発では、

SQL 文を、文字列で組み立ててはいけない！
ユーザーが危険な文字列を送ってきて、SQL injection しようとするから

必ず、危険な文字列をエラーにするように、
place holder という書き方をしないといけない！

フレームワークを使った、ウェブ開発の基本

**デフォルトの名無しさん** · 2021/11/21(日) 21:21:08.30

>>795
①も②もprepared statementではないけども②が正解
②でpsycopg2が行っているような処理をRDBMS(PostgreSQL)側で行うのがprepared statements

https://www.psycopg.org/psycopg3/docs/advanced/prepare.html#prepared-statements
psycopg3になれば勝手にやってくれるみたい

**799** · 2021/11/21(日) 21:44:07.52

例えば、Ruby では、

変数a を使って、上の2つのように文字列を連結させたり、
式展開してから埋め込んだりしても、

変数aの内容をユーザーからもらった、危険な文字列の場合、SQL injection される

例えば、WHERE (id = 1 OR 1 = 1)なら、
true となるので、すべてのレコードが取得される！

それを最後のように、place holder, ? を使えば、
危険な文字列をエラーにできる

こういうやり方が、Ruby on Rails などのフレームワークを使った、ウェブ開発の基本

id = '1 OR 1 = 1'

User.where( "id = " + id )
User.where( "id = #{id}" )

User.where( "id = ?", id )

**デフォルトの名無しさん** · 2021/11/21(日) 21:46:31.38

調べてきたけど、プレースホルダーを使わないと攻撃されたとき危険ってのがわかったわ。

ちなみに↓をf''使わずに(%)をつかって書くとどうなるんや？
f'SELECT * FROM info_test WHERE "A_code"=\'{a_code}\''

**799** · 2021/11/21(日) 21:47:15.98

>>801
修正

変数a ではなく、変数id

**デフォルトの名無しさん** · 2021/11/21(日) 21:48:35.16

で、結局どう書くのがベストなの？　こう？
c.execute("SELECT * FROM info_test WHERE A_code=%s", (a_code,))

テーブル作成とかの"A_code"って、ダブルクォーテーションいらないんじゃない？
ttps://www.curict.com/item/20/20f70b7.html
とか見るとダブルクォーテーションで囲ってないよね

**デフォルトの名無しさん** · 2021/11/21(日) 21:51:23.16

大文字の時は括らなきゃいけないのかと思ってたわ

**デフォルトの名無しさん** · 2021/11/21(日) 22:20:00.67

＞　お前は毎朝起きるたびに俺に負けたことを思い出すよ＾＾

あー、ホンッとに思い出すなあ（笑）
キチガイの嘘つきの低レベルFランの、
朝鮮ゴキブリBot君は、
チョン独特の「なにもできないけど俺のほうがジャップより偉い！」的な
ことはよーくわかったよ。
ホントなにもできない朝鮮ゴキブリBot君！

クソチョンｗ
クソチョンはウンコを食べる糞食人種w
ゲリ便をじゅるじゅると
うまそうに食ってるw

**デフォルトの名無しさん** · 2021/11/21(日) 22:30:00.92

>>804
記号とかを含まなきゃ " " で囲む必要ない
info_test, item_name, A_code とかは囲まなくても良いけど weight(g) は多分だめ

**デフォルトの名無しさん** · 2021/11/21(日) 23:10:08.06

>>807
そうそう、だからカラム名に()とか入れないほうがいいのよね。めんどくさいから
必要な場合自分は逆引用符`使ってるけど

**デフォルトの名無しさん** · 2021/11/22(月) 16:55:05.56

>>455

**デフォルトの名無しさん** · 2021/11/23(火) 12:20:48.24

3.10に変えたらscikit-learnがインストール出来なくなった
まあそう頻繁に使うライブラリでもないけど

**デフォルトの名無しさん** · 2021/11/23(火) 19:50:40.69

assertの使いどころがぐぐってみましたがいまいちピンと来ません

**デフォルトの名無しさん** · 2021/11/23(火) 20:09:45.21

>>811
a<0になるようにプログラム組んだけどもしa<0になったまま次にいくと
機械がつぶれる
不安だというとき
assert文で例外エラーだしてストップさせるとか

**デフォルトの名無しさん** · 2021/11/23(火) 20:42:03.75

あくまで開発中の考慮漏れなんかを防ぐ用途なので
ランタイムエラーにしたいならassertの出番ではない

**デフォルトの名無しさん** · 2021/11/23(火) 22:55:20.18

>>812
要するに
> a<0になるようにプログラム組んだけどもしa<0になったまま次にいくと機械がつぶれる
みたいな意味不明な状況を検出するためだよね

**デフォルトの名無しさん** · 2021/11/23(火) 22:55:45.59

var : Optional[str] =None

on_btn():
__assert var
__var処理

みたいな。pylanceとかに怒られない
varにモノ入ってっからbtnが押されるに決まってんだろうがっていうとき

on_btn():
__if not var:
____return
__else:
____var処理

て書くのがバカらしいので

**デフォルトの名無しさん** · 2021/11/24(水) 03:25:37.66

>>812
絶対壊れる未来しか観えない

**デフォルトの名無しさん** · 2021/11/24(水) 03:27:08.47

>>814
assert __AUTHOR__ != >>812

**デフォルトの名無しさん** · 2021/11/24(水) 08:02:23.61

1000行のプログラムって初心者からすると途方もない規模のプログラムに感じるけど、慣れた人からすると当たり前な規模なのかな

**デフォルトの名無しさん** · 2021/11/24(水) 10:22:49.14

一本の文脈でプログラム書こうとすると人間は必ずワーキングメモリの限界がくるから、そんなもんだよ
自分の場合、そうやって場当たり的に書けるのは1000行くらいが限界だな
大きなプログラムを書くには、プログラムというものをトップダウンに考えて、モジュールや関数に適宜分割していくことが必要
そうすることで枝葉の細かい部分を忘れてワーキングメモリを節約できる
特にPythonの場合はJupyter使って勉強する人が多いから、プログラムの分割が身に着きにくいんだよ

**デフォルトの名無しさん** · 2021/11/24(水) 10:39:50.61

>>818
こぴぺとか
そうじゃなくても
同じ処理つらつら描いて行増えたって喜ぶのが初心者

**デフォルトの名無しさん** · 2021/11/24(水) 10:42:31.59

>819
Jupyterは慣れた人が楽するためには良いけど
あれで勉強するのは限界もあるな
Jupyterが悪いとは言ってない
あれがPython世界の全てだと勘違い認識しないようにするのが大事

**デフォルトの名無しさん** · 2021/11/24(水) 11:34:24.45

Jupyterなんか、ここ5年くらいてpythonはいった人の一部がつかってるだけで、python流行り出した2005年頃から利用してるpython使ってる組み合わせは今もあまり使ってないでしょ。

**デフォルトの名無しさん** · 2021/11/24(水) 16:15:21.36

今日中にあるサイトのスクレイピングコードを書かないといけなくなりました
しかしスクレイピングはしたことがありません
どのように書くのがいいのでしょうか？
恐らくpostであろうformっぽい部分にデータを入れて検索すると色々と表示される感じです
djangoだろうと思います
インプット・アウトプットが特にイメージできません

**デフォルトの名無しさん** · 2021/11/24(水) 16:59:36.29

今日中には無理だから期限延ばしてもらうしかないね

**デフォルトの名無しさん** · 2021/11/24(水) 17:33:42.69

まぁresponseがjsonなのかhtmlなのかによるけど
後者ならbeautifulsoup4（他にもあるけど安定してるのはなんだかんだでbs4）
スクレイピングはrequestsとbs4だけでどうにかなることが大半
なんのデータを扱うかによるが時系列やら行列計算するならならpandas,numpyも必須
データベースに出力と言うなら、djangoで何使われているかは知らんが
sqlite3のORMのsqlalchemyで事足りることが大半

レスから察するにインプットは、
forms.pyだかview.pyだかに
クエリかリクエストボディ(get/post)受け取る部分書いて
スクレイピングするコードをclass Command(BaseCommand):形式で書いて
適当に名前つけてpyファイルにして
management>commandsディレクトリに放り込んで終い。
で、view.pyで受け取ったパラメータをそのCommandに投げて
結果をtemplatesに渡して表示する感じじゃなかたっけ

**デフォルトの名無しさん** · 2021/11/24(水) 17:40:18.98

＞management>commandsディレクトリに放り込んで終い。
コマンド使わないなら↑これは必要なかったわ
全部 views.pyに書いても分けても好きにしたらいいと思う

**デフォルトの名無しさん** · 2021/11/24(水) 19:16:52.56

ぼくも3ヶ月くらい前からスクレイピングの勉強始めてようやくほしいデータを物怖じせず取れるようになりましたが、自分はseleniumとlxmlに落ち着きました。

requestsだとうまく取れないページがあったり、scrapyだと非同期処理？で爆速過ぎてサイトから速攻banされたりしました

サイトによってはpyppeteerやseleniumじゃないととりづらいとこもあるのでselenium＋beautifulsoup or lxmlをおすすめしたい

**デフォルトの名無しさん** · 2021/11/24(水) 20:53:24.72

私はrequestsとseleniumと正規表現ですね

**デフォルトの名無しさん** · 2021/11/25(木) 01:42:23.64

Ruby では、Nokogiri, Selenium WebDriver, Capybara

Nokogiriには、wait が無いから、
5ch みたいに、空のHTML を送ってきてから、
Ajax でページ内容を取得するようなサイトでは、要素が取れないかも

要素が出現するまで確実に待つには、Seleniumを使う

**デフォルトの名無しさん** · 2021/11/25(木) 02:33:04.16

NokogiriがインストールできないってQiitaではクッソほど量産された記事ですよね
ガイジ言語には本当にお似合いだと思った

**デフォルトの名無しさん** · 2021/11/25(木) 05:20:37.28

確率がpの宝くじを当たるまで引いて、当たるのにかかった回数を記録。それをn回繰り返し（100万回とか）、最後はそれをpyplotでヒストグラムにしようとしています

回数を記録する配列はndarrayで作り、そこにnp.concatenateで回数を追記していったのですが、どうもこれが処理が重いのか時間がものすごくかかる…
サイズが100万の配列を作る以外に思いつかないのだけど、このやり方は良くないのでしょうか？

**デフォルトの名無しさん** · 2021/11/25(木) 07:58:41.89

ndarrayは固定配列。だから、appendなどサイズを変更する処理は考えなしにしてはいけない。

**デフォルトの名無しさん** · 2021/11/25(木) 09:32:49.11

例えばM回引いてk回当たったとするじゃん？
するとk回の「当たるまで引いた」データが取れるわけだから、律儀に「当たるまで引く」をn回繰り返す必要はない

**デフォルトの名無しさん** · 2021/11/25(木) 09:43:35.46

擬似乱数だろうからシードをどう考えるかだな

**デフォルトの名無しさん** · 2021/11/25(木) 09:44:51.66

concat は無駄が多いので
予め最大の大きさが判ってるならその大きさで確保しておくとか
最大が判らないなら concat せずに list で繋ぐ方が速い

**デフォルトの名無しさん** · 2021/11/25(木) 10:37:40.50

Counterとかで保持したほうがいいんじゃねーの(ハナホジ)

**デフォルトの名無しさん** · 2021/11/25(木) 10:42:23.98

ヒストグラムの範囲毎に予め変数作って当たりが出る度に直接そこに+1してカウントして行けば
100万個の「当たるのにかかった回数」を全て保持する必要が無いと思うが
何か他にデータ残したい理由があるの？

**デフォルトの名無しさん** · 2021/11/25(木) 12:47:25.27

確率の収束をマジで計算しちゃうと何したって遅いよ
0.01%当たるまでを100万回
リストに数字appendするの100万回
それぞれやってみたらいい

後者は1秒とかでしょう
前者は1万回試行のレベルでも1分くらいかかるべ

**デフォルトの名無しさん** · 2021/11/25(木) 13:40:02.87

最近ピストグラム流行ってるな

**デフォルトの名無しさん** · 2021/11/25(木) 15:31:05.54

確率はscipy.stats.berniulli.rvs(p)で求めてたけど、確かにこれを100万回繰り返すのに時間かかってますね…
リストにappendは100万回でも一瞬でした

しかし、これ以外で確率求める関数なさそうだし困ったな…
ありがとうございました