【まず1嫁】くだすれPython(超初心者用) その55

■ このスレッドは過去ログ倉庫に格納されています
2021/10/01(金) 15:46:47.17ID:9qOHXj6D
当スレに★Python以外のプログラミング言語での回答類を書くべからず★
派生言語はそれぞれ専スレがある(この板にあるとは限らない)ので、そっち池。
「Ruby」「Rails」「某言語では」「クソチョンw」をNGワード登録推奨。荒らしは、完全スルー放置が一番きらいです。

このスレッドは「お勉強」スレのほうには書き込めない超低レベル、
もしくは質問者自身何が何だか分からない質問を、勇気を持って書き込むスレッドです。
へび使いが優しくコメントを返しますので、お礼は Python の布教と初心者の救済をお願いします。

★エラーを解決したい場合★は、
  表示されたエラーの全文(勝手に省略やスクショうp等の横着クソ行為禁止)と、
  実行環境(Pythonのバージョン・OSとIDEの種類およびバージョン)をシッカリ書くこと。

Pythonの★ソースコードをそのまま5ちゃんに貼るとインデントが崩れてチヌ★
【【【複数の連続半角スペースはなにもなかったことにされる&タブは普通には入れられない】】】掲示板の仕様なので、
プログラム文は↓等の、いわゆるコードうp用サイトに貼ってこいください。
ttps://techiedelight.com/compiler/  Run Code機能あり。
ttp://ideone.com/      デフォ設定はC用のため、言語選択ボタン押下がピコ手間かも。
ttp://codepad.org/      ほぼ直感的に使える。Run codeボタンあり。
ttp://pastebin.com/     まずまずシンプル。
ttp://dpaste.com/      とてもシンプル。消えるまでの日数は十分長ーく指定のこと。

◇Python公式◇ http://www.python.org/
◇まとめwiki◇ ttp://python.rdy.jp/wiki.cgi

〇前スレ〇 【まず1嫁】くだすれPython(超初心者用) その54
https://mevius.5ch.net/test/read.cgi/tech/1623240344/

次スレたては >>985 あたりが挑戦する。
### END OF TEMPLATE ###
2021/11/19(金) 11:20:04.92ID:eyeX0xyM
たぶんそれ人違いで殺してる
741デフォルトの名無しさん
垢版 |
2021/11/19(金) 19:16:34.09ID:gJnyLrIF
df = df.values.tolist()
print(df)
を実行すると[[a1,b1],[a2,b2],[a3,b3]]のような形でデータを取得できますが、
これをタプルで取得する方法ってありますか?
下記みたいな感じで取得死体です
[(a1,b1),(a2,b2),(a3,b3)]
2021/11/19(金) 19:37:02.12ID:FvmYZMBk
[tuple(x) for x in df.values]
743デフォルトの名無しさん
垢版 |
2021/11/19(金) 21:02:22.10ID:gJnyLrIF
>>742
できました!ありがとうございます。

ちなみにpsycopg2で[(a1,b1),(a2,b2),(a3,b3)]のデータを
テーブルに入れるにはどうしたらいいんだ?

import psycopg2
from psycopg2 import extras
conn = psycopg2.connect('host=localhost port=5432 dbname=db user=db password=db')
c = conn.cursor()
insert_list = [(a1,b1),(a2,b2),(a3,b3)]
extras.execute_values(c, "INSERT INTO table values %s", insert_list)
c.commit()
調べたら上記でいけるかと思いましたがだめでした
2021/11/20(土) 04:07:01.58ID:Pz0iKQrb
プログラミング自体が初めて2週間ほどなので幼稚な質問をお許しください。

目的:読み込まれたリストから複数の条件で項目を除外する

testlist = ['月A','月B','火A','火B','','水A','水B','','月C','月D']
boxlist = list(map(str, testlist))

というところまで書いた時に、例えばこのリストから
「'月'が含まれている物全て」と「""(空行)」を消したいんです。
(特に空行はどうしても発生する物なので除去必須です)

たとえば『list(filter(lambda...』というのが使えるらしい事は調べたものの
文法がよく分からず何度やってもエラーが出てしまいました。
他の方法でもいいのでなにとぞ複数条件の除去が可能なコードなりを教えてもらえると助かります。
745デフォルトの名無しさん
垢版 |
2021/11/20(土) 04:49:44.14ID:w0sFPEUw
簡単なところから徐々にステップアップしていけよ
とりあえず超初心者本買って読め
今の調子じゃ一から十まで全部聞くハメになるぞ

newlist = []
for data in testlist:
__if data:
____if '月' not in data:
________newlist.append(data)

これならわかるだろ
lambdaとかfilterは、まずこれが書ける人が次の段階で覚えろ
2021/11/20(土) 06:00:34.25ID:hT1QMP3Z
初めて2週間でそんな所まで行くって凄いな
上の奴の言う通りだけどあえて書いてみるならば

testlist = ['月A','月B','火A','火B','','水A','水B','','月C','月D']

a = list(filter(lambda x: x and x[0] != '月', testlist))

filterやmapは高階関数と言うよ
第一引数に関数を取る
第二引数にイテラブルな型のオブジェクトを取る

上記の例ではtestlistから順番に一つずつvalueを:の左のxという引数に取り出して自分で書いたlambda関数内で処理して条件に合うvalueをメモリ領域に一時保存しているよ
そんでtestlistの全てのvalueを取り出し終えたらメモリ上に保存しておいたvalueをlist型に変換してaに代入している

testlist[0]の部分はスライス
2021/11/20(土) 07:17:36.90ID:7hjyIAPL
Ruby では色々な書き方ができるが、メソッドチェーンを使うのが、バグらない書き方。
Linux のパイプみたいな感じ。
各フィルターで処理を分けて、実行していく

最後の2つは、処理が複雑

ary_1 = [ "A月A", "", "火B", "", "月C" ]

# 配列から、空文字列を除去する
p ary_2 = ary_1.reject( &:empty? ) #=> ["A月A", "火B", "月C"]

# ary_2 から、月を含む文字列を除去する
p res_1 = ary_2.reject { |str| str.include? "月" } #=> ["火B"]

# 上の2つの処理をメソッドチェーンでつなげる
p res_2 = ary_1.reject( &:empty? ).
reject { |str| str.include? "月" } #=> ["火B"]

# 空文字列か、月を含む文字列を除去する
p res_3 = ary_1.reject { |str| str.empty? || str.include?( "月" ) } #=> ["火B"]

# 上の処理を、lambda にする
lambda_1 = ->( str ){ str.empty? || str.include?( "月" ) }
p res_4 = ary_1.reject{ |str| lambda_1.call( str ) } #=> ["火B"]
2021/11/20(土) 08:38:43.30ID:/G7VwRdk
複数のpythonファイルを順に実行する方法ってないですか?

zikkou.py
1.py
2.py
3.py
ってファイルがあった場合にzikkou.pyを実行すると1.py→2.py→3.pyの順で処理してくれる感じです。

import osかimport subprocessでできますか?
749デフォルトの名無しさん
垢版 |
2021/11/20(土) 08:43:20.89ID:EeA4sZVq
rubyのアタマがバグってるやつはおいといて
今回の件は
news=[dat for dat in olds if '月' in dat]
だけでいいんじゃ〜
forの実直ループ覚えたら内包表記覚えて
そのあと高階関数とpandas行くのだぞ
やりたいことの範囲はopenpyxlぽいけど
2021/11/20(土) 09:12:28.20ID:MzN+MOHO
>>748
subprocessでできると思うけど、結局コマンドプロンプトのコマンドを実行するわけだから
zikkou.pyじゃなくてbatファイルで1.py, 2.py, 3.pyを呼び出した方がいいんじゃないかな?
2021/11/20(土) 09:22:38.89ID:MzN+MOHO
>>748
でけた!
for pyfile in ['1.py', '2.py', '3.py']:
____subprocess.call(f'python {pyfile}')
2021/11/20(土) 13:43:03.64ID:EfL5Dmlb
>>744
最初の考え方としては `boxlist.filter(空行以外).filter(‘月’が含まれてない)` みたいに2回filterしてやるのでもいいよ

↑をpythonで愚直に実装すると
list(filter(lambda x: '月' not in x, filter(lambda x: x != ‘’, boxlist)))

↑pythonの場合は2回filterするとオーバーヘッドが大きくなるだけなので1回にまとめて
list(filter(lambda x: x != ‘’ and ’月’ not in x, boxlist))

↑pythonではmapやfilterの代わりに内包表記を使うのが一般的なので
[ x for x in boxlist if x != ‘’ and ’月’ not in x ]

↑空行以外のfalsy値(0やNone)も除外してよければ
[ x for x in boxlist if x and ’月’ not in x ]

2回filterしても最適化されてオーバーヘッドかからない言語もあるので
アルゴリズム的な考え方と特定言語での実装とを分けて捉えるようにしておくと後々役に立つ
753デフォルトの名無しさん
垢版 |
2021/11/20(土) 15:32:34.01ID:/G7VwRdk
>>750
ありがとう!
ちょっとやってみます
754デフォルトの名無しさん
垢版 |
2021/11/20(土) 15:34:29.98ID:/G7VwRdk
pandasの列のデータ型をnumpy.int64からpythonのintにするにはどうしたらいいんや?
列名["count"]の場合にdf["count"].astype(int)でいけるのかと思ったらできなかった
2021/11/20(土) 17:05:24.67ID:Pz0iKQrb
>>744です。
帰ってきたら想像してた以上に色んなやり方を書いてもらえててなんか感動してます。

実は超初心者向けとされている本は読んでいて、>>745さんが書かれてる通りリストやfor inを使う範囲で出来そうな
単純な内容の1000行とかになる記録簿の整理なら覚えた範囲で可能そう、かつ超便利と思ったのがきっかけなんです。
ただ、’月’とかの単語を指定しての除去だけならそれで出来たんですが、同時に空行の除去をしようとすると
ろくに作動しなくなってしまったために色々調べてfilterに行き着いたという流れでした・・・。

特に、というと序列を付けてるみたいで違うのですが、>>745さんのコードが目からうろこでした。
さっきまでどうして空行が除去出来てるのか理解できずググりまくったんですが、さんざん見てたはずの.appendの特性の応用で
正直色々空行の除去についてググってた時に見た色んなコードよりスマートに思えました。

他の皆さんのコードもかなり学び甲斐があってほんと頭が下がりました。
今からまた一個一個調べて見直しますが、かなり成長出来そうなので楽しみです。

・・・ちなみになんですが、こういう引数の知識は基礎の基礎と思うのですが、
その一通りが日本語でまとめてあるような本やサイトってあるんでしょうか?
2021/11/20(土) 17:42:34.55ID:IJPPTR8A
pythonの勉強を1ヶ月位してるけど、ここ1ヶ月何度も解いてる問題がノーヒントだと解けない
たとえばこういうやつ

>>
文字列 str1 と str2 が引数として与えられたとき、 str2 が str1 を部分文字列として含むかどうか判定する関数 simple_match を作成してください。
具体的には、str2 を含む場合、 その部分文字列が開始される str1 のインデックスを返値として返してください。
str2 を含まない場合、 -1 を返してください。 ただし、simple_match の中で文字列のメソッドやモジュール(正規表現など)を使ってはいけません。
<<
以下コード
https://techiedelight.com/compiler/?~simple_match

局所的な部分は分かるんだけど、全体を把握してきれいな回答が作れない
こういうアルゴリズムはどっからとっかかりを作って組み立てていくの?
2021/11/20(土) 18:00:04.82ID:8IbVqVu9
個人的にそんな問題が解けることになんの価値があるのか理解不能だけど
スライスを使うと簡単に書けるよ
2021/11/20(土) 18:01:23.71ID:8IbVqVu9
スライスを知ってるかどうかはアルゴリズムというより言語の知識の話だよな
アルゴリズムを数知ってるよりググる能力が高い方が
十把一絡げレベルのプログラマならよほど当てになると思う
2021/11/20(土) 18:17:57.11ID:IJPPTR8A
こういう練習問題をすぐ解けないからって定期的にやり直すより
どんどん先へ勉強を進めてしまった方が良いのか?
2021/11/20(土) 18:31:09.23ID:7hjyIAPL
>>756
典型的な2重ループのアルゴリズムの問題

s1 を、1文字ずつ処理していく。
s2 の先頭文字と一致したら、s1のインデックスを保存して、
1文字目の意味で、1も保存する

s1を1文字進めて、s2も1文字進めて、また一致すれば、
2文字目も一致したので、2も保存する

s1を1文字進めて、s2も1文字進めて、また一致すれば、
3文字目も一致したので、3も保存する

この数字が、s2の文字数と一致するまで増加したら、s2がs1に含まれる

スライスを使うと、もっと簡単に書けるのか?
2021/11/20(土) 18:32:51.76ID:7hjyIAPL
アルゴリズム系の問題は、図を描いて、考えた方がよい
2021/11/20(土) 19:11:39.87ID:IJPPTR8A
>>761
その図を書くってのを教えて欲しい
出来ればPCやスマホ上で出来るようなツールない?
763デフォルトの名無しさん
垢版 |
2021/11/20(土) 20:00:29.61ID:w0sFPEUw
俺はこれは問題のための問題
クソ問だと思う
特に-1返すとか、モジュールはともかく、文字列メソッド使用不可とかバカの極み
クイズは無視してやりたいことを追え
2021/11/20(土) 20:01:36.80ID:fQWlPv63
せっかくだからKMP法まで勉強しろ
2021/11/20(土) 20:17:33.74ID:72MXZSnK
>>762
一番メジャーの方法はUML
ググるといっぱいツールが出てくる
有料なのも多いけど
2021/11/20(土) 20:26:19.53ID:Kgb5xsxv
文字列をスライスするのって文字列のメソッド使ってるよね?
2021/11/20(土) 20:54:17.15ID:785tmrzC
> str2 が str1 を部分文字列として含むかどうか
> str2 を含む場合
逆転してね?
2021/11/20(土) 21:36:08.75ID:hT1QMP3Z
>>759
そりゃそうだろ
そもそも大半のプログラマーは競技プログラミングなんか興味ない
2021/11/20(土) 22:02:54.27ID:IJPPTR8A
>>768
いや、これ初心者向けの教材なんだよ
だからこの問いの答えがぱっと出て来なきゃいけないのかと思ったんだ
2021/11/20(土) 22:05:42.97ID:hT1QMP3Z
>>769
普通にググればいいよどうしても自力でやりたいなら組み込み関数のソースコード読んでパクればいいんじゃねやったことないけど
2021/11/20(土) 22:16:28.52ID:eO5P7jHp
>>756
自分でやるときどうする?
例えば location と cat なら

location
cat → 合わない
location
_cat → 合わない
location
__cat → お、合った、2個ずらしたから 2 を返せばいいんだな

って言うようにずらしながら比較していくよね
って言うところからやればいいんじゃね
2021/11/20(土) 23:00:40.68ID:W0+y3mk4
>>766
それが文字列のメソッドに該当するならインデックスアクセスもできねえだろw
解なしになっちまうよ
2021/11/20(土) 23:03:09.18ID:W0+y3mk4
まあ、スライスがいい回答だとは思わないけど
小学校の教材ならたぶん0点つけてくる教師がいる回答
2021/11/21(日) 00:27:58.17ID:QD7EEWWT
構文などの書き方が分からないってなら仕方無いと思うけど
この程度のアルゴリズムを思い付けないってならヤバいだろ
池沼疑われるレベル
2021/11/21(日) 00:38:15.47ID:dCta8OJm
アルゴリズムとか使わないから
知能検査は別スレだろ
2021/11/21(日) 01:16:28.56ID:L8vXU9lo
KMP法とかsuffix arrayの話?
2021/11/21(日) 08:44:34.82ID:1b0LVSEh
>>772
そんなこと言っても文字列のメソッド使ってるじゃん
使っちゃダメだから
2021/11/21(日) 09:58:00.66ID:4YV1JWdz
アスペって生き辛そう…
2021/11/21(日) 11:02:45.04ID:6VEnDrqa
def simple_match(str1, str2):
____for idx, _ in enumerate(str1):
________if str1[idx:idx+len(str2)] == str2:
____________return idx
____return -1
2021/11/21(日) 11:15:39.23ID:6VEnDrqa
さらに速く高機能にした

def simple_match(str1, str2):
____len_str1 = len(str1)
____len_str2 = len(str2)
____if ret := [idx for idx in range(len_str1) if str1[idx:idx+len_str2]==str2]:
________return ret
____else:
________return -1

simple_match('location', 'cat')
[2]
simple_match('soccer', 'cat')
-1
simple_match('locationcat', 'cat')
[2, 8]
2021/11/21(日) 12:37:43.77ID:jllQNQOR
__getitem__も__iter__も文字列のメソッドなのでその回答だと0点ですね
2021/11/21(日) 12:40:01.89ID:jllQNQOR
__len__も使ってたか
783デフォルトの名無しさん
垢版 |
2021/11/21(日) 15:17:06.09ID:BLVHorEN
列"B1FD24"は存在しませんになって行のデータが取得できません。
解決策おしえてください。

import psycopg2

conn = psycopg2.connect('host=localhost port=5432 dbname=goya user=goya password=goya1395CCC')
c = conn.cursor()

#練習用のテーブル作成
c.execute('''
CREATE TABLE IF NOT EXISTS info_test(
"A_code" text unique,
"weight(g)" integer,
"item_name" text
)
''')
data = [("B1FD24",int(566),"ハンマー"),("B6DE49",None,"空気"),("B4XB21",int(823),"米")]
for d in data:
c.execute(f'INSERT INTO info_test ("A_code","weight(g)","item_name") VALUES(%s,%s,%s) on conflict ("A_code") do nothing',d)
conn.commit()

#練習
c.execute(f'SELECT "A_code" FROM info_test')
a_code_list = [row[0] for row in c.fetchall()]
for a_code in a_code_list:
c.execute(f'SELECT * FROM info_test WHERE "A_code"="{a_code}"')
d = [row for row in c.fetchall()]
print(d)
784デフォルトの名無しさん
垢版 |
2021/11/21(日) 15:24:19.44ID:BLVHorEN
行データを一行ずつ取得したいのですが、できませんでした。
書き込み時にインデントが消えてしまいましたので再度投下します。
import psycopg2

conn = psycopg2.connect('host=localhost port=5432 dbname=goya user=goya password=ksfdkjwoe')
c = conn.cursor()

#練習用のテーブル作成
c.execute('''
CREATE TABLE IF NOT EXISTS info_test(
____"A_code" text unique,
____"weight(g)" integer,
____"item_name" text
)
''')
data = [("B1FD24",int(566),"ハンマー"),("B6DE49",None,"空気"),("B4XB21",int(823),"米")]
for d in data:
____c.execute(f'INSERT INTO info_test ("A_code","weight(g)","item_name") VALUES(%s,%s,%s) on conflict ("A_code") do nothing',d)
conn.commit()

#練習
c.execute(f'SELECT "A_code" FROM info_test')
a_code_list = [row[0] for row in c.fetchall()]
for a_code in a_code_list:
____c.execute(f'SELECT * FROM info_test WHERE "A_code"="{a_code}"')
____d = [row for row in c.fetchall()]
____print(d)

c.execute(f'SELECT * FROM info_test WHERE "A_code"="{a_code}"')
の部分をc.execute(f'SELECT * FROM info_test WHERE "weight(g)"=566')にすると行データを取れるのでどうしていいかわかりません
2021/11/21(日) 15:36:48.25ID:uiA0IfT6
a_codeを%sにすりゃいいだけちゃう
fと%sの使いどころの問題では
786デフォルトの名無しさん
垢版 |
2021/11/21(日) 15:43:34.67ID:BLVHorEN
>>785
今%sにしてみましたが、
not all arguments converted during string formatting
がでてきてしまいました
2021/11/21(日) 16:48:00.01ID:BwaLJwgU
>>754
df["count"].astype(long)
2021/11/21(日) 17:07:50.01ID:BwaLJwgU
"weight(g)"=None
になってる行があるから
insert に失敗してるんだろ
789デフォルトの名無しさん
垢版 |
2021/11/21(日) 17:18:17.35ID:BLVHorEN
>>788
#練習の上の行に下記を入れると表示されるのでinsertは成功してると思います
import pandas as pd
df = pd.read_sql(sql=f'SELECT * FROM info_test;', con=conn)
print(df)

A_code weight(g) item_name
0 B1FD24 566.0 ハンマー
1 B6DE49 NaN 空気
2 B4XB21 823.0 米
790デフォルトの名無しさん
垢版 |
2021/11/21(日) 17:53:07.18ID:pk+QZJjo
f'SELECT * FROM info_test WHERE "A_code"=\'{a_code}\''
f"SELECT * FROM info_test WHERE \"A_code\"='{a_code}'"
SQL文字列リテラルはSQL標準ではシングルクォート。
2021/11/21(日) 18:18:28.27ID:szj4saah
Warning
Never, never, NEVER use Python string concatenation (+) or string parameters interpolation (%) to pass variables to a SQL query string. Not even at gunpoint.

f-stringも同じこと
792デフォルトの名無しさん
垢版 |
2021/11/21(日) 18:22:31.92ID:BLVHorEN
>>790
できた!できました!!!
ありがとうございます!!!!!!
2021/11/21(日) 19:25:01.44ID:MSJBJTi1
>>791 をスルーするのが今日の流れっぽい
2021/11/21(日) 19:40:20.97ID:coVM5S7R
実験や習作だと思うけどprepared statement使うのが筋だし
f-stringで教えるアホは業界去った方がいい
795デフォルトの名無しさん
垢版 |
2021/11/21(日) 20:19:01.83ID:BLVHorEN
すまん、791はwarningって書いてあったからよくみてなかった。
初心者すぎてよくわからんのですが、f-stringとprepared statementってどっちがどっちですか?
@f"{a}"のやつ
A(%),aのやつ
結果が同じでも処理に違いがある感じですか?
796デフォルトの名無しさん
垢版 |
2021/11/21(日) 20:23:30.97ID:BLVHorEN
791google翻訳してみましたが、よくわからん。

警告
変数をSQLクエリ文字列に渡すために、
Python文字列連結(+)または文字列パラメーター補間(%)を使用しないでください。
銃を突きつけても。

(%),aではなくf"{a}"がいいですよってこと?
2021/11/21(日) 20:45:52.97ID:szj4saah
>>791はpsycopg2の公式ドキュメントから引用
https://www.psycopg.org/docs/usage.html#sql-injection
798デフォルトの名無しさん
垢版 |
2021/11/21(日) 20:48:25.93ID:BLVHorEN
>>797
ありがとう。
ブクマして少しずつ読んで見る
2021/11/21(日) 21:16:22.28ID:zYUtuXs9
基本、Ruby on Rails などのウェブ開発では、

SQL 文を、文字列で組み立ててはいけない!
ユーザーが危険な文字列を送ってきて、SQL injection しようとするから

必ず、危険な文字列をエラーにするように、
place holder という書き方をしないといけない!

フレームワークを使った、ウェブ開発の基本
2021/11/21(日) 21:21:08.30ID:coVM5S7R
>>795
@もAもprepared statementではないけどもAが正解
Aでpsycopg2が行っているような処理をRDBMS(PostgreSQL)側で行うのがprepared statements

https://www.psycopg.org/psycopg3/docs/advanced/prepare.html#prepared-statements
psycopg3になれば勝手にやってくれるみたい
801799
垢版 |
2021/11/21(日) 21:44:07.52ID:zYUtuXs9
例えば、Ruby では、

変数a を使って、上の2つのように文字列を連結させたり、
式展開してから埋め込んだりしても、

変数aの内容をユーザーからもらった、危険な文字列の場合、SQL injection される

例えば、WHERE (id = 1 OR 1 = 1)なら、
true となるので、すべてのレコードが取得される!

それを最後のように、place holder, ? を使えば、
危険な文字列をエラーにできる

こういうやり方が、Ruby on Rails などのフレームワークを使った、ウェブ開発の基本

id = '1 OR 1 = 1'

User.where( "id = " + id )
User.where( "id = #{id}" )

User.where( "id = ?", id )
802デフォルトの名無しさん
垢版 |
2021/11/21(日) 21:46:31.38ID:BLVHorEN
調べてきたけど、プレースホルダーを使わないと攻撃されたとき危険ってのがわかったわ。

ちなみに↓をf''使わずに(%)をつかって書くとどうなるんや?
f'SELECT * FROM info_test WHERE "A_code"=\'{a_code}\''
803799
垢版 |
2021/11/21(日) 21:47:15.98ID:zYUtuXs9
>>801
修正

変数a ではなく、変数id
2021/11/21(日) 21:48:35.16ID:6VEnDrqa
で、結局どう書くのがベストなの? こう?
c.execute("SELECT * FROM info_test WHERE A_code=%s", (a_code,))

テーブル作成とかの"A_code"って、ダブルクォーテーションいらないんじゃない?
ttps://www.curict.com/item/20/20f70b7.html
とか見るとダブルクォーテーションで囲ってないよね
2021/11/21(日) 21:51:23.16ID:BLVHorEN
大文字の時は括らなきゃいけないのかと思ってたわ
806デフォルトの名無しさん
垢版 |
2021/11/21(日) 22:20:00.67ID:EfkKXMOb
> お前は毎朝起きるたびに俺に負けたことを思い出すよ^^

あー、ホンッとに思い出すなあ(笑)
キチガイの嘘つきの低レベルFランの、
朝鮮ゴキブリBot君は、
チョン独特の「なにもできないけど俺のほうがジャップより偉い!」的な
ことはよーくわかったよ。
ホントなにもできない朝鮮ゴキブリBot君!

クソチョンw
クソチョンはウンコを食べる糞食人種w
ゲリ便をじゅるじゅると
うまそうに食ってるw
2021/11/21(日) 22:30:00.92ID:nzk7IXVa
>>804
記号とかを含まなきゃ " " で囲む必要ない
info_test, item_name, A_code とかは囲まなくても良いけど weight(g) は多分だめ
2021/11/21(日) 23:10:08.06ID:i/lteX3h
>>807
そうそう、だからカラム名に()とか入れないほうがいいのよね。めんどくさいから
必要な場合自分は逆引用符`使ってるけど
2021/11/22(月) 16:55:05.56ID:axkd8Lua
>>455
810デフォルトの名無しさん
垢版 |
2021/11/23(火) 12:20:48.24ID:HWlCU4L+
3.10に変えたらscikit-learnがインストール出来なくなった
まあそう頻繁に使うライブラリでもないけど
2021/11/23(火) 19:50:40.69
assertの使いどころがぐぐってみましたがいまいちピンと来ません
2021/11/23(火) 20:09:45.21ID:HurF++pM
>>811
a<0になるようにプログラム組んだけどもしa<0になったまま次にいくと
機械がつぶれる
不安だというとき
assert文で例外エラーだしてストップさせるとか
2021/11/23(火) 20:42:03.75ID:mB/cMOfZ
あくまで開発中の考慮漏れなんかを防ぐ用途なので
ランタイムエラーにしたいならassertの出番ではない
2021/11/23(火) 22:55:20.18ID:bS29UIDJ
>>812
要するに
> a<0になるようにプログラム組んだけどもしa<0になったまま次にいくと機械がつぶれる
みたいな意味不明な状況を検出するためだよね
815デフォルトの名無しさん
垢版 |
2021/11/23(火) 22:55:45.59ID:xEN2JBOU
var : Optional[str] =None

on_btn():
__assert var
__var処理

みたいな。pylanceとかに怒られない
varにモノ入ってっからbtnが押されるに決まってんだろうがっていうとき

on_btn():
__if not var:
____return
__else:
____var処理

て書くのがバカらしいので
816デフォルトの名無しさん
垢版 |
2021/11/24(水) 03:25:37.66ID:Q5JPayEq
>>812
絶対壊れる未来しか観えない
2021/11/24(水) 03:27:08.47ID:Q5JPayEq
>>814
assert __AUTHOR__ != >>812
2021/11/24(水) 08:02:23.61ID:jO3RIx+f
1000行のプログラムって初心者からすると途方もない規模のプログラムに感じるけど、慣れた人からすると当たり前な規模なのかな
2021/11/24(水) 10:22:49.14ID:9k7x+oD0
一本の文脈でプログラム書こうとすると人間は必ずワーキングメモリの限界がくるから、そんなもんだよ
自分の場合、そうやって場当たり的に書けるのは1000行くらいが限界だな
大きなプログラムを書くには、プログラムというものをトップダウンに考えて、モジュールや関数に適宜分割していくことが必要
そうすることで枝葉の細かい部分を忘れてワーキングメモリを節約できる
特にPythonの場合はJupyter使って勉強する人が多いから、プログラムの分割が身に着きにくいんだよ
2021/11/24(水) 10:39:50.61ID:kXzWnsgO
>>818
こぴぺとか
そうじゃなくても
同じ処理つらつら描いて行増えたって喜ぶのが初心者
2021/11/24(水) 10:42:31.59ID:kXzWnsgO
>819
Jupyterは慣れた人が楽するためには良いけど
あれで勉強するのは限界もあるな
Jupyterが悪いとは言ってない
あれがPython世界の全てだと勘違い認識しないようにするのが大事
2021/11/24(水) 11:34:24.45ID:q9kQZP30
Jupyterなんか、ここ5年くらいてpythonはいった人の一部がつかってるだけで、python流行り出した2005年頃から利用してるpython使ってる組み合わせは今もあまり使ってないでしょ。
2021/11/24(水) 16:15:21.36ID:uoHN98GH
今日中にあるサイトのスクレイピングコードを書かないといけなくなりました
しかしスクレイピングはしたことがありません
どのように書くのがいいのでしょうか?
恐らくpostであろうformっぽい部分にデータを入れて検索すると色々と表示される感じです
djangoだろうと思います
インプット・アウトプットが特にイメージできません
2021/11/24(水) 16:59:36.29ID:SENfXVh3
今日中には無理だから期限延ばしてもらうしかないね
2021/11/24(水) 17:33:42.69
まぁresponseがjsonなのかhtmlなのかによるけど
後者ならbeautifulsoup4(他にもあるけど安定してるのはなんだかんだでbs4)
スクレイピングはrequestsとbs4だけでどうにかなることが大半
なんのデータを扱うかによるが時系列やら行列計算するならならpandas,numpyも必須
データベースに出力と言うなら、djangoで何使われているかは知らんが
sqlite3のORMのsqlalchemyで事足りることが大半

レスから察するにインプットは、
forms.pyだかview.pyだかに
クエリかリクエストボディ(get/post)受け取る部分書いて
スクレイピングするコードをclass Command(BaseCommand):形式で書いて
適当に名前つけてpyファイルにして
management>commandsディレクトリに放り込んで終い。
で、view.pyで受け取ったパラメータをそのCommandに投げて
結果をtemplatesに渡して表示する感じじゃなかたっけ
2021/11/24(水) 17:40:18.98
>management>commandsディレクトリに放り込んで終い。
コマンド使わないなら↑これは必要なかったわ
全部 views.pyに書いても分けても好きにしたらいいと思う
2021/11/24(水) 19:16:52.56ID:xsp2scS+
ぼくも3ヶ月くらい前からスクレイピングの勉強始めてようやくほしいデータを物怖じせず取れるようになりましたが、自分はseleniumとlxmlに落ち着きました。

requestsだとうまく取れないページがあったり、scrapyだと非同期処理?で爆速過ぎてサイトから速攻banされたりしました

サイトによってはpyppeteerやseleniumじゃないととりづらいとこもあるのでselenium+beautifulsoup or lxmlをおすすめしたい
2021/11/24(水) 20:53:24.72ID:ldCMVu13
私はrequestsとseleniumと正規表現ですね
2021/11/25(木) 01:42:23.64ID:nh0ZEMSE
Ruby では、Nokogiri, Selenium WebDriver, Capybara

Nokogiriには、wait が無いから、
5ch みたいに、空のHTML を送ってきてから、
Ajax でページ内容を取得するようなサイトでは、要素が取れないかも

要素が出現するまで確実に待つには、Seleniumを使う
2021/11/25(木) 02:33:04.16ID:Xt1TOEJK
NokogiriがインストールできないってQiitaではクッソほど量産された記事ですよね
ガイジ言語には本当にお似合いだと思った
2021/11/25(木) 05:20:37.28ID:xhC4D+V9
確率がpの宝くじを当たるまで引いて、当たるのにかかった回数を記録。それをn回繰り返し(100万回とか)、最後はそれをpyplotでヒストグラムにしようとしています

回数を記録する配列はndarrayで作り、そこにnp.concatenateで回数を追記していったのですが、どうもこれが処理が重いのか時間がものすごくかかる…
サイズが100万の配列を作る以外に思いつかないのだけど、このやり方は良くないのでしょうか?
832デフォルトの名無しさん
垢版 |
2021/11/25(木) 07:58:41.89ID:ysfwc6h6
ndarrayは固定配列。だから、appendなどサイズを変更する処理は考えなしにしてはいけない。
833デフォルトの名無しさん
垢版 |
2021/11/25(木) 09:32:49.11ID:1DZpA8jw
例えばM回引いてk回当たったとするじゃん?
するとk回の「当たるまで引いた」データが取れるわけだから、律儀に「当たるまで引く」をn回繰り返す必要はない
2021/11/25(木) 09:43:35.46ID:hXWvHSdH
擬似乱数だろうからシードをどう考えるかだな
2021/11/25(木) 09:44:51.66ID:r5Heuy4P
concat は無駄が多いので
予め最大の大きさが判ってるならその大きさで確保しておくとか
最大が判らないなら concat せずに list で繋ぐ方が速い
2021/11/25(木) 10:37:40.50ID:D93Sr9qt
Counterとかで保持したほうがいいんじゃねーの(ハナホジ)
2021/11/25(木) 10:42:23.98ID:jB6AdxeI
ヒストグラムの範囲毎に予め変数作って当たりが出る度に直接そこに+1してカウントして行けば
100万個の「当たるのにかかった回数」を全て保持する必要が無いと思うが
何か他にデータ残したい理由があるの?
838デフォルトの名無しさん
垢版 |
2021/11/25(木) 12:47:25.27ID:+wzV+gbn
確率の収束をマジで計算しちゃうと何したって遅いよ
0.01%当たるまで を100万回
リストに数字appendするの100万回
それぞれやってみたらいい

後者は1秒とかでしょう
前者は1万回試行のレベルでも1分くらいかかるべ
2021/11/25(木) 13:40:02.87ID:bDvmxdn9
最近ピストグラム流行ってるな
2021/11/25(木) 15:31:05.54ID:fS0drys5
確率はscipy.stats.berniulli.rvs(p)で求めてたけど、確かにこれを100万回繰り返すのに時間かかってますね…
リストにappendは100万回でも一瞬でした

しかし、これ以外で確率求める関数なさそうだし困ったな…
ありがとうございました
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況