くだすれPython(超初心者用) その39

■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん
垢版 |
2018/08/24(金) 07:50:35.97ID:VD4/++xS
このスレッドは、他のスレッドでは書き込めない超低レベル、
もしくは質問者自身何が何だか分からない質問を勇気を持って書き込むスレッドです。
へび使いが優しくコメントを返しますが、お礼は Python の布教と初心者の救済をお願いします。

エラーを解決したいときはエラー表示や環境(バージョン/IDE or command line)を略さずに書き込んで下さい。
騙りが頻発しています。質問する方は一時的なトリップをつけることを検討して下さい。
次スレは >>985 辺りで

前スレ
くだすれPython(超初心者用) その38
https://mevius.5ch.net/test/read.cgi/tech/1526522954/
609デフォルトの名無しさん
垢版 |
2018/10/27(土) 20:38:05.02ID:p3Z91K38
Linux系じゃね?
ブートストラップ周りに2系がガッツリ食い込んでるって聞いたことある。
そのせいで2系がデフォルトで入ってるとか。
2018/10/27(土) 20:52:22.52ID:QoVX+/e8
>>608
基本Windows使ってるけど
2系のころ勉強して
そのまんま・・・

あとたしかに>>609
611デフォルトの名無しさん
垢版 |
2018/10/27(土) 21:09:16.81ID:d3ZViLoJ
humi = 25
print("humi" , humi, "%")
print(humi)

出力:
('humi', 25, '%')
25
612デフォルトの名無しさん
垢版 |
2018/10/27(土) 21:26:03.77ID:M4OQ4nwj
>>611
まさにこれ。
python2はないと思う。ずっとこれでやってきてるので。
部分的に2とかありえるのかな?
613デフォルトの名無しさん
垢版 |
2018/10/27(土) 21:28:08.36ID:d3ZViLoJ
>>611はpython2で動かした結果
614デフォルトの名無しさん
垢版 |
2018/10/27(土) 21:39:51.74ID:M4OQ4nwj
>>613
まじですか・・
当方ラズパイをつかってまして lxterminalで sudo python ファイル名 なら実行できるけど
python3 IDLEつかうとモジュールエラー出るから避けてたんだけど もしかしてpython3じゃないってことですかね?
2018/10/27(土) 21:41:02.12ID:GbJLfo15
ちゃんと調べたら2系で動いてましたテヘペロ
に1票
これまでずっとそうしてきたからとか本当に信用ならん
2018/10/27(土) 21:42:08.13ID:QoVX+/e8
sudo python -Vと打ってかくにんしる
617デフォルトの名無しさん
垢版 |
2018/10/27(土) 21:53:58.98ID:WN5vicFY
RHEL系もDebian系もシステム周りはここしばらくはpython -> python2で、3はpython3で呼ぶようになってる
618デフォルトの名無しさん
垢版 |
2018/10/27(土) 21:57:57.20ID:M4OQ4nwj
>>615
確認しました。ほんとにそれでしたすいません。
pip3でインストールしなきゃいけなかったそうです
どうもありがとうございました
2018/10/27(土) 23:54:55.35ID:GbJLfo15
どんまい
2018/10/28(日) 07:05:43.19ID:7IwsJv31
自分ではどうしようもなくて他人に泣きついたのにどうしてその相手の言うことを聞かずにグダグダやってたんだ?
2018/10/28(日) 07:43:54.72ID:lVhl2H66
Pythonで作成したモジュールをUWSCで呼び出すことはできますか?
UWSCではDLLを読み込んで関数が使えるのですが
そういう行為をプログラミング用語でなんというのでしょうか
検索ワードがよくないのか手がかりすら掴めてないです
よろしくお願いします
2018/10/28(日) 07:57:38.17ID:JDWqlC9k
>>621
uwscなんて初めて知ったけど、exec()というコマンドがあるそうだから、単純に
exec("pythonのパス" + "pythonスクリプトのパス")でいいんじゃないの?
2018/10/28(日) 11:48:06.52ID:lVhl2H66
>>622
execはexeを起動するだけなんです
似たようなものにdoscmdというのがあるんですがこれでも駄目でした
UWSC掲示板があって過去ログもみたんですがPythonに関する質問すらなかったです
http://www3.rocketbbs.com/13/bbs.cgi?id=umiumi
すみませんわざわざ調べて頂いて
2018/10/28(日) 12:12:29.72ID:YiTUMI+K
>>623
それで十分だろ。
思い込みは捨てて
exec("<python.exeのフルパス> <スクリプトのフルパス>")
を実行してみなよ。
discmdのほうも単にパスが通ってないだけだと思うよ。
フルパスで入力してる?
2018/10/28(日) 12:54:25.06ID:lVhl2H66
>>624
すみません、解決しました
実行時の引数が不足してました
ありがとうございました
2018/10/28(日) 13:08:03.94ID:auhqQrbO
Fswebcamで撮影した写真をメールで自動送信を考えています。
探知して送るのはあるんですけど、撮影した写真をまとめて送るようなプログラムってつくりにくいですか?
シェルだと楽っぽいけど 慣れてないので分からない。。
2018/10/28(日) 13:30:49.38ID:auhqQrbO
もしくは撮影されたフォルダ内から日時の新しいものとか新しいうちの四つを添付するとかできないかなと?
普通に添付するならファイルが指定になるから難しそうですかね。。
2018/10/28(日) 22:42:22.92ID:KcfCsfCB
書いてみれば良いじゃない
2018/10/28(日) 23:28:27.44ID:fiBcuTbE
numpyで配列の要素が範囲となるような配列をつくることはできますか?
例えばAというはいれつがあって、
A[0] = np.arange(0,1,0.01)
みたいなものです
630デフォルトの名無しさん
垢版 |
2018/10/29(月) 00:31:07.47ID:tXMYusEl
意図があってるか分からないが
A = np.stack([np.arange(0,1,0.01)]*10)
A += np.arange(10).reshape((10,1))
2018/10/29(月) 09:07:55.84ID:FSHl5k4M
>>620
いるよなこういう何の生産性もないレスする奴(烏賊ブ)
2018/10/29(月) 09:36:36.83ID:sBuO7UaY
そうだな
2018/10/29(月) 10:18:07.79ID:ThrPEx61
>>630
ありがとうございます
なんとかできました
2018/10/29(月) 11:12:02.14ID:wR2M4wFA
requestsでファイルをダウンロードする時タイムスタンプは変更しないでダウンロードする方法教えて下さい!!
635デフォルトの名無しさん
垢版 |
2018/10/29(月) 11:28:06.05ID:VxCr7qKV
os.utime
2018/10/29(月) 11:56:15.99ID:wR2M4wFA
requestsで何らかの方法を使ってファイルの作成日などを取得してダウンロード後にos.utimeでその日付に書き換えるんでしょうか?
2018/10/29(月) 11:57:16.03ID:wR2M4wFA
wget -N url
みたいな事が出来るとよいんですが。
2018/10/29(月) 12:28:53.22ID:20y3T6Cw
httpレスポンスヘッダのlastmodified
639デフォルトの名無しさん
垢版 |
2018/10/29(月) 12:51:46.14ID:VtmwN/uo
wget -N url も utime やろ
640493
垢版 |
2018/10/29(月) 17:45:54.93ID:k7vAtK/H
ちょっと前にwebkitgtk epubミューアの件で質問した者ですが、コードを見ていて疑問に思っていたことがあるので
質問させてください。
main_window.py

self.viewer = viewer.Viewer(self)
print("Displaying blank page.")
self.viewer.load_uri("about:blank") # Display a blank page
self.viewer.connect("load-finished", self.__ajust_scroll_position)
self.viewer.connect("load-finished", self.__save_new_position)
self.right_box.pack_end(self.right_scrollable_window, True, True, 0)
# Create Chapters List component and pack it on the left
self.chapters_list_component = chapters_list.ChaptersListComponent(self)

(途中省略)

def __save_new_position(self, wiget, data):
"""
Saves new position in case new load came from link based navigation
:param wiget:
:param data:
"""
if not data.get_uri() == "about:blank":
self.content_provider.set_data_from_uri(data.get_uri())

load-finishedの時に呼ばれているコールバック関数なんですが、wigetとdataって何なんですか?
なんでdata.get_uri()と書けるんでしょうか?
それと、このコールバック関数配置ページ読み込むごとに呼ばれているという認識で正しいのでしょうか?

あと、 content_provider.py
if urllib.parse.unquote((os.path.split(uri)[-1]).split("#")[0]) == os.path.split(self.chapter_links[i])[-1]:
ってどうして必要なんでしょうか?(これがないと機能しないようですが)
2018/10/29(月) 17:46:38.70ID:k7vAtK/H
関数配置ページ
関数は一ページの変換ミスです。ごめんなさい。
2018/10/29(月) 17:50:01.97ID:dTGmjkHB
https://imgur.com/a/iT18u6W

titleの文字列取得の時はstring付ければよかったけど、最後の奴はstring付けるとエラーになります
こういうときはどうやって文字列だけ抽出するんですか?
2018/10/29(月) 18:12:16.70ID:ItEstrK2
>>642
写真だと見づらいね
find_allの時はリストで取得してるから
for c in content: で回して取り出してみて
644デフォルトの名無しさん
垢版 |
2018/10/29(月) 18:35:48.17ID:RJcKPmzk
c.attrs['content']
2018/10/29(月) 18:38:50.81ID:5LhWTx/7
pandasのtocsv使うときデータ内に¥nが入っててcsv出力時点で改行され、excelからcsvをデータインポートカンマ区切りで読み込みたい時に改行されて悲しいことになるんですがどうするのがスマートですか
¥n入るのは正しく、16桁以上の数字のカラムがあるのでデータインポートで読み込みたいです
2018/10/29(月) 18:49:52.26ID:dTGmjkHB
本当だ
よく見るとこの場合は実行するとリストとして取得されてるんですね
そりゃstringじゃ無理な訳ですね
わかりやすい
2018/10/29(月) 19:06:12.03ID:wR2M4wFA
>>638
>>639
もうちょっと教えてくださいお願いします!
2018/10/29(月) 19:11:52.05ID:PoEM5suC
ん? 今、何でもするって言ったよね。
649デフォルトの名無しさん
垢版 |
2018/10/29(月) 19:21:40.44ID:TEtmhpeX
>>645
to_csvのオプションで個々の値にクォーテーションを付ける
import csv
df.to_csv(“hoge.csv”, quoting=csv.QUOTE_ALL)
2018/10/29(月) 21:46:01.91ID:b4sCrQ/m
>>640
そんな零細プログラムの詳細をここで質問しても誰も答えないと思うぞ…

気が向いたから答えるけど次はないからな。

__save_new_position()メソッドを呼びだしているのはwebviewクラス。
下記ページによると、第二引数はwebview自身、第三引数はwebframeクラスのインスタンスを渡して呼び出されることが分かる。
webframeのリファレンスページを見ればwebframeクラスがget_uri()メソッドを持っていることも分かる。
https://lazka.github.io/pgi-docs/WebKit-3.0/classes/WebView.html#WebKit.WebView.signals.load_finished

content_providerのほうは、指定されたxmlファイルが、chapter_links配列の何番目のファイル名と一致しているかを調べることで、チャプター番号を特定している。
uriがエスケープされていたり"#"フラグメントがついてると比較できないから取り除いている。
2018/10/29(月) 21:54:17.26ID:g2+WGN4L
>>647
一般的にHTTPレスポンスヘッダのLast-Modifiedにファイルのmtimeが入ってるからそれを取得して、ファイル書き出してからmtime更新すれば良い

curl使えるなら-vで一度レスポンスヘッダ見るといい
2018/10/29(月) 21:58:45.40ID:Uyob8jIm
凄いねよく答えられるな、流石

gtkは全く知らないけど
wigetはwidgetのスペルミスだろうね、きっと
2018/10/30(火) 06:58:19.30ID:wwkQj2Ri
>>651
これであってますか?

resp = requests.get(url)

# レスポンスヘッダの Last-Modified を取得
last_modified = resp.headers['Last-Modified']
print(ast_modified)
Thu, 13 Oct 2016 05:36:56 GMT

# datetime オブジェクトに変換 (表記のロケール依存を防ぐために dateutil.parser を使う)
last_modified = dateutil.parser.parse(last_modified)
print(ast_modified)
2016-10-13 05:36:56+00:00

# unix time に変えるために calendar を使う
unixtime = calendar.timegm(lastModified.utctimetuple())
print(unixtime)
1476337016

# ファイルの書き込み
img_file = open(file_path, 'wb')
img_file.write(resp.content)
img_file.close()
os.utime(file_path, (unixtime, unixtime)) # ファイルパス, (アクセス時間, 修正時間)


ファイルの作成日の取得と書き込みはどうやるんでしょうか?
2018/10/30(火) 06:59:46.91ID:wwkQj2Ri
>>653
print(ast_modified)はprint(last_modified)の間違いです
655640
垢版 |
2018/10/30(火) 08:47:23.62ID:/tw9qCHj
>>650
レスありがとうございます。助かりました。
2018/10/30(火) 09:35:33.18ID:/tw9qCHj
次はないと言割れましたがちょっと不思議なことがあったので質問させていただきます。
sorted関数を使うと、
パブリックドメインのepubで有名なgutenbergのファイル名をソートしていたのですが、
(@public@vhost@g@gutenberg@html@files@31278@31278-h@31278-h-0.htm.htm、@public@vhost@g@gutenberg@html@files@31278@31278-h@31278-h-10.htm.htmllなどというファイル名です)
0. 1.10, 11,12, .2などとソートされるようですが、普通に0,1,2,3,4の順番にできないのでしょうか。
というよりなぜグーテンベルクのファイルだけ、おかしなソートになるのかわかりません。
2018/10/30(火) 09:48:16.33ID:JqsKq037
数値型は数の大小で比較されるが、
文字列型の数値は文字列として比較されるから数の大小順には並ばない
数値として比較したければ、sort(またはsorted)のkey引数に適切なキー抽出関数を与える必要がある

その本だけがと言っているが、条件を満たしていればどんなリストでもお前の言う「おかしなソート」になる
print(sorted('11', '2', '.1'))
658656
垢版 |
2018/10/30(火) 10:00:46.78ID:/tw9qCHj
>>657
ググったらでてきました。文字列型だと10が2より先に来るようですね。
どうもありがとうございました。
2018/10/30(火) 12:37:59.64ID:BBRqRtLN
>>653
そんな感じ
ファイルの作成日時は取得する手段がないので諦めて
(独自ヘッダで応答してくれるサーバーを除く)
2018/10/30(火) 12:44:20.01ID:QArnhM9r
>>649
試してみたけど無理でした
ダブルクリックで開くと問題ないけどtxtのインポートだと開いた時点で改行されるからどうしようも無いのかなこれ
661デフォルトの名無しさん
垢版 |
2018/10/30(火) 14:52:54.90ID:mxVOiKCI
bashからpythonプログラムを実行するときに、pycharmで簡単にデバッグしたいんですが、どうすればいいですか?
pythonコードだけの場合のやり方は分かるんですけど
print()いっぱい書くしか無いんですかね
662デフォルトの名無しさん
垢版 |
2018/10/30(火) 14:55:07.36ID:mxVOiKCI
>>658
float型に変換しないとちゃんとソートできないよ
663デフォルトの名無しさん
垢版 |
2018/10/30(火) 15:01:43.41ID:mxVOiKCI
>>661
解決しました
https://stackoverflow.com/questions/27952331/debugging-with-pycharm-terminal-arguments
2018/10/30(火) 15:02:59.00ID:o9t78hsF
>>661
pycharm使ってparametersに引数入れてやればいい。
665653
垢版 |
2018/10/30(火) 15:46:23.76ID:74FRV+Zp
>>659
どうもありがとうございます
基本的に作成日の取得は出来ないんですね
666653
垢版 |
2018/10/30(火) 16:13:18.69ID:74FRV+Zp
try:
f = open(local_path, 'rb')
dbx.files_upload(f.read(), upload_path)
f.close()
except dropbox.exceptions.ApiError:
print(dropbox.exceptions.ApiError.error)

Dropboxにアップロードする時、エラーが出た時はプリントするように例外を出したいんですが、
これだと、
AttributeError: type object 'ApiError' has no attribute 'error'
ってエラーが出てしまいます。


try:
f = open(local_path, 'rb')
dbx.files_upload(f.read(), upload_path)
f.close()
except dropbox.exceptions.ApiError as err:
print(err.error)

これだと、エラーがちゃんとプリントされます
なぜ、 as err を付けるとちゃんと動くんでしょうか? 👀
Rock54: Caution(BBR-MD5:1341adc37120578f18dba9451e6c8c3b)
667デフォルトの名無しさん
垢版 |
2018/10/30(火) 16:47:54.22ID:mxVOiKCI
pycharmでrun/debug configurationのset wowrking directoryに、プログラムを実行したいディレクトリ(pロジェクトのルート外)を入れても、ファイルが見つからないとエラーがでます
ターミナルでは実行可能です
プロジェクトのルート外のディレクトリで実行するにはどうすればいいいか教えて頂きたいです
2018/10/30(火) 17:27:16.66ID:o9t78hsF
>>667
ちょっと何言ってんだかわかんない。
working directoryは実行するpyhonスクリプトのディレクトリが勝手に入ると思うのだが。
見つからないと言われるファイルは何?
実行するスクリプトから参照しているファイルじゃないの?
図示してくれ。
2018/10/30(火) 18:23:15.32ID:LRpQBEf3
>>666
前者はクラス名.変数名(ApiError.error)になっているのでクラス変数を参照しようとしている。
故にApiErrorにerrorという名前のクラス変数がなければエラーになる。

後者はインスタンス名.変数名(err.error)になっているのでインスタンス変数を参照しようとしている。
errorはインスタンス変数なのでエラーにならない。
670653
垢版 |
2018/10/30(火) 18:43:42.81ID:wwkQj2Ri
>>669
どうもありがとうございます
dropbox.exceptions.ApiError as err
これって、
dropbox.exceptions.ApiError
をerrって別名にしただけですよね?

ってことは
err.errorと
dropbox.exceptions.ApiError.error
は結局同じ気がするんですが、違うんでしょうか?
違いがわからないです
2018/10/30(火) 19:22:58.06ID:LRpQBEf3
>>670
違うよ。
ApiErrorはクラス名、errはインスタンス名。
a = MyClass()
って書いたときにMyClassとaは違うものでしょ?それと同じ
672デフォルトの名無しさん
垢版 |
2018/10/30(火) 19:39:22.54ID:vHVA3ezu
except E as N:
と書いてある場合は
"Eが例外オブジェクトのクラスだったら例外をNに代入"
という処理になる
他のasを使った文のようにEの別名をNにする訳ではない
2018/10/30(火) 23:12:08.40ID:tLch1bmf
普通そういう所に、クラス名など来ない

例外インスタンスが来る
2018/10/31(水) 00:55:47.26ID:KgeV0wH8
ConvergenceWarning: Liblinear failed to converge, increase the number of iterations.

sklearnでLinearSVCのグリッドサーチするとこの文章が永遠に出てくるんですけどどういうことですか?調べてもわかりませんでした。
675デフォルトの名無しさん
垢版 |
2018/10/31(水) 01:29:09.72ID:C97UeufF
そのままの意味で、毎回の学習が収束まで行ってないからイテレーション回数増やせって事では
2018/10/31(水) 01:30:14.36ID:KgeV0wH8
>>675
増やしても出てくるんですよね…
677デフォルトの名無しさん
垢版 |
2018/10/31(水) 10:16:21.72ID:C97UeufF
>>676
学習率が大きすぎるとか
678デフォルトの名無しさん
垢版 |
2018/10/31(水) 12:17:11.83ID:/o0RsUYT
1からpythonの勉強始めて、オブジェクト指向とやらで挫折中。
クラスやら継承は何となく理解できて、
どう書けばいいのかも何となくわかるけど、
理解するのに時間がかかりそう。色々なコードを書いて覚えていくしかないのか?
経験者ってここら辺どうなんですか(しっかり理解できているかどうか)
2018/10/31(水) 13:08:59.03ID:gqgWGRur
関数とかと同じで、クラスも便利だなあと思える具体例や機会があれば使えるようになる
何処か見たアドレス帳を作る例は分かり易そうだったけど、あれは何処だったか
でもクラス使わなくてもプログラムは出来るから直ぐに使えるようにならなくても問題ない
680デフォルトの名無しさん
垢版 |
2018/10/31(水) 13:20:42.47ID:gqtAU0ur
>>678
スクリプターってクラスを使うばっかりで作る方はあんまりって傾向があるから、無問題ではある。
Cも覚えてライブラリ作りも頑張ってほしいかな。
日本のプログラマーの質が問われるから。
681デフォルトの名無しさん
垢版 |
2018/10/31(水) 13:31:11.31ID:zGg5PO0t
日本のプログラマーの質が問われるから。

だってw
2018/10/31(水) 13:32:03.51ID:gc+olMws
"html54200-0.html#anchor001"

と言う文字列の#の前の数字だけ抽出(542000)したいのですが、どのような正規表現を書けばよいのでしょうか?
([0-9]+)(?=#)
ではだめでした。よろしくお願いします。
683682
垢版 |
2018/10/31(水) 13:35:03.91ID:gc+olMws
書き忘れましたが、現状ではre.findall[54200、 0]と言うリストを取得したあと、
join()で542000にすることを考えていたのですが、アンカーから後を取得すると狂ってしまうので、
アンカーから後は抽出したくないのです。よろしくお願いします。
2018/10/31(水) 13:40:28.98ID:fzRw5h8F
正規表現とかいらんだろ

str.lstrip("html")
str[:7]
2018/10/31(水) 13:42:08.67ID:1NzreX+B
re.search("(¥d+).*?(?=#)",s).group(1)
2018/10/31(水) 13:43:24.16ID:fzRw5h8F
ああそこが欲しいのか

str.lstrip("html")
str[:6].strip("-")
687デフォルトの名無しさん
垢版 |
2018/10/31(水) 13:43:30.37ID:BEBaW28W
>>668
見つからないと言われるファイルはrun/debug configurationのparametersで指定したものです
>>working directoryは実行するpyhonスクリプトのディレクトリが勝手に入る
それをスクリプトを実行したい場所に変更してるんですけど
2018/10/31(水) 13:45:53.85ID:0yqa0SvH
>>682
(^0-9)|#.* を空文字に置換
689デフォルトの名無しさん
垢版 |
2018/10/31(水) 13:51:38.68ID:XAA9QXm2
>>680-681
2ちゃんや5ちゃんの履歴消すしかないな
2018/10/31(水) 13:53:01.77ID:gc+olMws
レスありがとうございます。
>>684
これ以外にも似たようなファイルがあるので、できるだけ一般化しておきたいのです正規表現を考えました。
>>685
お教えいただいたところ申し訳ないのですが、Noneとでてしまいました。私の設定のどこかがまずかったのかしれませんが。
2018/10/31(水) 13:55:03.93ID:1NzreX+B
>>690
¥dの¥はバックスラッシュに直してくれ
[0-9]でもいいよ
2018/10/31(水) 14:00:41.64ID:gc+olMws
検索する文字列にsplit("#")[0]をつけることを思いつきました。
あんまりスマートじゃないかもしれませんがこれで行こうと思います。
皆さんありがとうございました。
2018/10/31(水) 14:03:31.31ID:1NzreX+B
>>687
図示してくれるか、何をどうしているのかという全体の構成がわからないと、
何でつまづいているのかがわからない。
parametersにはsys.argvで受け取りたい内容を入れることはわかってるんだよね?
694デフォルトの名無しさん
垢版 |
2018/10/31(水) 14:20:03.17ID:BEBaW28W
>>693
他人の書いたコードがどう動いてるのか理解するためにデバッグしたいと思っていて、全体の構成はよくわかってないんですけど、それだとデバッグはできないってことなんでしかね?
あるファイルが出力される時点で動いてるコードを見たいと思ってるんですけど
2018/10/31(水) 14:46:51.62ID:1NzreX+B
>>694
イマイチわからんけど、
bashでpythonのscriptに何らかの引数を渡して実行したいって事じゃないの?

そうだとすればbashからの引数がscript parmetersの値で、
pycharmでそのスクリプトを開いてデバッグするだけの事だと思うんだけど違うの?
696デフォルトの名無しさん
垢版 |
2018/10/31(水) 14:54:31.80ID:BEBaW28W
>>695
parameterで渡したはずのファイルがnot found になって困っているんです
で、そのファイルはcontent root 外なので問題なのかなとか思ってるんですけど
2018/10/31(水) 15:00:36.67ID:1NzreX+B
python側のデバッグ(動作確認)したいだけなら、
引数にこだわらずにダイレクトにファイル指定してやればいいだけだと思うけど?
698デフォルトの名無しさん
垢版 |
2018/10/31(水) 15:27:06.72ID:BEBaW28W
いちいち書き換えないといけないんですかね?
せっかくコマンドライン引数で指定できるようになってるのに
699デフォルトの名無しさん
垢版 |
2018/10/31(水) 15:29:28.35ID:BEBaW28W
>>692
そういう文字列処理はawkとかperlのほうが簡単だよ
2018/10/31(水) 17:36:50.33ID:DIssBnZo
def gethtml(url, prm=""):
 r = requests.get(url, params=prm)
 r.encoding = 'CP932'
 return r.text

こんな関数でエンコードがCP932(のはずの)サイトを取得して
日本語は普通に表示されてるんですけど
@とかqとかが文字化けしてしまいます。どうすれば文字化けを回避できますか?
2018/10/31(水) 18:12:41.93ID:taLNwoKn
NEC特殊文字が化けてるのか
いま確認環境がないからどうにかできるかはわからん
702デフォルトの名無しさん
垢版 |
2018/10/31(水) 18:28:43.45ID:XAA9QXm2
>>> print('@とかqとか')
@とかqとか


ちゃんと表示される
2018/10/31(水) 18:37:40.87ID:DIssBnZo
とりあえず自己解決
対象ページをファイルとして保存した後、codecsで保存したファイルをロードすることで対処できました
704デフォルトの名無しさん
垢版 |
2018/10/31(水) 20:12:08.83ID:gHBnMNYM
epubビューアの開発は順調に進んでるのかな
705デフォルトの名無しさん
垢版 |
2018/10/31(水) 20:40:39.13ID:/o0RsUYT
>>680 >>679
2年間運用(継続中)してます。
所属部署がクラウドに力入れ始めててpython勉強
しとけと言われてやってます。取りあえずスクレイピング
できるようになりたいのでコード漁ってるんですが関数さえ
使用してないように見えてて、おっしゃる通りなんですかね
最終的に何か作れるようになりたいけど、何も思いつかないし
何を目指したらいいのやら
2018/11/01(木) 00:22:16.46ID:PBz6MbCm
>>682-692
Ruby なら、File.basename の第2引数に、.* を渡せば、. より前の部分を取れる

file_name = File.basename( "html54200-0.html#anchor001", ".*" )
#=> "html54200-0"

>>705
Ruby で、Selenium WebDriver, Nokogiri を使って、
ブラウザで自動ログインしたり、Showroom のアバターを削除したりしてる

他にも、5ch の書き込み内から、画像のURL だけを拾って表示したり、
主に、ブラウザを使った、webサイトの自動テストに使う

その際のPage Object は、典型的なオブジェクト指向による、テスト方法
707デフォルトの名無しさん
垢版 |
2018/11/01(木) 04:05:25.76ID:rG6revia
>>705
まずはDomを理解汁
708デフォルトの名無しさん
垢版 |
2018/11/01(木) 10:34:25.18ID:z733lC2q
>>705-707
スレチ
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況