くだすれPython(超初心者用) その39

**デフォルトの名無しさん** · 2018/10/23(火) 13:20:20.07

>>516
バージョンも同じなら、理由はわからんなぁ…

**デフォルトの名無しさん** · 2018/10/23(火) 17:07:59.89

みんなやさしいな

**デフォルトの名無しさん** · 2018/10/23(火) 18:06:12.08

別のフォルダに入った同名ファイルをjoblibのParallelで処理するために以下のようなコードを書いたところ1番目のフォルダの結果が常に出てきてしまうんだけど原因分かる？

・環境
Python: 3.7.0
joblib: 0.12.5
Jupyter Notebook上で実行

・ファイル
C:\a\a.txt -> 「1」とだけ半角で書かれたテキストファイル
C:\b\a.txt -> 「2」とだけ半角で書かれたテキストファイル

・コード
import numpy as np
from joblib import Parallel, delayed

# 実際はもっと大容量のファイルに対して重い処理を行う
def read_file():
return np.loadtxt("a.txt")

os.chdir(r"C:\a")
result1 = Parallel(n_jobs=-1)(delayed(test)() for _ in range(1))

os.chdir(r"C:\b")
result2 = Parallel(n_jobs=-1)(delayed(test)() for _ in range(1))

# 空のフォルダcに移動する
os.chdir(r"C:\c")
result3 = Parallel(n_jobs=-1)(delayed(test)() for _ in range(1))

print(result1) # 出力 : [array(1.)]
print(result2) # 出力 : [array(1.)]・・・[array(2.)]が出力されないのはなぜ?
print(result3) # 出力 : [array(1.)]

**デフォルトの名無しさん** · 2018/10/23(火) 22:14:21.56

ファイルの数を返すメソッドはありますか？
例えばsrcの下にディレクトリaとbがあって
それぞれのディレクトリにa1.txt～a100.txt、b1.txt～b100.txtとファイルがあった時に
200と返してくれるメソッドはありますか？
defで関数とか作らず1行で済む方法を探しています。

**デフォルトの名無しさん** · 2018/10/23(火) 22:22:44.49

len(os.lisdir(ディレクトリのpath))

**デフォルトの名無しさん** · 2018/10/23(火) 22:36:02.00

いまやってみたらそのコードでは2が帰って来ました
aとbの2つのディレクトリがあるから2なのですかね？
欲しいのはそのまた下にあるファイルの数でした

**デフォルトの名無しさん** · 2018/10/23(火) 22:46:04.08

Pythonは詳しく無いけど、そう言うは再帰でディレクトリが無い最下層まで潜るコードってよく見るね。

**デフォルトの名無しさん** · 2018/10/23(火) 23:35:56.37

>>521
import glob
len(glob.glob(“**/*”, recursive=True))

**デフォルトの名無しさん** · 2018/10/23(火) 23:36:52.55

src/**/* だったわ

**デフォルトの名無しさん** · 2018/10/23(火) 23:53:26.39

>>521
sum([len(files) for root, dirs, files in os.walk("src")])

**デフォルトの名無しさん** · 2018/10/24(水) 00:12:08.40

>>504
パス・カレントディレクトリとか、起動時オプションとか。
別の実行ファイルを起動しているとか

IDE の前提条件は、プロジェクトごとだろ。
プロジェクトフォルダ・プロジェクト設定ファイルありきだろ。
プロジェクトの条件を満たしていないのかも？

プロジェクトとシェルから実行する形式とは、異なるような気がする

そのエラーメッセージをここにも書いて、それで検索すれば？

>>513-517
「python sqlalchemy filter vs filter_by」で検索！

**デフォルトの名無しさん** · 2018/10/24(水) 00:33:01.65

>>521-527
ls -1UR | wc -l

「linux ファイル数ディレクトリごと」で検索！

**デフォルトの名無しさん** · 2018/10/24(水) 00:58:29.86

>>514
「gtk webkitwebview」で検索！

**デフォルトの名無しさん** · 2018/10/24(水) 15:19:12.25

521,523です
教えていただいたのをやってみました。
525さんの方法は、フォルダーの数が含まれていました。結果は202が返りました。
527さんの方法は、ちょうど200が返りました。
529さんの方法は、windowsなので出来ませんでした。

これにて問題は解決しました。皆さまありがとうございます。

**514** · 2018/10/24(水) 17:55:05.58

https://webkitgtk.org/reference/webkit2gtk/stable/WebKitWebView.html

＞Note that WebKitWebView is scrollable by itself, so you don't need to embed it in a GtkScrolledWindow.

って書いてありました。スクロールをGtkで担当していないから、他のgtk3アプリのようにタッチでスクロールできないようです。でも、だったらなんで>>514のリンク先の人はGTK.gestureでできたんだろう・・・

**デフォルトの名無しさん** · 2018/10/24(水) 18:10:34.94

>なんといっても、800g弱とは思えない軽さと、
薄型コンパクトな筐体はタブレットと同様に、
「出番はないかもしれないけど常時携行しても良い」レベルです。

いざ使おうとすると windows update が始まって再起動…何時間も待たされる…鞄にしまう。
↓
放置
↓
「出番はないかもしれないけど常時携行しても良い」
↓
また持ち出す
↓
いざ使おうとすると windows update が始まって再起動…何時間も待たされる…鞄にしまう。
↓
放置

**デフォルトの名無しさん** · 2018/10/24(水) 18:40:13.35

リストにn個の要素があります。
このリストの要素から2個をランダムに選んだペアをm組作りたいです。
ただしペアを重複しないようにしたいのですが、
どうすれば実装できるでしょうか。もしくはライブラリがありますか？
いくら考えてもペアが重複してしまいます。(特に(a,b)と(b,a)のようなペアが出来てしまいます)

n=[1, 2, ... n]
m=3
new_n=f(n, m)
new_n
=[(1,8), (45,n), (n-2, 20)]

みたいになるfを探しています。

**デフォルトの名無しさん** · 2018/10/24(水) 18:54:46.79

>>534
itertools

**デフォルトの名無しさん** · 2018/10/24(水) 18:57:07.94

リストの中身をシャッフル→前から二つずつ取得

**デフォルトの名無しさん** · 2018/10/24(水) 18:57:08.14

>>532
ここで回答を待つよりリンク先に直凸したほうがはやいきががが

Why could you "scroll" with GTK.gesture?

**デフォルトの名無しさん** · 2018/10/24(水) 19:10:02.77

scrapyとXParhについて教えてください

https://ideone.com/af79WT
うまく動いてくれないです。

67行目からの関数が間違えてると思うんですが、77行目のp_templateはどう書くのが正しいんでしょうか？

9行目は
# https://github.com/Kyrand/dataviz-with-python-and-js

17行目は
BASE_URL = 'http://en.wikipedia.org'

40行目は
start_urls = ["https://en.wikipedia.org/wiki/List_of_Nobel_laureates_by_country";]

80行目は
# https://www.wikidata.org/wiki/Q155525

です。

**デフォルトの名無しさん** · 2018/10/24(水) 19:14:14.74

>>535
これは指定した組み合わせ数に達したら中断する方法はありますか？
実際にはnとmが両方4000程なので、nC2を全て取得するのは冗長と思われるので・・
とはいえやりたいことにとても近いのでありがとうございます。

>>536
実際にはm>n/2となるので難しいと思いました。
すみませんこちらの例題が悪かったですね・・

**デフォルトの名無しさん** · 2018/10/24(水) 19:14:37.21

>>534
itertoolsとrandom.sampleを組み合わせる
import itertools, random
def pair(n, m):
combi = list(itertools.combinations(n, m))
return random.sample(combi, m)

**デフォルトの名無しさん** · 2018/10/24(水) 19:51:07.40

>>506
これ、モジュールを入れてますが、ideoneで外部モジュールってどうやって使うんです？

**デフォルトの名無しさん** · 2018/10/24(水) 20:02:29.89

>>539
いつでもやめれるぞ

おれはあほだから
count=0からカウントアップしていって
欲しい組数になったらbreak
とか思いつくが
もっとスマートなやり方あるとおもう

**デフォルトの名無しさん** · 2018/10/24(水) 20:03:01.03

>>541
ソースが貼れるだけで
外部モジュールをとってきて動かすまではideoneしてくれない

**デフォルトの名無しさん** · 2018/10/24(水) 20:26:18.89

>>538
大抵は日付Gregorianで書いてあるとおもうから
文字列Gregorianの　前の文字列を探したらよさげなんだが

80行目のアドレスにアクセスして見てみた
Xpathがもはや538が書いたソースと違っつる
（/html/body/pre/span[1577]　ってなってて　divに１ツも入ってないYO）ので
具体的にどうとは書けない

**デフォルトの名無しさん** · 2018/10/24(水) 23:59:09.70

wikipedia みたいに、しょっちゅう構成が変化するものを、
XPath みたいに順番で指定するものは、動かない

div[2]/div[1]/div/div[2]/div[2]/div[1]
「div の3つ目の、div の2つ目の...」

CSS セレクターみたいに、id, class などの意味で指定する方が、構成の変化に強い。
まだマシ

HTML を解析して、id, class などで限定していくのが基本

**デフォルトの名無しさん** · 2018/10/25(木) 01:12:10.66

今日突然プログラミングに興味を持ちとりあえずpythonをインストールした初心者です。

連番を作成するとき range(10)と打ち込んでも結果がrange(0,10)になってしまいます
解説サイトを見ると9まで表示されるらしいのですが、なぜrange(0,10)になってしまうのでしょうか？
バージョンは3.7.1です

**デフォルトの名無しさん** · 2018/10/25(木) 02:20:57.87

>>546
解説サイトがpython2向けだから。
別のサイトを見つけましょう

**デフォルトの名無しさん** · 2018/10/25(木) 02:27:15.39

Ruby の範囲は、終端を含む、.. と、含まない ... がある

0..3 → 0～3
0...3 → 0～2

python では、終端を含まないのかな？

推測だけど、range(10)と引数が1つの場合は、終端のみが指定されたとみなすのだろう。
その場合、始端は0 が指定されたのと同じ

つまり、range(0,10)と同じ

**デフォルトの名無しさん** · 2018/10/25(木) 07:58:15.11

>>544
538を書いたのは昨日だけど、今試しても80行目のアドレスのdate of birthのXPathは
//*[@id="P569"]/div[1]/div/a

8 October 1927の部分のXPathは
//*[@id="q155525$82312275-D23F-4048-A710-6EC6AB12C2C2"]/div[2]/div[1]/div/div[2]/div[2]/div[1]
でしたよ

>>544
>>545
583のスクリプトだと誕生日、死亡日、出生地、死亡地、性別を77行目の天ぷらで取得するようになってるけれど、もう天ぷらを改変して使うことも無理だから、項目一つ一つそれぞれ取得しないといけないって事ですか？

**デフォルトの名無しさん** · 2018/10/25(木) 08:09:34.19

https://www.wikidata.org/wiki/Q155525

この表の左側(date of birthとかplace of birth)のdiv classは
wikibase-statementgroupview-property-label

表示の真ん中の8 October 1927や、Bahía Blancaのdiv classは
wikibase-snakview-value wikibase-snakview-variation-valuesnak
のようでした。
これらを使って >>583 に当てはめる事できますか？

**545** · 2018/10/25(木) 08:57:54.49

例えば、Ruby で、5ch の書き込み内のa タグを、XPath で指定するのは、こういう感じ

# a を含む、post_node だけを抜き出す。descendant は子孫、ancestor は祖先
# div.thread > div.post > div.message > span > a

post_nodes = doc.xpath "//div[@class='thread']/div[@class='post']/div[@class='message']/descendant::a/ancestor::div[@class='post']"

/div[2]/div[1]/div/div[2]/div[2]/div[1]
こういう、1, 2 などの順番では指定しない

順番で指定すると、サーバー側で、HTML ページを作る時に、順番が変わるかもしれない

普通はXPathではなく、以下のような、CSS セレクターで指定する。
div.thread > div.post > div.message > span > a

thread クラスが付いた、div 要素の直下の、
post クラスが付いた、div 要素の直下の、
message クラスが付いた、div 要素の直下の、
span 要素の直下の、a 要素

ブラウザのF12 開発者ツールを起動して、自分でHTMLを解析する

**545** · 2018/10/25(木) 09:17:05.90

Chrome で、自分が解析したい要素上で、右クリックメニューで検証を押すと、F12 開発者ツールが起動する

表示されたHTML 上で、右クリックメニューでCopy の所から、
XPath, selector(CSS selector)をコピーできる

例えば、このスレの書き込み内のa タグを、検証してみると、
XPath, CSS selectorは、

//*[@id="550"]/div[2]/span/a[2]
550 > div.message > span > a.reply_link

id が550 の要素の直下の、
message クラスが付いた、div 要素の直下の、
span 要素の直下の、
reply_link クラスが付いた、a 要素

ただし、id は550など、先頭文字が数字では始められないから、これは間違い。
5ch の開発者が間違っている。バグ

**545** · 2018/10/25(木) 09:39:35.73

date of birth の、XPath, CSS selectorは、

//*[@id="P569"]/div[1]
#P569 > div.wikibase-statementgroupview-property

id がP569 の要素の直下の、
wikibase-statementgroupview-property クラスが付いた、div 要素

このCSS セレクターで要素を取得して、それが1つだけかどうか確認しないといけない。
このHTML の製作者は、このクラスを複数のタグに付けているかもしれない

このように、他人が作ったHTMLを、解析していくのが難しい。
その仕様は、その製作者が決めたもので、我々が知らないものだから、
隠された情報を暴くのに、時間を食うから、非常に無駄！

仕事以外で、他人の仕様を解析するのは辞めた方がよい。
製作者は答えを知っているけど、我々は答えを知らないから、時間ばかり食う！

**デフォルトの名無しさん** · 2018/10/25(木) 09:43:11.50

たまにはいいこと言うじゃねえか

**デフォルトの名無しさん** · 2018/10/25(木) 10:14:40.95

今は1階層深くなっているようだ
//*[@id="{code}"]/div[2]/div/div/div[2]/div[1]/div/div[2]/div[2]/div[1]{link_html}/text()

**デフォルトの名無しさん** · 2018/10/25(木) 10:21:59.94

>>553
なるほど

まだ途中までしか読んでないけどおそらく本の内容はこんな感じ

1
ウィキペディアにある現在までのノーベル賞受賞者の全員の一覧からウィキデータにある各人のパーソナル情報とウィキペディアの各人の概略と人物写真をScrapyでスクレイピング

2
そのデータをPandasとMatplotlibでクリーニング、分析

3
そのデータをFlaskを使って配信

4
そのデータをJavascriptのD3.jsで可視化

4の可視化に興味があって読み始めた感じ。けどせっかくなので1から読んでScrapyも学んでみようかと。
でも、他人が作ったサイト(ウィキペディア)で悩むよりもAPIなどで簡単に取得出来るような別のデータを使って2に進んだ方がよいですか？
(幸い、本の著作のGithubは数年前にすでにスクレイピングしたデータが置いてありました。数年前なのでもちろん今年の本庶さんは含まれてないですけどね。)

**デフォルトの名無しさん** · 2018/10/25(木) 10:22:45.04

>>555
それどうやって見つけたんでしょうか？
ちょっと見てみます。

**デフォルトの名無しさん** · 2018/10/25(木) 10:43:07.24

https://i.imgur.com/I9jF1Rl.jpg
date of birthのところでコピーしたXPath
//*[@id="P569"]/div[1]/div/a

https://i.imgur.com/b4m9Pop.jpg
その日付けのところでコピーしたXPath
//*[@id="q155525$82312275-D23F-4048-A710-6EC6AB12C2C2"]/div[2]/div[1]/div/div[2]/div[2]/div[1]

2枚目の画像の部分を選ぶんだと思っていたんですけど、もしかして選ぶ場所間違えてますか？

**545** · 2018/10/25(木) 11:01:29.24

>>556
その本の例題が難しすぎる。
自分で他人のHTML を解析してまでやる必要はない。無視すべし

自分のやりたい部分だけを、やった方がよい

**デフォルトの名無しさん** · 2018/10/25(木) 11:34:29.89

>>558
目的地点はあってるが出発地点が違う
もうちょっとソースを読んで、どういう風にXPathをテンプレート化しているかを理解しよう

**545** · 2018/10/25(木) 12:03:03.26

date of birth の、XPath, CSS selectorは、
//*[@id="P569"]/div[1]
#P569 > div.wikibase-statementgroupview-property

id がP569 の要素の直下の、
wikibase-statementgroupview-property クラスが付いた、div 要素

place of birth の、XPath, CSS selectorは、
//*[@id="P19"]/div[1]
#P19 > div.wikibase-statementgroupview-property

id がP19 の要素の直下の、
wikibase-statementgroupview-property クラスが付いた、div 要素

ここで、id のP569, P19 みたいなものは、別のHTML から取れるのか？
だったら、CSS セレクターで取れる

XPath なら、div[1] とか番号指定よりも、class 指定の方がよい。
//*[@id='P569']/div[@class='wikibase-statementgroupview-property']
//*[@id='P19']/div[@class='wikibase-statementgroupview-property']

**デフォルトの名無しさん** · 2018/10/25(木) 12:21:08.82

>>560
出発地点ですか！

例えば「8 October 1927」という文字の上で右クリックして検証を選んで出てくる開発者ツールのElements欄を見てるんですが、もしかしてそこから間違えているとかですか？

> もうちょっとソースを読んで、どういう風にXPathをテンプレート化しているかを理解しよう

どういう事なのかさっぱり分からないです…

>>560
>>561
そういう知識はどこで身につけるんでしょうか？
おそらくこれはPythonとは直接関係ない部分なのでPythonの本でもそんなに詳しくは書いてないのかと思います。
これらはWeb開発の知識でしょうか？
ほんのちょっとだけどPythonは覚えたから大丈夫だけど、Webは分からないから暗号にしか見えず恐ろしいです。

なるべくWeb開発をしなくてもいいように(ほんとはWebは専門の人に任せようって)、Web開発の部分はなるべく最小限で済むようにして、みなさんがPythonとJavascriptのプログラミングに専念してシングルページアプリを作れるようにってのがこの本らしいけれど、
XPathやChromeのこのツールやdivとかクラスっていうものの知識ってどういうところ(本？サービス？言語？)で学ぶといいんでしょうか？結局はやはりWebの知識が必要になってくるんでしょうか？
途中、SVGでグラフィックを作る章の最初にHTMLとcssの基本的な事が書かれてありましたけれど。

**545** · 2018/10/25(木) 13:36:59.66

先に、JavaScript, jQuery で、CSS セレクターを学ぶ。
CSS セレクターの方が読みやすい。
入門用サイトでも見て

HTML で、CSS デザイン用の属性、id, class などを付けるでしょ？
それを手掛かりにして、要素を取得する

XPath は後でよい。
入門用サイトを見る

**デフォルトの名無しさん** · 2018/10/25(木) 14:08:58.54

https://i.imgur.com/H3vQCNy.jpg
>危険なWeb開発地帯
自分もこの認識
恐ろしい

>>563
早く先に進みたいけれど、一旦Pythonは横に置いて、そういう学習してみます。
プログラミング言語としてのJavaScriptではなくWebで使うためのJavaScriptという位置付けで学ぶとcssなど理解できるようになるんですかね？

あと、JavaScriptのスキルを身に付けたいならフレームワーク(jQueryなど)の存在は完全に無視すべきとありました。

**デフォルトの名無しさん** · 2018/10/25(木) 14:10:23.63

Python少し触っただけの初心者です。
インデント位置が変わるだけでプログラムのロジックの意味が
変わるのを知ってビックリしているのですが、
そんな言語を使ってまともなプログラムを書けるのですか？

**デフォルトの名無しさん** · 2018/10/25(木) 14:13:05.16

>>565
初心者ですけど、逆に分かりやすいと思いました。

**545** · 2018/10/25(木) 14:20:16.10

難しすぎるから、あきらめた方がよい。
他人が作った、HTML を解析しても、時間の無駄で、得るものがない！

本か入門用サイトで勉強した方が、体系的に勉強できて、余程よい

それと投稿時には、名前欄に、538 と書いてくれ

**538** · 2018/10/25(木) 14:29:40.72

>>567
まさにこの本がPython学習者がデータの可視化に向けてJavaScriptを学ぶのにちょうどよい本だと思って手に取ったんですが…

**デフォルトの名無しさん** · 2018/10/25(木) 15:37:48.62

最近裾野が広がって初学者が増えたのは良いが
FAQはどっかでまとまったの見ておくべき

**デフォルトの名無しさん** · 2018/10/25(木) 15:45:19.08

>>565
同じ処理なら誰が書いても同じようなコードになる

**デフォルトの名無しさん** · 2018/10/25(木) 16:04:24.36

Python始めたての初学者です。
ファイルを読み込んで、バックアップをとってから、ファイルの一部を書き換えるというプログラムを書きました。
これをPython3.6.1環境のLinuxで実行すると、うまく動きましたが、2.7.5環境の別マシンでは、
TypeError: 'encoding' is an invalid keyword argument for this function
というエラーを吐き実行できませんでした。さらに、2.5.2環境の別マシンでは
AttributeError: 'str' object has no attribute 'format'
というエラーを吐き、実行できませんでした。
Python2と3では互換性がないということは存じ上げていますが、今回、3.6.1、2.7.5、2.5.2のすべての環境で動くものを作りたいです。
おそらくopenのencodingの部分と、datetimeの部分のformatの書き方がだめなんだと思いますが、
全バージョン対応の書き方をしようと思うとどういった形になるのでしょうか。
ちなみに、以下がコード全文です。
https://pastebin.com/F2UKiYtQ

**デフォルトの名無しさん** · 2018/10/25(木) 16:27:15.45

無駄な抵抗はよせ

**デフォルトの名無しさん** · 2018/10/25(木) 17:20:42.65

>>562,564

Pythonは詳しく無いので恐縮ですが、

>プログラミング言語としてのJavaScriptではなくWebで使うためのJavaScriptという位置付けで学ぶとcssなど理解できるようになるんですかね？

CSS(スタイルシート)はWebページの見た目を制御するためのものです。

HTMLの要素ごとに、サイズ、背景、フォントの種類、レイアウトなどをCSSで指定する。
HTMLの要素は、タグ、属性、値で構成される。divはタグ、id, classは属性。

よって、CSSを覚えるには、HTML+CSSのセットで覚える必要がある。

今だったら、HTML5+CSS3

さらに、HTMLの要素を操作して表示を変化させるにはJavaScriptを使う。

ホスト側で処理が必要な場合は、CGI(GET,POST)などの知識も必要。

Webページ(HTML)の解析をするのであれば、HTML+CSSの知識は必須と思う。

**デフォルトの名無しさん** · 2018/10/25(木) 18:16:58.93

>>572
抵抗させてください

**デフォルトの名無しさん** · 2018/10/25(木) 19:39:32.30

まず2.5の文法だけで2.5で動く奴を書け

**デフォルトの名無しさん** · 2018/10/25(木) 19:56:43.69

>>575
なに偉そうに命令しとるんじゃ
しばくぞ

**デフォルトの名無しさん** · 2018/10/25(木) 20:10:31.29

>>571
　　>>575
　　しかるのちpythonのバージョンを検出し
　　そのさき読み込む部分を切り替える処理を書く
おｋ

**デフォルトの名無しさん** · 2018/10/25(木) 20:58:23.32

無駄なあがきだと思うよ
import sys
if sys.version_info >= (3, 0):
def xopen(file, encoding):
return open(file, encoding=encoding)
else:
import codecs
def xopen(file, encoding):
return codecs.open(file, encoding=encoding)

**デフォルトの名無しさん** · 2018/10/25(木) 23:07:28.40

確かに文字列関係は労力が見合わないな

**デフォルトの名無しさん** · 2018/10/26(金) 01:52:17.86

>>578
ありがとうございます
いい感じに動いてるっぽいです
ちなみになんですが、
def xopen(file, encoding):
return open(file, encoding=encoding)
xopenという新たに定義した関数のencodingっていうパラメータが、open関数に渡る際に、encoding=encodingとなった右側のみに代入されるのがいまいち何故か分かりません

**532** · 2018/10/26(金) 10:52:40.48

>>537
遅レスで会話の邪魔して悪いんですが。英語で質問するだけの勇気がありません・・・
pyGTKでgtk.gestureはそもそも文献自体がほとんど（2019/1に洋書が出るようですが)ないので、
とりあえず今はwebkit1を使って凌ごうともいます。

**デフォルトの名無しさん** · 2018/10/26(金) 11:27:23.79

いまスクレイピングの勉強してて、テキスト通りに入力したら
operation not permittedとエラーが出ました
python3.6
IPad Proでpythonista使ってます
写真がその内容です
https://imgur.com/a/DNU9qUA

**デフォルトの名無しさん** · 2018/10/26(金) 11:28:03.08

原因わかるかた教えてください

**デフォルトの名無しさん** · 2018/10/26(金) 12:46:11.07

>>571
そういうマルチバージョン対応などは、10年以上の開発者がやるもの！
初心者がやるべき事ではない

初心者は、python3系だけを使ってください

**デフォルトの名無しさん** · 2018/10/26(金) 13:22:34.36

>>584
アホは出てくんな

**デフォルトの名無しさん** · 2018/10/26(金) 13:32:28.45

>>583
クリップボードの内容を取得したりOSと連携する様な操作は
iPadだと出来ることと出来ないことがあるよ
クリップボードの内容取得は出来るけど
iOS用に書き換えないと

import clipboard
text = clipboard.get()
print(text)

Pythonista のドキュメントに以下の項目があって
iOS 用に使えるモジュールが出てる
Pythonista Modules
Additional modules developed specifically for iOS

**デフォルトの名無しさん** · 2018/10/26(金) 13:40:57.57

pipでuinstallした時に
would remove:
proceed?(y/n)
と聞かれて、yを選ぶと
fikenotfounderrorが出てアンインストール出来ません
どうしたらよいですか？

**デフォルトの名無しさん** · 2018/10/26(金) 14:05:26.31

>>587
pipのバージョン、Pythonのバージョン、OSの種類とバージョンくらい書かないと絶対無理

**デフォルトの名無しさん** · 2018/10/26(金) 14:59:47.80

pip 18.1
python 3.5.3
windows10
です。

**デフォルトの名無しさん** · 2018/10/26(金) 15:02:26.09

そして、uinstallしたいのはtensorflow1.4.0です。

**デフォルトの名無しさん** · 2018/10/26(金) 15:07:19.64

>>589-590
・ないといわれたファイルは実際に（ほんとうに）あるのか、ないのかをexplorerあたりから確認しる
・テンソルフローはうまくうごいていたのか、いないのか
・ログインユーザー名に日本語（２バイト文字）を使ってないか？

**デフォルトの名無しさん** · 2018/10/26(金) 15:09:31.17

もしかしたら
「setuptoolsを再インストール」すればなおるかもしんない。

**デフォルトの名無しさん** · 2018/10/26(金) 15:41:07.87

>>543
なるほど
見せるためだけに使ってる感じですか
ありがとうございます

**デフォルトの名無しさん** · 2018/10/26(金) 17:48:07.64

>>586
ありがとうございます
やっぱり初心者にpythonistaは厳しいのかなー
iPadで出来ていろいろ便利なんですけどね……。

**538** · 2018/10/26(金) 20:36:27.02

>>573
どうもありがとうございます参考になります。
自分はWebページ作りそのものに感心は全く無いんですが、しかし今の自分が読むべきなのは例えばこういう本なんでしょうか？
https://images-na.ssl-images-amazon.com/images/I/51cDHqLOl3L._SX353_BO1,204,203,200_.jpg
(アマゾンでHTML5で検索して一番上に出てきた本です)

**573** · 2018/10/26(金) 23:50:52.48

>>595
そういう感じの本です。

私の持っている本はこれです。ちょっと古いです。
https://images-na.ssl-images-amazon.com/images/I/51e-xYj018L.jpg

タグや属性を調べるだけならポケットリファレンスで十分かもしれません。
https://images-na.ssl-images-amazon.com/images/I/91Oh7lXoi0L.jpg

**デフォルトの名無しさん** · 2018/10/27(土) 00:41:13.73

スレチ

**デフォルトの名無しさん** · 2018/10/27(土) 17:49:12.10

HTML, CSS, JavaScript, jQuery などの事は、web制作管理板で聞いてください

**デフォルトの名無しさん** · 2018/10/27(土) 17:49:31.22

python3で
print("humi" , humi, "%")　を実行すると ('temp', 23.0, 'c')　←２３は実際のセンサーの値です。
print関数で””で囲んだのは文字扱いで、複数の文字のときは「,」で区切りますよね？
理想は　humi　47.0　%　　と表示させたいのですがどうすればよいでしょうか？
初歩の質問なのですが悩んでおります

**デフォルトの名無しさん** · 2018/10/27(土) 17:53:45.53

>>599
https://ideone.com/TzBly3

**デフォルトの名無しさん** · 2018/10/27(土) 18:16:13.96

>>600
すまんが　俺もいままではそれでできてた。
今回はそれを入力すると ('temp', 23.0, 'c')　って出るんです
そもそもなんで「'」になってるのかすら分からない。

**デフォルトの名無しさん** · 2018/10/27(土) 18:19:52.16

すまんごちゃごちゃになってますね。
print("humi" , humi, "%")　→('humi', 23.0, '%')　になります。
普通なら>>600で大丈夫なはずなんですけど。。

**デフォルトの名無しさん** · 2018/10/27(土) 18:26:42.99

それはpython2の挙動だな

**デフォルトの名無しさん** · 2018/10/27(土) 18:40:14.43

>>603
ん？そんな急に変わるもんなの？
実行もsudo pythonで実行してるけど　sudo python3にできたりするのですか？

**デフォルトの名無しさん** · 2018/10/27(土) 18:49:01.71

>>604
２系と３系はハゲあがるほど文字列まわりが違う
３系をsudoするなら
sudo py

**デフォルトの名無しさん** · 2018/10/27(土) 19:20:52.01

Windows10, WSL, Ubuntu 16.04 では、

which python3
=> /usr/bin/python3

**デフォルトの名無しさん** · 2018/10/27(土) 19:42:26.23

>>605
それは存じてます。
それより下にあるprint関数はpython3の書き方でしっかり表示できてるんですよね。。
なぜかこの行だけ変な表示になる

**デフォルトの名無しさん** · 2018/10/27(土) 19:56:03.40

まだ2系使ってるのはどんな層？

**デフォルトの名無しさん** · 2018/10/27(土) 20:38:05.02

Linux系じゃね？
ブートストラップ周りに2系がガッツリ食い込んでるって聞いたことある。
そのせいで2系がデフォルトで入ってるとか。

**デフォルトの名無しさん** · 2018/10/27(土) 20:52:22.52

>>608
基本Windows使ってるけど
２系のころ勉強して
そのまんま・・・

あとたしかに>>609

**デフォルトの名無しさん** · 2018/10/27(土) 21:09:16.81

humi = 25
print("humi" , humi, "%")
print(humi)

出力：
('humi', 25, '%')
25

**デフォルトの名無しさん** · 2018/10/27(土) 21:26:03.77

>>611
まさにこれ。
python2はないと思う。ずっとこれでやってきてるので。
部分的に２とかありえるのかな？

**デフォルトの名無しさん** · 2018/10/27(土) 21:28:08.36

>>611はpython2で動かした結果

**デフォルトの名無しさん** · 2018/10/27(土) 21:39:51.74

>>613
まじですか・・
当方ラズパイをつかってまして　lxterminalで sudo python ファイル名　なら実行できるけど
python3 IDLEつかうとモジュールエラー出るから避けてたんだけど　もしかしてpython3じゃないってことですかね？

**デフォルトの名無しさん** · 2018/10/27(土) 21:41:02.12

ちゃんと調べたら2系で動いてましたﾃﾍﾍﾟﾛ
に1票
これまでずっとそうしてきたからとか本当に信用ならん

**デフォルトの名無しさん** · 2018/10/27(土) 21:42:08.13

sudo python -Vと打ってかくにんしる

**デフォルトの名無しさん** · 2018/10/27(土) 21:53:58.98

RHEL系もDebian系もシステム周りはここしばらくはpython -> python2で、3はpython3で呼ぶようになってる

**デフォルトの名無しさん** · 2018/10/27(土) 21:57:57.20

>>615
確認しました。ほんとにそれでしたすいません。
pip3でインストールしなきゃいけなかったそうです
どうもありがとうございました

**デフォルトの名無しさん** · 2018/10/27(土) 23:54:55.35

どんまい

**デフォルトの名無しさん** · 2018/10/28(日) 07:05:43.19

自分ではどうしようもなくて他人に泣きついたのにどうしてその相手の言うことを聞かずにグダグダやってたんだ？

**デフォルトの名無しさん** · 2018/10/28(日) 07:43:54.72

Pythonで作成したモジュールをUWSCで呼び出すことはできますか？
UWSCではDLLを読み込んで関数が使えるのですが
そういう行為をプログラミング用語でなんというのでしょうか
検索ワードがよくないのか手がかりすら掴めてないです
よろしくお願いします

**デフォルトの名無しさん** · 2018/10/28(日) 07:57:38.17

>>621
uwscなんて初めて知ったけど、exec()というコマンドがあるそうだから、単純に
exec("pythonのパス" + "pythonスクリプトのパス")でいいんじゃないの？

**デフォルトの名無しさん** · 2018/10/28(日) 11:48:06.52

>>622
execはexeを起動するだけなんです
似たようなものにdoscmdというのがあるんですがこれでも駄目でした
UWSC掲示板があって過去ログもみたんですがPythonに関する質問すらなかったです
http://www3.rocketbbs.com/13/bbs.cgi?id=umiumi
すみませんわざわざ調べて頂いて

**デフォルトの名無しさん** · 2018/10/28(日) 12:12:29.72

>>623
それで十分だろ。
思い込みは捨てて
exec("<python.exeのフルパス> <スクリプトのフルパス>")
を実行してみなよ。
discmdのほうも単にパスが通ってないだけだと思うよ。
フルパスで入力してる？

**デフォルトの名無しさん** · 2018/10/28(日) 12:54:25.06

>>624
すみません、解決しました
実行時の引数が不足してました
ありがとうございました

**デフォルトの名無しさん** · 2018/10/28(日) 13:08:03.94

Fswebcamで撮影した写真をメールで自動送信を考えています。
探知して送るのはあるんですけど、撮影した写真をまとめて送るようなプログラムってつくりにくいですか？
シェルだと楽っぽいけど　慣れてないので分からない。。

**デフォルトの名無しさん** · 2018/10/28(日) 13:30:49.38

もしくは撮影されたフォルダ内から日時の新しいものとか新しいうちの四つを添付するとかできないかなと？
普通に添付するならファイルが指定になるから難しそうですかね。。

**デフォルトの名無しさん** · 2018/10/28(日) 22:42:22.92

書いてみれば良いじゃない

**デフォルトの名無しさん** · 2018/10/28(日) 23:28:27.44

numpyで配列の要素が範囲となるような配列をつくることはできますか？
例えばAというはいれつがあって、
A[0] = np.arange(0,1,0.01)
みたいなものです

**デフォルトの名無しさん** · 2018/10/29(月) 00:31:07.47

意図があってるか分からないが
A = np.stack([np.arange(0,1,0.01)]*10)
A += np.arange(10).reshape((10,1))

**デフォルトの名無しさん** · 2018/10/29(月) 09:07:55.84

>>620
いるよなこういう何の生産性もないレスする奴(烏賊ﾌﾞ)

**デフォルトの名無しさん** · 2018/10/29(月) 09:36:36.83

そうだな

**デフォルトの名無しさん** · 2018/10/29(月) 10:18:07.79

>>630
ありがとうございます
なんとかできました

**デフォルトの名無しさん** · 2018/10/29(月) 11:12:02.14

requestsでファイルをダウンロードする時タイムスタンプは変更しないでダウンロードする方法教えて下さい！！

**デフォルトの名無しさん** · 2018/10/29(月) 11:28:06.05

os.utime

**デフォルトの名無しさん** · 2018/10/29(月) 11:56:15.99

requestsで何らかの方法を使ってファイルの作成日などを取得してダウンロード後にos.utimeでその日付に書き換えるんでしょうか？

**デフォルトの名無しさん** · 2018/10/29(月) 11:57:16.03

wget -N url
みたいな事が出来るとよいんですが。

**デフォルトの名無しさん** · 2018/10/29(月) 12:28:53.22

httpレスポンスヘッダのlastmodified

**デフォルトの名無しさん** · 2018/10/29(月) 12:51:46.14

wget -N url も utime やろ

**493** · 2018/10/29(月) 17:45:54.93

ちょっと前にwebkitgtk epubミューアの件で質問した者ですが、コードを見ていて疑問に思っていたことがあるので
質問させてください。
main_window.py

self.viewer = viewer.Viewer(self)
print("Displaying blank page.")
self.viewer.load_uri("about:blank") # Display a blank page
self.viewer.connect("load-finished", self.__ajust_scroll_position)
self.viewer.connect("load-finished", self.__save_new_position)
self.right_box.pack_end(self.right_scrollable_window, True, True, 0)
# Create Chapters List component and pack it on the left
self.chapters_list_component = chapters_list.ChaptersListComponent(self)

(途中省略)

def __save_new_position(self, wiget, data):
"""
Saves new position in case new load came from link based navigation
:param wiget:
:param data:
"""
if not data.get_uri() == "about:blank":
self.content_provider.set_data_from_uri(data.get_uri())

load-finishedの時に呼ばれているコールバック関数なんですが、wigetとdataって何なんですか？
なんでdata.get_uri()と書けるんでしょうか？
それと、このコールバック関数配置ページ読み込むごとに呼ばれているという認識で正しいのでしょうか？

あと、 content_provider.py
if urllib.parse.unquote((os.path.split(uri)[-1]).split("#")[0]) == os.path.split(self.chapter_links[i])[-1]:
ってどうして必要なんでしょうか？（これがないと機能しないようですが）

**デフォルトの名無しさん** · 2018/10/29(月) 17:46:38.70

関数配置ページ
関数は一ページの変換ミスです。ごめんなさい。

**デフォルトの名無しさん** · 2018/10/29(月) 17:50:01.97

https://imgur.com/a/iT18u6W

titleの文字列取得の時はstring付ければよかったけど、最後の奴はstring付けるとエラーになります
こういうときはどうやって文字列だけ抽出するんですか？

**デフォルトの名無しさん** · 2018/10/29(月) 18:12:16.70

>>642
写真だと見づらいね
find_allの時はリストで取得してるから
for c in content: で回して取り出してみて

**デフォルトの名無しさん** · 2018/10/29(月) 18:35:48.17

c.attrs['content']

**デフォルトの名無しさん** · 2018/10/29(月) 18:38:50.81

pandasのtocsv使うときデータ内に¥nが入っててcsv出力時点で改行され、excelからcsvをデータインポートカンマ区切りで読み込みたい時に改行されて悲しいことになるんですがどうするのがスマートですか
¥n入るのは正しく、16桁以上の数字のカラムがあるのでデータインポートで読み込みたいです

**デフォルトの名無しさん** · 2018/10/29(月) 18:49:52.26

本当だ
よく見るとこの場合は実行するとリストとして取得されてるんですね
そりゃstringじゃ無理な訳ですね
わかりやすい

**デフォルトの名無しさん** · 2018/10/29(月) 19:06:12.03

>>638
>>639
もうちょっと教えてくださいお願いします！

**デフォルトの名無しさん** · 2018/10/29(月) 19:11:52.05

ん？　今、何でもするって言ったよね。

**デフォルトの名無しさん** · 2018/10/29(月) 19:21:40.44

>>645
to_csvのオプションで個々の値にクォーテーションを付ける
import csv
df.to_csv(“hoge.csv”, quoting=csv.QUOTE_ALL)

**デフォルトの名無しさん** · 2018/10/29(月) 21:46:01.91

>>640
そんな零細プログラムの詳細をここで質問しても誰も答えないと思うぞ…

気が向いたから答えるけど次はないからな。

__save_new_position()メソッドを呼びだしているのはwebviewクラス。
下記ページによると、第二引数はwebview自身、第三引数はwebframeクラスのインスタンスを渡して呼び出されることが分かる。
webframeのリファレンスページを見ればwebframeクラスがget_uri()メソッドを持っていることも分かる。
https://lazka.github.io/pgi-docs/WebKit-3.0/classes/WebView.html#WebKit.WebView.signals.load_finished

content_providerのほうは、指定されたxmlファイルが、chapter_links配列の何番目のファイル名と一致しているかを調べることで、チャプター番号を特定している。
uriがエスケープされていたり"#"フラグメントがついてると比較できないから取り除いている。

**デフォルトの名無しさん** · 2018/10/29(月) 21:54:17.26

>>647
一般的にHTTPレスポンスヘッダのLast-Modifiedにファイルのmtimeが入ってるからそれを取得して、ファイル書き出してからmtime更新すれば良い

curl使えるなら-vで一度レスポンスヘッダ見るといい

**デフォルトの名無しさん** · 2018/10/29(月) 21:58:45.40

凄いねよく答えられるな、流石

gtkは全く知らないけど
wigetはwidgetのスペルミスだろうね、きっと

**デフォルトの名無しさん** · 2018/10/30(火) 06:58:19.30

>>651
これであってますか？

resp = requests.get(url)

# レスポンスヘッダの Last-Modified を取得
last_modified = resp.headers['Last-Modified']
print(ast_modified)
Thu, 13 Oct 2016 05:36:56 GMT

# datetime オブジェクトに変換 (表記のロケール依存を防ぐために dateutil.parser を使う)
last_modified = dateutil.parser.parse(last_modified)
print(ast_modified)
2016-10-13 05:36:56+00:00

# unix time に変えるために calendar を使う
unixtime = calendar.timegm(lastModified.utctimetuple())
print(unixtime)
1476337016

# ファイルの書き込み
img_file = open(file_path, 'wb')
img_file.write(resp.content)
img_file.close()
os.utime(file_path, (unixtime, unixtime)) # ファイルパス, (アクセス時間, 修正時間)

ファイルの作成日の取得と書き込みはどうやるんでしょうか？

**デフォルトの名無しさん** · 2018/10/30(火) 06:59:46.91

>>653
print(ast_modified)はprint(last_modified)の間違いです

**640** · 2018/10/30(火) 08:47:23.62

>>650
レスありがとうございます。助かりました。

**デフォルトの名無しさん** · 2018/10/30(火) 09:35:33.18

次はないと言割れましたがちょっと不思議なことがあったので質問させていただきます。
sorted関数を使うと、
パブリックドメインのepubで有名なgutenbergのファイル名をソートしていたのですが、
(@public@vhost@g@gutenberg@html@files@31278@31278-h@31278-h-0.htm.htm、@public@vhost@g@gutenberg@html@files@31278@31278-h@31278-h-10.htm.htmllなどというファイル名です）
0. 1.10, 11,12, .2などとソートされるようですが、普通に0,1,2,3,4の順番にできないのでしょうか。
というよりなぜグーテンベルクのファイルだけ、おかしなソートになるのかわかりません。

**デフォルトの名無しさん** · 2018/10/30(火) 09:48:16.33

数値型は数の大小で比較されるが、
文字列型の数値は文字列として比較されるから数の大小順には並ばない
数値として比較したければ、sort(またはsorted)のkey引数に適切なキー抽出関数を与える必要がある

その本だけがと言っているが、条件を満たしていればどんなリストでもお前の言う「おかしなソート」になる
print(sorted('11', '2', '.1'))

**656** · 2018/10/30(火) 10:00:46.78

>>657
ググったらでてきました。文字列型だと10が2より先に来るようですね。
どうもありがとうございました。

**デフォルトの名無しさん** · 2018/10/30(火) 12:37:59.64

>>653
そんな感じ
ファイルの作成日時は取得する手段がないので諦めて
（独自ヘッダで応答してくれるサーバーを除く）

**デフォルトの名無しさん** · 2018/10/30(火) 12:44:20.01

>>649
試してみたけど無理でした
ダブルクリックで開くと問題ないけどtxtのインポートだと開いた時点で改行されるからどうしようも無いのかなこれ

**デフォルトの名無しさん** · 2018/10/30(火) 14:52:54.90

bashからpythonプログラムを実行するときに、pycharmで簡単にデバッグしたいんですが、どうすればいいですか？
pythonコードだけの場合のやり方は分かるんですけど
print()いっぱい書くしか無いんですかね

**デフォルトの名無しさん** · 2018/10/30(火) 14:55:07.36

>>658
float型に変換しないとちゃんとソートできないよ

**デフォルトの名無しさん** · 2018/10/30(火) 15:01:43.41

>>661
解決しました
https://stackoverflow.com/questions/27952331/debugging-with-pycharm-terminal-arguments

**デフォルトの名無しさん** · 2018/10/30(火) 15:02:59.00

>>661
pycharm使ってparametersに引数入れてやればいい。

**653** · 2018/10/30(火) 15:46:23.76

>>659
どうもありがとうございます
基本的に作成日の取得は出来ないんですね

**653** · 2018/10/30(火) 16:13:18.69

try:
f = open(local_path, 'rb')
dbx.files_upload(f.read(), upload_path)
f.close()
except dropbox.exceptions.ApiError:
print(dropbox.exceptions.ApiError.error)

Dropboxにアップロードする時、エラーが出た時はプリントするように例外を出したいんですが、
これだと、
AttributeError: type object 'ApiError' has no attribute 'error'
ってエラーが出てしまいます。

try:
f = open(local_path, 'rb')
dbx.files_upload(f.read(), upload_path)
f.close()
except dropbox.exceptions.ApiError as err:
print(err.error)

これだと、エラーがちゃんとプリントされます
なぜ、 as err を付けるとちゃんと動くんでしょうか？ 👀
Rock54: Caution(BBR-MD5:1341adc37120578f18dba9451e6c8c3b)

**デフォルトの名無しさん** · 2018/10/30(火) 16:47:54.22

pycharmでrun/debug configurationのset wowrking directoryに、プログラムを実行したいディレクトリ（pロジェクトのルート外）を入れても、ファイルが見つからないとエラーがでます
ターミナルでは実行可能です
プロジェクトのルート外のディレクトリで実行するにはどうすればいいいか教えて頂きたいです

**デフォルトの名無しさん** · 2018/10/30(火) 17:27:16.66

>>667
ちょっと何言ってんだかわかんない。
working directoryは実行するpyhonスクリプトのディレクトリが勝手に入ると思うのだが。
見つからないと言われるファイルは何？
実行するスクリプトから参照しているファイルじゃないの？
図示してくれ。

**デフォルトの名無しさん** · 2018/10/30(火) 18:23:15.32

>>666
前者はクラス名.変数名(ApiError.error)になっているのでクラス変数を参照しようとしている。
故にApiErrorにerrorという名前のクラス変数がなければエラーになる。

後者はインスタンス名.変数名(err.error)になっているのでインスタンス変数を参照しようとしている。
errorはインスタンス変数なのでエラーにならない。

**653** · 2018/10/30(火) 18:43:42.81

>>669
どうもありがとうございます
dropbox.exceptions.ApiError as err
これって、
dropbox.exceptions.ApiError
をerrって別名にしただけですよね？

ってことは
err.errorと
dropbox.exceptions.ApiError.error
は結局同じ気がするんですが、違うんでしょうか？
違いがわからないです

**デフォルトの名無しさん** · 2018/10/30(火) 19:22:58.06

>>670
違うよ。
ApiErrorはクラス名、errはインスタンス名。
a = MyClass()
って書いたときにMyClassとaは違うものでしょ？それと同じ

**デフォルトの名無しさん** · 2018/10/30(火) 19:39:22.54

except E as N:
と書いてある場合は
"Eが例外オブジェクトのクラスだったら例外をNに代入"
という処理になる
他のasを使った文のようにEの別名をNにする訳ではない

**デフォルトの名無しさん** · 2018/10/30(火) 23:12:08.40

普通そういう所に、クラス名など来ない

例外インスタンスが来る

**デフォルトの名無しさん** · 2018/10/31(水) 00:55:47.26

ConvergenceWarning: Liblinear failed to converge, increase the number of iterations.

sklearnでLinearSVCのグリッドサーチするとこの文章が永遠に出てくるんですけどどういうことですか？調べてもわかりませんでした。

**デフォルトの名無しさん** · 2018/10/31(水) 01:29:09.72

そのままの意味で、毎回の学習が収束まで行ってないからイテレーション回数増やせって事では

**デフォルトの名無しさん** · 2018/10/31(水) 01:30:14.36

>>675
増やしても出てくるんですよね…

**デフォルトの名無しさん** · 2018/10/31(水) 10:16:21.72

>>676
学習率が大きすぎるとか

**デフォルトの名無しさん** · 2018/10/31(水) 12:17:11.83

１からpythonの勉強始めて、オブジェクト指向とやらで挫折中。
クラスやら継承は何となく理解できて、
どう書けばいいのかも何となくわかるけど、
理解するのに時間がかかりそう。色々なコードを書いて覚えていくしかないのか？
経験者ってここら辺どうなんですか（しっかり理解できているかどうか）

**デフォルトの名無しさん** · 2018/10/31(水) 13:08:59.03

関数とかと同じで、クラスも便利だなあと思える具体例や機会があれば使えるようになる
何処か見たアドレス帳を作る例は分かり易そうだったけど、あれは何処だったか
でもクラス使わなくてもプログラムは出来るから直ぐに使えるようにならなくても問題ない

**デフォルトの名無しさん** · 2018/10/31(水) 13:20:42.47

>>678
スクリプターってクラスを使うばっかりで作る方はあんまりって傾向があるから、無問題ではある。
Cも覚えてライブラリ作りも頑張ってほしいかな。
日本のプログラマーの質が問われるから。

**デフォルトの名無しさん** · 2018/10/31(水) 13:31:11.31

日本のプログラマーの質が問われるから。

だってｗ

**デフォルトの名無しさん** · 2018/10/31(水) 13:32:03.51

"html54200-0.html#anchor001"

と言う文字列の#の前の数字だけ抽出(542000)したいのですが、どのような正規表現を書けばよいのでしょうか？
([0-9]+)(?=#)
ではだめでした。よろしくお願いします。

**682** · 2018/10/31(水) 13:35:03.91

書き忘れましたが、現状ではre.findall[54200、 0]と言うリストを取得したあと、
join()で542000にすることを考えていたのですが、アンカーから後を取得すると狂ってしまうので、
アンカーから後は抽出したくないのです。よろしくお願いします。

**デフォルトの名無しさん** · 2018/10/31(水) 13:40:28.98

正規表現とかいらんだろ

str.lstrip("html")
str[:7]

**デフォルトの名無しさん** · 2018/10/31(水) 13:42:08.67

re.search("(¥d+).*?(?=#)",s).group(1)

**デフォルトの名無しさん** · 2018/10/31(水) 13:43:24.16

ああそこが欲しいのか

str.lstrip("html")
str[:6].strip("-")

**デフォルトの名無しさん** · 2018/10/31(水) 13:43:30.37

>>668
見つからないと言われるファイルはrun/debug configurationのparametersで指定したものです
＞＞working directoryは実行するpyhonスクリプトのディレクトリが勝手に入る
それをスクリプトを実行したい場所に変更してるんですけど

**デフォルトの名無しさん** · 2018/10/31(水) 13:45:53.85

>>682
(^0-9)|#.*　を空文字に置換

**デフォルトの名無しさん** · 2018/10/31(水) 13:51:38.68

>>680-681
2ちゃんや5ちゃんの履歴消すしかないな

**デフォルトの名無しさん** · 2018/10/31(水) 13:53:01.77

レスありがとうございます。
>>684
これ以外にも似たようなファイルがあるので、できるだけ一般化しておきたいのです正規表現を考えました。
>>685
お教えいただいたところ申し訳ないのですが、Noneとでてしまいました。私の設定のどこかがまずかったのかしれませんが。

**デフォルトの名無しさん** · 2018/10/31(水) 13:55:03.93

>>690
¥dの¥はバックスラッシュに直してくれ
[0-9]でもいいよ

**デフォルトの名無しさん** · 2018/10/31(水) 14:00:41.64

検索する文字列にsplit("#")[0]をつけることを思いつきました。
あんまりスマートじゃないかもしれませんがこれで行こうと思います。
皆さんありがとうございました。

**デフォルトの名無しさん** · 2018/10/31(水) 14:03:31.31

>>687
図示してくれるか、何をどうしているのかという全体の構成がわからないと、
何でつまづいているのかがわからない。
parametersにはsys.argvで受け取りたい内容を入れることはわかってるんだよね？

**デフォルトの名無しさん** · 2018/10/31(水) 14:20:03.17

>>693
他人の書いたコードがどう動いてるのか理解するためにデバッグしたいと思っていて、全体の構成はよくわかってないんですけど、それだとデバッグはできないってことなんでしかね？
あるファイルが出力される時点で動いてるコードを見たいと思ってるんですけど

**デフォルトの名無しさん** · 2018/10/31(水) 14:46:51.62

>>694
イマイチわからんけど、
bashでpythonのscriptに何らかの引数を渡して実行したいって事じゃないの？

そうだとすればbashからの引数がscript parmetersの値で、
pycharmでそのスクリプトを開いてデバッグするだけの事だと思うんだけど違うの？

**デフォルトの名無しさん** · 2018/10/31(水) 14:54:31.80

>>695
parameterで渡したはずのファイルがnot found になって困っているんです
で、そのファイルはcontent root 外なので問題なのかなとか思ってるんですけど

**デフォルトの名無しさん** · 2018/10/31(水) 15:00:36.67

python側のデバッグ(動作確認)したいだけなら、
引数にこだわらずにダイレクトにファイル指定してやればいいだけだと思うけど？

**デフォルトの名無しさん** · 2018/10/31(水) 15:27:06.72

いちいち書き換えないといけないんですかね？
せっかくコマンドライン引数で指定できるようになってるのに

**デフォルトの名無しさん** · 2018/10/31(水) 15:29:28.35

>>692
そういう文字列処理はawkとかperlのほうが簡単だよ

**デフォルトの名無しさん** · 2018/10/31(水) 17:36:50.33

def gethtml(url, prm=""):
　r = requests.get(url, params=prm)
　r.encoding = 'CP932'
　return r.text

こんな関数でエンコードがCP932(のはずの)サイトを取得して
日本語は普通に表示されてるんですけど
①とか㎞とかが文字化けしてしまいます。どうすれば文字化けを回避できますか？

**デフォルトの名無しさん** · 2018/10/31(水) 18:12:41.93

NEC特殊文字が化けてるのか
いま確認環境がないからどうにかできるかはわからん

**デフォルトの名無しさん** · 2018/10/31(水) 18:28:43.45

>>> print('①とか㎞とか')
①とか㎞とか

ちゃんと表示される

**デフォルトの名無しさん** · 2018/10/31(水) 18:37:40.87

とりあえず自己解決
対象ページをファイルとして保存した後、codecsで保存したファイルをロードすることで対処できました

**デフォルトの名無しさん** · 2018/10/31(水) 20:12:08.83

epubビューアの開発は順調に進んでるのかな

**デフォルトの名無しさん** · 2018/10/31(水) 20:40:39.13

>>680 >>679
2年間運用（継続中）してます。
所属部署がクラウドに力入れ始めててpython勉強
しとけと言われてやってます。取りあえずスクレイピング
できるようになりたいのでコード漁ってるんですが関数さえ
使用してないように見えてて、おっしゃる通りなんですかね
最終的に何か作れるようになりたいけど、何も思いつかないし
何を目指したらいいのやら

**デフォルトの名無しさん** · 2018/11/01(木) 00:22:16.46

>>682-692
Ruby なら、File.basename の第2引数に、.* を渡せば、. より前の部分を取れる

file_name = File.basename( "html54200-0.html#anchor001", ".*" )
#=> "html54200-0"

>>705
Ruby で、Selenium WebDriver, Nokogiri を使って、
ブラウザで自動ログインしたり、Showroom のアバターを削除したりしてる

他にも、5ch の書き込み内から、画像のURL だけを拾って表示したり、
主に、ブラウザを使った、webサイトの自動テストに使う

その際のPage Object は、典型的なオブジェクト指向による、テスト方法

**デフォルトの名無しさん** · 2018/11/01(木) 04:05:25.76

>>705
まずはDomを理解汁

**デフォルトの名無しさん** · 2018/11/01(木) 10:34:25.18

>>705-707
スレチ

**デフォルトの名無しさん** · 2018/11/01(木) 10:58:02.80

>>698
言ってる事が矛盾してるんだけど。
>他人の書いたコードがどう動いてるのか理解するためにデバッグ
>いちいち書き換えないといけないんですかね？

理解すれためなら、一回入力するだけでいちいち書き換える必要はないだろ。

**デフォルトの名無しさん** · 2018/11/02(金) 23:07:04.01

MySQL connectorの使い方を教えてください。

MySQLのTIME型をSELECTしてfetchoneすると、datetime.timedelta型になってしまいます。
datetime.time型で取得するにはどうすれば良いのでしょうか？

**デフォルトの名無しさん** · 2018/11/03(土) 07:29:30.23

>>710
がいしゅつぽ
ttps://teratail.com/questions/141268

**デフォルトの名無しさん** · 2018/11/03(土) 10:46:05.35

rawで引っ張って自分でconvertする。
列の仕様がはっきりしているなら、たぶんこれが一番速い。

**デフォルトの名無しさん** · 2018/11/03(土) 22:09:03.24

>>667
まだサポートされていない機能だったらしいです
一応報告
https://youtrack.jetbrains.com/issue/IDEA-88717

**デフォルトの名無しさん** · 2018/11/03(土) 22:14:11.53

pyファイルに引数としてファイル渡して実行しながらデバッグしたいんですけどideでできますか？

**デフォルトの名無しさん** · 2018/11/04(日) 00:16:25.00

さすがにできないと困るでしょう。

**デフォルトの名無しさん** · 2018/11/04(日) 13:42:02.03

>>711
これあかんやつやω
環境変わったら動かなくなるぞ

**デフォルトの名無しさん** · 2018/11/04(日) 23:14:32.54

Excelの全シートの特定セルから値を抽出したいんですが、

import openpyxl
book = openpyxl.load_workbook('xxx.xlsx')
all_sheet = book.sheetnames
for 抽出 in all_sheet:
print(抽出.cell(row=1, column=1).value)

ってやってもうまくいきません。
ご指導をお願いします。