くだすれPython(超初心者用) その39

**デフォルトの名無しさん** · 2018/08/24(金) 07:50:35.97

このスレッドは、他のスレッドでは書き込めない超低レベル、
もしくは質問者自身何が何だか分からない質問を勇気を持って書き込むスレッドです。
へび使いが優しくコメントを返しますが、お礼は Python の布教と初心者の救済をお願いします。

エラーを解決したいときはエラー表示や環境(バージョン/IDE or command line)を略さずに書き込んで下さい。
騙りが頻発しています。質問する方は一時的なトリップをつけることを検討して下さい。
次スレは >>985 辺りで

前スレ
くだすれPython(超初心者用) その38
https://mevius.5ch.net/test/read.cgi/tech/1526522954/

**デフォルトの名無しさん** · 2018/10/27(土) 20:38:05.02

Linux系じゃね？
ブートストラップ周りに2系がガッツリ食い込んでるって聞いたことある。
そのせいで2系がデフォルトで入ってるとか。

**デフォルトの名無しさん** · 2018/10/27(土) 20:52:22.52

>>608
基本Windows使ってるけど
２系のころ勉強して
そのまんま・・・

あとたしかに>>609

**デフォルトの名無しさん** · 2018/10/27(土) 21:09:16.81

humi = 25
print("humi" , humi, "%")
print(humi)

出力：
('humi', 25, '%')
25

**デフォルトの名無しさん** · 2018/10/27(土) 21:26:03.77

>>611
まさにこれ。
python2はないと思う。ずっとこれでやってきてるので。
部分的に２とかありえるのかな？

**デフォルトの名無しさん** · 2018/10/27(土) 21:28:08.36

>>611はpython2で動かした結果

**デフォルトの名無しさん** · 2018/10/27(土) 21:39:51.74

>>613
まじですか・・
当方ラズパイをつかってまして　lxterminalで sudo python ファイル名　なら実行できるけど
python3 IDLEつかうとモジュールエラー出るから避けてたんだけど　もしかしてpython3じゃないってことですかね？

**デフォルトの名無しさん** · 2018/10/27(土) 21:41:02.12

ちゃんと調べたら2系で動いてましたﾃﾍﾍﾟﾛ
に1票
これまでずっとそうしてきたからとか本当に信用ならん

**デフォルトの名無しさん** · 2018/10/27(土) 21:42:08.13

sudo python -Vと打ってかくにんしる

**デフォルトの名無しさん** · 2018/10/27(土) 21:53:58.98

RHEL系もDebian系もシステム周りはここしばらくはpython -> python2で、3はpython3で呼ぶようになってる

**デフォルトの名無しさん** · 2018/10/27(土) 21:57:57.20

>>615
確認しました。ほんとにそれでしたすいません。
pip3でインストールしなきゃいけなかったそうです
どうもありがとうございました

**デフォルトの名無しさん** · 2018/10/27(土) 23:54:55.35

どんまい

**デフォルトの名無しさん** · 2018/10/28(日) 07:05:43.19

自分ではどうしようもなくて他人に泣きついたのにどうしてその相手の言うことを聞かずにグダグダやってたんだ？

**デフォルトの名無しさん** · 2018/10/28(日) 07:43:54.72

Pythonで作成したモジュールをUWSCで呼び出すことはできますか？
UWSCではDLLを読み込んで関数が使えるのですが
そういう行為をプログラミング用語でなんというのでしょうか
検索ワードがよくないのか手がかりすら掴めてないです
よろしくお願いします

**デフォルトの名無しさん** · 2018/10/28(日) 07:57:38.17

>>621
uwscなんて初めて知ったけど、exec()というコマンドがあるそうだから、単純に
exec("pythonのパス" + "pythonスクリプトのパス")でいいんじゃないの？

**デフォルトの名無しさん** · 2018/10/28(日) 11:48:06.52

>>622
execはexeを起動するだけなんです
似たようなものにdoscmdというのがあるんですがこれでも駄目でした
UWSC掲示板があって過去ログもみたんですがPythonに関する質問すらなかったです
http://www3.rocketbbs.com/13/bbs.cgi?id=umiumi
すみませんわざわざ調べて頂いて

**デフォルトの名無しさん** · 2018/10/28(日) 12:12:29.72

>>623
それで十分だろ。
思い込みは捨てて
exec("<python.exeのフルパス> <スクリプトのフルパス>")
を実行してみなよ。
discmdのほうも単にパスが通ってないだけだと思うよ。
フルパスで入力してる？

**デフォルトの名無しさん** · 2018/10/28(日) 12:54:25.06

>>624
すみません、解決しました
実行時の引数が不足してました
ありがとうございました

**デフォルトの名無しさん** · 2018/10/28(日) 13:08:03.94

Fswebcamで撮影した写真をメールで自動送信を考えています。
探知して送るのはあるんですけど、撮影した写真をまとめて送るようなプログラムってつくりにくいですか？
シェルだと楽っぽいけど　慣れてないので分からない。。

**デフォルトの名無しさん** · 2018/10/28(日) 13:30:49.38

もしくは撮影されたフォルダ内から日時の新しいものとか新しいうちの四つを添付するとかできないかなと？
普通に添付するならファイルが指定になるから難しそうですかね。。

**デフォルトの名無しさん** · 2018/10/28(日) 22:42:22.92

書いてみれば良いじゃない

**デフォルトの名無しさん** · 2018/10/28(日) 23:28:27.44

numpyで配列の要素が範囲となるような配列をつくることはできますか？
例えばAというはいれつがあって、
A[0] = np.arange(0,1,0.01)
みたいなものです

**デフォルトの名無しさん** · 2018/10/29(月) 00:31:07.47

意図があってるか分からないが
A = np.stack([np.arange(0,1,0.01)]*10)
A += np.arange(10).reshape((10,1))

**デフォルトの名無しさん** · 2018/10/29(月) 09:07:55.84

>>620
いるよなこういう何の生産性もないレスする奴(烏賊ﾌﾞ)

**デフォルトの名無しさん** · 2018/10/29(月) 09:36:36.83

そうだな

**デフォルトの名無しさん** · 2018/10/29(月) 10:18:07.79

>>630
ありがとうございます
なんとかできました

**デフォルトの名無しさん** · 2018/10/29(月) 11:12:02.14

requestsでファイルをダウンロードする時タイムスタンプは変更しないでダウンロードする方法教えて下さい！！

**デフォルトの名無しさん** · 2018/10/29(月) 11:28:06.05

os.utime

**デフォルトの名無しさん** · 2018/10/29(月) 11:56:15.99

requestsで何らかの方法を使ってファイルの作成日などを取得してダウンロード後にos.utimeでその日付に書き換えるんでしょうか？

**デフォルトの名無しさん** · 2018/10/29(月) 11:57:16.03

wget -N url
みたいな事が出来るとよいんですが。

**デフォルトの名無しさん** · 2018/10/29(月) 12:28:53.22

httpレスポンスヘッダのlastmodified

**デフォルトの名無しさん** · 2018/10/29(月) 12:51:46.14

wget -N url も utime やろ

**493** · 2018/10/29(月) 17:45:54.93

ちょっと前にwebkitgtk epubミューアの件で質問した者ですが、コードを見ていて疑問に思っていたことがあるので
質問させてください。
main_window.py

self.viewer = viewer.Viewer(self)
print("Displaying blank page.")
self.viewer.load_uri("about:blank") # Display a blank page
self.viewer.connect("load-finished", self.__ajust_scroll_position)
self.viewer.connect("load-finished", self.__save_new_position)
self.right_box.pack_end(self.right_scrollable_window, True, True, 0)
# Create Chapters List component and pack it on the left
self.chapters_list_component = chapters_list.ChaptersListComponent(self)

(途中省略)

def __save_new_position(self, wiget, data):
"""
Saves new position in case new load came from link based navigation
:param wiget:
:param data:
"""
if not data.get_uri() == "about:blank":
self.content_provider.set_data_from_uri(data.get_uri())

load-finishedの時に呼ばれているコールバック関数なんですが、wigetとdataって何なんですか？
なんでdata.get_uri()と書けるんでしょうか？
それと、このコールバック関数配置ページ読み込むごとに呼ばれているという認識で正しいのでしょうか？

あと、 content_provider.py
if urllib.parse.unquote((os.path.split(uri)[-1]).split("#")[0]) == os.path.split(self.chapter_links[i])[-1]:
ってどうして必要なんでしょうか？（これがないと機能しないようですが）

**デフォルトの名無しさん** · 2018/10/29(月) 17:46:38.70

関数配置ページ
関数は一ページの変換ミスです。ごめんなさい。

**デフォルトの名無しさん** · 2018/10/29(月) 17:50:01.97

https://imgur.com/a/iT18u6W

titleの文字列取得の時はstring付ければよかったけど、最後の奴はstring付けるとエラーになります
こういうときはどうやって文字列だけ抽出するんですか？

**デフォルトの名無しさん** · 2018/10/29(月) 18:12:16.70

>>642
写真だと見づらいね
find_allの時はリストで取得してるから
for c in content: で回して取り出してみて

**デフォルトの名無しさん** · 2018/10/29(月) 18:35:48.17

c.attrs['content']

**デフォルトの名無しさん** · 2018/10/29(月) 18:38:50.81

pandasのtocsv使うときデータ内に¥nが入っててcsv出力時点で改行され、excelからcsvをデータインポートカンマ区切りで読み込みたい時に改行されて悲しいことになるんですがどうするのがスマートですか
¥n入るのは正しく、16桁以上の数字のカラムがあるのでデータインポートで読み込みたいです

**デフォルトの名無しさん** · 2018/10/29(月) 18:49:52.26

本当だ
よく見るとこの場合は実行するとリストとして取得されてるんですね
そりゃstringじゃ無理な訳ですね
わかりやすい

**デフォルトの名無しさん** · 2018/10/29(月) 19:06:12.03

>>638
>>639
もうちょっと教えてくださいお願いします！

**デフォルトの名無しさん** · 2018/10/29(月) 19:11:52.05

ん？　今、何でもするって言ったよね。

**デフォルトの名無しさん** · 2018/10/29(月) 19:21:40.44

>>645
to_csvのオプションで個々の値にクォーテーションを付ける
import csv
df.to_csv(“hoge.csv”, quoting=csv.QUOTE_ALL)

**デフォルトの名無しさん** · 2018/10/29(月) 21:46:01.91

>>640
そんな零細プログラムの詳細をここで質問しても誰も答えないと思うぞ…

気が向いたから答えるけど次はないからな。

__save_new_position()メソッドを呼びだしているのはwebviewクラス。
下記ページによると、第二引数はwebview自身、第三引数はwebframeクラスのインスタンスを渡して呼び出されることが分かる。
webframeのリファレンスページを見ればwebframeクラスがget_uri()メソッドを持っていることも分かる。
https://lazka.github.io/pgi-docs/WebKit-3.0/classes/WebView.html#WebKit.WebView.signals.load_finished

content_providerのほうは、指定されたxmlファイルが、chapter_links配列の何番目のファイル名と一致しているかを調べることで、チャプター番号を特定している。
uriがエスケープされていたり"#"フラグメントがついてると比較できないから取り除いている。

**デフォルトの名無しさん** · 2018/10/29(月) 21:54:17.26

>>647
一般的にHTTPレスポンスヘッダのLast-Modifiedにファイルのmtimeが入ってるからそれを取得して、ファイル書き出してからmtime更新すれば良い

curl使えるなら-vで一度レスポンスヘッダ見るといい

**デフォルトの名無しさん** · 2018/10/29(月) 21:58:45.40

凄いねよく答えられるな、流石

gtkは全く知らないけど
wigetはwidgetのスペルミスだろうね、きっと

**デフォルトの名無しさん** · 2018/10/30(火) 06:58:19.30

>>651
これであってますか？

resp = requests.get(url)

# レスポンスヘッダの Last-Modified を取得
last_modified = resp.headers['Last-Modified']
print(ast_modified)
Thu, 13 Oct 2016 05:36:56 GMT

# datetime オブジェクトに変換 (表記のロケール依存を防ぐために dateutil.parser を使う)
last_modified = dateutil.parser.parse(last_modified)
print(ast_modified)
2016-10-13 05:36:56+00:00

# unix time に変えるために calendar を使う
unixtime = calendar.timegm(lastModified.utctimetuple())
print(unixtime)
1476337016

# ファイルの書き込み
img_file = open(file_path, 'wb')
img_file.write(resp.content)
img_file.close()
os.utime(file_path, (unixtime, unixtime)) # ファイルパス, (アクセス時間, 修正時間)

ファイルの作成日の取得と書き込みはどうやるんでしょうか？

**デフォルトの名無しさん** · 2018/10/30(火) 06:59:46.91

>>653
print(ast_modified)はprint(last_modified)の間違いです

**640** · 2018/10/30(火) 08:47:23.62

>>650
レスありがとうございます。助かりました。

**デフォルトの名無しさん** · 2018/10/30(火) 09:35:33.18

次はないと言割れましたがちょっと不思議なことがあったので質問させていただきます。
sorted関数を使うと、
パブリックドメインのepubで有名なgutenbergのファイル名をソートしていたのですが、
(@public@vhost@g@gutenberg@html@files@31278@31278-h@31278-h-0.htm.htm、@public@vhost@g@gutenberg@html@files@31278@31278-h@31278-h-10.htm.htmllなどというファイル名です）
0. 1.10, 11,12, .2などとソートされるようですが、普通に0,1,2,3,4の順番にできないのでしょうか。
というよりなぜグーテンベルクのファイルだけ、おかしなソートになるのかわかりません。

**デフォルトの名無しさん** · 2018/10/30(火) 09:48:16.33

数値型は数の大小で比較されるが、
文字列型の数値は文字列として比較されるから数の大小順には並ばない
数値として比較したければ、sort(またはsorted)のkey引数に適切なキー抽出関数を与える必要がある

その本だけがと言っているが、条件を満たしていればどんなリストでもお前の言う「おかしなソート」になる
print(sorted('11', '2', '.1'))

**656** · 2018/10/30(火) 10:00:46.78

>>657
ググったらでてきました。文字列型だと10が2より先に来るようですね。
どうもありがとうございました。

**デフォルトの名無しさん** · 2018/10/30(火) 12:37:59.64

>>653
そんな感じ
ファイルの作成日時は取得する手段がないので諦めて
（独自ヘッダで応答してくれるサーバーを除く）

**デフォルトの名無しさん** · 2018/10/30(火) 12:44:20.01

>>649
試してみたけど無理でした
ダブルクリックで開くと問題ないけどtxtのインポートだと開いた時点で改行されるからどうしようも無いのかなこれ

**デフォルトの名無しさん** · 2018/10/30(火) 14:52:54.90

bashからpythonプログラムを実行するときに、pycharmで簡単にデバッグしたいんですが、どうすればいいですか？
pythonコードだけの場合のやり方は分かるんですけど
print()いっぱい書くしか無いんですかね

**デフォルトの名無しさん** · 2018/10/30(火) 14:55:07.36

>>658
float型に変換しないとちゃんとソートできないよ

**デフォルトの名無しさん** · 2018/10/30(火) 15:01:43.41

>>661
解決しました
https://stackoverflow.com/questions/27952331/debugging-with-pycharm-terminal-arguments

**デフォルトの名無しさん** · 2018/10/30(火) 15:02:59.00

>>661
pycharm使ってparametersに引数入れてやればいい。

**653** · 2018/10/30(火) 15:46:23.76

>>659
どうもありがとうございます
基本的に作成日の取得は出来ないんですね

**653** · 2018/10/30(火) 16:13:18.69

try:
f = open(local_path, 'rb')
dbx.files_upload(f.read(), upload_path)
f.close()
except dropbox.exceptions.ApiError:
print(dropbox.exceptions.ApiError.error)

Dropboxにアップロードする時、エラーが出た時はプリントするように例外を出したいんですが、
これだと、
AttributeError: type object 'ApiError' has no attribute 'error'
ってエラーが出てしまいます。

try:
f = open(local_path, 'rb')
dbx.files_upload(f.read(), upload_path)
f.close()
except dropbox.exceptions.ApiError as err:
print(err.error)

これだと、エラーがちゃんとプリントされます
なぜ、 as err を付けるとちゃんと動くんでしょうか？ 👀
Rock54: Caution(BBR-MD5:1341adc37120578f18dba9451e6c8c3b)

**デフォルトの名無しさん** · 2018/10/30(火) 16:47:54.22

pycharmでrun/debug configurationのset wowrking directoryに、プログラムを実行したいディレクトリ（pロジェクトのルート外）を入れても、ファイルが見つからないとエラーがでます
ターミナルでは実行可能です
プロジェクトのルート外のディレクトリで実行するにはどうすればいいいか教えて頂きたいです

**デフォルトの名無しさん** · 2018/10/30(火) 17:27:16.66

>>667
ちょっと何言ってんだかわかんない。
working directoryは実行するpyhonスクリプトのディレクトリが勝手に入ると思うのだが。
見つからないと言われるファイルは何？
実行するスクリプトから参照しているファイルじゃないの？
図示してくれ。

**デフォルトの名無しさん** · 2018/10/30(火) 18:23:15.32

>>666
前者はクラス名.変数名(ApiError.error)になっているのでクラス変数を参照しようとしている。
故にApiErrorにerrorという名前のクラス変数がなければエラーになる。

後者はインスタンス名.変数名(err.error)になっているのでインスタンス変数を参照しようとしている。
errorはインスタンス変数なのでエラーにならない。

**653** · 2018/10/30(火) 18:43:42.81

>>669
どうもありがとうございます
dropbox.exceptions.ApiError as err
これって、
dropbox.exceptions.ApiError
をerrって別名にしただけですよね？

ってことは
err.errorと
dropbox.exceptions.ApiError.error
は結局同じ気がするんですが、違うんでしょうか？
違いがわからないです

**デフォルトの名無しさん** · 2018/10/30(火) 19:22:58.06

>>670
違うよ。
ApiErrorはクラス名、errはインスタンス名。
a = MyClass()
って書いたときにMyClassとaは違うものでしょ？それと同じ

**デフォルトの名無しさん** · 2018/10/30(火) 19:39:22.54

except E as N:
と書いてある場合は
"Eが例外オブジェクトのクラスだったら例外をNに代入"
という処理になる
他のasを使った文のようにEの別名をNにする訳ではない

**デフォルトの名無しさん** · 2018/10/30(火) 23:12:08.40

普通そういう所に、クラス名など来ない

例外インスタンスが来る

**デフォルトの名無しさん** · 2018/10/31(水) 00:55:47.26

ConvergenceWarning: Liblinear failed to converge, increase the number of iterations.

sklearnでLinearSVCのグリッドサーチするとこの文章が永遠に出てくるんですけどどういうことですか？調べてもわかりませんでした。

**デフォルトの名無しさん** · 2018/10/31(水) 01:29:09.72

そのままの意味で、毎回の学習が収束まで行ってないからイテレーション回数増やせって事では

**デフォルトの名無しさん** · 2018/10/31(水) 01:30:14.36

>>675
増やしても出てくるんですよね…

**デフォルトの名無しさん** · 2018/10/31(水) 10:16:21.72

>>676
学習率が大きすぎるとか

**デフォルトの名無しさん** · 2018/10/31(水) 12:17:11.83

１からpythonの勉強始めて、オブジェクト指向とやらで挫折中。
クラスやら継承は何となく理解できて、
どう書けばいいのかも何となくわかるけど、
理解するのに時間がかかりそう。色々なコードを書いて覚えていくしかないのか？
経験者ってここら辺どうなんですか（しっかり理解できているかどうか）

**デフォルトの名無しさん** · 2018/10/31(水) 13:08:59.03

関数とかと同じで、クラスも便利だなあと思える具体例や機会があれば使えるようになる
何処か見たアドレス帳を作る例は分かり易そうだったけど、あれは何処だったか
でもクラス使わなくてもプログラムは出来るから直ぐに使えるようにならなくても問題ない

**デフォルトの名無しさん** · 2018/10/31(水) 13:20:42.47

>>678
スクリプターってクラスを使うばっかりで作る方はあんまりって傾向があるから、無問題ではある。
Cも覚えてライブラリ作りも頑張ってほしいかな。
日本のプログラマーの質が問われるから。

**デフォルトの名無しさん** · 2018/10/31(水) 13:31:11.31

日本のプログラマーの質が問われるから。

だってｗ

**デフォルトの名無しさん** · 2018/10/31(水) 13:32:03.51

"html54200-0.html#anchor001"

と言う文字列の#の前の数字だけ抽出(542000)したいのですが、どのような正規表現を書けばよいのでしょうか？
([0-9]+)(?=#)
ではだめでした。よろしくお願いします。

**682** · 2018/10/31(水) 13:35:03.91

書き忘れましたが、現状ではre.findall[54200、 0]と言うリストを取得したあと、
join()で542000にすることを考えていたのですが、アンカーから後を取得すると狂ってしまうので、
アンカーから後は抽出したくないのです。よろしくお願いします。

**デフォルトの名無しさん** · 2018/10/31(水) 13:40:28.98

正規表現とかいらんだろ

str.lstrip("html")
str[:7]

**デフォルトの名無しさん** · 2018/10/31(水) 13:42:08.67

re.search("(¥d+).*?(?=#)",s).group(1)

**デフォルトの名無しさん** · 2018/10/31(水) 13:43:24.16

ああそこが欲しいのか

str.lstrip("html")
str[:6].strip("-")

**デフォルトの名無しさん** · 2018/10/31(水) 13:43:30.37

>>668
見つからないと言われるファイルはrun/debug configurationのparametersで指定したものです
＞＞working directoryは実行するpyhonスクリプトのディレクトリが勝手に入る
それをスクリプトを実行したい場所に変更してるんですけど

**デフォルトの名無しさん** · 2018/10/31(水) 13:45:53.85

>>682
(^0-9)|#.*　を空文字に置換

**デフォルトの名無しさん** · 2018/10/31(水) 13:51:38.68

>>680-681
2ちゃんや5ちゃんの履歴消すしかないな

**デフォルトの名無しさん** · 2018/10/31(水) 13:53:01.77

レスありがとうございます。
>>684
これ以外にも似たようなファイルがあるので、できるだけ一般化しておきたいのです正規表現を考えました。
>>685
お教えいただいたところ申し訳ないのですが、Noneとでてしまいました。私の設定のどこかがまずかったのかしれませんが。

**デフォルトの名無しさん** · 2018/10/31(水) 13:55:03.93

>>690
¥dの¥はバックスラッシュに直してくれ
[0-9]でもいいよ

**デフォルトの名無しさん** · 2018/10/31(水) 14:00:41.64

検索する文字列にsplit("#")[0]をつけることを思いつきました。
あんまりスマートじゃないかもしれませんがこれで行こうと思います。
皆さんありがとうございました。

**デフォルトの名無しさん** · 2018/10/31(水) 14:03:31.31

>>687
図示してくれるか、何をどうしているのかという全体の構成がわからないと、
何でつまづいているのかがわからない。
parametersにはsys.argvで受け取りたい内容を入れることはわかってるんだよね？

**デフォルトの名無しさん** · 2018/10/31(水) 14:20:03.17

>>693
他人の書いたコードがどう動いてるのか理解するためにデバッグしたいと思っていて、全体の構成はよくわかってないんですけど、それだとデバッグはできないってことなんでしかね？
あるファイルが出力される時点で動いてるコードを見たいと思ってるんですけど

**デフォルトの名無しさん** · 2018/10/31(水) 14:46:51.62

>>694
イマイチわからんけど、
bashでpythonのscriptに何らかの引数を渡して実行したいって事じゃないの？

そうだとすればbashからの引数がscript parmetersの値で、
pycharmでそのスクリプトを開いてデバッグするだけの事だと思うんだけど違うの？

**デフォルトの名無しさん** · 2018/10/31(水) 14:54:31.80

>>695
parameterで渡したはずのファイルがnot found になって困っているんです
で、そのファイルはcontent root 外なので問題なのかなとか思ってるんですけど

**デフォルトの名無しさん** · 2018/10/31(水) 15:00:36.67

python側のデバッグ(動作確認)したいだけなら、
引数にこだわらずにダイレクトにファイル指定してやればいいだけだと思うけど？

**デフォルトの名無しさん** · 2018/10/31(水) 15:27:06.72

いちいち書き換えないといけないんですかね？
せっかくコマンドライン引数で指定できるようになってるのに

**デフォルトの名無しさん** · 2018/10/31(水) 15:29:28.35

>>692
そういう文字列処理はawkとかperlのほうが簡単だよ

**デフォルトの名無しさん** · 2018/10/31(水) 17:36:50.33

def gethtml(url, prm=""):
　r = requests.get(url, params=prm)
　r.encoding = 'CP932'
　return r.text

こんな関数でエンコードがCP932(のはずの)サイトを取得して
日本語は普通に表示されてるんですけど
①とか㎞とかが文字化けしてしまいます。どうすれば文字化けを回避できますか？

**デフォルトの名無しさん** · 2018/10/31(水) 18:12:41.93

NEC特殊文字が化けてるのか
いま確認環境がないからどうにかできるかはわからん

**デフォルトの名無しさん** · 2018/10/31(水) 18:28:43.45

>>> print('①とか㎞とか')
①とか㎞とか

ちゃんと表示される

**デフォルトの名無しさん** · 2018/10/31(水) 18:37:40.87

とりあえず自己解決
対象ページをファイルとして保存した後、codecsで保存したファイルをロードすることで対処できました

**デフォルトの名無しさん** · 2018/10/31(水) 20:12:08.83

epubビューアの開発は順調に進んでるのかな

**デフォルトの名無しさん** · 2018/10/31(水) 20:40:39.13

>>680 >>679
2年間運用（継続中）してます。
所属部署がクラウドに力入れ始めててpython勉強
しとけと言われてやってます。取りあえずスクレイピング
できるようになりたいのでコード漁ってるんですが関数さえ
使用してないように見えてて、おっしゃる通りなんですかね
最終的に何か作れるようになりたいけど、何も思いつかないし
何を目指したらいいのやら

**デフォルトの名無しさん** · 2018/11/01(木) 00:22:16.46

>>682-692
Ruby なら、File.basename の第2引数に、.* を渡せば、. より前の部分を取れる

file_name = File.basename( "html54200-0.html#anchor001", ".*" )
#=> "html54200-0"

>>705
Ruby で、Selenium WebDriver, Nokogiri を使って、
ブラウザで自動ログインしたり、Showroom のアバターを削除したりしてる

他にも、5ch の書き込み内から、画像のURL だけを拾って表示したり、
主に、ブラウザを使った、webサイトの自動テストに使う

その際のPage Object は、典型的なオブジェクト指向による、テスト方法

**デフォルトの名無しさん** · 2018/11/01(木) 04:05:25.76

>>705
まずはDomを理解汁

**デフォルトの名無しさん** · 2018/11/01(木) 10:34:25.18

>>705-707
スレチ