最近、Pythonコードが夢に出てくるヒラノです。
ようやくPythonでのスクレイピングができました。
初心者でも環境構築さえできればあとはなんとかなるかも!?と思った瞬間です。
とりあえず、初回はCloud9の環境を使って本で写経しながらのスクレイピング。
私の環境はこんな感じ。
- Cloud9
- Python 3.6.5
- pip 9.0.3
- BeautifulSoup 4
Cloud9を使ったPythonの環境構築で散々つまずいたので、初心者の方のためにメモとして残しておこうと思いました。
しかし、なぜか何度アップデートやら変更をしてもPython2がPython3にできない。
苦労の末にPython3が標準で動くようになったものの、今度はスクレイピングに必要なライブラリであるBeautifulSoupがインポートできずエラー、、、
その後いろいろと調べてもできず、こちらの記事を参考にさせていただき、ようやくスクレイピングできる環境ができました。
ありがてえ、、ありがてえっっ、、、、!
先人の知恵をお借りして、さらなるパワーアップができました。※ちなみに後日、どういうわけか環境がまたPython2に戻っていたので苦戦中。
実際にスクレイピングで動かすコードはこちらの本のサンプルを参考にしました。
Pythonによるスクレイピング&機械学習 開発テクニック BeautifulSoup,scikit-learn,TensorFlowを使ってみよう
posted with ヨメレバ
クジラ飛行机 ソシム 2016-12-06
この本、初心者にもかな〜りわかりやすく書かれています。
バージョンをPython2系からPython3系にして、スクレイピングな必要なライブラリさえちゃんとインストールできればコード自体の理解は早いと思います。
私はPythonの基礎をPyQで大体学習済みなので、オール手書き写経でエラー対応がぼちぼち出来てきた印象。
Pythonの基礎学習時間は減った
実践的な事に手を出し始め、それに伴いPyQの学習時間が減ってきました。
まあでも問題はありません。なぜなら、プログラミングの学習は、作りたい物がまずあって、その分野をまず進めていくのが一番のスキルアップになるかなーと思っているからです。
これまでPyQの学習時間が自分のモチベーションのものさしだったので、深夜にチキンラーメン食べちゃったわ〜程度のちょっとした罪悪感はあります。
が、それでも本格的な基礎学習はしばらくお休みにします。
PyQはたまにのぞいて使いたいコードの技術参考にするという感じで、今は作りたい物に没頭することにしました。
いずれ中級以上の理解が必要になったらまた再開します。
コードは応用できないと意味がないですからね!ここ大事!まずはアクセス過多禁止等のルールを守りつつ、いろんなサイトをスクレイピングしていこうと考えてます。
また、スクレイピングしたデータはデータベースとして使いたいので、並行してMySQLの学習を少しずつ進めて行く予定です。
というか、Linuxの基礎ももうちょいわからないとダメな気がしてきてる。。
Pythonだけやるつもりが、やりたい事がどんどん増えてしまって必要なスキルまみれになってきました笑。
ま、楽しみながらぼちぼちやってきます。
おっさんのPython初学者ですが、Pythonトークしてくれる方は気軽にご連絡下さい〜。