SSブログ

Pythonによるデータ分析入門 [読書]

Pythonによるデータ分析入門 ―NumPy、pandasを使ったデータ処理読了
以前に買ったときに、一通り読んだはずだがさっぱり覚えてない。
今回、 (第47回)Python mini Hack-a-thon
http://pyhack.connpass.com/event/8554/
で、もう一度読み直し。
やっぱり、こういうのは、読みながらやってみないと全然だめだと実感した。

内容的には、データ分析入門というより、pandas, matplotlib, numpy の使い方入門という感じで統計解析に関する数学的知識はまったく必要なかった。データ解析なんて関係ないという人もでも Excel で集計してグラフにしてるような仕事の人は読んでみると使いどころあるかも。

手元の Ubuntu 14.04 に ipython は apt-getで。numpy, scipy, matplotlib は
pip でインストールした。
pip でインストールするもののために apt-get install したライブラリはいろいろ
あったが、メモってない。メモっておけばよかった。
scipy をインストールするために Fortran をインストールする必要があったが、
結局、この本で scipy の解説はなかった。
Ubuntu は Server 版で GUI を持ってなかったが、 ipython notebook で動かして
ブラウザでアクセスすれば特に困ることなかった。
ipython notebook すごい


書籍の説明例のデータの GitHub リポジトリがあるので
https://github.com/pydata/pydata-book
それを clone してブランチを作成して実行した iPython Notebook のファイルを作った
https://github.com/nakagami/pydata-book/tree/pyhack

- pyhack47.ipynb 昨日本を読みながら書いた。基本的な使い方。
- corr.ipynb 今日書いた、相関関数に関するもの。

iPython Notebookの--pylab Inlineは使うのをやめようという話
http://yagays.github.io/blog/2014/08/15/ipython-notebook-matplotlib-inline/
というのを読んだので、書籍中では

ipython notebook --pylab=inline
を実行していたが
ipython notebook --matplotlib=inline
で動くように書き直した

(2014-10-18追記)CentOS6 でインストールする記事発見
http://memo.yomukaku.net/entries/jbRkQkq
コメント(0)  トラックバック(0) 
共通テーマ:日記・雑感

コメント 0

コメントを書く

お名前:
URL:
コメント:
画像認証:
下の画像に表示されている文字を入力してください。

※ブログオーナーが承認したコメントのみ表示されます。

Facebook コメント

トラックバック 0