Pythonによるデータ分析入門 [読書]

以前に買ったときに、一通り読んだはずだがさっぱり覚えてない。
今回、 (第47回)Python mini Hack-a-thon
http://pyhack.connpass.com/event/8554/
で、もう一度読み直し。
やっぱり、こういうのは、読みながらやってみないと全然だめだと実感した。
内容的には、データ分析入門というより、pandas, matplotlib, numpy の使い方入門という感じで統計解析に関する数学的知識はまったく必要なかった。データ解析なんて関係ないという人もでも Excel で集計してグラフにしてるような仕事の人は読んでみると使いどころあるかも。
手元の Ubuntu 14.04 に ipython は apt-getで。numpy, scipy, matplotlib は
pip でインストールした。
pip でインストールするもののために apt-get install したライブラリはいろいろ
あったが、メモってない。メモっておけばよかった。
scipy をインストールするために Fortran をインストールする必要があったが、
結局、この本で scipy の解説はなかった。
Ubuntu は Server 版で GUI を持ってなかったが、 ipython notebook で動かして
ブラウザでアクセスすれば特に困ることなかった。
ipython notebook すごい
書籍の説明例のデータの GitHub リポジトリがあるので
https://github.com/pydata/pydata-book
それを clone してブランチを作成して実行した iPython Notebook のファイルを作った
https://github.com/nakagami/pydata-book/tree/pyhack
- pyhack47.ipynb 昨日本を読みながら書いた。基本的な使い方。
- corr.ipynb 今日書いた、相関関数に関するもの。
iPython Notebookの--pylab Inlineは使うのをやめようという話
http://yagays.github.io/blog/2014/08/15/ipython-notebook-matplotlib-inline/
というのを読んだので、書籍中では
ipython notebook --pylab=inline
を実行していたが
ipython notebook --matplotlib=inline
で動くように書き直した
(2014-10-18追記)CentOS6 でインストールする記事発見
http://memo.yomukaku.net/entries/jbRkQkq
コメント 0