GraphLab Create

Courseraで新たに機械学習のコースを受講することにしました。
「Machine Learning Foundations: A Case Study Approach」

このコースではPythonを使ってプログラムするようです。
最初の授業ではiPythonとiPython Notebook, そしてGraphLab Createをインストールするように
求められます。

どれもよーわからんですが、
とりあえずiPythonとiPython Notebookはすでにインストールされているようです。
Anacondaちゃんやりよるわ。

んで、GraphLab Createをインストールするんですが
まずはGraphLab Createってなんぞ?ということで
ユーザーズガイドの説明を抜粋してみます。
GraphLab Create is a Python package that allows programmers to perform end-to-end large-scale data analysis and data product development.

Data ingestion and cleaning with SFrames. SFrame is an efficient disk-based tabular data structure that is not limited by RAM. This lets you scale your analysis and data processing to handle terabytes of data, even on your laptop.

Data exploration and visualization with GraphLab Canvas. GraphLab Canvas is a browser-based interactive GUI that allows you to explore tabular data, summary plots and statistics.

Network analysis with SGraph. SGraph is a disk-based graph data structure that stores vertices and edges in SFrames.

Predictive model development with machine learning toolkits. GraphLab Create includes several toolkits for quick prototyping with fast, scalable algorithms.

Production automation with data pipelines. Data pipelines allow you to assemble reusable code tasks into jobs and automatically run them on common execution environments (e.g. Amazon Web Services, Hadoop).
というわけで、どうやら大規模なデータを解析するためのパッケージみたいですね。
なにやら便利そうです。

インストールにはregistrationが必要です。まずはメールアドレスやならにやらをここで登録して
ダウンロードサイトに飛びます。
これまでにまったくPythonを導入していない方はインストーラーでまるっとインストールするのがいいようです。
ぼくはすでにAnacondaでPythonを導入しているので、GraphLab CreateもAnacondaで導入します。

まずはせっかくなので新しい環境を作成します(オプション)
GraphLab CreateはPython2.7でしか動作しないようなので
>>conda create -n murinus python=2.7
>>activate murinus

つぎにpipのバージョンアップもしときます(オプション)
>>conda update pip

いよいよGraphLab Createの導入
>>pip install --upgrade --no-cache-dir https://get.dato.com/GraphLab-Create/1.6/emailaddress/keycode/filenames
emailaddressは登録したメールアドレス
keycodeは登録時に発行されるコード
filenameはダウンロードするファイルの名前です。
適宜、ご自身の環境に合わせてください。

さいごに、ipythonとipython notebookもバージョンアップしといたほうがいいよって言われるので
従います
>>conda update ipython ipython-notebook
ここでわが忠実なるPython犬から
「この環境にはipythonとipython notebookは導入されていません。ご主人様」
と指摘される。

仕方がないので、defaultの環境(root)に再度GraphLab Createを導入しました。
インストールの最中にDeprecation warningが出てきたんですが、
最終的にSuccessfully installedと表示されたのでよしとしときます。







コメント

このブログの人気の投稿

TightVNCでリモートデスクトップ

firefoxからmidoriちゃんにのりかえ

2016.09.30 Psychopy 日本語改行できない問題