UbuntuにAnacondaをインストールしてPythonとJupyter Notebookを動かすまでの手順

はじめに
機械学習やデータ解析に触れる機会があり、今更ながら今後も必要になりそうなためまずはPythonを実行できる環境を構築しようと思いAnacondaをUbuntuにインストールしました。Anacondaをインストールすることで、PythonとJupyter Notebookの環境を構築できます。ここではその手順をメモします。
環境と前提
ここでは、Vagrant上の仮想マシンのUbuntu18.04にインストールしましたが、Windows Subsystems for Linux(以降、WSL)上のUbuntu18.04でも同様の手順でインストールできました。
- OS:Ubuntu18.04 (Vagrantの仮想マシン)
できるようになること
Pythonの実行環境とJupyter Notebook環境を構築できます。Pythonについては複数の異なるバージョンを動作させることもできます。
Anacondaとは
Anacondaは、機械学習や統計解析などのデータサイエンス向けに必要なパッケージを網羅的に含んだプラットフォームです。Anacondaを使えば、Python本体に加えてデータサイエンス向けのライブラリを簡単にインストールすることができます。以下のサイト様に詳しく紹介されていましたので見てみてください。
近年、科学技術計算で利用するプログラミング言語としてPythonが注目されている。ただ、Pythonを利用する環境を構築しようとすると、Python本体に加えてさまざまなライブラリのインストールが必要となる。その作業の手助けとなるのが「Anaconda」というPythonディストリビューションだ。 科学技術計算で広く使われるようになったPython 世の中に……
Anacondaをインストールする
こちらの公式サイトAnaconda Distributionにアクセスし、少し下にスクロールすると各OS、環境毎にインストーラのダウンロードボタンがあるので各環境にあったものをダウンロードします。ここでは以下のように「Linux」の最新版である「Python 3.7 version」のインストーラをダウンロードします。 なお、「Python 3.7 version」をインストールしたからといってPython 3.7しか使えないという意味ではなく、Anacondaでは複数の仮想環境を構築して各仮想環境で異なるPythonのバージョンを指定可能です。これについては後述します。
なお、今回のようにUbuntuにインストールする場合はwget
コマンド等を使ってターミナルから直接インストーラをダウンロードもできます。
2019年4月時点では、Anaconda3-2019.03-Linux-x86_64.sh
が最新のようです。
インストーラをダウンロードしたら次はbash
コマンドで実行します。
実行すると以下のメッセージが表示されます。
Enterを押すと、利用規約が表示されますので、Enterを押して全てに目を通します。最終的に以下のように同意するか聞かれますので、yesを入力してEnterを押します。
続いてAnacondaのインストール先について聞かれます。デフォルトでは、ユーザのホームディレクトリ直下にインストールされます。(以下では、/home/vagrant/anaconda3
)
デフォルトでよければ何も入力せずにEnterを押します。
別の場所にインストールしたい場合は、[/home/vagrant/anaconda3] >>>
に続けてそのパスを入力してEnterを押します。ここではデフォルトで進めます。
Enterを押すと、以下のようにインストールが始まります。
最終的に以下のようなメッセージが表示されます。以下は、Anacondaを初期化して良いか確認していますので、yesとします。
すると、以下のように表示され、インストールは完了です。
Anacondaを使用できるように.bashrc
を再読込します。
Anacondaでは、conda
というパッケージ管理システムを内包しており、基本的にはconda
コマンドを使用します。
そこで試しにconda
コマンドを使ってバージョンを確認してみると、以下のようにバージョンが表示され正常にインストールが完了していることがわかります。
source
で再読込しないと、以下のようにnot found
が表示されますので注意が必要です。
続いて、Anacondaを使ってPythonをインストールします。
Anacondaの仮想環境を構築する
Anacondaでは、プロジェクト毎に異なるバージョンのPythonをインストールして使用できるよう仮想環境を構築できます。 仮想環境というのはその名の通りで、例えばこのディレクトリではPython3.5を使いたい、一方で違うディレクトリではPython3.6を使いたいなどがある場合に、 作成した仮想環境を切り替えることで同一のパソコン上でも異なるPythonのバージョン、ライブラリを使用できるようになります。 おそらく最初はあまりイメージも湧かないと思うため、実際に以下の手順で仮想環境を構築しPythonをインストールしてみます。まずはじめに以下のコマンドでconda
自体を更新しておきます。
yを入力してEnterを押すと以下のように表示されて更新が完了します。
続いて以下のコマンドで仮想環境を構築します。以下では、my_env
という適当な名前でPython 3.6を使用する仮想環境を構築します。
なお、Please update conda by running
というようなメッセージが表示される場合は、上述したようにconda
を更新してください。
yを入力してEnterを押すと以下のように必要なパッケージのダウンロードとインストールが開始されて仮想環境の構築が完了します。
上記で仮想環境の構築が完了です。仮想環境を構築したら次はその仮想環境を有効化(activate
)します。
上記メッセージにも表示されているように、仮想環境を有効化するには以下のようにactivate
コマンドを実行します。
仮想環境を有効化すると、以下のようにターミナルの先頭に仮想環境名が表示されます。
(base)
は仮想環境が有効化されていない状態です。
仮想環境を有効化した状態でPythonのバージョンを確認してみると、以下のように指定したとおりPython3.6がインストールされていることを確認できます。
仮想環境を解除する場合は、以下のようにdeactivate
を使用します。
仮想環境を解除した状態でPythonのバージョンを確認してみると、システムそのものにインストールしたPythonのバージョンが表示されます。
ちなみに、info
コマンドで作成済の仮想環境一覧を確認することができます。
以上で仮想環境の構築とPythonのインストールは完了です。
Jupyter Notebookをインストールし起動する
最後にJupyter Notebookをインストールして起動してみます。 仮想環境を有効化した状態で以下でJupyter Notebookをインストールします。 ```bash (my_env) vagrant@ubuntu-bionic:~$ conda install jupytersh_bash ```色々とダウンロードされてインストールされます。
メモ
condaとpipについて
パッケージのインストールに別のパッケージ管理システムであるpip
を使用することもできます。
ただし、conda
とpip
の両方を混ぜて使うのは避けるよう公式サイトにも書かれています。
理由としては、これらは互換性がないため、意図せずに環境を破壊してしまう可能性があるそうです。
例えば、conda
でインストールしたパッケージをpip
が上書き、削除してしまうなどです。
したがって、基本的にはconda
を使ってパッケージをインストールするようにし、もしconda
が提供していないパッケージをインストールしたい場合にのみpip
を使用するよう書かれています。英語になりますがさらに詳細な内容が公式サイトに書かれていますので、必要な方は見てみてください。
今回私は仮想マシン上に構築する環境のため、最悪壊れても良い前提で進めています。
以下のコマンドを実行することでJupyter Notebookを起動します。
上記では、WSLで動いているJupyter NotebookにWindowsからアクセスする場合、Vagrant上の仮想マシンで動いているJupyter Notebookに実マシンからアクセスする場合など、
Jupyter Notebookを動かすマシンとJupyter Notebookにアクセスするマシンが異なるために--no-browser
を指定してブラウザが起動しないようにしています。
もしJupyter Notebookを動かすマシンとJupyter Notebookにアクセスするマシンが同じであれば不要です。
起動してみると上記のようにtoken=f70056d3d0973654afe08f422dee6e12e26414xx13k4l13k41
という記載があり、このトークンを使用します。
Jupyter Notebookを起動したら次はブラウザから以下のアドレスでJupyter Notebookにアクセスします。
localhost
にあたる部分は、Vagrantの仮想マシンであればデフォルトではおそらく192.168.33.10
になっているかと思います。各自のJupyter Notebookを動かしているサーバのIPアドレスを指定します。
アクセスすると以下のような画面が表示されます。
この画面で、先程のトークンを入力してLog in
をクリックします。
ログインすると、以下のようにJupyter Notebookを起動したディレクトリが表示され、ここで作業することができます。
なお、Jupyter Notebookがインストールされていない状態で起動しようとすると以下のようなエラーが表示されます。
まとめ
Anacondaを使用することで簡単にPython環境とデータサイエンスに必要な環境を構築することができました。Windows自体にインストールもできますが、個人的にはWindows Subsystem Linux上のUbuntu等にインストールしてしまうのが大変楽な印象でした。関連記事
- 公開日:2019/06/03 更新日:2019/06/03
自然言語処理ライブラリのGiNZAを使って係り受け解析を試す
自然言語処理ライブラリのGiNZAを使って係り受け解析を行ってみたのでその手順をまとめます。指定した文章の係り受け木を作成して、単語間の修飾関係を可視化してみます。また、条件に合致する文章の検索、名詞節の抽出も行います。
- 公開日:2019/05/30 更新日:2019/05/30
News APIへの登録とPythonでニュースを取得するまでの手順
News APIは、いくつかのニュースサイトからトップニュースや条件指定して合致したニュースをJSON形式で取得できるAPIです。2019年5月時点では30,000ほどのニュースサイト等のソースに対応しています。この記事では、実際にNews APIを使用してニュースを取得するまでの手順をまとめます。
- 公開日:2019/04/16 更新日:2019/04/16
MeCabをインストールしてPythonで動作させるまでの手順
日本語による文章を解析してみたいと思い、色々調べたところMeCabという形態素解析エンジンがあることを知りました。自然言語処理自体に全く縁がありませんでしたが、手始めとしてMeCabをインストールして実際に動作させたのでその手順をメモします。
- 公開日:2016/03/13 更新日:2016/03/13
vagrant上のUbuntuでTensor Flowを動かすまでの手順
Tensor FlowはGoogleが2015年11月にオープンソース化して公開した機械学習ライブラリです。少し興味を持ったのでまずはTensor Flowを動かすための環境として、vagrant上のubuntuにインストールして動作させてみました。その手順をメモします。
開発アプリ
