Google Colaboratoryの使い方 - Google Drive内のファイル基本的な扱い方

Google Colaboratoryの使い方 - Google Drive内のファイル基本的な扱い方


この記事では、Pythonでデータ分析・機械学習を学ぶ際に使う神ツールと名高い「Google Colaboratory」の扱い方を紹介します!

地味に初学者や初めて触れた人にとってハードルが高そうな部分である。分析・学習用のデータを読み込む方法のまとめとなります。

Google Colabratoryとは

言わずとしれた、Googleが提供しているデータ分析や機械学習を個人・小さいチーム等で行う人たちに向けたツールです。

Googleアカウントさえ作れば、ブラウザからアクセスするだけで、

  • データ分析や機械学習や良い性能のPCの準備
  • 面倒で挫折しやすいPythonやライブラリのインストール等の環境構築

等を行うことなくPythonを書きデータの分析等を始める事が出来る素晴らしいツールです。

なぜこのような事が出来るかというと、簡単にいうとGoogleが保有しているPythonの実行環境を一時的に貸してもらい、そこで自分のコードを動かすようイメージです。

そこで若干ネックになるのがGoogleのPython実行環境から、どうやって自分が扱いたいファイルを読み込めるようにするかです。 (残念ながらひと手間かけないと、自分のローカルファイルやGoogleDriveのファイルを連携することは出来ません。)

Google Driveからの連携方法

コードを書く方法

現実的に一番便利なのは、Google Driveからのファイルの連携になるかと思います。

Google Driveは容量制限などはあるものの、一度コードを書いてしまえばColablatoryからGoogle Drive上のファイルを普通に読み込むことが出来るようになるため、個人的にはこの方法がおすすめです。

このコードをセルに貼り付けで実行すると、

import google.colab.drive
google.colab.drive.mount('gdrive')

「Go to this URL in a browser: https://accounts.google.com/o/oauth2/auth?client\_id=xxxxxx」というような実行結果が表示されるので、そのURLへアクセスします。

画面のとおりにすすめると、認証コードが出てくるので、そのコードを入力してしばらく待つと、マウントが完了します。 これを行うだけで、後は自由にGoogle Drive上のファイルを読み込むことが出来るようになります!

(毎回手動でファイルをアップロードする事もできますが、12時間毎にそれをしなければいけなかったりするので中々に面倒です。)

画面から設定する方法

なんかめっちゃ便利に出来るようになってました。

「ドライブ」をマウント、を押して画面通りにすすめていけば完成です。すっげぇ楽や…。

パスの指定方法

「/content/drive/My Drive」の配下にデータが格納されていますので、特別なことはなくこのパスを起点として指定しれ上げるだけでOKです。

MyとDriveの間に半角スペースが入っているので、その点だけは要注意です。

Linuxコマンドの扱い方

パスを指定する際はダブルクォーテーションで囲う

半角スペースが入っているパスを指定する際は、Linuxコマンドには若干気を使う必要があります。

といってもダブルクォーテーションで囲って上げるだけなので、複雑なことをする必要はないのですが、知らないと詰まりがちな部分なので…。

Linuxコマンドの基礎を学ぶ際におすすめの本を紹介しているので、良かったら見てみてください。

zipファイルを回答する際の例

!unzip "/content/gdrive/My Drive/data.zip" -d /content/data/

※「!」を先頭に付けることで、Linuxコマンドを実行することが出来ます。便利。

私もまだまだ勉強中ですが、Google Colablatoryと仲良くなってデータ分析や機械学習どんどんやっていきましょう!!