
この記事を読まれている皆様は機械学習の環境構築をどのようにされているでしょうか?
機械学習を行う環境を構築して機械学習の学習を始めようとすると、まずは環境の構築を学ばないといけないため大変ではないでしょうか。
そこで今回の記事では無料でブラウザから使用できる Google Colaboratory について紹介させていただきます。
Google Colaboratory とは
Google Colaboratory は Google が提供するブラウザで Pythonのコードを実行することができます。
必要なのは Googleアカウントのみであり、機械学習に必要な外部ライブラリもインストール済みとなっています。
そのため機械学習を始めてみよう!と考えた瞬間から始めることができます。
無料版の制限
Google Colaboratory の無料版には以下のような制限があります。
しかし入門として初めてみる段階では問題は発生いたしません。
使用できるリソースがGPUなど高価なリソースは制限されている
インスタンスのメモリにも制限がある
インスタンスが起動して12時間立つとリセットされる
事前準備
まずは Googleアカウントにログインした状態で こちら の公式サイトにアクセスします。
すると以下のようにチュートリアルのページが表示されます。

左上のタブの「ファイル」から ドライブの新しいノートブックをクリックすることで、新規にソースコードを記載するページを開くことができます。


[コーディングを開始するか、AI で生成します] と記載されている箇所をクリックし、Pythonのコードを記載し、左側のスタートボタンを押すことによって記載したソースコードを実行することができます。
今回は、取得した文字列を分かち書きと呼ばれる単語の区切りに分割してもらうように実行してみようと思います。
まずは以下のように mecab をインストールする必要があるので、以下を実行してください。

実行が完了すると Successully が表示されます。
対話形式で進めることができて簡単ですね。

続いて、文章をWeb上から文章を取得してみましょう。
Wikipedia の Python のページから文章を取得してみます。
r.text と実行することによって、取得した文章の内容を確認することができます。

最後に取得した文章を
MeCab に渡して分かち書きを実施してもらいます。MeCab.Tagger(“-Owakati”) と設定することによって文章を分かち書きしてくれるようになります。
実際に出力した内容が以下となります。

Wikipediaの記事の文章を分かち書きすることができました。
最後に
今回は機械学習の中でも、データの取得と取得したデータが文章であるため形態素解析の一部として分かち書きを実施するところまでを試してみました。
Google Colaboratory は機械学習以外にもPythonの学習などでも使用できますので、興味のある方は早速触ってみてはいかがでしょうか