Machine Learning for Beginners! MeetUp #3 LT会 に参加してきました!
# 勉強会 # 機械学習
ブログ枠という形で2020/1/18(土)開催の Machine Learning for Beginners! MeetUp #3 LT会 に参加させていただきました!
発信しなくてはと思いつつも、怠けてしまいがちなので強制的にやらされるこういう機会はありがたいです。 やっぱり同じような人たちが頑張っている姿を見ると、モチベーションが上がります。
それでは、イベントの概要の紹介と簡単にですが各LTの内容を記載させていただきます。
内容に間違いや、削除・補足すべき事項などがあれば、お手数ですがコメントもしくはTwitterアカウントへ連絡頂けますと幸いです。
イベント概要
@Yasshieeeeさんが開催している機械学習の初心者向けのLT会です。
- 機械学習・データ支援すのカジュアルなLT場所が少ない。
- 初学者のサポートが出来るよう場が欲しかった。
- どんどん発信出来るように、厳しい意見は禁止!!
というような思いをもとに運営されています。非常に初心者に対して優しいLT会だと思います。 いろいろなLT会あるのいいですよねぇ。
雪になるかも…というような悪天候でしたが、自分を始め多くのAI初学者が集う会となりました!
LTの内容
実際にやってみて分かった機械学習の魅力
Michikataさん(アカウント不明…)
やる前に思っていた機械学習のイメージ
今ある業務が機械学習で一部置き換えられる。めっちゃ効率化!
例)人の仕事を減らせる!!何かと大変な研究者仕事も減らすことが出来そう。
触ってみて思った機械学習について
・機械学習の結果が直感と反するような、人間が考えつかないような新しい発見が生まれる。
・医療×AI、FinTech、スポーツTechなど幅広い分野で使えるから人脈広げやすそう。
・AutoML(DataRobot・MatrixFlow・SkyFoxなど)などの登場により、誰でも簡単に出来るようになることで今まで以上に普及していく可能性が高い。
・パソコンが普及したらそれに伴う仕事が出てきたように、今まで以上に新しい仕事や技術がどんどん普及していくだろう。
Googleが提供するJupyterノートブック環境を比べてみました
Twitterアカウント:@megumi_takahira
資料:https://drive.google.com/file/d/1FM6AjHkvhHEnxRWdheeAq0oXAjsvAd5h/view?usp=sharing
その前に、Jupyterノートブックとは
- OSSなので無料!
- データ分析でよく使う!
- ブラウザで動く、インストールするだけ!
Google Colaboratoryとは
- 無料!!
- クラウド上で動くJupyterノートブックみたいなもの
- 環境構築が不要(ライブラリもインストール済み)!!
- 無料でGPU・TPUが使える
- GoogleDriveで共有できるので、非エンジニアの人への共有もJupyterノートブックに比べて簡単
AI Platform Notebooks
- GoogleColaboratoryとは違って有償
- GCPの中の一機能なので、スケーラブル
- Gitとの統合があるので、CI/CDが回せる。バージョン管理も優れている。
- 当然だが、Colaboratoryのような12時間制限なし
- 権限管理も自由自在(VPCからのアクセスも可能)
まとめ
個人の勉強やお金かけずにサクッと! →Google Colaboratory ※アドホック分析等なら十分使える
商用で使ったり本気で分析やりたい!! →AI Platform Notebooks
音楽仲間がいないのでバンドメンバーを実装した話
Twitterアカウント:@kawazu255_
背景
_人人人人人人人人人人人人人人人人人人人人人人人人_ > 音楽性の違いによってバンド解散した去年!!! <  ̄Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y ̄
なのでGoogleのmagentaで音楽(MIDI)を生成→Python(pygame)で再生
やはり音楽性の違いはよくあることらしいです 笑
Google Magentaって?
- 簡単な設定を行うだけで、音楽を生成してくれるいわゆるAIっぽいサービス。
- バックエンドはTensorFlowで作られている。
- 学習済みモデルもあるので、環境さえ構築できれば簡単に曲を生成出来る。
使い方
コード進行など曲の情報を入れるだけで、いろいろなパターンの音楽を作ってくれる。すごい簡単。
感想
- たまに予想外なものも出来るので楽しい。
- 学習を始めるハードルが圧倒的に下がってきていることを感じる。
- 最初はパラメータチューニングとか数式とかあまりわからなくても、今はライブラリが沢山あるので動かす。 その後で中身を理解するという方法で勉強できるようになってきた。
略)「でも、私の画像データの水増しがしたい」 (略
Twitterアカウント:@ki_rii9
albumentationsを使うと、高品質な画像学習データの水増しが簡単に出来る
- Google Colaboratory上で実装可能なので、お手軽 (gitからインストール必要はある。)
- 雨や雪を降らせるなど、天気を変えることが出来る。
- 影を付ける、太陽の光が強いなど学習に影響が出そうなデータを作ることが出来る。
まどマギを見ないと人生を9割損している()
業務利用前提でのpvmc3 と pystanの比較
Twitterアカウント:@deerto_herajika
概要
教育でのIT活用を推進するシステムを作っているが、業務でベイズ推定を行う必要が発生した。
既存のパッケージでサクッと事後分布を取得したい。
pymc3の特徴
- python3.5.4がきれいに動くが、依存ライブラリの関係で結構バージョン指定が限定的。
- でも書きやすいしデバッグも比較的簡単
pystanの特徴
- 比較的環境構築が楽。
- stan(c++の確率的プログラミング言語)でモデルを定義する必要があるのでそれが大変
- ドキュメントは充実している
使い方
- 書き方の違いはあるが、やりたいことは一緒で基本的な使い方は変わらない。
- 結果についても大きな差は生まれない。
- ともに、r_hatが1.1を下回るのが収束している目安
業務のシチュエーション
- カテゴリーが8個あり、どれに所属するかの確率を推定する。
- 確率なので、そのカテゴリの確率が高い・低いも出すことが出来るのが便利
- データの確からしさもモデルに反映したい
ゲスト講演(2019年と2020年のAI)
Twitterアカウント:@ozaken_AI
登壇した。
2019年の振り返り&2020年には必要なAIの発展について話した!#MLbeginners pic.twitter.com/J8LWNvgNwc— おざけん|AINOW編集長|活用の視点でAIトレンドを発信|カメラマン|AIドル (@ozaken_AI) January 18, 2020
はじめに
- AI業界での広報してる。
- 東京MXでAIをテーマにしたテレビ放送もやる!ちなみにYouTubeチャンネルは解説済み
2019年の振り返り
- BERTの登場による自然言語処理での大きな技術革新あった。 (ただ、モデルが巨大過ぎたり再学習の必要などから現実の問題への適用は模索中。)
- 技術が水平展開していった年で、異常検知ばかりではなく、一次産業への展開も進んでいった。 例)マグロの品質判定を機械学習で行うなど
- やってみたという記事ではなく、〇〇時間削減などのビジネス展開が進んだ
- OCR技術が確率し、市場として形成された
- AIに関しては、扱える人も少ないがプロジェクトも少ない…。 →AI戦略2019が政府から発表。数百万人レベルでAIに強い人を育てていくプロジェクト!
- 無料で機械学習やプログラミングが学習できるような機会がどんどん生まれている(42 TokyoやLAVOT)
AI人材は足りないのか…??
- スキルよりも、プロジェクトマネジメントや現場知識の欠如が問題際立っている状態。
- 一言にAI人材と言っても2パターンの人間に分かれていくと考えられる。 技術特化型…汎用的なモデルを開発する研究者に近いような人材(少数派) 現場特化型…各会社・プロジェクトに特化したモデルを作っていく人材(多数派)
SIer文化の限界がやってきそう
- 現在の日本のAIプロジェクトは、ほとんど外注・受託開発で進められている。
- 2019年はPOCを行うことまでがAI市場になってしまっている現実があった。
- 今後は内部からドメイン知識を持った人がAIプロジェクトをドライブさせる必要あり??
AI導入の一番の課題とは?
データ量とかではなく、「課題がわからない」というのが最重要な課題!! 運用に乗っていたとしても、課題がわかっていない人が多いという恐ろしい現実
2020年はどうなっていく?
- データ基盤をきちんと整えることが重要。
- AIを使わなくてはいいような部分(ルールベースやRPAでOK)は無理に使わない。データ基盤をきちんと整理していくべき。 (実際エクセルレベルでの集計行えばいいじゃんみたいなことは実際のビジネスの現場ではありがち)
- 今の業務にAIを活用していくようなものに比べ、新技術やAIを活用して新たな市場を作り出していくような事が出来れば、経済への波及効果がすごい大きい。
- データ基盤が増えれば、適切かつ効果的なAI活用が進んでいくはず。
以上、駆け足かつ簡単でしたがまとめとなります!
最近足が遠のき気味でしたが、勉強会やもくもく会どんどん参加していきたいなと思う一日でした。