Se ha denunciado esta presentación.
Utilizamos tu perfil de LinkedIn y tus datos de actividad para personalizar los anuncios y mostrarte publicidad más relevante. Puedes cambiar tus preferencias de publicidad en cualquier momento.

機械学習を始める前の「学習」

1.384 visualizaciones

Publicado el

社内勉強会で機械学習の基礎的なテーマに話しました。
機械学習の概要、その分類、流れ、実践のためのツール、学習コンテンツなどを紹介しました。

Publicado en: Tecnología
  • Sé el primero en comentar

機械学習を始める前の「学習」

  1. 1. 機械学習を始める前の「学習」 クラウドインテグレーション部 技術4課 多田 貞剛
  2. 2. - 自己紹介 - 多田 貞剛(ただ さだよし) - 3年目 - 昨年から機械学習のことを勉強し はじめた - 数学は中2で挫折した orz けど頑 張りたい!
  3. 3. 前提 ‣ 今回扱わない内容 ‣ 数式,統計 ‣ 論文の紹介 ‣ 機械学習のフレームワークの使い方 ‣ ビジネス観点での機械学習の活用方法 3
  4. 4. 今回目指したいゴール 用語や技術や手段がわからない 機械学習がどんなものかわからない 機械学習の流れがわからない 機械学習の実践方法がわからない ワタシ、スコシワカル 4 ワタシ、スコシML開発ヤリタイ
  5. 5. 目次 1.機械学習って何ぞや 2.機械学習の分類 3.機械学習の流れ 4.機械学習の実践 5.勉強コンテンツの紹介 6.まとめ 5
  6. 6. 機械学習ってなんぞや 6
  7. 7. 機械学習ってなんぞや ‣人間の学習能力と同様の機能をコンピュータで 実現するための技術や手法を指す 7 入力 出力 コンピュータが 自動で解析
  8. 8. 8 ‣ 例1:スパムメール ‣ 例2:レコメンド
  9. 9. 機械学習の分野別利用事例 ‣時系列系 ‣画像/映像系 ‣音声/音楽系 ‣文章/言語系 9
  10. 10. 時系列系 ‣過去の情報から未来を予測する領域 ‣株価の予測 ‣商品の販売予測 10
  11. 11. 画像/映像系 ‣画像、映像に映っているものを認識する領域 ‣自動運転の物体検出 ‣Google の AI 実験「Move Mirror」 ‣https://experiments.withgoogle.com/collec tion/ai/move-mirror/view 11
  12. 12. 音声/音楽系 ‣音の波形や譜面を学習し、音を生成する領域 ‣ 譜面のデータを学習し、即興演奏のフレー ズを出す、「A.I.Duet」 ‣https://experiments.withgoogle.com/ai/ai- duet/view/ 12
  13. 13. 文章/言語系 ‣テキストの分類、要約、翻訳、対話、知識抽出 を行う領域 ‣ 文章の分類からニュースのカテゴリを自動 分類する ‣ Microsoft の LINE bot 「りんな」 13
  14. 14. ディープラーニングとの違いは ? ‣ ディープラーニングは機械学習の一部 ‣脳内部にあるニューロンの働きをコンピュ ーターで模倣したもの 人工知能(AI) 機械学習 深層学習 14
  15. 15. Tensorflow Playground ‣ノンプログラミングでディープラーニングを体 感できるツール ‣https://hinaser.github.io/Machine- Learning/raw/learntensorflowplayground/inde x.html 15
  16. 16. 機械学習の分類 16
  17. 17. 機械学習の分類 ‣ 教師あり学習(Supervised Learning) ‣ 教師なし学習(Unsupervised Learning) ‣ 強化学習(Reinforcement Learning) 17
  18. 18. 教師あり学習 ‣コンピュータに入力と期待される出力(正解)の情報を教 えるモデル ‣例えば、スパムメールの分類、株価の予測等 ‣ 教師あり学習では、学習用のデータと正解のラベル のペアを提供してモデルを作る 18
  19. 19. 教師あり学習のイメージ 19 (ラベル)(データ) これは馬! データセット(学習データ)
  20. 20. 教師なし学習 ‣学習の過程でコンピュータに「正解」の情報を与えず 、データの中から何らかの構造や法則を見つけるモデ ル ‣ 例えば、商品購入のレコメンドやマーケティングの ターゲットマーケティング等 ‣教師なし学習では、学習データにラベルをつけない 20
  21. 21. 教師なし学習のイメージ 21
  22. 22. 強化学習 ‣ エージェント(プログラム)の行動が良い結果をもたらしたか 、悪い結果をもたらしたかという報酬(リワード)を最も多く 得られる行動を試行錯誤しながらコンピュータ自らが学習、 評価していくモデル 22
  23. 23. 自動走行技術を例にした場合 23 試行n回目 ブレーキを踏まず、障害物にぶつかった 試行錯誤の結果、障害物の前でブレーキを踏む 試行1回目
  24. 24. 機械学習の流れ 24
  25. 25. ①データセッ トを準備 ②データセッ トを前処理 ③学習モデル を訓練する ④学習モデル を 評価する 25 機械学習の大まかな流れ
  26. 26. データセットを準備 ‣機械学習で扱うデータセットを収集する工程 ‣機械学習のモデルを形成するには大量のデータが必 要なので、形成したいモデルに応じてデータ収集を 徹底しておく 26
  27. 27. データセットを前処理 ‣ 対象データを整形・加工等して機械学習で扱えるよう にする工程 ‣ 例えば、テキストファイルならば、単語を分割した り、低頻度の単語を除去するなどの調整を行う 27
  28. 28. 学習モデルを訓練する ‣実際に機械学習のモデルを作る工程 ‣前処理したデータを使って、精度の高いモデルを試 行錯誤して作っていく 28
  29. 29. 学習モデルを評価する ‣作成した学習モデルの精度を評価する工程 ‣解決した問題に対する結果が得られるかをモデルを 使って判断する ‣ここでいう「精度」はあらゆる問題に対して一定量 の結果が得られるようにならないといけない ‣特定の問題にのみ適用できるような汎用性のない モデルは適用できない 29
  30. 30. 機械学習を行う前に確認! ‣機械学習を選択する前に、「本当に機械学習を行うべ きか」を考慮する ‣課題が曖昧なまま ‣ex) ECサイトの有料会員を増やしたい、いい感じ にML使いたい ‣機械学習を使わなくても良いなら無理に使わない 30
  31. 31. 機械学習の実践 31
  32. 32. 機械学習の環境に必要なもの 32 ‣Python ‣Jupyter Notebook(データ分析ツール) ‣Numpy(数値計算ライブラリ) ‣scikit-learn(機械学習ライブラリ) ‣matplotlib(グラフ描画ライブラリ) ‣pandas(データ解析ライブラリ)
  33. 33. Jupyter Notebook ‣ウェブブラウザで動作する、データ分析用ツー ル ‣プログラミングのみならずMarkdown にも対 応しているためドキュメント作成にも使える 33
  34. 34. 手早く環境を整えよう 34 ‣ローカル開発なら Anaconda ‣ブラウザ上で開発なら Google Colaboratory ‣ AWSなら Amazon SageMaker
  35. 35. Anaconda ‣ Python 本体に加え、科学技術、数学、データ 分析などのパッケージを一括インストールした もの ‣ 利用料は無料 ‣ Windows/Mac いずれも利用可能 URL : https://www.anaconda.com/ 35
  36. 36. 実際の画面
  37. 37. Google Colaboratory ‣ ブラウザ上で実行される Jupyter Notebook 環 境 ‣ Google の研究プロジェクトの1つ ‣ 利用料は無料で、GPU 環境も使える ‣ 利用には、Google アカウントが必要になる URL : https://colab.research.google.com/ 37
  38. 38. 38 実際の画面
  39. 39. 39 実際の画面
  40. 40. Amazon SageMaker ‣AWS の 機械学習フルマネージドサービス ‣マネージドのJupyter Notebook環境(ノートブッ クインスタンス)が提供されている ‣機械学習モデルの訓練からデプロイまで一気通 貫で利用できる 40
  41. 41. 41 実際の画面
  42. 42. 42 実際の画面
  43. 43. 勉強コンテンツの紹介 43
  44. 44. 日本語で学べるコンテンツ ‣東大 松尾教授の公開講座 ‣ ディープラーニング講座 ‣ データサイエンス養成講座 ‣Coursera の Machine Learning Course ‣ 無料で受講できる ‣ 日本語字幕がある 44
  45. 45. 実践的に学ぶためのコンテンツ ‣ Kaggle ‣ グローバルなデータ分析コンペ。課題に対 して精度の高いモデルを提供すると賞金を もらえる。 ‣ SIGNATE ‣ 日本発のデータ分析コンペ。日本語で日本 企業のデータセットで課題設定されるから 取り組みやすい。 45
  46. 46. まとめ 46
  47. 47. ‣ 機械学習の概要、分類について ‣ 機械学習を行なうための流れを紹介 ‣ 実践のための環境や、学習コンテンツを紹介 47 まとめ
  48. 48. Let’s Enjoy ML Life! 48

×