Se ha denunciado esta presentación.
Utilizamos tu perfil de LinkedIn y tus datos de actividad para personalizar los anuncios y mostrarte publicidad más relevante. Puedes cambiar tus preferencias de publicidad en cualquier momento.

不動産価格査定におけるヘドニックアプローチからディープラーニングへの進化の軌跡

1.122 visualizaciones

Publicado el

人工知能時代に備えて不動産関連データについて色々語らう勉強会 資料

Publicado en: Tecnología
  • Sé el primero en comentar

不動産価格査定におけるヘドニックアプローチからディープラーニングへの進化の軌跡

  1. 1. 不動産価格査定における ヘドニックアプローチから ディープラーニングへの 進化の軌跡
  2. 2. 自己紹介 • 濵田 雄斗(はまだ ゆうと) • 職歴 • イタンジ インターン • イタンジ 就職 • 職業 • データサイエンティスト • エンジニア • 気になる • AIチャット
  3. 3. ITANDIの目指す道 ITANDIとは 不動産の在り方を変えてく 不動産は“動かないモノ”であるがゆえに、取引コスト、情報の偏在、需給の不一致など 摩擦が生じやすい。 我々は不動産(業)のデジタル化を推し進めることで、固定的で硬 直的な不動産のあり方を覆し、すべての人がすべての不動産に自由にアクセスできる 世界を実現する。 不動産取引をなめらかにする 我々はテクノロジーによって不動産業務の分業化、細分化、自動化を推し進め、不動産 取引を滑らかにする。 不動産の価値は使用と交換によって生まれる。世界中の人々が 必用なときに、必用な単位で使用・交換できるようにすることで、不動産の使用価値と 資産価値は最大化する。 人間とテクノロジーの融合 我々は技術を創造し、活用し、世界へ価値を提供する事を生業としている。我々はテク ノロジストであり、アントレプレナーであり、マーケッターである。最高の技術を身につけ、 最高の製品を創りあげ、最高の価値を提供しよう。
  4. 4. VALUE 価格算定機能を持ったAI  過去20年分25万件に及ぶ 区分所有マンションの成約 事例を解析  500名の個人投資家が利用 (2016年6月時点)  価格算出の精度は96%程 度  賃料算出と10年後の再販価 格も予測  DCFとIRRによって投資価値 を判定
  5. 5. 2つのアプローチ ヘドニックアプローチ DeepLearning
  6. 6. ヘドニックアプローチ ヘドニック法は環境条件の違いが どのように地価の違いに 反映されているかを観察し それをもとに環境の価値の計測を 行う手法である。 国土交通政策研究所
  7. 7. ヘドニックアプローチ 「坪単価」 = 2155724 + -18390.59 × 「駅徒歩」 + -15901.88 × 「部屋数」 + 72.31378 × 「管理費」 + -32.82219 × 「修繕費」 + -73772.4 × 「構造」 + 4556.246 × 「所在階」 + 30122.13 × 「総階数」 + -31798.67 × 「築年月」 + 32975.37 × 「バルコニー」 + 0.3641633 × 「駅毎平均坪単価」 + 80394.72 × 「土地権利」 + 323917.2 × 「シリーズ物」 + -54608.89 × 「タワーマンション」 係数 ✕ 変数 ※ダミー変数:数字でないデータを数字変換する。
  8. 8. データ • 使用データ • 約1ヶ月の募集データ(約1万5000件) • クローリング • 路線ごと、平米ごとで分割(120以上に分類) • Ex)山手線の30㎡以下、山手線の30㎡以上50㎡以下 • 理由:精度を上げるため • 物件の条件のみを使用し、経済指標は使用せず • 目的変数 • 販売物件の募集坪単価 • 販売物件の予測月額賃料
  9. 9. データの整形 Ruby でごりごり。。。
  10. 10. モデルの作成 Rでまわす (無理やりRailsで) rrx
  11. 11. 予測 係数をmysqlに保存して、Rails内で計算
  12. 12. 精度 R2 平均0.6
  13. 13. この時の課題 • 精度が低すぎる • 少ないデータ数 • 100以上のモデルのメンテ工数 • 少ない変数
  14. 14. 少ない変数 実業務・実購入の知見がない →眼前のデータからしか変数を作れない 物件を購入する人は何を考えているのか? →弊社代表伊藤の知見
  15. 15. 解決策 • 精度が低すぎる • 少ないデータ数 • 100以上のモデ ルのメンテ工数 • 少ない変数 ? クローリング プロの教え
  16. 16. 新技術(2015年5月当時) Deep Learning chainerまだなかった
  17. 17. H2O Java scala python可能 GUI完備 Sparkの分散処理で 高速化 まだGPUとかそこまで盛り上がっ てなかった
  18. 18. データ -クローリングの結果- • データ数は25万件に増加 • モデルは4つまで減少 モデル数 データ数 4月 6月 1 30 25倍
  19. 19. データ • 使用データ • 過去25年の成約データ(約25万件) • 平米ごとで分割(4つに分割) • 物件の条件と、経済指標を使用 • 金利、空室率、病床数、etc • 目的変数 • 販売物件の成約坪単価 • 販売物件の予測月額賃料
  20. 20. データのクリーニング Rails内で自動化
  21. 21. モデルの作成 (GUIでも可能)
  22. 22. モデルの作成 (scalaでCUI化)
  23. 23. 予測 Railsからコンパイルしたjavaバイナリを実行
  24. 24. 精度 R2 平均0.9
  25. 25. Deep Leaningの課題 • モデルの作成時間 – スポットインスタンスの活用 • ブラックボックス – ヘドニックのような 各変数に対しての説明が不可
  26. 26. まとめ -アルゴリズム- ヘドニックアプローチ Deep Learning メ リ ッ ト • 変数の影響力が明確 • DLほどデータ数が必要で はない • 精度が出る • 変数選定の工数低 デ メ リ ッ ト • 変数選定の工数高 • やりきれば精度出る • 変数の影響力が不明 • 膨大なデータ数が必要
  27. 27. まとめ -データまわり- データだけではわからない必要変数の存在 →実際に購入する、値段を付ける場合に人は何を 見ているか R2が高い ≠ 精度が高い
  28. 28. ご清聴 ありがとうございました

×