SlideShare una empresa de Scribd logo
1 de 20
Descargar para leer sin conexión
PyData.Okinawa #29 LT
2017/09/23(土)
15:00:00 晴
アイパー隊長
自己紹介
沖縄県うるま市の平安座島に住んでいます
ちゅらデータ株式会社(メイン言語Python)
会社できました!
オフィスも契約(冷房無い(´;ω;`)ウッ…
数学勉強中
祭りがあります!
話すこと
vs Google Vision API
vs Google Vision API
Google Vision APIとは?
使い方
精度向上との戦い(どんなして精度あげるの?
Google Vision APIとは?
Google Cloud Platformで用意されているAPIのひ
とつ
機能が色々ある(ラベル検出、ロゴ検出、顔検
出、OCR...etc)
でもお高いんでしょう...?
1 ~ 1000 ユニット/月-> 無料!!
1,001~500万ユニット/月-> (リクエスト数/
1,000) × $3.50
今回触ったのはtext detection (OCR)
使い方.1
api_url = 'Vision API URL'
access_key = 'Access key'
img = open('画像ファイルパス', 'rb').read()
content = base64.b64encode(img).decode('utf8')
url = '%s?key=%s' % , (api_url, access_key))
res = json.dumps({
'requests': [{
'image': {
'content': content
},
'features': [{
'type': 'TEXT_DETECTION',
'maxResults': 2
}]
}]
})
res = requests.post(url, res)
return res.json()
使い方.2
リクエストする画像はbase64に変換するか、
Google Cloud Storageへアップしてそのurlを渡す
features を複数指定することも可能
OCRと同時に顔検出することもできる
maxResults というパラメータは謎
検出数が多くなるらしいが変更してもそんなか
わらん(気がする
画像のサイズとかは? -> ベストプラクティス
返ってくるデータは検出位置とテキスト
[左上(x, y), 右上(x, y), 右下(x, y), 左下(x, y)]
使い方.3
精度向上との戦い.1
はじめのころ-> これはすごい!!
実際開発に組み込むと-> 文字を認識してくれない
ケースがでてきた...
どうすべ?(´・ω・`)
色々試してみた
グレースケール
精度上がらない(´・ω・`)
二値化
ちょっとだけあがった!
幾何学変換+ グレースケール
さがった(´・ω・`)
幾何学変換+ 二値化
あがった!(`・ω・´)
幾何学変換+ 二値化-> 平滑化
(´・ω・`)?
超必殺技必要なとこだけ投げる
(‫^ﻭ‬o^)‫ﻭ‬ イケルイケル!!
/(^o^)\
まとめ
Google Vision APIでOCRするときは
検出文字は黒、他は白(二値化)
paddingを除去する(幾何学変換)
必要な箇所以外は削除する(スライス)
この3つで結構精度あがるはず!! 参考まで
今日使ったコード->
https://github.com/Aipakazuma/play-gcp-vision-
api
終わり
(宣伝: ちゅらデータはエンジニアを"絶賛"募集しています!!)

Más contenido relacionado

La actualidad más candente

かすれ文字看板の補完_ver0.0
かすれ文字看板の補完_ver0.0かすれ文字看板の補完_ver0.0
かすれ文字看板の補完_ver0.0SakaiAtsushi
 
[SIGDance Cypher Session vol.1] キャラクタアニメーションで実現する楽曲の歌詞化表現
[SIGDance Cypher Session vol.1] キャラクタアニメーションで実現する楽曲の歌詞化表現 [SIGDance Cypher Session vol.1] キャラクタアニメーションで実現する楽曲の歌詞化表現
[SIGDance Cypher Session vol.1] キャラクタアニメーションで実現する楽曲の歌詞化表現 Iwamoto Naoya
 
Dance Information Processing / ダンス情報処理
Dance Information Processing / ダンス情報処理Dance Information Processing / ダンス情報処理
Dance Information Processing / ダンス情報処理SIGDance
 
新卒1年目が語る「ヤフーに入ってどう?」 #ヤフー名古屋
新卒1年目が語る「ヤフーに入ってどう?」 #ヤフー名古屋新卒1年目が語る「ヤフーに入ってどう?」 #ヤフー名古屋
新卒1年目が語る「ヤフーに入ってどう?」 #ヤフー名古屋Yahoo!デベロッパーネットワーク
 
青森ITビジネス・マッチング交流会
青森ITビジネス・マッチング交流会青森ITビジネス・マッチング交流会
青森ITビジネス・マッチング交流会Takehito Tanabe
 
スマホ音楽ゲームの動画から譜面をデータ化したかった
スマホ音楽ゲームの動画から譜面をデータ化したかったスマホ音楽ゲームの動画から譜面をデータ化したかった
スマホ音楽ゲームの動画から譜面をデータ化したかったHiro H.
 

La actualidad más candente (7)

かすれ文字看板の補完_ver0.0
かすれ文字看板の補完_ver0.0かすれ文字看板の補完_ver0.0
かすれ文字看板の補完_ver0.0
 
養成読本と私
養成読本と私養成読本と私
養成読本と私
 
[SIGDance Cypher Session vol.1] キャラクタアニメーションで実現する楽曲の歌詞化表現
[SIGDance Cypher Session vol.1] キャラクタアニメーションで実現する楽曲の歌詞化表現 [SIGDance Cypher Session vol.1] キャラクタアニメーションで実現する楽曲の歌詞化表現
[SIGDance Cypher Session vol.1] キャラクタアニメーションで実現する楽曲の歌詞化表現
 
Dance Information Processing / ダンス情報処理
Dance Information Processing / ダンス情報処理Dance Information Processing / ダンス情報処理
Dance Information Processing / ダンス情報処理
 
新卒1年目が語る「ヤフーに入ってどう?」 #ヤフー名古屋
新卒1年目が語る「ヤフーに入ってどう?」 #ヤフー名古屋新卒1年目が語る「ヤフーに入ってどう?」 #ヤフー名古屋
新卒1年目が語る「ヤフーに入ってどう?」 #ヤフー名古屋
 
青森ITビジネス・マッチング交流会
青森ITビジネス・マッチング交流会青森ITビジネス・マッチング交流会
青森ITビジネス・マッチング交流会
 
スマホ音楽ゲームの動画から譜面をデータ化したかった
スマホ音楽ゲームの動画から譜面をデータ化したかったスマホ音楽ゲームの動画から譜面をデータ化したかった
スマホ音楽ゲームの動画から譜面をデータ化したかった
 

Similar a vs Google Vision API

Cloud Vsion APIによるGUIの検証自動化
Cloud Vsion APIによるGUIの検証自動化Cloud Vsion APIによるGUIの検証自動化
Cloud Vsion APIによるGUIの検証自動化Terui Masashi
 
AWS ソリューションアーキテクト アソシエイト受験レポ
AWS ソリューションアーキテクト アソシエイト受験レポAWS ソリューションアーキテクト アソシエイト受験レポ
AWS ソリューションアーキテクト アソシエイト受験レポかの たん
 
AWS(Rekognition)と Pepperでご機嫌解析
AWS(Rekognition)と Pepperでご機嫌解析AWS(Rekognition)と Pepperでご機嫌解析
AWS(Rekognition)と Pepperでご機嫌解析Mitsuhiro Yamashita
 
エヌビディアのディープラーニング戦略
エヌビディアのディープラーニング戦略エヌビディアのディープラーニング戦略
エヌビディアのディープラーニング戦略NVIDIA Japan
 
第4次産業革命 AIでビジネスの現場が変わる
第4次産業革命 AIでビジネスの現場が変わる第4次産業革命 AIでビジネスの現場が変わる
第4次産業革命 AIでビジネスの現場が変わるDIVE INTO CODE Corp.
 
[_gaTracker]GAのここがすき。ここがきらい。
[_gaTracker]GAのここがすき。ここがきらい。[_gaTracker]GAのここがすき。ここがきらい。
[_gaTracker]GAのここがすき。ここがきらい。Toru Enomoto
 
PredictionIOのPython対応計画
PredictionIOのPython対応計画PredictionIOのPython対応計画
PredictionIOのPython対応計画Shinsuke Sugaya
 
2018.05.16 DOA 朝会トーク | 自己紹介&勉強会のすゝめ
2018.05.16 DOA 朝会トーク | 自己紹介&勉強会のすゝめ 2018.05.16 DOA 朝会トーク | 自己紹介&勉強会のすゝめ
2018.05.16 DOA 朝会トーク | 自己紹介&勉強会のすゝめ Koichiro Oki
 
TensorFlowで会話AIを作ってみた。
TensorFlowで会話AIを作ってみた。TensorFlowで会話AIを作ってみた。
TensorFlowで会話AIを作ってみた。tak9029
 
クラウド型データベース「kintone」のご紹介
クラウド型データベース「kintone」のご紹介クラウド型データベース「kintone」のご紹介
クラウド型データベース「kintone」のご紹介kintone papers
 
20170703_07 IoTシステム開発スタートアップって本を書こうと思ったら大変だった
20170703_07 IoTシステム開発スタートアップって本を書こうと思ったら大変だった20170703_07 IoTシステム開発スタートアップって本を書こうと思ったら大変だった
20170703_07 IoTシステム開発スタートアップって本を書こうと思ったら大変だったIoTビジネス共創ラボ
 
Einsteinvision - object detection を試してみよう
Einsteinvision - object detection を試してみようEinsteinvision - object detection を試してみよう
Einsteinvision - object detection を試してみようSalesforce Developers Japan
 
AI技術の現状と課題 〜aiboおよび自然言語処理〜
AI技術の現状と課題 〜aiboおよび自然言語処理〜AI技術の現状と課題 〜aiboおよび自然言語処理〜
AI技術の現状と課題 〜aiboおよび自然言語処理〜Naoki Fujiwara
 
20191105 cognitiveservices x powerapps
20191105 cognitiveservices x powerapps20191105 cognitiveservices x powerapps
20191105 cognitiveservices x powerappsひかり 影中
 
おふとんリーディング - docomo device hackathon
おふとんリーディング - docomo device hackathonおふとんリーディング - docomo device hackathon
おふとんリーディング - docomo device hackathonYuuki Toriba
 
kintoneプラグインがstripeに出会った話
kintoneプラグインがstripeに出会った話kintoneプラグインがstripeに出会った話
kintoneプラグインがstripeに出会った話安隆 沖
 
Microsoft Conversational AI_20191030
Microsoft Conversational AI_20191030Microsoft Conversational AI_20191030
Microsoft Conversational AI_20191030Ayako Omori
 

Similar a vs Google Vision API (20)

Cloud Vsion APIによるGUIの検証自動化
Cloud Vsion APIによるGUIの検証自動化Cloud Vsion APIによるGUIの検証自動化
Cloud Vsion APIによるGUIの検証自動化
 
AWS ソリューションアーキテクト アソシエイト受験レポ
AWS ソリューションアーキテクト アソシエイト受験レポAWS ソリューションアーキテクト アソシエイト受験レポ
AWS ソリューションアーキテクト アソシエイト受験レポ
 
AWS(Rekognition)と Pepperでご機嫌解析
AWS(Rekognition)と Pepperでご機嫌解析AWS(Rekognition)と Pepperでご機嫌解析
AWS(Rekognition)と Pepperでご機嫌解析
 
エヌビディアのディープラーニング戦略
エヌビディアのディープラーニング戦略エヌビディアのディープラーニング戦略
エヌビディアのディープラーニング戦略
 
第4次産業革命 AIでビジネスの現場が変わる
第4次産業革命 AIでビジネスの現場が変わる第4次産業革命 AIでビジネスの現場が変わる
第4次産業革命 AIでビジネスの現場が変わる
 
[_gaTracker]GAのここがすき。ここがきらい。
[_gaTracker]GAのここがすき。ここがきらい。[_gaTracker]GAのここがすき。ここがきらい。
[_gaTracker]GAのここがすき。ここがきらい。
 
PredictionIOのPython対応計画
PredictionIOのPython対応計画PredictionIOのPython対応計画
PredictionIOのPython対応計画
 
2018.05.16 DOA 朝会トーク | 自己紹介&勉強会のすゝめ
2018.05.16 DOA 朝会トーク | 自己紹介&勉強会のすゝめ 2018.05.16 DOA 朝会トーク | 自己紹介&勉強会のすゝめ
2018.05.16 DOA 朝会トーク | 自己紹介&勉強会のすゝめ
 
Why python
Why pythonWhy python
Why python
 
Why python
Why pythonWhy python
Why python
 
TensorFlowで会話AIを作ってみた。
TensorFlowで会話AIを作ってみた。TensorFlowで会話AIを作ってみた。
TensorFlowで会話AIを作ってみた。
 
Azureで動いている機械学習のいろいろについて
Azureで動いている機械学習のいろいろについてAzureで動いている機械学習のいろいろについて
Azureで動いている機械学習のいろいろについて
 
クラウド型データベース「kintone」のご紹介
クラウド型データベース「kintone」のご紹介クラウド型データベース「kintone」のご紹介
クラウド型データベース「kintone」のご紹介
 
20170703_07 IoTシステム開発スタートアップって本を書こうと思ったら大変だった
20170703_07 IoTシステム開発スタートアップって本を書こうと思ったら大変だった20170703_07 IoTシステム開発スタートアップって本を書こうと思ったら大変だった
20170703_07 IoTシステム開発スタートアップって本を書こうと思ったら大変だった
 
Einsteinvision - object detection を試してみよう
Einsteinvision - object detection を試してみようEinsteinvision - object detection を試してみよう
Einsteinvision - object detection を試してみよう
 
AI技術の現状と課題 〜aiboおよび自然言語処理〜
AI技術の現状と課題 〜aiboおよび自然言語処理〜AI技術の現状と課題 〜aiboおよび自然言語処理〜
AI技術の現状と課題 〜aiboおよび自然言語処理〜
 
20191105 cognitiveservices x powerapps
20191105 cognitiveservices x powerapps20191105 cognitiveservices x powerapps
20191105 cognitiveservices x powerapps
 
おふとんリーディング - docomo device hackathon
おふとんリーディング - docomo device hackathonおふとんリーディング - docomo device hackathon
おふとんリーディング - docomo device hackathon
 
kintoneプラグインがstripeに出会った話
kintoneプラグインがstripeに出会った話kintoneプラグインがstripeに出会った話
kintoneプラグインがstripeに出会った話
 
Microsoft Conversational AI_20191030
Microsoft Conversational AI_20191030Microsoft Conversational AI_20191030
Microsoft Conversational AI_20191030
 

Último

論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video UnderstandingToru Tamaki
 
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Hiroshi Tomioka
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NTT DATA Technology & Innovation
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルCRI Japan, Inc.
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)Hiroshi Tomioka
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイスCRI Japan, Inc.
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...Toru Tamaki
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Gamesatsushi061452
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 

Último (11)

論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 

vs Google Vision API