Enviar búsqueda
Cargar
vs Google Vision API
•
0 recomendaciones
•
368 vistas
隊長 アイパー
Seguir
PyData.Okinawa #29 LT
Leer menos
Leer más
Tecnología
Denunciar
Compartir
Denunciar
Compartir
1 de 20
Descargar ahora
Descargar para leer sin conexión
Recomendados
18 minitus発表資料
18 minitus発表資料
Keiichirou Miyamoto
Fluentd勉強会 (導入編 TreasureData活用)
Fluentd勉強会 (導入編 TreasureData活用)
takeuchi-tk
hpフィルター
hpフィルター
chjava
MBSハッカソン協賛品_ハンズラボ20170211
MBSハッカソン協賛品_ハンズラボ20170211
由佳 青木
Unagipy pysuruga202010
Unagipy pysuruga202010
hide ogawa
エンジニア転向を目指すデザイナーがNuxt.jsでアプリを開発した話
エンジニア転向を目指すデザイナーがNuxt.jsでアプリを開発した話
Kota Hashihama
ヤマムギVol.5 BIファーストステップre:dash
ヤマムギVol.5 BIファーストステップre:dash
Mitsuhiro Yamashita
Rustで3D graphics programming
Rustで3D graphics programming
KiyotomoHiroyasu
Recomendados
18 minitus発表資料
18 minitus発表資料
Keiichirou Miyamoto
Fluentd勉強会 (導入編 TreasureData活用)
Fluentd勉強会 (導入編 TreasureData活用)
takeuchi-tk
hpフィルター
hpフィルター
chjava
MBSハッカソン協賛品_ハンズラボ20170211
MBSハッカソン協賛品_ハンズラボ20170211
由佳 青木
Unagipy pysuruga202010
Unagipy pysuruga202010
hide ogawa
エンジニア転向を目指すデザイナーがNuxt.jsでアプリを開発した話
エンジニア転向を目指すデザイナーがNuxt.jsでアプリを開発した話
Kota Hashihama
ヤマムギVol.5 BIファーストステップre:dash
ヤマムギVol.5 BIファーストステップre:dash
Mitsuhiro Yamashita
Rustで3D graphics programming
Rustで3D graphics programming
KiyotomoHiroyasu
かすれ文字看板の補完_ver0.0
かすれ文字看板の補完_ver0.0
SakaiAtsushi
養成読本と私
養成読本と私
Kimikazu Kato
[SIGDance Cypher Session vol.1] キャラクタアニメーションで実現する楽曲の歌詞化表現
[SIGDance Cypher Session vol.1] キャラクタアニメーションで実現する楽曲の歌詞化表現
Iwamoto Naoya
Dance Information Processing / ダンス情報処理
Dance Information Processing / ダンス情報処理
SIGDance
新卒1年目が語る「ヤフーに入ってどう?」 #ヤフー名古屋
新卒1年目が語る「ヤフーに入ってどう?」 #ヤフー名古屋
Yahoo!デベロッパーネットワーク
青森ITビジネス・マッチング交流会
青森ITビジネス・マッチング交流会
Takehito Tanabe
スマホ音楽ゲームの動画から譜面をデータ化したかった
スマホ音楽ゲームの動画から譜面をデータ化したかった
Hiro H.
Cloud Vsion APIによるGUIの検証自動化
Cloud Vsion APIによるGUIの検証自動化
Terui Masashi
AWS ソリューションアーキテクト アソシエイト受験レポ
AWS ソリューションアーキテクト アソシエイト受験レポ
かの たん
AWS(Rekognition)と Pepperでご機嫌解析
AWS(Rekognition)と Pepperでご機嫌解析
Mitsuhiro Yamashita
エヌビディアのディープラーニング戦略
エヌビディアのディープラーニング戦略
NVIDIA Japan
第4次産業革命 AIでビジネスの現場が変わる
第4次産業革命 AIでビジネスの現場が変わる
DIVE INTO CODE Corp.
[_gaTracker]GAのここがすき。ここがきらい。
[_gaTracker]GAのここがすき。ここがきらい。
Toru Enomoto
PredictionIOのPython対応計画
PredictionIOのPython対応計画
Shinsuke Sugaya
2018.05.16 DOA 朝会トーク | 自己紹介&勉強会のすゝめ
2018.05.16 DOA 朝会トーク | 自己紹介&勉強会のすゝめ
Koichiro Oki
Why python
Why python
TeppeiAkada1
Why python
Why python
TeppeiAkada1
TensorFlowで会話AIを作ってみた。
TensorFlowで会話AIを作ってみた。
tak9029
Azureで動いている機械学習のいろいろについて
Azureで動いている機械学習のいろいろについて
エンジニア勉強会 エスキュービズム
クラウド型データベース「kintone」のご紹介
クラウド型データベース「kintone」のご紹介
kintone papers
20170703_07 IoTシステム開発スタートアップって本を書こうと思ったら大変だった
20170703_07 IoTシステム開発スタートアップって本を書こうと思ったら大変だった
IoTビジネス共創ラボ
Einsteinvision - object detection を試してみよう
Einsteinvision - object detection を試してみよう
Salesforce Developers Japan
Más contenido relacionado
La actualidad más candente
かすれ文字看板の補完_ver0.0
かすれ文字看板の補完_ver0.0
SakaiAtsushi
養成読本と私
養成読本と私
Kimikazu Kato
[SIGDance Cypher Session vol.1] キャラクタアニメーションで実現する楽曲の歌詞化表現
[SIGDance Cypher Session vol.1] キャラクタアニメーションで実現する楽曲の歌詞化表現
Iwamoto Naoya
Dance Information Processing / ダンス情報処理
Dance Information Processing / ダンス情報処理
SIGDance
新卒1年目が語る「ヤフーに入ってどう?」 #ヤフー名古屋
新卒1年目が語る「ヤフーに入ってどう?」 #ヤフー名古屋
Yahoo!デベロッパーネットワーク
青森ITビジネス・マッチング交流会
青森ITビジネス・マッチング交流会
Takehito Tanabe
スマホ音楽ゲームの動画から譜面をデータ化したかった
スマホ音楽ゲームの動画から譜面をデータ化したかった
Hiro H.
La actualidad más candente
(7)
かすれ文字看板の補完_ver0.0
かすれ文字看板の補完_ver0.0
養成読本と私
養成読本と私
[SIGDance Cypher Session vol.1] キャラクタアニメーションで実現する楽曲の歌詞化表現
[SIGDance Cypher Session vol.1] キャラクタアニメーションで実現する楽曲の歌詞化表現
Dance Information Processing / ダンス情報処理
Dance Information Processing / ダンス情報処理
新卒1年目が語る「ヤフーに入ってどう?」 #ヤフー名古屋
新卒1年目が語る「ヤフーに入ってどう?」 #ヤフー名古屋
青森ITビジネス・マッチング交流会
青森ITビジネス・マッチング交流会
スマホ音楽ゲームの動画から譜面をデータ化したかった
スマホ音楽ゲームの動画から譜面をデータ化したかった
Similar a vs Google Vision API
Cloud Vsion APIによるGUIの検証自動化
Cloud Vsion APIによるGUIの検証自動化
Terui Masashi
AWS ソリューションアーキテクト アソシエイト受験レポ
AWS ソリューションアーキテクト アソシエイト受験レポ
かの たん
AWS(Rekognition)と Pepperでご機嫌解析
AWS(Rekognition)と Pepperでご機嫌解析
Mitsuhiro Yamashita
エヌビディアのディープラーニング戦略
エヌビディアのディープラーニング戦略
NVIDIA Japan
第4次産業革命 AIでビジネスの現場が変わる
第4次産業革命 AIでビジネスの現場が変わる
DIVE INTO CODE Corp.
[_gaTracker]GAのここがすき。ここがきらい。
[_gaTracker]GAのここがすき。ここがきらい。
Toru Enomoto
PredictionIOのPython対応計画
PredictionIOのPython対応計画
Shinsuke Sugaya
2018.05.16 DOA 朝会トーク | 自己紹介&勉強会のすゝめ
2018.05.16 DOA 朝会トーク | 自己紹介&勉強会のすゝめ
Koichiro Oki
Why python
Why python
TeppeiAkada1
Why python
Why python
TeppeiAkada1
TensorFlowで会話AIを作ってみた。
TensorFlowで会話AIを作ってみた。
tak9029
Azureで動いている機械学習のいろいろについて
Azureで動いている機械学習のいろいろについて
エンジニア勉強会 エスキュービズム
クラウド型データベース「kintone」のご紹介
クラウド型データベース「kintone」のご紹介
kintone papers
20170703_07 IoTシステム開発スタートアップって本を書こうと思ったら大変だった
20170703_07 IoTシステム開発スタートアップって本を書こうと思ったら大変だった
IoTビジネス共創ラボ
Einsteinvision - object detection を試してみよう
Einsteinvision - object detection を試してみよう
Salesforce Developers Japan
AI技術の現状と課題 〜aiboおよび自然言語処理〜
AI技術の現状と課題 〜aiboおよび自然言語処理〜
Naoki Fujiwara
20191105 cognitiveservices x powerapps
20191105 cognitiveservices x powerapps
ひかり 影中
おふとんリーディング - docomo device hackathon
おふとんリーディング - docomo device hackathon
Yuuki Toriba
kintoneプラグインがstripeに出会った話
kintoneプラグインがstripeに出会った話
安隆 沖
Microsoft Conversational AI_20191030
Microsoft Conversational AI_20191030
Ayako Omori
Similar a vs Google Vision API
(20)
Cloud Vsion APIによるGUIの検証自動化
Cloud Vsion APIによるGUIの検証自動化
AWS ソリューションアーキテクト アソシエイト受験レポ
AWS ソリューションアーキテクト アソシエイト受験レポ
AWS(Rekognition)と Pepperでご機嫌解析
AWS(Rekognition)と Pepperでご機嫌解析
エヌビディアのディープラーニング戦略
エヌビディアのディープラーニング戦略
第4次産業革命 AIでビジネスの現場が変わる
第4次産業革命 AIでビジネスの現場が変わる
[_gaTracker]GAのここがすき。ここがきらい。
[_gaTracker]GAのここがすき。ここがきらい。
PredictionIOのPython対応計画
PredictionIOのPython対応計画
2018.05.16 DOA 朝会トーク | 自己紹介&勉強会のすゝめ
2018.05.16 DOA 朝会トーク | 自己紹介&勉強会のすゝめ
Why python
Why python
Why python
Why python
TensorFlowで会話AIを作ってみた。
TensorFlowで会話AIを作ってみた。
Azureで動いている機械学習のいろいろについて
Azureで動いている機械学習のいろいろについて
クラウド型データベース「kintone」のご紹介
クラウド型データベース「kintone」のご紹介
20170703_07 IoTシステム開発スタートアップって本を書こうと思ったら大変だった
20170703_07 IoTシステム開発スタートアップって本を書こうと思ったら大変だった
Einsteinvision - object detection を試してみよう
Einsteinvision - object detection を試してみよう
AI技術の現状と課題 〜aiboおよび自然言語処理〜
AI技術の現状と課題 〜aiboおよび自然言語処理〜
20191105 cognitiveservices x powerapps
20191105 cognitiveservices x powerapps
おふとんリーディング - docomo device hackathon
おふとんリーディング - docomo device hackathon
kintoneプラグインがstripeに出会った話
kintoneプラグインがstripeに出会った話
Microsoft Conversational AI_20191030
Microsoft Conversational AI_20191030
Último
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
Toru Tamaki
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Hiroshi Tomioka
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NTT DATA Technology & Innovation
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
CRI Japan, Inc.
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
Hiroshi Tomioka
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
CRI Japan, Inc.
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
Toru Tamaki
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
atsushi061452
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
Último
(11)
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
vs Google Vision API
1.
PyData.Okinawa #29 LT 2017/09/23(土) 15:00:00
晴 アイパー隊長
2.
自己紹介 沖縄県うるま市の平安座島に住んでいます ちゅらデータ株式会社(メイン言語Python) 会社できました! オフィスも契約(冷房無い(´;ω;`)ウッ… 数学勉強中
3.
祭りがあります!
4.
話すこと
5.
vs Google Vision
API
6.
vs Google Vision
API Google Vision APIとは? 使い方 精度向上との戦い(どんなして精度あげるの?
7.
Google Vision APIとは? Google
Cloud Platformで用意されているAPIのひ とつ 機能が色々ある(ラベル検出、ロゴ検出、顔検 出、OCR...etc) でもお高いんでしょう...? 1 ~ 1000 ユニット/月-> 無料!! 1,001~500万ユニット/月-> (リクエスト数/ 1,000) × $3.50 今回触ったのはtext detection (OCR)
8.
使い方.1 api_url = 'Vision
API URL' access_key = 'Access key' img = open('画像ファイルパス', 'rb').read() content = base64.b64encode(img).decode('utf8') url = '%s?key=%s' % , (api_url, access_key)) res = json.dumps({ 'requests': [{ 'image': { 'content': content }, 'features': [{ 'type': 'TEXT_DETECTION', 'maxResults': 2 }] }] }) res = requests.post(url, res) return res.json()
9.
使い方.2 リクエストする画像はbase64に変換するか、 Google Cloud Storageへアップしてそのurlを渡す features
を複数指定することも可能 OCRと同時に顔検出することもできる maxResults というパラメータは謎 検出数が多くなるらしいが変更してもそんなか わらん(気がする 画像のサイズとかは? -> ベストプラクティス 返ってくるデータは検出位置とテキスト [左上(x, y), 右上(x, y), 右下(x, y), 左下(x, y)]
10.
使い方.3
11.
精度向上との戦い.1 はじめのころ-> これはすごい!! 実際開発に組み込むと-> 文字を認識してくれない ケースがでてきた... どうすべ?(´・ω・`) 色々試してみた
12.
グレースケール 精度上がらない(´・ω・`)
13.
二値化 ちょっとだけあがった!
14.
幾何学変換+ グレースケール さがった(´・ω・`)
15.
幾何学変換+ 二値化 あがった!(`・ω・´)
16.
幾何学変換+ 二値化-> 平滑化 (´・ω・`)?
17.
超必殺技必要なとこだけ投げる (^ﻭo^)ﻭ イケルイケル!!
18.
/(^o^)\
19.
まとめ Google Vision APIでOCRするときは 検出文字は黒、他は白(二値化) paddingを除去する(幾何学変換) 必要な箇所以外は削除する(スライス) この3つで結構精度あがるはず!!
参考まで 今日使ったコード-> https://github.com/Aipakazuma/play-gcp-vision- api
20.
終わり (宣伝: ちゅらデータはエンジニアを"絶賛"募集しています!!)
Descargar ahora