SlideShare una empresa de Scribd logo
1 de 25
Random Wikipedia つくってみた
Hiroki.lzh IT-Slide#4
1
本業
Twitter
プロデューサー
@Hiroki_lzh
副業 とあるIT関係サラリーマン
最近やらかしたこと rm -rf /usr/bin/*
※ちゃんと復旧させました…
自己紹介
73253752
Random Wikipedia を製作してみてあれこれ
物事の経緯
Random Wikipedia 構想
プログラム実装
発生した問題
評価
2
今回のお品書き
3
物事の経緯
大学研究室のOB会が近づいてきた・・・
小ネタ仕込まないとなー
何やろうかなー
4
物事の経緯
大学研究室のOB会が近づいてきた・・・
最近の研究室の課題って
何やってんだろ
5
物事の経緯
恩師から現在の学生への春の課題を眺める
6
物事の経緯
こうして大雑把に作るものが決まった
7
Random Wikipedia 構想
細かな設計は無く、次のようなことを考えつつ実装
WEBページで閲覧できるような形式にしよう
正解の確認は自分のタイミングでやりたいよね
とりあえず選択肢じゃなく、名称当てクイズで作りたい
ここをマスクすれば大体イケるだろうな
8
プログラム実装
実装としては以下
Wikipedia から本文取得
取得文字列解析
問題についてマスク処理(文字列置換)
HTMLの整形
MediaWikiのAPIで
日本語記事をランダム取得
記事の主題を取得
主題を問題文としてマスク
適宜改行を差し込みつつ
ページ整形
9
プログラム実装
PHPでつくりました
http://lookatmio.sakura.ne.jp/randomwiki/
次の問題を表示するボタン答えを表示するボタン
製作過程でいくつかの問題が発生した
日本語揺らぎ問題
「とは」問題
問題化不可能記事問題
10
発生した問題
日本語揺らぎ問題
タイトル隠すだけ、そう考えていた時もあった
11
発生した問題
主題の内容を隠せば
イケるやろ、ヨユーヨユー
日本語揺らぎ問題
外来語は日本語翻訳時のブレが・・・
12
発生した問題
日本語揺らぎ問題
マスクする範囲を緑⇒赤に拡張することに
13
発生した問題
日本語揺らぎ問題
結果的に ネタバレ要素の排除も実現
14
発生した問題
「とは」問題
Wikipediaの本文は
「 XXX とは 」 もしくは 「 XXX は」 で始まる
15
発生した問題
「とは」より前を隠せばええんやろ?
みんな大好き形態素解析の出番や
「とは」問題
はいはい、ダメな予感はしてました
16
発生した問題
「とは」問題
「文章の開始から最初の括弧閉じまで」で実装
この実装は穴があることは理解している
いい方法ないかな?という模索・・・
17
発生した問題
問題化不可能記事問題
MediaWikiのAPIの仕様上問題化出来ない記事が存在
( 時間が足りなくて )未対処
18
発生した問題
転送ページ
カテゴリページ
評価実験
製作者含む全1名によるシステム利用を実施
50問回答による正解率とシステムの面白さについて調査
操作感についても意見を収集
19
評価
実際の50問
20
脳幹 フランシス 日本蝶類学会 奈須 真司 ウラッサイ
ルイジ・タベリ オルドス100 本田庄太郎 比屋根 渉 タキシング
近藤 史恵 相棒タッグ つぐみ座 Yahoo!ロコ 密陀絵
稲穂峠 清水 千賀 株式併合 逸架 ぱずる Agree
八戸銀行 神崎 紫電 山本十左衛門尉 カデの発煙液体 粉末散布車
公益社団法人
消費者関連専門
家会議
MUSIC POWER
PLAY
東京スカパラダイ
スオーケストラ
ペラ 緑区
ニューベリー競馬
場
ルイージ・カニョー
ラ
フィニッシュ・ハウ
ンド
全金属製飛行機
研究材料
東京ディズニー
ランドのショップ
粗糖 アッテンボロー
男爵
襄州区 河本 裕之 門馬良デイリー
ファイル
ゴールドスター 東風悦達起亜汽
車
エゼキエル・ワル
トヴォ
有限会社
上峰タクシー
チャーリー・ゲーリ
ンジャー
Ch223 MUSIC
PINKISS
長崎市営大橋球
場
カンムリエボシドリ 「遠影 feat. John
Legend」
ジ・ジェット・エイ
ジ・オブ・トゥモ
ロー
正解率: 2 / 50 = 4%
21
脳幹 フランシス 日本蝶類学会 奈須 真司 ウラッサイ
ルイジ・タベリ オルドス100 本田庄太郎 比屋根 渉 タキシング
近藤 史恵 相棒タッグ つぐみ座 Yahoo!ロコ 密陀絵
稲穂峠 清水 千賀 株式併合 逸架 ぱずる Agree
八戸銀行 神崎 紫電 山本十左衛門尉 カデの発煙液体 粉末散布車
公益社団法人
消費者関連専門
家会議
MUSIC POWER
PLAY
東京スカパラダイ
スオーケストラ
ペラ 緑区
ニューベリー競馬
場
ルイージ・カニョー
ラ
フィニッシュ・ハウ
ンド
全金属製飛行機
研究材料
東京ディズニー
ランドのショップ
粗糖 アッテンボロー
男爵
襄州区 河本 裕之 門馬良デイリー
ファイル
ゴールドスター 東風悦達起亜汽
車
エゼキエル・ワル
トヴォ
有限会社
上峰タクシー
チャーリー・ゲーリ
ンジャー
Ch223 MUSIC
PINKISS
長崎市営大橋球
場
カンムリエボシドリ 「遠影 feat. John
Legend」
ジ・ジェット・エイ
ジ・オブ・トゥモ
ロー
22
正解率
4%
被験者の意見を聞く
範囲が広くて知らないことばかり、もう少し絞りたい
改行の位置を整形できれば可読性が上がるはず…
回答確認のモーション、いらないのでは?
2,3問もやれば過去の問題はもう覚えてないよね
23
評価結果
今後の課題として
カテゴリを特定ジャンルに絞る機能の実装 (未定)
可読性向上のためのなにかしら (未定)
UI設計の見直し (未定)
出題履歴を表示可能にする
& Wikipediaの対象ページにリンクの付与 (未定)
24
今後の課題

Más contenido relacionado

Destacado

Characters positions
Characters positionsCharacters positions
Characters positionsnilesh2104
 
Quoi de neuf en Poutinie? - Commerce Russie
Quoi de neuf en Poutinie? - Commerce RussieQuoi de neuf en Poutinie? - Commerce Russie
Quoi de neuf en Poutinie? - Commerce RussieBertrand Guély
 
Servicios Gestionados @ asLAN Nexica
Servicios Gestionados @ asLAN NexicaServicios Gestionados @ asLAN Nexica
Servicios Gestionados @ asLAN NexicaSergim
 
Cover makalah mineralogi
Cover makalah mineralogiCover makalah mineralogi
Cover makalah mineralogirikamulia
 
Vimpa Islands
Vimpa IslandsVimpa Islands
Vimpa IslandsDadoofy
 
Future Urban Design for the Emergence of a Fluid Sense of Self
Future Urban Design for the Emergence of a Fluid Sense of SelfFuture Urban Design for the Emergence of a Fluid Sense of Self
Future Urban Design for the Emergence of a Fluid Sense of SelfUniversity of Oxford
 
Bab 3 kualitas sebagai alternatif peningkatan daya saing
Bab 3 kualitas sebagai alternatif peningkatan daya saingBab 3 kualitas sebagai alternatif peningkatan daya saing
Bab 3 kualitas sebagai alternatif peningkatan daya saingKartika Lukitasari
 

Destacado (10)

Characters positions
Characters positionsCharacters positions
Characters positions
 
Quotes3
Quotes3Quotes3
Quotes3
 
Quoi de neuf en Poutinie? - Commerce Russie
Quoi de neuf en Poutinie? - Commerce RussieQuoi de neuf en Poutinie? - Commerce Russie
Quoi de neuf en Poutinie? - Commerce Russie
 
MediaFilmExchange.co.uk Powerpoint
MediaFilmExchange.co.uk PowerpointMediaFilmExchange.co.uk Powerpoint
MediaFilmExchange.co.uk Powerpoint
 
Carmen e
Carmen eCarmen e
Carmen e
 
Servicios Gestionados @ asLAN Nexica
Servicios Gestionados @ asLAN NexicaServicios Gestionados @ asLAN Nexica
Servicios Gestionados @ asLAN Nexica
 
Cover makalah mineralogi
Cover makalah mineralogiCover makalah mineralogi
Cover makalah mineralogi
 
Vimpa Islands
Vimpa IslandsVimpa Islands
Vimpa Islands
 
Future Urban Design for the Emergence of a Fluid Sense of Self
Future Urban Design for the Emergence of a Fluid Sense of SelfFuture Urban Design for the Emergence of a Fluid Sense of Self
Future Urban Design for the Emergence of a Fluid Sense of Self
 
Bab 3 kualitas sebagai alternatif peningkatan daya saing
Bab 3 kualitas sebagai alternatif peningkatan daya saingBab 3 kualitas sebagai alternatif peningkatan daya saing
Bab 3 kualitas sebagai alternatif peningkatan daya saing
 

Similar a IT004_2015_RandomWikipedia作ってみた

Pythonの理解を試みる 〜バイトコードインタプリタを作成する〜
Pythonの理解を試みる 〜バイトコードインタプリタを作成する〜Pythonの理解を試みる 〜バイトコードインタプリタを作成する〜
Pythonの理解を試みる 〜バイトコードインタプリタを作成する〜Preferred Networks
 
とある Perl Monger の働き方
とある Perl Monger の働き方とある Perl Monger の働き方
とある Perl Monger の働き方Yusuke Wada
 
農業とITをOSSで
農業とITをOSSで農業とITをOSSで
農業とITをOSSでBus Hato
 
ios+Android最近気付いいたこと
ios+Android最近気付いいたことios+Android最近気付いいたこと
ios+Android最近気付いいたことHiratsuka Shunsuke
 
Sphinxの使い方事例
Sphinxの使い方事例Sphinxの使い方事例
Sphinxの使い方事例Go Yamada
 
Twenty Fourteen徹底解剖! ~デフォルトテーマに学ぶ今ドキテーマの作り方~
Twenty Fourteen徹底解剖! ~デフォルトテーマに学ぶ今ドキテーマの作り方~Twenty Fourteen徹底解剖! ~デフォルトテーマに学ぶ今ドキテーマの作り方~
Twenty Fourteen徹底解剖! ~デフォルトテーマに学ぶ今ドキテーマの作り方~Keisuke Imura
 

Similar a IT004_2015_RandomWikipedia作ってみた (6)

Pythonの理解を試みる 〜バイトコードインタプリタを作成する〜
Pythonの理解を試みる 〜バイトコードインタプリタを作成する〜Pythonの理解を試みる 〜バイトコードインタプリタを作成する〜
Pythonの理解を試みる 〜バイトコードインタプリタを作成する〜
 
とある Perl Monger の働き方
とある Perl Monger の働き方とある Perl Monger の働き方
とある Perl Monger の働き方
 
農業とITをOSSで
農業とITをOSSで農業とITをOSSで
農業とITをOSSで
 
ios+Android最近気付いいたこと
ios+Android最近気付いいたことios+Android最近気付いいたこと
ios+Android最近気付いいたこと
 
Sphinxの使い方事例
Sphinxの使い方事例Sphinxの使い方事例
Sphinxの使い方事例
 
Twenty Fourteen徹底解剖! ~デフォルトテーマに学ぶ今ドキテーマの作り方~
Twenty Fourteen徹底解剖! ~デフォルトテーマに学ぶ今ドキテーマの作り方~Twenty Fourteen徹底解剖! ~デフォルトテーマに学ぶ今ドキテーマの作り方~
Twenty Fourteen徹底解剖! ~デフォルトテーマに学ぶ今ドキテーマの作り方~
 

Más de Hiroki.lzh

FAV004_ちひろさんに投票したい!
FAV004_ちひろさんに投票したい!FAV004_ちひろさんに投票したい!
FAV004_ちひろさんに投票したい!Hiroki.lzh
 
Moba passion 日野茜誕生日2015
Moba passion 日野茜誕生日2015Moba passion 日野茜誕生日2015
Moba passion 日野茜誕生日2015Hiroki.lzh
 
IT003_2015_素数休日のススメ
IT003_2015_素数休日のススメIT003_2015_素数休日のススメ
IT003_2015_素数休日のススメHiroki.lzh
 
IT002_DISKベンチマークをとろう
IT002_DISKベンチマークをとろうIT002_DISKベンチマークをとろう
IT002_DISKベンチマークをとろうHiroki.lzh
 
IT001_開発環境を新しくしよう
IT001_開発環境を新しくしようIT001_開発環境を新しくしよう
IT001_開発環境を新しくしようHiroki.lzh
 
FAV001_はじめよう自己監視
FAV001_はじめよう自己監視FAV001_はじめよう自己監視
FAV001_はじめよう自己監視Hiroki.lzh
 

Más de Hiroki.lzh (6)

FAV004_ちひろさんに投票したい!
FAV004_ちひろさんに投票したい!FAV004_ちひろさんに投票したい!
FAV004_ちひろさんに投票したい!
 
Moba passion 日野茜誕生日2015
Moba passion 日野茜誕生日2015Moba passion 日野茜誕生日2015
Moba passion 日野茜誕生日2015
 
IT003_2015_素数休日のススメ
IT003_2015_素数休日のススメIT003_2015_素数休日のススメ
IT003_2015_素数休日のススメ
 
IT002_DISKベンチマークをとろう
IT002_DISKベンチマークをとろうIT002_DISKベンチマークをとろう
IT002_DISKベンチマークをとろう
 
IT001_開発環境を新しくしよう
IT001_開発環境を新しくしようIT001_開発環境を新しくしよう
IT001_開発環境を新しくしよう
 
FAV001_はじめよう自己監視
FAV001_はじめよう自己監視FAV001_はじめよう自己監視
FAV001_はじめよう自己監視
 

Último

Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルCRI Japan, Inc.
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイスCRI Japan, Inc.
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video UnderstandingToru Tamaki
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NTT DATA Technology & Innovation
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...Toru Tamaki
 
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Hiroshi Tomioka
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptxsn679259
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Gamesatsushi061452
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsWSO2
 

Último (12)

Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
 

IT004_2015_RandomWikipedia作ってみた