Más contenido relacionado
2018aiexpo linguistic experiment_design_and_management_group
Notas del editor
- では、具体的にどういった流れでデータを作成してくのかを説明させていただきます。
私が所属している「実験管理グループ」では、被験者を集め音声や映像のデータを作るということをメインで行っているので、音声や映像データ作成の工程について詳しくお話ができればと思います。
- まず、作業をご依頼いただきデータを納品するまでの流れですが、大きく分けて6つのステップに分かれています。
- ステップ1では、データの理想像のヒアリングを行います。
- 「こんなデータが欲しい」と考える時、欲しいデータは決まっていても、具体的にどうしたら良いのかが分からないことがあると思います。
「どうすれば、欲しいデータを作ることができるかわからない…」そんな時は、アイアール・アルトにお任せください!
15年以上に渡り培ってきた「欲しいデータを作る」ためのノウハウを駆使し、「データ収集をする目的や要望」を基に、使用する機材・データ収集を実施する環境・データ収集の方法などを、細かくご提案させていただきます。
収録には、弊社保有の機材をご利用いただくこともできるので、お気軽にご相談ください!
- 具体的な仕様が決まっている場合は、ご希望の環境で、指定の機器を使用し、一貫した手順で収録を実施することもできます。
収録の経験が豊富なスタッフがそろっているので、「モーションキャプチャスーツ」「アイトラッカー」「ドライビングシミュレータ」「ヘッドマウントディスプレイ」「Kinect」「アレイマイク」など、どんな機材でもお任せください。
ですが、仕様通りに実験を行ったからと言って質の高いデータを収集できるわけではありません。
既に仕様が決まっている場合でも「より質の高いデータを作るにはどうすればよいか」を考え、仕様変更をご提案させていただくことがあります。
- ステップ2は、作業準備です。
- 収録の準備は、意外と大変です。
使用機材の選定、被験者のアサイン、収録場所の確保…などなど
収録を実施するためには、様々なタスクを同時進行で行わなければなりません。
- まず絶対に必要なのは、被験者のアサインですが…被験者のアサインには、アルトメンバーズがおすすめです!
弊社には、「アルトメンバーズ」という人材のプールがあります。
登録者数は5000人を超え、多種多様な年代、国籍、職業の方が登録をしているので、必ず「欲しい」が見つかります。
属性の難易度によって、アサインに必要な工数は変わってしまいますが、例えば「20代~50代を均等に」「男女比1:1」「日本語が母語」「30人」といった条件であれば、5営業日でアサインが可能です!フットワークの軽さもアルトメンバーズの強みです。
- また、実験を実施する時に意外と困るのが、実施場所の確保です。
弊社では、静音環境での音声収録が可能な防音ブース6基保有しているので、収録場所に困りません。
レイアウトの変更が自由自在の広い実験室もあるので、大きな機材を使っての実検にも対応しています!
もしも、持ち出せない機材を使用しての実験をご希望の場合は、ご指定の施設に出張することもできます!!
- データを作成する時に、意外と見落としてしまうのが、収録ツールの重要性です。
音声や映像データなどは、いずれもマイクやビデオカメラ等の機材があれば簡単に作成することができますが、「どの文章を読み上げた音声なのか」、「誰の音声なのか」といった情報を管理することはできません。
弊社では、プロジェクトごとに専用の収録ツールを作成し、収録と同時にリアルタイムでファイルの整理を行っているので、大量のデータ管理も簡単です!
オーダーメイドで作成するので、こんな仕組みがあるといいな!を実現し、より効率的で正確にデータを管理することができます。
- 最後に、データを収集する時、一番重要なのは「同意書」です。
データの開示範囲、機密保持誓約、著作権の放棄…など用途に合わせて必要な内容を盛り込んだ同意書を作成します。
収集したデータは、著作権ごと納品するので、納品データは自由にご利用いただけます。
また、その他説明資料や作業マニュアル、アンケート等も全て作成できるので、ワンパスで作業準備が完了します!
- ステップ3は、テスト収録です。
- 収録方法を検討するため、必ずテスト収録を実施しています。
テスト収録で取得したデータを基に、より良いデータを収集するにはどうしたら良いかを検討します。
テスト収録がうまくいかなかった場合は、仕様や機材の変更も臨機応変に対応いたします。
- ステップ4は、本番収録です。
- 収録実施中も、随時細かく収録状況をご報告させていただきます。
音声や映像データを随時共有できる環境が整っているので、収集したデータをその日のうちに、すぐにご確認いただけます。
必要な場合は、収録実施中のタスク変更も臨機応変に対応いたします。
- 収録の様子を、ムービーでご紹介します。
これは、「読み上げ音声収録」の様子です。
静音環境で収録するため、実験監督者は、防音ブースの外から読み上げタイミングの合図を出し、音声を録音します。
防音ブースの中には、録音用のマイクやモニタリング用のカメラ、原稿を提示するモニター等が設置されています。
リアルタイムで音声を確認しているので、読み間違いやノイズによるリテイクの実施もスムーズです。
これは、「対話音声収録」の様子です。
2~3名での雑談的な対話はもちろん8名以上など、大人数での会議を模した対話収録の経験もあります。
- ステップ5は、データ整理です。
- 収録中も、リアルタイムでデータの選別はしていますが、再度検聴を行い、不備データの見逃しを予防しています。
検聴作業では、機械的な処理と、人手処理を組み合わせ、効率的に「余白調整」「音声ファイルのリネーム」「音量レベルチェック」「読み間違いのチェック」などを行っています。
また、アンケートなど紙媒体で収集したデータの電子化を実施し、データベース化した状態でデータを納品するので、納品後すぐに研究にご利用いただけます。
- 「すぐに使えるデータの提供」をモットーとしているので、「ファイル名と内容が一致していない」「音量が小さすぎる」「動画と音声の同期がとられていない」といったデータは、弊社の納品データには一切ありません!!
- ステップ6は、分析用データの作成です。
-
弊社では、ElanやPraat、anvil等のソフトウェアを使用し、分析用データを作成します。
アノテーションの経験が豊富なスタッフが揃っているので、細かい仕様にも対応できます。
今モニターに表示しているのは、Elanを使用した発話・視線・ジェスチャーのアノテーションサンプルです。
写真上の黄色い点は、話し相手の視線の動きを可視化したものです。
動画・音声を確認しながら、各種情報をアノテーションしていきます。
- これまでに、書き起こしはもちろん発話者の特定や注視対象の特定、感情やジェスチャーの分類など様々なアノテーション経験があります。
どんなアノテーションでもお任せください!
- また、独自に音声や映像を収集したものの、分析用のデータを作成する段階でお困りの場合もぜひ弊社にご相談ください!
どんなデータのアノテーションでも承ります!!
- 今回ご紹介したのは、音声・映像のデータ収集案件でしたが、言語データの作成も得意としています。
- 私たちの仕事の形態は「研究・開発サポート」です。
データ作成についてお困りのことがありましたら、お気軽にブース内の説明員にお声がけください。
ご清聴ありがとうございました。