20. 1 2 3 4 5
0
20
40
60
80
100
MOS on naturalness
Correctrate[%]on
speakersimilarity
Target
Source
Baseline
良い
良い
A
B
C
D
E
F
G
H
I
J
K
LM
N
O
P
Q
• 統計的音声変換手法の性能比較には共通の音声データセットを用いた
評価が必要不可欠
• Voice Conversion Challenge 2016 の開催 [Toda et al., 2016]
• タスク:話者変換(5話者⇒5話者,162文対で学習,別の54文を評価)
• データセット:DAPS [Mysore, 2015] を利用
• 参加チーム数:17
• 中国:4
• 日本:3
• インド:3
• 英国:2
• 香港:1
• 台湾:1
• シンガポール:1
• スペイン:1
• 米国:1
B.手法の評価
4.課題と展望:3
21. 1 2 3 4 5
0
20
40
60
80
100
MOS on naturalness
Correctrate[%]on
speakersimilarity
Target
Source
Baseline
良い
良い
A
B
C
D
E
F
G
H
I
J
K
LM
N
O
P
Q
• 統計的音声変換手法の性能比較には共通の音声データセットを用いた
評価が必要不可欠
• Voice Conversion Challenge 2016 の開催 [Toda et al., 2016]
• タスク:話者変換(5話者⇒5話者,162文対で学習,別の54文を評価)
• データセット:DAPS [Mysore, 2015] を利用
• 参加チーム数:17
• 中国:4
• 日本:3
• インド:3
• 英国:2
• 香港:1
• 台湾:1
• シンガポール:1
• スペイン:1
• 米国:1
B.手法の評価
正解率 = 75%
MOS = 3.5
4.課題と展望:3
22. 1 2 3 4 5
0
20
40
60
80
100
MOS on naturalness
Correctrate[%]on
speakersimilarity
Target
Source
Baseline
良い
良い
A
B
C
D
E
F
G
H
I
J
K
LM
N
O
P
Q
• 統計的音声変換手法の性能比較には共通の音声データセットを用いた
評価が必要不可欠
• Voice Conversion Challenge 2016 の開催 [Toda et al., 2016]
• タスク:話者変換(5話者⇒5話者,162文対で学習,別の54文を評価)
• データセット:DAPS [Mysore, 2015] を利用
• 参加チーム数:17
• 中国:4
• 日本:3
• インド:3
• 英国:2
• 香港:1
• 台湾:1
• シンガポール:1
• スペイン:1
• 米国:1
B.手法の評価
正解率 = 75%
MOS = 3.5
4.課題と展望:3