Quantum Support Vector Machine

QuantumTokyo
Qt
Last updated: 2020-09-25
QSVM (量子サポートベクターマシン)
Yuma Nakamura
Qiskit Advocate

QuantumTokyoアジェンダ
2
1. 古典SVMについて
1. SVMの概要
2. カーネルトリックについて
2. 量子SVMについて
1. 量子SVMの概要(理想版 vs NISQ版)
2. 量子カーネルについて
1. 量子状態への特徴量マッピング
2. カーネル関数決定のパラメータ (量子カーネルの候補)
3. 内積の計算方法
4. 計算コスト
3. Pythonで実行

QuantumTokyoSVMの特徴
3
Q：青と赤のグループのデータセットがあります。これを下図のように分けるとき、どちらの方が良いでしょうか？

4
境界線付近の拡大図
• 右図の方が境界線と最近接データ点との距離(マージン)が長い→左図より安定した分け方
マージン

SVM
• グループ間の境界面を定める分析手法
• マージンMをできるだけ大きく取るように最適化→汎化性能をできるだけ高くする
目的：max 𝑀
5

QuantumTokyoSVMのアルゴリズム
SVMが決定するのはマージンが最大化されるような境界面の方程式: 𝒘 ⋅ 𝒙 + 𝑏 = 0
• つまり、係数𝒘と切片𝑏を計算する
データ数Nのデータセットにおいて２値分類を考える
• 各データ点：𝒙𝑖 (𝑖 = 1, 2, … , 𝑁)
• マージン：𝑀
𝒘 ⋅ 𝒙 + 𝑏 = 0
𝒙𝒊
𝒙𝒋
𝑀 = min
𝑖
|𝒘⋅𝒙 𝒋+𝑏|
|𝒘| 𝑴
|𝒘 ⋅ 𝒙𝒋 + 𝑏|
|𝒘|
𝑴
6

QuantumTokyoSVMのアルゴリズム
𝒘, 𝑏には定数倍の任意性があるため、一意に決まるように以下の制約条件を設定
• min
𝑖
𝒘 ⋅ 𝒙𝑖 + 𝑏 = 1
• これにより𝑀 = 1/|𝒘|
分類条件を下記の式𝑡 𝒙𝑖 として表す。
このとき上記の制約条件と分類条件を合わせて、
上記条件下で、𝑀 = 1/|𝒘|を最大化する
𝑡𝑖 = 𝑡 𝑥𝑖 =
−1 … (𝑥𝑖が青グループ)
1 … (𝑥𝑖が赤グループ)
𝑡 = −1
𝑡 = 1
𝑡𝑖 𝒘 ⋅ 𝒙𝑖 + 𝑏 ≥ 1
7

QuantumTokyo
8
最適化問題をラグランジ未定係数法で解きやすい形に変換
SVMのアルゴリズム
元の問題
目的関数: max
𝑤,𝑏
𝑀: =
1
𝒘
⟺ min
𝑤,𝑏
1
2
𝒘 2 制約条件: 𝑡𝑖 𝒘 ⋅ 𝒙𝑖 + 𝑏 ≥ 1
変換後の問題
max
𝛼 𝑖≥0
𝐿 𝜶 : =
1
2
𝒘 2 −
𝑖
𝛼𝑖 𝑡𝑖 𝒘 ⋅ 𝒙𝑖 + 𝑏 − 1目的関数: 最大化条件:
𝜕𝐿
𝜕𝑤𝑖
= 𝑤𝑖 − 𝛼𝑖 𝑡𝑖 𝑥𝑖 = 0
𝜕𝐿
𝜕𝑏
=
𝑖
𝛼𝑖 𝑡𝑖 = 0
= max
𝛼 𝑖≥0
𝐿 𝜶 : =
𝑖
𝛼𝑖 −
1
2
𝑖,𝑘
𝛼𝑖 𝛼 𝑘 𝑡𝑖 𝑡 𝑘 𝒙𝑖 ⋅ 𝒙 𝑘
𝑤𝑖 = 𝛼𝑖 𝑡𝑖 𝑥𝑖を代入
これを解くと境界面を定める𝒘が決定する
𝛼𝑖 𝑡𝑖 𝒘 ⋅ 𝒙𝑖 + 𝑏 − 1 = 0

QuantumTokyoサポートベクトルとは
1つ目の最大化条件:
制約条件:𝛼𝑖 ≥ 0より
• 𝑡𝑖 𝒘 ⋅ 𝒙𝑖 + 𝑏 ≠ 1となる教師データについては必ず𝛼𝑖 = 0
• 𝑡𝑖 𝒘 ⋅ 𝒙𝑖 + 𝑏 = 1となる教師データにおいてのみ𝛼𝑖 ≠ 0
すなわち、モデルにとって意味のあるデータは図のようになる
…意味のない教師データ
…意味のある教師データ
𝛼𝑖 = 0
サポートベクトル
9
𝛼𝑖 𝑡𝑖 𝒘 ⋅ 𝒙𝑖 + 𝑏 − 1 = 0

QuantumTokyoSVMの問題点
SVMの問題点
• 境界面は線形である必要があり、下記のようなグループを分けることができない
10

QuantumTokyo非線形SVM
非線形SVM
• 特徴量を高次元化(特徴量マッピング)することで、線形な境界面で切り分ける
x
y
𝑥2
+ 𝑦2
𝑧 = 𝑥2 + 𝑦2を追加
𝒙 → 𝜙 𝒙 = (𝑥, 𝑦, 𝑥2
+ 𝑦2
)
11

QuantumTokyo非線形SVMの問題点
特徴量を高次元化するほど、計算コストがかかる！！
max
𝛼
𝑖
𝛼𝑖 −
1
2
𝑖,𝑘
𝛼𝑖 𝛼 𝑘 𝑡𝑖 𝑡 𝑘 𝜙(𝒙𝑖) ⋅ 𝜙(𝒙 𝑘)
次元が増えると内積の計算も増えてしまう
12

QuantumTokyoカーネルトリック
カーネル法…特徴量を高次元化することなく、その計算結果だけを使う手法
x
y
� + �
高次元へ写像
max
𝛼
𝑖
𝛼𝑖 −
1
2
𝑖,𝑘
𝛼𝑖 𝛼 𝑘 𝑡𝑖 𝑡 𝑘 𝜙(𝒙𝑖) ⋅ 𝜙(𝒙 𝑘)
内積計算
𝒙 → 𝜙 𝒙
max
𝛼
𝑖
𝛼𝑖 −
1
2
𝑖,𝑘
𝛼𝑖 𝛼 𝑘 𝑡𝑖 𝑡 𝑘 𝑘(𝒙𝑖, 𝒙 𝑘)
𝒙𝑖 𝒙 𝑘 → 𝑘(𝒙𝒊, 𝒙 𝒌)
カーネル関数kを定義し計算へぶち込むだけ
従来の手法
カーネル法
13

QuantumTokyoカーネルトリック
カーネル関数の例1…多項式カーネル
• d=2とすると…
𝑘 𝒂, 𝒃 = 1 + 𝒂 ⋅ 𝒃 𝑑
𝑘 𝒂, 𝒃 = 1 + 2𝒂 ⋅ 𝒃 + (𝒂 ⋅ 𝒃) 𝟐
= 1, 2𝑥 𝑎, 2𝑦𝑎, 𝑥 𝑎
2
, 𝑦𝑎
2
, 𝑥 𝑎 𝑦𝑎 ⋅ 1, 2𝑥 𝑏, 2𝑦 𝑏, 𝑥 𝑏
2
, 𝑦 𝑏
2
, 𝑥 𝑏 𝑦 𝑏
x
y
𝑎 = (𝑥 𝑎, 𝑦𝑎)
𝑏 = (𝑥 𝑏, 𝑦 𝑏)
変換𝜙により６次元化
𝑘 𝒂, 𝒃 = 𝜙 𝒂 ⋅ 𝜙(𝒃)
２次元→6次元
変換を実際には行わず、内積の結果のみを使用する
14
𝜙 𝒂 𝜙 𝒃

QuantumTokyo古典SVMのまとめ
• 分類問題を解く分析手法
• 汎化性能の向上を目的としてマージンを最大化する
• カーネルトリックを使うことで、特徴量マッピングをすることなく、その計算結果だけを使用できる
15

16
1. SVMの概要
4. 計算コスト
3. Pythonで実行

量子SVMの概要(理想版 vs NISQ版)
理想的(ノイズフリー)な量子コンピューターでは、古典版SVMと比べて計算時間の削減が見込まれていました。
しかし実際は理想的(ノイズフリー)な量子SVMは不可能で、NISQデバイス版での量子SVMが提案されます。
ノイズフリーな量子SVM
時期: 2013年頃*1
要件: 位相推定(QPE)を使った逆行列計算が精度良く実行可能
目標: 計算の高速化
NISQデバイスの量子SVM
時期:2018年*2~
要件: 少数のゲート数で実装する必要がある(QPEが使えない)
目標: 古典で再現が難しいカーネルを実装する
17
(1) S. Lloyd et. al., arXiv:1307.0411 (2013).
(2) V. Havlíček et. al., Nature 567, 209 (2019)

ノイズフリー(1) NISQ(2)
逆行列計算
(*位相推定を利用)
◯ ×
(位相推定はNISQでは不可)
内積計算 △
(SWAPテストで高コストな3量子
ゲートを利用)
◯
(改良アルゴリズムで少数の
2量子ゲートを利用)
高速化 ◯
(指数的な高速化)
△
(特に優位性なし*)
特徴量マッピング △
(古典と同様、量子特有の工夫なし)
◯
(量子カーネルを作成)
*量子の計算方法を古典で再現すると優位性が「示唆」されるが古典本来の方法と比べると優位性はない
量子SVMの概要(理想版 vs NISQ版)
NISQ版のQSVMでは高速化ではなく特徴量マッピングの高度化に焦点が置かれています。
18
(1)P. Rebentrost, M. Mohseni and S. Lloyd, PRL 113, 13050 (2014)
(2)V. Havlíček et. al., Nature 567, 209 (2019)

QuantumTokyoNISQ版量子SVMについて
19
古典SVMのカーネル計算を、量子カーネル(量子状態の内積)で置き換えたものを量子SVMと呼びます。
SVMの実行フロー
訓練データの準備
カーネル行列𝐾 𝒙𝑖, 𝒙 𝑘 を計算
マージンMを最大化するパラメータを決定
分類の境界面を決定
予測用データを分類
ココを量子版に置き換え古
典
版
多項式カーネル 𝐾 𝒙𝑖, 𝒙 𝑘 = 𝒙𝑖
𝑇
𝒙 𝑘 + 𝑐
𝑑
・𝑑次以下の全種類の単項式を
各成分に持つ特徴ベクトル𝜙が対応
ガウスカーネル 𝐾 𝒙𝑖, 𝒙 𝑘 = exp(−
𝒙 𝑖−𝒙 𝑘
2
2𝜎2 )
・無限次元の特徴ベクトル𝜙を用いていることと等価
・有用な特徴量も含まれていると期待できる
量
子
版
量子カーネル 𝐾 𝒙𝑖, 𝒙 𝑘 = Φ 𝒙𝑖 Φ 𝒙 𝑘
2
・古典での再現が難しい(とされる)
・回路を深くせずに実現できる

QuantumTokyo量子状態への特徴量マッピング
量子カーネルに対応する特徴量マッピングは、量子状態Φ ∶ 𝒙𝑖 → Φ 𝒙𝑖 へのマッピングです。
特徴量(1次元の場合) 𝒙𝑖 = 𝛼𝑖
𝒙𝑖 →
Φ
𝐴 𝛼𝑖 0 + 𝐵 𝛼𝑖 1
V. Havlíček et al., Nat., 567 209 (2019)
・１次元ではブロッホ球に対応
・この図ではwを地軸として赤道が境界面
・北半球を+1、南半球を-1と分類

QuantumTokyo量子状態への特徴量マッピング
21
量子SVMでは、Groverの量子状態マッピングとは考え方が異なります。
Groverでのマッピング
検索index
(古典情報)
0 → 00
1 → 01
2 → 10
3 → 11
量子状態
不連続な値を量子状態にエンコードする
量子SVMでのマッピング
特徴量
(2次元の場合)
量子状態
連続な値を量子状態の位相にエンコードする
𝒙𝑖 = 𝛼𝑖, 𝛽𝑖 → 𝐴 𝛼𝑖, 𝛽𝑖 00 + 𝐵 𝛼𝑖, 𝛽𝑖 01
+ 𝐶 𝛼𝑖, 𝛽𝑖 10 + 𝐷 𝛼𝑖, 𝛽𝑖 11

QuantumTokyo量子SVMについて
22
量子SVMの実装論文では、
次の形で定義される量子状態へのマッピングだと古典での再現が難しいと提案しています。
d 𝑤ℎ𝑒𝑟𝑒 𝑈Φ 𝑥 = exp 𝑖
𝑠
𝜙 𝑆 𝒙 Π 𝐾∈𝑆 𝑃 𝐾
= exp 𝑖
𝑖
𝜙𝑖(𝒙)𝑃𝑖 + 𝑖
𝑖,𝑗
𝜙𝑖𝑗(𝒙)𝑃𝑖𝑗 +
𝑖,𝑗,𝑘
𝜙𝑖𝑗𝑘(𝒙)𝑃𝑖𝑗𝑘 + ⋯
・S はエンタングルさせるビットの組み合わせ
・𝜙𝑖(𝒙)はパウリ行列𝑃𝑖の係数
マッピングの自由度
𝒙 ∶→ | 𝛷 𝒙 = 𝛱 𝑑 𝑈Φ 𝑥 𝐻 𝑛 0

QuantumTokyo量子SVMについて(Z-FeatureMap)
23
一番簡単な例としてZ-FeatureMapがありますが、これでは量子の優位性がありません。
𝑠
= exp 𝑖
𝑖
𝑖,𝑗
𝑖,𝑗,𝑘
・𝜙𝑖(𝒙)はパウリ行列𝑃𝑖の係数
𝜙 𝑆 𝒙 = 𝜙𝑖 𝒙 = 𝑥𝑖
𝑃 𝐾 = 𝑍𝑖
𝑈Φ 𝑥 = exp 𝑖
𝑖
𝑥𝑖 𝑍𝑖
𝒙 ∶→ | 𝛷 𝒙 = 𝛱 𝑑 𝑈Φ 𝑥 𝐻 𝑛 0

QuantumTokyo量子SVMについて(ZZ-FeatureMap)
24
量子SVMの実装論文ではZZ-FeatureMapが採用されており、
d=2(2回の繰り返し)以上で古典での再現が難しくなると主張しています。
𝑠
= exp 𝑖
𝑖
𝑖,𝑗
𝑖,𝑗,𝑘
・𝜙𝑖(𝒙)はパウリ行列𝑃𝑖の係数 𝜙 𝑆 𝒙 =
𝑥𝑖 𝑆 = {𝑖}
𝜋 − 𝑥𝑖 𝜋 − 𝑥𝑗 𝑆 = {𝑖, 𝑗}
𝑃 𝐾 =
𝑍𝑖 𝐾 = 𝑖
𝑍𝑖𝑗 𝐾 = 𝑖𝑗
exp 𝑖𝜙12 𝑍12
𝒙 ∶→ | 𝛷 𝒙 = 𝛱 𝑑 𝑈Φ 𝑥 𝐻 𝑛 0

QuantumTokyo量子SVMについて(ZZ-FeatureMap)
25
論文での設定ではd=2でのZZ-FeatureMapが使用され、
𝐻, 𝑒 𝑖𝜃𝑍, 𝐶𝑁𝑂𝑇ゲートのみで構成ができます。
𝒙 → | 𝛷 𝒙 = 𝑈Φ 𝑥 𝐻 𝑛 𝑈Φ 𝑥 𝐻 𝑛|0
| 𝛷 𝒙 = 𝑒 𝑖 𝛼𝑍1+𝛽𝑍2+ 𝜋−𝛼 𝜋−𝛽 𝑍1 𝑍2 𝐻2 2
|0
H
H
𝑒 𝑖𝛼𝑍
𝑒 𝑖𝛽𝑍 𝑒 𝑖 𝜋−𝛼 (𝜋−𝛽)𝑍
2
入力データ𝒙 = 𝛼, 𝛽 に対応する量子状態

QuantumTokyo量子SVMについて(Pauli-FeatureMap)
26
さらに自由度の高い特徴量マッピングとしてPauli-FeatureMapもあります。
𝑠
= exp 𝑖
𝑖
𝑖,𝑗
𝑖,𝑗,𝑘
・𝜙𝑖(𝒙)はパウリ行列𝑃𝑘の係数 𝜙 𝑆 𝒙 =
𝑥𝑖 𝑆 = {𝑖}
𝜋 − 𝑥𝑖 𝜋 − 𝑥𝑗 𝑆 = {𝑖, 𝑗}
𝑃 𝐾 =
𝑋𝑖 𝑍𝑖 𝐾 = 𝑖
(𝑌𝑍)𝑖𝑗 𝐾 = 𝑖𝑗
exp 𝑖𝜙12 𝑍𝑌 12
exp 𝑖𝜙1 𝑋1
詳しくは以下参照
https://github.com/Qiskit-Challenge-
India/2020/blob/master/Day%206%2C%207%2C8/VQC_notebook.ipynb
𝒙 ∶→ | 𝛷 𝒙 = 𝛱 𝑑 𝑈Φ 𝑥 𝐻 𝑛 0

27
1. SVMの概要
4. 計算コスト
3. Pythonで実行

QuantumTokyo
28
量子カーネル(内積)の計算方法
| 𝜓 = 𝐴|00 = 𝑎 00 + 𝑏 01 + 𝑐 10 + 𝑑 11
初期状態|00 にユニタリ行列𝐴をかけた状態| 𝜓 の観測考えます
これで| 𝛷 𝒙 の実装方法を学びました。
次は量子カーネル𝐾 𝒙𝑖, 𝒙 𝑘 = Φ(𝒙𝑖) Φ(𝒙 𝑘) 2の計算方法です。
𝐴
このとき観測される状態が 00 , …, 11 となる確率は
それぞれ 𝑎 2
, … , 𝑑 2
となります(量子力学のルール)。
𝑖 𝑗 = 𝛿𝑖𝑗なので、 00 𝐴 00 2 = 𝑎 2です。
00 𝐴 00 2
𝑎 2
Shot=1000 (千回観測)したときのヒストグラム
01 𝐴 00 2
𝑏 2
𝑐 2 𝑑 2
10 𝐴 00 2
11 𝐴 00 2

QuantumTokyo
29
量子カーネル(内積)の計算方法
量子カーネル𝐾 𝒙𝑖, 𝒙 𝑘 = Φ(𝒙𝑖) Φ(𝒙 𝑘) 2 = 0 𝑈Φ 𝒙 𝑖
†
𝑈Φ 𝒙 𝑘
0
2
より同様に計算できます。
をR回測定して|00 がr回出現したとき、
𝐾 𝒙𝑖, 𝒙 𝑘 =
𝑟
𝑅
となります。
特徴量が2次元の場合( 0 ≔ 00 )、次のように計算できます
𝑈Φ 𝒙 𝑘
𝑈Φ 𝒙 𝑖
†
00 𝑈𝑖
†
𝑈 𝑘 00
2
𝐾 𝒙𝑖, 𝒙 𝑘
Shot=1000 (千回観測)したときのヒストグラム
𝒙1= (2, 3), 𝒙2= (1, 1)で
を𝐾 𝒙1 𝒙2 を実際に計算

QuantumTokyo
30
計算コスト
|Φ(𝒙1) |Φ(𝒙2) |Φ(𝒙3) |Φ(𝒙4) |Φ(𝒙5)
Φ 𝒙1 | 1
Φ 𝒙2 | 1
Φ 𝒙3 | 1
Φ 𝒙4 | 1
Φ 𝒙5 | 1
例: データ数𝑁 =5の場合
𝑈Φ 𝒙1
𝑈Φ 𝒙2
†
十分な精度を得るために
𝑂(𝑁2
)回の観測が必要
訓練データ数𝑁に対し、十分な精度を得るために𝑂(𝑁2)回の観測が必要で、
カーネル𝐾 𝒙𝑖, 𝒙 𝑘 の全ペア𝑂(𝑁2)回の量子回路の構築・実行が必要なため計算コストは𝑂(𝑁4)
カーネル行列の対角成分は常に1で、
対象行列なので計算が必要なペアは𝑁(𝑁 − 1)/2

31
1. SVMの概要
4. 計算コスト
3. Pythonで実行

QuantumTokyoPythonで実行
32
詳しくはQiitaの記事にも書いてあります
https://qiita.com/ucc_white/items/f2ea0d019979dd675f82

QuantumTokyoPythonで実行
33
Pythonで試したこと
古典SVMと量子SVMで次のことを実施
2つのデータセット(Breast_cancer/ad_hoc_data)でモデル作成・予測
訓練データ数：20 ;テストデータ数: 10 ; 予測データ数: 2500 (境界面を可視化するため)
分類モデルの性能評価
指標: Accuracy(分類の正解率)
Precision(正と予測したデータのうち，実際に正であるものの割合) :TP/(TP+FP)
Recall(実際に正であるもののうち，正であると予測されたものの割合): TP/(TP+FN)
Specificity(実際に負であるもののうち，負であると予測されたものの割合): TN/(FP+TN)
F-1 Score(RecallとPrecisionの調和平均): 2Recall*Precision/(Recall+ Precision)
境界面の可視化
真の結果
正負
予測
結果
正 TP FP
負 FN TN
TP:真陽性 FP:偽陰性
FN:偽陰性 FP:真陰性

QuantumTokyoGithubのコードで実際に実行してみた (量子シミュレータ[仮想版])
古典SVM 量子SVM
データセット: Breast_cancer (sklearn)
Accuracy: 0.85
Precision: 0.77
Recall: 1.00
Specificity: 0.70
F1-score: 0.87
実行時間(Mac PC):
モデル作成 3分11秒
予測 90分
モデル作成 + 予測 0.2秒
Accuracy: 0.65
Precision: 0.60
Recall: 0.90
Specificity: 0.40
F1-score: 0.72
●/●: 訓練データ(n=20) ■/■: テストデータ(n=10) ■/■予測データ(n=2500) × 誤分類
34

QuantumTokyoGithubのコードで実際に実行してみた (量子シミュレータ[仮想版])
古典SVM 量子SVM
●/●: 訓練データ(n=40) ■/■: テストデータ(n=20) ■/■予測データ(n=2500) × 誤分類
Accuracy: 0.80
Precision: 0.80
Recall: 0.80
Specificity: 0.80
F1-score: 0.80
モデル作成 3分11秒
予測 90分
モデル作成 + 予測 0.2秒
データセット: ad_hoc_data(qiskit.ml.datasets; 量子SVM用のデータセット)
Accuracy: 0.50
Precision: 0.50
Recall: 0.60
Specificity: 0.40
F1-score: 0.5535

QuantumTokyoハイパーパラメータ調整
36
Depth vs Time
*ad_hoc_dataを利用
Depth
Score
Depth vs モデル性能
Time(second)
Depth
特徴量を量子状態にマッピングする際のパラメータ、depthを調整することで性能が向上する

QuantumTokyo結論
37
結論
・量子SVMはカーネルを置き換えてる
・古典では再現が難しいカーネルを作った
・depthをパラメータでチューニングすると精度上がる

Quantum Support Vector Machine

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Similar a Quantum Support Vector Machine

Similar a Quantum Support Vector Machine (20)

Último

Último (7)

Quantum Support Vector Machine

Notas del editor