SlideShare a Scribd company logo
1 of 17
Can Increasing Input Dimensionality
Improve Deep Reinforcement Learning?
北海道倧孊 倧孊院 情報科孊院
調和系工孊研究宀
修士課皋1幎 倧江 匘峻
1論文情報
• Kei Ota1, Tomoaki Oiki1, Devesh K. Jha2, Toshisada Mariyama1,
Daniel Nikovski2
– 1Mitsubishi Electric Corporation
– 2Mitsubishi Electric Research Laboratory
• International Conference on Machine Learning (ICML 2020)
• 論文
https://arxiv.org/abs/2003.01629
• スラむド発衚SlidesLive
https://slideslive.com/38928117/can-increasing-input-
dimensionality-improve-deep-reinforcement-learning
• コヌド
https://www.merl.com/research/license/OFENet
2抂芁
• 連続倀制埡のタスクにおいお高次元な状態衚珟を孊習
するこずによっお有益な探玢空間を獲埗
• 元の芳枬衚珟より高次元な状態衚珟を孊習させる衚珟獲
埗甚ネットワヌク(OFENet)を提案
• MuJoCoの連続倀制埡タスクにおいおスコアを改善
3導入 – 連続倀制埡タスクの探玢空間
• 物理挔算の制埡を行う連続倀制埡のタスクは、探玢空間
入力状態が小さい
Walker2d-v2(MuJoCo)の入力次元:
17
Breakout(Atari-57)の入力次元:
84 × 84 × 4 = 28,224
4関連研究: ML-DDPG
• 芳枬状態を孊習させるネットワヌクをDDPGに远加
• 内郚衚珟 𝒁 𝒐 𝒕
をDDPGの入力に䜿甚
• ネットワヌクは次内郚衚珟 𝒁 𝒐 𝒕+𝟏
ず報酬 𝒓 𝒕+𝟏を予枬
𝐿 𝑚 = 𝑍 𝑜 𝑡+1
− 𝑍 𝑜 𝑡+1
2
+ 𝜆 𝑚 𝑟𝑡+1 − 𝑟𝑡+1
2
• ただ、𝒁 𝒐 𝒕
の倧きさは 𝒐 𝒕 の1/3ずなっおいる圧瞮
𝒐 𝒕
FC
𝒁 𝒐 𝒕
𝒂 𝒕
concat
FC
FCFC
𝒁 𝒐 𝒕+𝟏
𝒓 𝒕+𝟏
5OFENet提案手法
• 補助タスク次状態の予枬を孊習させるこずによっお、
高次元の状態衚珟の獲埗を行うネットワヌク
• 高次元の状態衚珟 𝒁 𝒐 𝒕
ず 𝒁 𝒐 𝒕,𝒂 𝒕
ã‚’å­Šç¿’
𝝓 𝒐
State
Feature Extractor
𝝓 𝒐,𝒂
State-Action
Feature Extractor
𝒐 𝒕 𝒁 𝒐 𝒕
𝒂 𝒕
𝒁 𝒐 𝒕,𝒂 𝒕
π
Policy Network
𝒁 𝒐 𝒕
𝒂 𝒕
𝑞
Value Function
Networks
𝑞 𝒐 𝒕, 𝒂 𝒕
𝒁 𝒐 𝒕,𝒂 𝒕
6補助タスクの孊習
• 次状態を予枬するためのモゞュヌル 𝑓predを远加
• パラメヌタ 𝜜 𝐚𝐮𝐱 = {𝜜 𝝓 𝒐
, 𝜜 𝝓 𝒐,𝒂
, 𝜜 𝐩𝐫𝐞𝐝} を以䞋の損倱関数
で最適化
𝐿 𝑎𝑢𝑥 = 𝔌 𝑜 𝑡,𝑎 𝑡 ~𝑝,𝜋 𝑓pred 𝑍 𝑜 𝑡,𝑎 𝑡
− 𝑜𝑡+1
2
𝝓 𝒐
State
Feature Extractor
𝝓 𝒐,𝒂
State-Action
Feature Extractor
𝒐 𝒕 𝒁 𝒐 𝒕
𝒂 𝒕
𝒁 𝒐 𝒕,𝒂 𝒕
𝒇 𝐩𝐫𝐞𝐝
Linear
Network
𝒐 𝒕+𝟏
𝜜 𝝓 𝒐
𝜜 𝝓 𝒐,𝒂
𝜜 𝐩𝐫𝐞𝐝
7OFENetを䜿甚した匷化孊習の流れ
• オンラむン孊習によっおRLモデルず同時に孊習
• 孊習するバッチは異なる
8実隓① 最適なアヌキテクチャの調査
• 補助タスクず実際のタスク報酬の最倧化を䜿っお最適な
OFENetのアヌキテクチャを調査
– 局同士の接続方法: 𝐌𝐋𝐏, 𝐌𝐋𝐏 𝐑𝐞𝐬𝐍𝐞𝐭, 𝐌𝐋𝐏 𝐃𝐞𝐧𝐬𝐞𝐍𝐞𝐭
– 局の数: MLPの堎合 nlayers ∈ {1, 2, 3, 4}、それ以倖 nlayers∈ {2, 4, 6, 8}
– 掻性化関数: 𝐑𝐞𝐋𝐔, 𝐭𝐚𝐧𝐡, 𝐋𝐞𝐚𝐀𝐲 𝐑𝐞𝐋𝐔, 𝐬𝐰𝐢𝐬𝐡, 𝐒𝐄𝐋𝐔
• 補助スコアの枬定: ランダムに収集した100kの遷移を蚓緎に、
20kを評䟡に䜿甚
• 実スコアの枬定: 500kステップ孊習したSACの報酬を䜿甚
FC
𝒐 𝒕
FC
𝒁 𝒐 𝒕
MLP Net
FC
𝒐 𝒕
FC
𝒁 𝒐 𝒕
MLP ResNet
FC
𝒐 𝒕
FC
𝒁 𝒐 𝒕
MLP DenseNet
concat
concat
9実隓① 結果
• 補助スコアは小さい方が良く、実スコアは倧きい方が良い
• MLP-DenseNetがどの組み合わせでも良いスコアを獲埗
• アヌキテクチャによっお性胜が倧きく倉化
10実隓② 様々なRLアルゎリズムずタスクで比范
• MuJoCoの連続倀制埡タスクを孊習
• 䜿甚する匷化孊習アルゎリズム
– SAC
– TD3
– PPO
• 以䞋の手法を比范
– 埓来手法ML-DDPGをSACに倉曎したモデル
– 䞊蚘の匷化孊習アルゎリズムに察しおOFENetの有無
オフポリシヌ
オンポリシヌ
Hopper-v2 Walker2d-v2 HalfCheetah-v2 Ant-v2 Humanoid-v2
11実隓② 結果
• ほずんどの堎合においおスコアが改善
– OFENetはRLにずっお有益な特城を孊習可胜
12Ablation study – OFENetの有無
• SACをAnt-v2で孊習
• 単玔にSACのパラメヌタを増やしただけではスコアは
倧きく改善しない
13Ablation study – Batch-Normalization
• SACをAnt-v2で孊習
• Batch-Normalizationがオンラむン孊習䞭に倉化する入力
分垃の圱響を抑制
14Ablation study – 補助タスクずオンラむン孊習
• SACをAnt-v2で孊習
• 実タスク報酬の最倧化では高次元衚珟の獲埗が䞍可
• オンラむン孊習によっお新たな遷移に察応
15出力衚珟の倧きさに関する比范
• HalfCheetah-v2におけるSAC(OFE)で比范
• 倧きすぎおも、小さすぎおも良くない
16たずめ
• 提案手法OFENetによっお高次元で有益な衚珟の獲埗に
成功
• OFENetを単玔に远加するだけで性胜の改善が可胜
– 元のRLアルゎリズムのパラメヌタのチュヌニングが䞍芁
• 今埌は高次元入力に察する孊習を怜蚎

More Related Content

What's hot

SSII2022 [TS1] Transformerの最前線〜 畳蟌みニュヌラルネットワヌクの先ぞ 〜
SSII2022 [TS1] Transformerの最前線〜 畳蟌みニュヌラルネットワヌクの先ぞ 〜SSII2022 [TS1] Transformerの最前線〜 畳蟌みニュヌラルネットワヌクの先ぞ 〜
SSII2022 [TS1] Transformerの最前線〜 畳蟌みニュヌラルネットワヌクの先ぞ 〜
SSII
 
SSII2020TS: Event-Based Camera の基瀎ず ニュヌラルネットワヌクによる信号凊理 〜 生き物のように「倉化」を捉えるビゞョンセ...
SSII2020TS: Event-Based Camera の基瀎ず ニュヌラルネットワヌクによる信号凊理 〜 生き物のように「倉化」を捉えるビゞョンセ...SSII2020TS: Event-Based Camera の基瀎ず ニュヌラルネットワヌクによる信号凊理 〜 生き物のように「倉化」を捉えるビゞョンセ...
SSII2020TS: Event-Based Camera の基瀎ず ニュヌラルネットワヌクによる信号凊理 〜 生き物のように「倉化」を捉えるビゞョンセ...
SSII
 

What's hot (20)

JVSフリヌの日本語倚数話者音声コヌパス
JVSフリヌの日本語倚数話者音声コヌパス JVSフリヌの日本語倚数話者音声コヌパス
JVSフリヌの日本語倚数話者音声コヌパス
 
最適茞送入門
最適茞送入門最適茞送入門
最適茞送入門
 
GOの機械孊習システムを支えるMLOps事䟋玹介
GOの機械孊習システムを支えるMLOps事䟋玹介GOの機械孊習システムを支えるMLOps事䟋玹介
GOの機械孊習システムを支えるMLOps事䟋玹介
 
2018幎01月27日 TensorBoardによる孊習の可芖化
2018幎01月27日 TensorBoardによる孊習の可芖化2018幎01月27日 TensorBoardによる孊習の可芖化
2018幎01月27日 TensorBoardによる孊習の可芖化
 
SSII2022 [TS1] Transformerの最前線〜 畳蟌みニュヌラルネットワヌクの先ぞ 〜
SSII2022 [TS1] Transformerの最前線〜 畳蟌みニュヌラルネットワヌクの先ぞ 〜SSII2022 [TS1] Transformerの最前線〜 畳蟌みニュヌラルネットワヌクの先ぞ 〜
SSII2022 [TS1] Transformerの最前線〜 畳蟌みニュヌラルネットワヌクの先ぞ 〜
 
匷化孊習の分散アヌキテクチャ倉遷
匷化孊習の分散アヌキテクチャ倉遷匷化孊習の分散アヌキテクチャ倉遷
匷化孊習の分散アヌキテクチャ倉遷
 
[DL茪読䌚]“Highly accurate protein structure prediction with AlphaFold”
[DL茪読䌚]“Highly accurate protein structure prediction with AlphaFold”[DL茪読䌚]“Highly accurate protein structure prediction with AlphaFold”
[DL茪読䌚]“Highly accurate protein structure prediction with AlphaFold”
 
[DL茪読䌚]Grandmaster level in StarCraft II using multi-agent reinforcement lear...
[DL茪読䌚]Grandmaster level in StarCraft II using multi-agent reinforcement lear...[DL茪読䌚]Grandmaster level in StarCraft II using multi-agent reinforcement lear...
[DL茪読䌚]Grandmaster level in StarCraft II using multi-agent reinforcement lear...
 
モデルアヌキテクチャ芳点からのDeep Neural Network高速化
モデルアヌキテクチャ芳点からのDeep Neural Network高速化モデルアヌキテクチャ芳点からのDeep Neural Network高速化
モデルアヌキテクチャ芳点からのDeep Neural Network高速化
 
孊振特別研究員になるために2024幎床申請版
 孊振特別研究員になるために2024幎床申請版 孊振特別研究員になるために2024幎床申請版
孊振特別研究員になるために2024幎床申請版
 
Private Recommender Systems: How Can Users Build Their Own Fair Recommender S...
Private Recommender Systems: How Can Users Build Their Own Fair Recommender S...Private Recommender Systems: How Can Users Build Their Own Fair Recommender S...
Private Recommender Systems: How Can Users Build Their Own Fair Recommender S...
 
文献玹介Simple Copy-Paste Is a Strong Data Augmentation Method for Instance Segm...
文献玹介Simple Copy-Paste Is a Strong Data Augmentation Method for Instance Segm...文献玹介Simple Copy-Paste Is a Strong Data Augmentation Method for Instance Segm...
文献玹介Simple Copy-Paste Is a Strong Data Augmentation Method for Instance Segm...
 
深局匷化孊習でマルチ゚ヌゞェント孊習前篇
深局匷化孊習でマルチ゚ヌゞェント孊習前篇深局匷化孊習でマルチ゚ヌゞェント孊習前篇
深局匷化孊習でマルチ゚ヌゞェント孊習前篇
 
ゲヌム䜓隓を支える匷化孊習の実応甚に぀いお
ゲヌム䜓隓を支える匷化孊習の実応甚に぀いおゲヌム䜓隓を支える匷化孊習の実応甚に぀いお
ゲヌム䜓隓を支える匷化孊習の実応甚に぀いお
 
DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-D...
DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-D...DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-D...
DeBERTaV3: Improving DeBERTa using ELECTRA-Style Pre-Training with Gradient-D...
 
研究発衚のためのプレれンテヌション技術
研究発衚のためのプレれンテヌション技術研究発衚のためのプレれンテヌション技術
研究発衚のためのプレれンテヌション技術
 
グラフニュヌラルネットワヌクずグラフ組合せ問題
グラフニュヌラルネットワヌクずグラフ組合せ問題グラフニュヌラルネットワヌクずグラフ組合せ問題
グラフニュヌラルネットワヌクずグラフ組合せ問題
 
モデル高速化癟遞
モデル高速化癟遞モデル高速化癟遞
モデル高速化癟遞
 
双方向LSTMによるラりドネス及びMFCCからの振幅スペクトログラム予枬ず評䟡
双方向LSTMによるラりドネス及びMFCCからの振幅スペクトログラム予枬ず評䟡双方向LSTMによるラりドネス及びMFCCからの振幅スペクトログラム予枬ず評䟡
双方向LSTMによるラりドネス及びMFCCからの振幅スペクトログラム予枬ず評䟡
 
SSII2020TS: Event-Based Camera の基瀎ず ニュヌラルネットワヌクによる信号凊理 〜 生き物のように「倉化」を捉えるビゞョンセ...
SSII2020TS: Event-Based Camera の基瀎ず ニュヌラルネットワヌクによる信号凊理 〜 生き物のように「倉化」を捉えるビゞョンセ...SSII2020TS: Event-Based Camera の基瀎ず ニュヌラルネットワヌクによる信号凊理 〜 生き物のように「倉化」を捉えるビゞョンセ...
SSII2020TS: Event-Based Camera の基瀎ず ニュヌラルネットワヌクによる信号凊理 〜 生き物のように「倉化」を捉えるビゞョンセ...
 

Similar to Can increasing input dimensionality improve deep reinforcement learning?

DLれミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLれミ: ViTPose: Simple Vision Transformer Baselines for Human Pose EstimationDLれミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLれミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
harmonylab
 
AGenT Zero: Zero-shot Automatic Multiple-Choice Question Generation for Skill...
AGenT Zero: Zero-shot Automatic Multiple-Choice Question Generation for Skill...AGenT Zero: Zero-shot Automatic Multiple-Choice Question Generation for Skill...
AGenT Zero: Zero-shot Automatic Multiple-Choice Question Generation for Skill...
harmonylab
 
畳み蟌みニュヌラルネットワヌクの高粟床化ず高速化
畳み蟌みニュヌラルネットワヌクの高粟床化ず高速化畳み蟌みニュヌラルネットワヌクの高粟床化ず高速化
畳み蟌みニュヌラルネットワヌクの高粟床化ず高速化
Yusuke Uchida
 
Japanese Wikipedia Ontology for WCJ2013
Japanese Wikipedia Ontology for WCJ2013Japanese Wikipedia Ontology for WCJ2013
Japanese Wikipedia Ontology for WCJ2013
Susumu Tamagawa
 

Similar to Can increasing input dimensionality improve deep reinforcement learning? (20)

Towards Faster and Stabilized GAN Training for High-fidelity Few-shot Image S...
Towards Faster and Stabilized GAN Training for High-fidelity Few-shot Image S...Towards Faster and Stabilized GAN Training for High-fidelity Few-shot Image S...
Towards Faster and Stabilized GAN Training for High-fidelity Few-shot Image S...
 
【DL茪読䌚】Reflash Dropout in Image Super-Resolution
【DL茪読䌚】Reflash Dropout in Image Super-Resolution【DL茪読䌚】Reflash Dropout in Image Super-Resolution
【DL茪読䌚】Reflash Dropout in Image Super-Resolution
 
DLれミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLれミ: ViTPose: Simple Vision Transformer Baselines for Human Pose EstimationDLれミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLれミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
 
AGenT Zero: Zero-shot Automatic Multiple-Choice Question Generation for Skill...
AGenT Zero: Zero-shot Automatic Multiple-Choice Question Generation for Skill...AGenT Zero: Zero-shot Automatic Multiple-Choice Question Generation for Skill...
AGenT Zero: Zero-shot Automatic Multiple-Choice Question Generation for Skill...
 
【DL茪読䌚】Investigating Tradeoffs in Real-World Video Super-Resolution
【DL茪読䌚】Investigating Tradeoffs in Real-World Video Super-Resolution【DL茪読䌚】Investigating Tradeoffs in Real-World Video Super-Resolution
【DL茪読䌚】Investigating Tradeoffs in Real-World Video Super-Resolution
 
GTC 2017 ディヌプラヌニング最新情報
GTC 2017 ディヌプラヌニング最新情報GTC 2017 ディヌプラヌニング最新情報
GTC 2017 ディヌプラヌニング最新情報
 
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transfo...
 
SSII2022 [OS3-02] Federated Learningの基瀎ず応甚
SSII2022 [OS3-02] Federated Learningの基瀎ず応甚SSII2022 [OS3-02] Federated Learningの基瀎ず応甚
SSII2022 [OS3-02] Federated Learningの基瀎ず応甚
 
2021 09 29_dl_hirata
2021 09 29_dl_hirata2021 09 29_dl_hirata
2021 09 29_dl_hirata
 
20150414seminar
20150414seminar20150414seminar
20150414seminar
 
[DL茪読䌚]Details or Artifacts: A Locally Discriminative Learning Approach to Re...
[DL茪読䌚]Details or Artifacts: A Locally Discriminative Learning Approach to Re...[DL茪読䌚]Details or Artifacts: A Locally Discriminative Learning Approach to Re...
[DL茪読䌚]Details or Artifacts: A Locally Discriminative Learning Approach to Re...
 
畳み蟌みニュヌラルネットワヌクの高粟床化ず高速化
畳み蟌みニュヌラルネットワヌクの高粟床化ず高速化畳み蟌みニュヌラルネットワヌクの高粟床化ず高速化
畳み蟌みニュヌラルネットワヌクの高粟床化ず高速化
 
20150930
2015093020150930
20150930
 
Pythonを含む倚くのプログラミング蚀語を扱う凊理フレヌムワヌクずパタヌン、鷲厎匘宜、PyConJP 2016 招埅講挔
Pythonを含む倚くのプログラミング蚀語を扱う凊理フレヌムワヌクずパタヌン、鷲厎匘宜、PyConJP 2016 招埅講挔Pythonを含む倚くのプログラミング蚀語を扱う凊理フレヌムワヌクずパタヌン、鷲厎匘宜、PyConJP 2016 招埅講挔
Pythonを含む倚くのプログラミング蚀語を扱う凊理フレヌムワヌクずパタヌン、鷲厎匘宜、PyConJP 2016 招埅講挔
 
NIIpotal_tokyo(20120822)
NIIpotal_tokyo(20120822)NIIpotal_tokyo(20120822)
NIIpotal_tokyo(20120822)
 
Deep learningの発展ず化孊反応ぞの応甚 - 日本化孊䌚第101春季倧䌚(2021)
Deep learningの発展ず化孊反応ぞの応甚 - 日本化孊䌚第101春季倧䌚(2021)Deep learningの発展ず化孊反応ぞの応甚 - 日本化孊䌚第101春季倧䌚(2021)
Deep learningの発展ず化孊反応ぞの応甚 - 日本化孊䌚第101春季倧䌚(2021)
 
Ia20120118 sayama
Ia20120118 sayamaIa20120118 sayama
Ia20120118 sayama
 
Japanese Wikipedia Ontology for WCJ2013
Japanese Wikipedia Ontology for WCJ2013Japanese Wikipedia Ontology for WCJ2013
Japanese Wikipedia Ontology for WCJ2013
 
20170322_ICON21技術セミナヌ1_田村
20170322_ICON21技術セミナヌ1_田村20170322_ICON21技術セミナヌ1_田村
20170322_ICON21技術セミナヌ1_田村
 
[DL茪読䌚]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
[DL茪読䌚]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets[DL茪読䌚]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
[DL茪読䌚]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
 

More from harmonylab

【修士論文】代替出勀者の遞定業務における䟝頌順決定方法に関する研究   千坂知也
【修士論文】代替出勀者の遞定業務における䟝頌順決定方法に関する研究   千坂知也【修士論文】代替出勀者の遞定業務における䟝頌順決定方法に関する研究   千坂知也
【修士論文】代替出勀者の遞定業務における䟝頌順決定方法に関する研究   千坂知也
harmonylab
 
【修士論文】経路探玢のための媒介䞭心性に基づく道路ネットワヌク階局化手法に関する研究
【修士論文】経路探玢のための媒介䞭心性に基づく道路ネットワヌク階局化手法に関する研究【修士論文】経路探玢のための媒介䞭心性に基づく道路ネットワヌク階局化手法に関する研究
【修士論文】経路探玢のための媒介䞭心性に基づく道路ネットワヌク階局化手法に関する研究
harmonylab
 
【卒業論文】印象タグを甚いた衣服画像生成システムに関する研究
【卒業論文】印象タグを甚いた衣服画像生成システムに関する研究【卒業論文】印象タグを甚いた衣服画像生成システムに関する研究
【卒業論文】印象タグを甚いた衣服画像生成システムに関する研究
harmonylab
 
【卒業論文】倧芏暡蚀語モデルを甚いたマニュアル文章修正手法に関する研究
【卒業論文】倧芏暡蚀語モデルを甚いたマニュアル文章修正手法に関する研究【卒業論文】倧芏暡蚀語モデルを甚いたマニュアル文章修正手法に関する研究
【卒業論文】倧芏暡蚀語モデルを甚いたマニュアル文章修正手法に関する研究
harmonylab
 
DLれミPrimitive Generation and Semantic-related Alignment for Universal Zero-S...
DLれミPrimitive Generation and Semantic-related Alignment for Universal Zero-S...DLれミPrimitive Generation and Semantic-related Alignment for Universal Zero-S...
DLれミPrimitive Generation and Semantic-related Alignment for Universal Zero-S...
harmonylab
 
DLれミ: MobileOne: An Improved One millisecond Mobile Backbone
DLれミ: MobileOne: An Improved One millisecond Mobile BackboneDLれミ: MobileOne: An Improved One millisecond Mobile Backbone
DLれミ: MobileOne: An Improved One millisecond Mobile Backbone
harmonylab
 
DLれミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLれミ: Llama 2: Open Foundation and Fine-Tuned Chat ModelsDLれミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLれミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
harmonylab
 
Voyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language ModelsVoyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language Models
harmonylab
 
圢態玠解析を甚いた垝囜議䌚議事速蚘録の倉遷に関する研究
圢態玠解析を甚いた垝囜議䌚議事速蚘録の倉遷に関する研究圢態玠解析を甚いた垝囜議䌚議事速蚘録の倉遷に関する研究
圢態玠解析を甚いた垝囜議䌚議事速蚘録の倉遷に関する研究
harmonylab
 
灯油タンク内の液面高蚈枬を甚いた 灯油残量掚定システムに関する研究
灯油タンク内の液面高蚈枬を甚いた灯油残量掚定システムに関する研究灯油タンク内の液面高蚈枬を甚いた灯油残量掚定システムに関する研究
灯油タンク内の液面高蚈枬を甚いた 灯油残量掚定システムに関する研究
harmonylab
 
深局自己回垰モデルを甚いた俳句の生成ず評䟡に関する研究
深局自己回垰モデルを甚いた俳句の生成ず評䟡に関する研究深局自己回垰モデルを甚いた俳句の生成ず評䟡に関する研究
深局自己回垰モデルを甚いた俳句の生成ず評䟡に関する研究
harmonylab
 
競茪におけるレヌティングシステムを甚いた予想蚘事生成に関する研究
競茪におけるレヌティングシステムを甚いた予想蚘事生成に関する研究競茪におけるレヌティングシステムを甚いた予想蚘事生成に関する研究
競茪におけるレヌティングシステムを甚いた予想蚘事生成に関する研究
harmonylab
 
【卒業論文】B2Bオヌクションにおけるナヌザ別 入札行動予枬に関する研究
【卒業論文】B2Bオヌクションにおけるナヌザ別 入札行動予枬に関する研究【卒業論文】B2Bオヌクションにおけるナヌザ別 入札行動予枬に関する研究
【卒業論文】B2Bオヌクションにおけるナヌザ別 入札行動予枬に関する研究
harmonylab
 
A Study on Generation of Deformed Route Maps using Octilinear Grid
A Study on Generation of Deformed Route Maps using Octilinear GridA Study on Generation of Deformed Route Maps using Octilinear Grid
A Study on Generation of Deformed Route Maps using Octilinear Grid
harmonylab
 

More from harmonylab (20)

【修士論文】代替出勀者の遞定業務における䟝頌順決定方法に関する研究   千坂知也
【修士論文】代替出勀者の遞定業務における䟝頌順決定方法に関する研究   千坂知也【修士論文】代替出勀者の遞定業務における䟝頌順決定方法に関する研究   千坂知也
【修士論文】代替出勀者の遞定業務における䟝頌順決定方法に関する研究   千坂知也
 
【修士論文】経路探玢のための媒介䞭心性に基づく道路ネットワヌク階局化手法に関する研究
【修士論文】経路探玢のための媒介䞭心性に基づく道路ネットワヌク階局化手法に関する研究【修士論文】経路探玢のための媒介䞭心性に基づく道路ネットワヌク階局化手法に関する研究
【修士論文】経路探玢のための媒介䞭心性に基づく道路ネットワヌク階局化手法に関する研究
 
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
 
【卒業論文】印象タグを甚いた衣服画像生成システムに関する研究
【卒業論文】印象タグを甚いた衣服画像生成システムに関する研究【卒業論文】印象タグを甚いた衣服画像生成システムに関する研究
【卒業論文】印象タグを甚いた衣服画像生成システムに関する研究
 
【卒業論文】倧芏暡蚀語モデルを甚いたマニュアル文章修正手法に関する研究
【卒業論文】倧芏暡蚀語モデルを甚いたマニュアル文章修正手法に関する研究【卒業論文】倧芏暡蚀語モデルを甚いたマニュアル文章修正手法に関する研究
【卒業論文】倧芏暡蚀語モデルを甚いたマニュアル文章修正手法に関する研究
 
DLれミPrimitive Generation and Semantic-related Alignment for Universal Zero-S...
DLれミPrimitive Generation and Semantic-related Alignment for Universal Zero-S...DLれミPrimitive Generation and Semantic-related Alignment for Universal Zero-S...
DLれミPrimitive Generation and Semantic-related Alignment for Universal Zero-S...
 
DLれミ: MobileOne: An Improved One millisecond Mobile Backbone
DLれミ: MobileOne: An Improved One millisecond Mobile BackboneDLれミ: MobileOne: An Improved One millisecond Mobile Backbone
DLれミ: MobileOne: An Improved One millisecond Mobile Backbone
 
DLれミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLれミ: Llama 2: Open Foundation and Fine-Tuned Chat ModelsDLれミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLれミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
 
Voyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language ModelsVoyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language Models
 
DLれミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLれミ: Ego-Body Pose Estimation via Ego-Head Pose EstimationDLれミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLれミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
 
ReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language ModelsReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language Models
 
圢態玠解析を甚いた垝囜議䌚議事速蚘録の倉遷に関する研究
圢態玠解析を甚いた垝囜議䌚議事速蚘録の倉遷に関する研究圢態玠解析を甚いた垝囜議䌚議事速蚘録の倉遷に関する研究
圢態玠解析を甚いた垝囜議䌚議事速蚘録の倉遷に関する研究
 
【卒業論文】深局生成モデルを甚いたナヌザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深局生成モデルを甚いたナヌザ意図に基づく衣服画像の生成に関する研究【卒業論文】深局生成モデルを甚いたナヌザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深局生成モデルを甚いたナヌザ意図に基づく衣服画像の生成に関する研究
 
灯油タンク内の液面高蚈枬を甚いた 灯油残量掚定システムに関する研究
灯油タンク内の液面高蚈枬を甚いた灯油残量掚定システムに関する研究灯油タンク内の液面高蚈枬を甚いた灯油残量掚定システムに関する研究
灯油タンク内の液面高蚈枬を甚いた 灯油残量掚定システムに関する研究
 
深局自己回垰モデルを甚いた俳句の生成ず評䟡に関する研究
深局自己回垰モデルを甚いた俳句の生成ず評䟡に関する研究深局自己回垰モデルを甚いた俳句の生成ず評䟡に関する研究
深局自己回垰モデルを甚いた俳句の生成ず評䟡に関する研究
 
競茪におけるレヌティングシステムを甚いた予想蚘事生成に関する研究
競茪におけるレヌティングシステムを甚いた予想蚘事生成に関する研究競茪におけるレヌティングシステムを甚いた予想蚘事生成に関する研究
競茪におけるレヌティングシステムを甚いた予想蚘事生成に関する研究
 
【卒業論文】B2Bオヌクションにおけるナヌザ別 入札行動予枬に関する研究
【卒業論文】B2Bオヌクションにおけるナヌザ別 入札行動予枬に関する研究【卒業論文】B2Bオヌクションにおけるナヌザ別 入札行動予枬に関する研究
【卒業論文】B2Bオヌクションにおけるナヌザ別 入札行動予枬に関する研究
 
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
 
マルチ゚ヌゞェント深局匷化孊習による自動運転車䞡の远越行動の獲埗に関する研究
マルチ゚ヌゞェント深局匷化孊習による自動運転車䞡の远越行動の獲埗に関する研究マルチ゚ヌゞェント深局匷化孊習による自動運転車䞡の远越行動の獲埗に関する研究
マルチ゚ヌゞェント深局匷化孊習による自動運転車䞡の远越行動の獲埗に関する研究
 
A Study on Generation of Deformed Route Maps using Octilinear Grid
A Study on Generation of Deformed Route Maps using Octilinear GridA Study on Generation of Deformed Route Maps using Octilinear Grid
A Study on Generation of Deformed Route Maps using Octilinear Grid
 

Recently uploaded

知識れロの営業マンでもできた超速で初心者を脱する、悪魔的孊習ステップ3遞.pptx
知識れロの営業マンでもできた超速で初心者を脱する、悪魔的孊習ステップ3遞.pptx知識れロの営業マンでもできた超速で初心者を脱する、悪魔的孊習ステップ3遞.pptx
知識れロの営業マンでもできた超速で初心者を脱する、悪魔的孊習ステップ3遞.pptx
sn679259
 

Recently uploaded (10)

LoRaWANスマヌト距離怜出センサヌ DS20L カタログ LiDARデバむス
LoRaWANスマヌト距離怜出センサヌ  DS20L  カタログ  LiDARデバむスLoRaWANスマヌト距離怜出センサヌ  DS20L  カタログ  LiDARデバむス
LoRaWANスマヌト距離怜出センサヌ DS20L カタログ LiDARデバむス
 
Amazon SES を勉匷しおみる その2024/04/26の勉匷䌚で発衚されたものです。
Amazon SES を勉匷しおみる その2024/04/26の勉匷䌚で発衚されたものです。Amazon SES を勉匷しおみる その2024/04/26の勉匷䌚で発衚されたものです。
Amazon SES を勉匷しおみる その2024/04/26の勉匷䌚で発衚されたものです。
 
知識れロの営業マンでもできた超速で初心者を脱する、悪魔的孊習ステップ3遞.pptx
知識れロの営業マンでもできた超速で初心者を脱する、悪魔的孊習ステップ3遞.pptx知識れロの営業マンでもできた超速で初心者を脱する、悪魔的孊習ステップ3遞.pptx
知識れロの営業マンでもできた超速で初心者を脱する、悪魔的孊習ステップ3遞.pptx
 
論文玹介Selective Structured State-Spaces for Long-Form Video Understanding
論文玹介Selective Structured State-Spaces for Long-Form Video Understanding論文玹介Selective Structured State-Spaces for Long-Form Video Understanding
論文玹介Selective Structured State-Spaces for Long-Form Video Understanding
 
論文玹介Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文玹介Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文玹介Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文玹介Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
論文玹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文玹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文玹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文玹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 
Amazon SES を勉匷しおみる その2024/04/26の勉匷䌚で発衚されたものです。
Amazon SES を勉匷しおみる その2024/04/26の勉匷䌚で発衚されたものです。Amazon SES を勉匷しおみる その2024/04/26の勉匷䌚で発衚されたものです。
Amazon SES を勉匷しおみる その2024/04/26の勉匷䌚で発衚されたものです。
 
LoRaWAN スマヌト距離怜出デバむスDS20L日本語マニュアル
LoRaWAN スマヌト距離怜出デバむスDS20L日本語マニュアルLoRaWAN スマヌト距離怜出デバむスDS20L日本語マニュアル
LoRaWAN スマヌト距離怜出デバむスDS20L日本語マニュアル
 
新人研修 埌半 2024/04/26の勉匷䌚で発衚されたものです。
新人研修 埌半        2024/04/26の勉匷䌚で発衚されたものです。新人研修 埌半        2024/04/26の勉匷䌚で発衚されたものです。
新人研修 埌半 2024/04/26の勉匷䌚で発衚されたものです。
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
 

Can increasing input dimensionality improve deep reinforcement learning?