-
- https://arxiv.org/abs/2103.05187
- 2021
本論文では,提案不要の参照表現接地タスクに取り組み,既製のオブジェクト提案に頼らずに,クエリ文に応じてターゲットオブジェクトをローカライズすることを目指す.
既存の提案不要の手法は、クエリと画像のマッチングを行い、画像特徴マップの中で最もスコアの高い点をターゲットボックスの中心として選択し、その幅と高さを…
e4exp updated
3 years ago
-
## 一言でいうと
Model Baseの手法で学習を行う際に、環境全体をモデル化するのでなく、局所的なパートだけモデル化して(このとき戦略も線形化する)、戦略の勾配を推定するという手法。これにより環境全体をモデル化する必要なしにModel Baseによる効率的な学習が可能になる。
![image](https://user-images.githubusercontent.com/5…
-
## 一言でいうと
テキストアドベンチャーゲームを、強化学習+知識グラフで攻略したという研究。ゲームは選択肢で分岐して進むため、得られた状態で内部のグラフを更新していく。グラフ表現(Graph Convolution + Attention)+テキスト表現(一定範囲のBi-LSTM)で行動価値を出力する(行動数はグラフで絞り込む)。
### 論文リンク
https://arxiv…
-
Do you provide an official ready-to-run script to reproduce the exact results of the "Benchmarking Deep Reinforcement Learning for Continuous Control" paper?
-
Check this implementation: https://medium.com/towards-data-science/deep-reinforcement-learning-and-monte-carlo-tree-search-with-connect-4-ba22a4713e7a
Create the following:
- [ ] Base class for MTC…
-
I want to make a project using reinforcement learning in which a bot send scam to other bots on social media, other bots detect the scam and reject it.
I think it needs a deep reinforcement learning…
-
亲爱的作者们,您好:
我正在读你的论文,给我留下了深刻的印象。但是当我尝试运行代码时出现此错误。
请帮助我解决这个错误
@neardws
(environment) teddy@teddy-HP-Notebook:~/Desktop/Game-Theoretic-Deep-Reinforcement-Learning-main/Experiment$ python run_d4…
-
This dataset is very helpful for NLP research in the scientific domain.
When I checked the parsed paper structure, I found some errors in the aspect of the paper structure.
For the paper "2212.002…
-
https://arxiv.org/abs/1706.05064
TMats updated
6 years ago
-
# Deep Q-Network (DQN) on LunarLander-v2 | Chan`s Jupyter
In this post, We will take a hands-on-lab of Simple Deep Q-Network (DQN) on openAI LunarLander-v2 environment. This is the coding exercise fr…