Refactoring Policy for Compositional Generalizability using Self-Supervised Object Proposals

Mu, Tongzhou, Gu, Jiayuan, Jia, Zhiwei, Tang, Hao, Su, Hao

Oct-26-2020–arXiv.org Artificial Intelligence

We study how to learn a policy with compositional generalizability. We propose a two-stage framework, which refactorizes a high-reward teacher policy into a generalizable student policy with strong inductive bias. Particularly, we implement an object-centric GNN-based student policy, whose input objects are learned from images through self-supervised learning. Empirically, we evaluate our approach on four difficult tasks that require compositional generalizability, and achieve superior performance compared to baselines.

detector, machine learning, reinforcement learning, (17 more...)

arXiv.org Artificial Intelligence

Oct-26-2020

arXiv.org PDF

Add feedback

Country:
- North America
  - United States > California
    - San Diego County > San Diego (0.04)
  - Canada > British Columbia
    - Metro Vancouver Regional District > Vancouver (0.04)
- Asia > China
  - Shanghai > Shanghai (0.04)

Genre:
- Research Report (0.50)

Industry:
- Education (0.68)
- Leisure & Entertainment > Games (0.46)

Technology:
- Information Technology > Artificial Intelligence
  - Representation & Reasoning (1.00)
  - Vision (0.93)
  - Machine Learning
    - Reinforcement Learning (0.94)
    - Statistical Learning (0.68)
    - Neural Networks > Deep Learning (0.46)

Duplicate Docs Excel Report

Title
None found

Similar Docs Excel Report more

Title	Similarity	Source
None found