Quantum Policy Gradient Algorithm with Optimized Action Decoding

Meyer, Nico, Scherer, Daniel D., Plinge, Axel, Mutschler, Christopher, Hartmann, Michael J.

May-22-2023–arXiv.org Artificial Intelligence

Quantum machine learning implemented by variational quantum circuits (VQCs) is considered a promising concept for the noisy intermediate-scale quantum computing era. Focusing on applications in quantum reinforcement learning, we propose a specific action decoding procedure for a quantum policy gradient approach. We introduce a novel quality measure that enables us to optimize the classical post-processing required for action selection, inspired by local and global quantum measurements. The resulting algorithm demonstrates a significant performance improvement in several benchmark environments. With this technique, we successfully execute a full training routine on a 5-qubit hardware device. Our method introduces only negligible classical overhead and has the potential to improve VQC-based algorithms beyond the field of quantum reinforcement learning.

artificial intelligence, machine learning, reinforcement learning, (16 more...)

arXiv.org Artificial Intelligence

May-22-2023

arXiv.org PDF

Add feedback

Country:
- North America > United States
  - Hawaii > Honolulu County > Honolulu (0.04)
- Europe
  - United Kingdom > England
    - Cambridgeshire > Cambridge (0.04)
  - Germany > Bavaria
    - Middle Franconia > Nuremberg (0.14)
    - Upper Bavaria > Munich (0.04)
- Asia > Philippines
  - Luzon > National Capital Region > City of Manila (0.04)

Genre:
- Research Report (0.63)

Technology:
- Information Technology
  - Hardware (1.00)
  - Artificial Intelligence > Machine Learning
    - Reinforcement Learning (1.00)
    - Neural Networks > Deep Learning (0.46)

Duplicate Docs Excel Report

Title
None found

Similar Docs Excel Report more

Title	Similarity	Source
None found