Cross-lingual Embedding Clustering for Hierarchical Softmax in Low-Resource Multilingual Speech Recognition

Yang, Zhengdong, Liu, Qianying, Li, Sheng, Cheng, Fei, Chu, Chenhui

Jan-29-2025–arXiv.org Artificial Intelligence

We present a novel approach centered on the decoding stage of Automatic Speech Recognition (ASR) that enhances multilingual performance, especially for low-resource languages. It utilizes a cross-lingual embedding clustering method to construct a hierarchical Softmax (H-Softmax) decoder, which enables similar tokens across different languages to share similar decoder representations. It addresses the limitations of the previous Huffman-based H-Softmax method, which relied on shallow features in token similarity assessments. Through experiments on a downsampled dataset of 15 languages, we demonstrate the effectiveness of our approach in improving low-resource multilingual ASR accuracy.

artificial intelligence, h-softmax, machine learning, (16 more...)

arXiv.org Artificial Intelligence

Jan-29-2025

arXiv.org PDF

Add feedback

Country:
- Oceania > Australia
  - Victoria > Melbourne (0.04)
- North America
  - United States
    - New York > New York County
      - New York City (0.04)
    - Arizona > Maricopa County
      - Scottsdale (0.04)
  - Canada > British Columbia
    - Metro Vancouver Regional District > Vancouver (0.14)
  - Barbados > Saint Michael
    - Bridgetown (0.04)
- Europe
  - Portugal (0.04)
  - United Kingdom > England
    - East Sussex > Brighton (0.04)
  - France > Provence-Alpes-Côte d'Azur
    - Bouches-du-Rhône > Marseille (0.04)
  - Czechia > South Moravian Region
    - Brno (0.04)
  - Austria > Styria
    - Graz (0.04)
- Asia
  - Japan > Honshū
    - Kansai > Kyoto Prefecture > Kyoto (0.04)
  - China > Shanghai
    - Shanghai (0.04)

Genre:
- Research Report
  - New Finding (0.93)
  - Promising Solution (0.66)

Technology:
- Information Technology > Artificial Intelligence
  - Speech > Speech Recognition (1.00)
  - Machine Learning > Statistical Learning
    - Clustering (0.49)

Duplicate Docs Excel Report

Title
None found

Similar Docs Excel Report more

Title	Similarity	Source
None found