MultimodalandMultilingualEmbeddings forLarge-ScaleSpeechMining

Feb-9-2026, 15:35:56 GMT–Neural Information Processing Systems

Using a similarity metric in that multimodal embedding space, we perform mining of audio in German, French, Spanish and English from Librivox against billions of sentences from CommonCrawl.

artificial intelligence, machine learning, natural language, (19 more...)

Neural Information Processing Systems

Feb-9-2026, 15:35:56 GMT

Conferences PDF

Country:
- North America > United States
  - Minnesota > Hennepin County > Minneapolis (0.14)
- Europe
  - Spain (0.04)
  - Austria > Styria
    - Graz (0.04)

Genre:
- Research Report > New Finding (0.46)

Technology:
- Information Technology > Artificial Intelligence
  - Machine Learning (1.00)
  - Speech > Speech Recognition (0.49)
  - Natural Language > Machine Translation (0.48)

Duplicate Docs Excel Report

Title
8466f9ace6a9acbe71f75762ffc890f1-Paper.pdf

Similar Docs Excel Report more

Title	Similarity	Source
None found