OxfordVGG Submission to the EGO4D AV Transcription Challenge