Dynamic-SUPERB

community

Activity Feed Request to join this org

AI & ML interests

None defined yet.

Recent Activity

Steveeeeeeen authored a paper 18 days ago

Treble10: A high-quality dataset for far-field speech recognition, dereverberation, and enhancement

Steveeeeeeen authored a paper 18 days ago

Open ASR Leaderboard: Towards Reproducible and Transparent Multilingual and Long-Form Speech Recognition Evaluation

chiyuanhsiao authored a paper about 1 month ago

Analyzing Mitigation Strategies for Catastrophic Forgetting in End-to-End Training of Spoken Language Models

View all activity

Steveeeeeeen

authored 2 papers 18 days ago

Treble10: A high-quality dataset for far-field speech recognition, dereverberation, and enhancement

Paper • 2510.23141 • Published Oct 27 • 4

Open ASR Leaderboard: Towards Reproducible and Transparent Multilingual and Long-Form Speech Recognition Evaluation

Paper • 2510.06961 • Published Oct 8 • 10

chiyuanhsiao

authored a paper about 1 month ago

Analyzing Mitigation Strategies for Catastrophic Forgetting in End-to-End Training of Spoken Language Models

Paper • 2505.17496 • Published May 23 • 2

yenting-biao

authored a paper about 2 months ago

SAKE: Towards Editing Auditory Attribute Knowledge of Large Audio-Language Models

Paper • 2510.16917 • Published Oct 19 • 19

zenyn

authored 2 papers about 2 months ago

SAKE: Towards Editing Auditory Attribute Knowledge of Large Audio-Language Models

Paper • 2510.16917 • Published Oct 19 • 19

Investigating Safety Vulnerabilities of Large Audio-Language Models Under Speaker Emotional Variations

Paper • 2510.16893 • Published Oct 19 • 17

ga642381

authored 3 papers 2 months ago

Dynamic-SUPERB Phase-2: A Collaboratively Expanding Benchmark for Measuring the Capabilities of Spoken Language Models with 180 Tasks

Paper • 2411.05361 • Published Nov 8, 2024 • 3

DeSTA2.5-Audio: Toward General-Purpose Large Audio Language Model with Self-Generated Cross-Modal Alignment

Paper • 2507.02768 • Published Jul 3 • 18

Game-Time: Evaluating Temporal Dynamics in Spoken Language Models

Paper • 2509.26388 • Published Sep 30 • 26

WeiChihChen

authored 6 papers 2 months ago

Dynamic-SUPERB Phase-2: A Collaboratively Expanding Benchmark for Measuring the Capabilities of Spoken Language Models with 180 Tasks

Paper • 2411.05361 • Published Nov 8, 2024 • 3

BreezyVoice: Adapting TTS for Taiwanese Mandarin with Enhanced Polyphone Disambiguation -- Challenges and Insights

Paper • 2501.17790 • Published Jan 29 • 3

DeSTA2.5-Audio: Toward General-Purpose Large Audio Language Model with Self-Generated Cross-Modal Alignment

Paper • 2507.02768 • Published Jul 3 • 18

Analyzing Mitigation Strategies for Catastrophic Forgetting in End-to-End Training of Spoken Language Models

Paper • 2505.17496 • Published May 23 • 2

Spoken Stereoset: On Evaluating Social Bias Toward Speaker in Speech Large Language Models

Paper • 2408.07665 • Published Aug 14, 2024

Game-Time: Evaluating Temporal Dynamics in Spoken Language Models

Paper • 2509.26388 • Published Sep 30 • 26

GaryNTUEE125

authored 2 papers 2 months ago

TASTE: Text-Aligned Speech Tokenization and Embedding for Spoken Language Modeling

Paper • 2504.07053 • Published Apr 9 • 5

AEGIS : Automated Co-Evolutionary Framework for Guarding Prompt Injections Schema

Paper • 2509.00088 • Published Aug 27

dlion168

authored 3 papers 2 months ago

Spoken Stereoset: On Evaluating Social Bias Toward Speaker in Speech Large Language Models

Paper • 2408.07665 • Published Aug 14, 2024

EMO-Debias: Benchmarking Gender Debiasing Techniques in Multi-Label Speech Emotion Recognition

Paper • 2506.04652 • Published Jun 5 • 1

Multi-Distillation from Speech and Music Representation Models

Paper • 2506.07237 • Published Jun 8