3 4 6

PanChanghao

DavidPigeon

https://david-pigeon.github.io/

DavidPigeon

AI & ML interests

audio synthesis

Recent Activity

liked a Space 1 day ago

teelinsan/aclpubcheck

upvoted a paper 5 days ago

Mega-ASR: Towards In-the-wild^2 Speech Recognition via Scaling up Real-world Acoustic Simulation

upvoted a paper about 1 month ago

WavAlign: Enhancing Intelligence and Expressiveness in Spoken Dialogue Models via Adaptive Hybrid Post-Training

View all activity

Organizations

liked a Space 1 day ago

ACL Pubcheck

📝

Check your PDF for ACL guidelines

upvoted a paper 5 days ago

Mega-ASR: Towards In-the-wild^2 Speech Recognition via Scaling up Real-world Acoustic Simulation

Paper • 2605.19833 • Published 7 days ago • 128

upvoted a paper about 1 month ago

WavAlign: Enhancing Intelligence and Expressiveness in Spoken Dialogue Models via Adaptive Hybrid Post-Training

Paper • 2604.14932 • Published Apr 16 • 11

updated a dataset about 1 month ago

DavidPigeon/huawei_long_tts

Updated Apr 20 • 614

published a dataset about 1 month ago

DavidPigeon/huawei_long_tts

Updated Apr 20 • 614

New activity in inLine-XJY/ImVideoEdit about 2 months ago

Upload ditto_outputs_frame_avg_81.tar.gz

#3 opened about 2 months ago by

DavidPigeon

Upload vace_14b_outputs.tar.gz

#2 opened about 2 months ago by

DavidPigeon

Upload ditto_outputs.tar.gz

#1 opened about 2 months ago by

DavidPigeon

liked a Space 4 months ago

Qwen3-TTS Demo

🎙

1.93k

Generate speech from text via voice design, cloning, or presets

liked a model 4 months ago

stepfun-ai/Step-Audio-R1.1

Audio-Text-to-Text • 33B • Updated Feb 14 • 315 • 180

liked a Space 4 months ago

Fun-ASR-Nano

🚀

LLM-powered ASR: 31 languages, Chinese dialects, timestamps

liked a model 4 months ago

nvidia/bigvgan_v2_24khz_100band_256x

Audio-to-Audio • Updated Sep 5, 2024 • 97.5k • 22

liked a dataset 9 months ago

OpenSound/CapSpeech

Viewer • Updated Jun 4, 2025 • 20.8M • 1.36k • 24

published a dataset 10 months ago

DavidPigeon/PSA-MOS

Updated Jul 21, 2025 • 7

authored a paper about 1 year ago

ISDrama: Immersive Spatial Drama Generation through Multimodal Prompting

Paper • 2504.20630 • Published Apr 29, 2025 • 9

upvoted 2 papers about 1 year ago

ISDrama: Immersive Spatial Drama Generation through Multimodal Prompting

Paper • 2504.20630 • Published Apr 29, 2025 • 9

Versatile Framework for Song Generation with Prompt-based Control

Paper • 2504.19062 • Published Apr 27, 2025 • 6

PanChanghao

AI & ML interests

Recent Activity

Organizations

DavidPigeon's activity

ACL Pubcheck

Upload ditto_outputs_frame_avg_81.tar.gz

Upload vace_14b_outputs.tar.gz

Upload ditto_outputs.tar.gz

Qwen3-TTS Demo

Fun-ASR-Nano