StyleCap: Automatic Speaking-Style Captioning from Speech Based on Speech and Language Self-supervised Learning Models K Yamauchi, Y Ijima, Y Saito 2024 IEEE International Conference on Acoustics, Speech and Signal …, 2023 | 4 | 2023 |
UTDUSS: UTokyo-SaruLab System for Interspeech2024 Speech Processing Using Discrete Speech Unit Challenge W Nakata, K Yamauchi, D Yang, H Hyodo, Y Saito arXiv preprint arXiv:2403.13720, 2024 | 1 | 2024 |
離散音声トークン生成によるテキスト音声合成のための音声主観評価値予測に基づくdecoding戦略 山内一輝, 中田亘, 齋藤佑樹, 猿渡洋 情報処理学会研究報告 152, No. 14, 2024 | | 2024 |
VQ-VAE に基づく解釈可能なアクセント潜在変数を用いた多方言音声合成 山内一輝, 齋藤佑樹, 猿渡洋 研究報告音声言語情報処理 (SLP) 2024 (52), 1-6, 2024 | | 2024 |
StyleCap: 音声および言語の自己教師あり学習モデルに基づく音声の発話スタイルに関するキャプション生成 山内一輝, 井島勇祐, 齋藤佑樹 日本音響学会 2024年春季研究発表会 講演論文集, 2024, 3-2-14, 843--846, 2024 | | 2024 |
アクセント潜在変数の予測と制御が可能な TTS モデルによる方言音声合成の検討 山内一輝, 齋藤佑樹, 猿渡洋 日本音響学会 2023年秋季研究発表会 講演論文集, 2-Q-30, 2023, 1255--1256, 2023 | | 2023 |