关注
Kazuki Yamauchi
Kazuki Yamauchi
在 g.ecc.u-tokyo.ac.jp 的电子邮件经过验证 - 首页
标题
引用次数
引用次数
年份
StyleCap: Automatic Speaking-Style Captioning from Speech Based on Speech and Language Self-supervised Learning Models
K Yamauchi, Y Ijima, Y Saito
2024 IEEE International Conference on Acoustics, Speech and Signal …, 2023
42023
UTDUSS: UTokyo-SaruLab System for Interspeech2024 Speech Processing Using Discrete Speech Unit Challenge
W Nakata, K Yamauchi, D Yang, H Hyodo, Y Saito
arXiv preprint arXiv:2403.13720, 2024
12024
離散音声トークン生成によるテキスト音声合成のための音声主観評価値予測に基づくdecoding戦略
山内一輝, 中田亘, 齋藤佑樹, 猿渡洋
情報処理学会研究報告 152, No. 14, 2024
2024
VQ-VAE に基づく解釈可能なアクセント潜在変数を用いた多方言音声合成
山内一輝, 齋藤佑樹, 猿渡洋
研究報告音声言語情報処理 (SLP) 2024 (52), 1-6, 2024
2024
StyleCap: 音声および言語の自己教師あり学習モデルに基づく音声の発話スタイルに関するキャプション生成
山内一輝, 井島勇祐, 齋藤佑樹
日本音響学会 2024年春季研究発表会 講演論文集, 2024, 3-2-14, 843--846, 2024
2024
アクセント潜在変数の予測と制御が可能な TTS モデルによる方言音声合成の検討
山内一輝, 齋藤佑樹, 猿渡洋
日本音響学会 2023年秋季研究発表会 講演論文集, 2-Q-30, 2023, 1255--1256, 2023
2023
系统目前无法执行此操作,请稍后再试。
文章 1–6