2-9 AI オーディオ
好きな声を選択し、テキストを音声に変換して、あなたの創造力を解放します!
Text-to-Speech(TTS)技術は、書かれたテキストを生き生きとした話し言葉に変換します。クリック一つで、ドキュメント、書籍、または任意の書かれた素材を、誰かが直接話しているかのように聞くことができます。マルチタスク、移動中の学習、または情報をよりアクセスしやすくするために理想的で、TTSは可能性の世界を開き、読書の未来を聞く機会を提供します。いつでも、どこでもコンテンツを吸収する自由と柔軟性を体験してください。
ページ入口

テキストから音声への変換の使い方
AI Audioをクリックして、音声コミュニティに入ります。
好きな声を選択し、「創作」クリックし、テキストを入力します(現在、日本語、英語、中国語に対応しています)。その後、再び「創作」をクリックします。


*右側の履歴レコードで、以前に生成された音声を確認できます。
利用可能な音色が気に入らない場合、独自の音色をカスタマイズすることができます。

音声トレーニングの三段階:
Ⅰ. 全体の流れ
1)音声情報を入力2)音声ファイルをアップロード3)「今すぐトレーニング」をクリックして結果を確認
Ⅱ. 手順詳細
Step 1:音声情報を入力

サムネイルアップロード(画像を選択)
1:1 正方形画像、2 MB 以内
音声名称
1~20 文字、検索しやすい名前を推奨
モデル
使用する学習モデル(デフォルト:SeaArt-speech-01-hd)
性別 / 年齢 / 口調
アップロードする声に合わせて選択
言語
音声と同じ言語を選択(日本語/英語/中国語/韓国語対応)
テキストから音声へのサンプル
モデルが参照する台詞(50 文字以内)
タグ
0~5 個まで設定可
公開するかどうか(公開 / 非公開)
公開:コミュニティに掲載/非公開:自分のみ閲覧
Step 2:音声をアップロード

アップロード方法:右側「ファイルをドラッグまたはアップロード」に音声をドラッグ&ドロップ、またはクリックして選択
対応形式:mp3 / wav / aac
長さ制限:30 秒以内(10 秒程度のクリア音声で高速学習が可能)
ファイルサイズ:20 MB 以内
品質のポイント
BGM・残響・ノイズのない純粋な音声を使用
声の特徴がはっきりし、感情が安定したクリップを選択
楽曲やBGM付き音声は推奨されません
Step 3:「今すぐトレーニング」をクリック
消耗:28(画面にリアルタイム表示)
進行状況と結果確認
右上「トレーニング履歴」で全ジョブを確認
完了後、リストで再生・名前変更・削除が可能
公開設定が「公開」の場合、プロフィール → Audio Works に自動掲載

Ⅲ. よくある質問 & ヒント
なぜ 10~20 秒が推奨?
短時間なら数分で学習が終わり、声の特徴も十分に抽出できます。
複数クリップをまとめてアップロードできる?
現在は未対応。事前に 1 本へ編集してからアップロードしてください。
録音品質が低い場合は?
Audition や Audacity などのノイズ除去ツールで処理した後にアップロードすると効果的です。
トレーニングが失敗・停止する場合は?
ネットワーク接続を確認し、音声形式・長さが要件を満たしているか再チェックしてください。
Last updated