2-9 AI オーディオ

好きな声を選択し、テキストを音声に変換して、あなたの創造力を解放します！

Text-to-Speech（TTS）技術は、書かれたテキストを生き生きとした話し言葉に変換します。クリック一つで、ドキュメント、書籍、または任意の書かれた素材を、誰かが直接話しているかのように聞くことができます。マルチタスク、移動中の学習、または情報をよりアクセスしやすくするために理想的で、TTSは可能性の世界を開き、読書の未来を聞く機会を提供します。いつでも、どこでもコンテンツを吸収する自由と柔軟性を体験してください。

ページ入口

テキストから音声への変換の使い方

AI Audioをクリックして、音声コミュニティに入ります。
好きな声を選択し、「創作」クリックし、テキストを入力します（現在、日本語、英語、中国語に対応しています）。その後、再び「創作」をクリックします。

*右側の履歴レコードで、以前に生成された音声を確認できます。

利用可能な音色が気に入らない場合、独自の音色をカスタマイズすることができます。

音声トレーニングの三段階：

Ⅰ. 全体の流れ

1）音声情報を入力2）音声ファイルをアップロード3）「今すぐトレーニング」をクリックして結果を確認

Ⅱ. 手順詳細

Step 1：音声情報を入力

サムネイルアップロード（画像を選択）

1:1 正方形画像、2 MB 以内

音声名称

1～20 文字、検索しやすい名前を推奨

モデル

使用する学習モデル（デフォルト：SeaArt-speech-01-hd）

性別 / 年齢 / 口調

アップロードする声に合わせて選択

言語

音声と同じ言語を選択（日本語／英語／中国語／韓国語対応）

テキストから音声へのサンプル

モデルが参照する台詞（50 文字以内）

タグ

0～5 個まで設定可

公開するかどうか（公開 / 非公開）

公開：コミュニティに掲載／非公開：自分のみ閲覧

Step 2：音声をアップロード

アップロード方法：右側「ファイルをドラッグまたはアップロード」に音声をドラッグ＆ドロップ、またはクリックして選択
対応形式：mp3 / wav / aac
長さ制限：30 秒以内（10 秒程度のクリア音声で高速学習が可能）
ファイルサイズ：20 MB 以内
品質のポイント
BGM・残響・ノイズのない純粋な音声を使用
声の特徴がはっきりし、感情が安定したクリップを選択
楽曲やBGM付き音声は推奨されません

Step 3：「今すぐトレーニング」をクリック

消耗：28（画面にリアルタイム表示）
進行状況と結果確認

右上「トレーニング履歴」で全ジョブを確認
完了後、リストで再生・名前変更・削除が可能
公開設定が「公開」の場合、プロフィール → Audio Works に自動掲載

Ⅲ. よくある質問 & ヒント

なぜ 10～20 秒が推奨？

短時間なら数分で学習が終わり、声の特徴も十分に抽出できます。

複数クリップをまとめてアップロードできる？

現在は未対応。事前に 1 本へ編集してからアップロードしてください。

録音品質が低い場合は？

Audition や Audacity などのノイズ除去ツールで処理した後にアップロードすると効果的です。

トレーニングが失敗・停止する場合は？

ネットワーク接続を確認し、音声形式・長さが要件を満たしているか再チェックしてください。

Previous開始フレームと終了フレーム Next2-10 ワークフロー

Last updated 4 months ago